第九章 管理真实的程序(一) -测试

通常,你可以从一本书中学到很多语法知识,能写一些小程序来解决简单的问题。但是若真要写程序来解决一个现实的问题,则还需要很多纪律和对问题的理解。如何组织你的代码?你知道它是怎么工作的吗?发生错误时健壮性如何?如何让代码简洁、清晰、可维护?这都是你要考虑的问题。幸运的是,Modern Perl能帮助你回答所有这些问题。

测试

你已经测试过你的代码了。

你运行代码时,可能会出现一些报错,马上改一下,然后再来试试,这个过程就是测试。测试就是验证软件按照你预期来运行的过程。高效的测试会自动化这个过程,与其依靠手动重复的执行这些检查,不如让电脑来做。

Perl提供了很好的工具来帮助你测试。

Test::More

测试的基本单位就是断言。每个测试断言就是一个能回答是或否的问题:这段代码的行为是否符合我的期望?
程序中要测试的内容最终都会转换成一个或多个断言。复杂的程序可能会有成千上万个不同的测试项,这很好,说明这个程序是可测试的。根据行为对断言进行归类有助于提高测试集的可维护性。

我们就从核心模块Test::More和它的ok()函数来开始Perl的测试。ok()函数有2个参数,一个布尔值和一个描述此条测试目的的字符串:

ok( 1, 'the number one should be true' );
ok( 0, '... and zero should not' );
ok( '', 'the empty string should be false' );
ok( '!', '... and a non-empty string should not' );

done_testing();

函数done_testing()会告诉Test::More,程序已经执行了所有的断言。如果程序意外退出了(还没调用到该函数就意外退出了),测试框架就会通知你出现了一些错误。如果没有done_testing(),那么测试框架就不知道发生了什么。

可选的,你可以指定测试条目数:

use Test::More tests => 4;

ok( 1, 'the number one should be true' );
ok( 0, '... and zero should not' );
ok( '', 'the empty string should be false' );
ok( '!', '... and a non-empty string should not' );

这样的话,如果测试的条目数量少于或大于4个,程序就会提醒你出错了。 相对而言done_testing()更简单些,但是有时候精确更有用。

运行测试

下面这个就是该测试的输出:

ok 1 - the number one should be true
not ok 2 - ... and zero should not
# Failed test '... and zero should not'
# at truth_values.t line 4.
not ok 3 - the empty string should be false
# Failed test 'the empty string should be false'
# at truth_values.t line 5.
ok 4 - ... and a non-empty string should not
1..4
# Looks like you failed 2 tests of 4.

这样的输出格式叫做TAP(Test Anything Protocol ,http://testanything.org/ )。失败的TAP测试条目会产生诊断信息帮助调试错误。

这个测试例子很简单,只有4个断言。一个真实的程序可能有成千上万个断言。大多数情况下,你关心的是要么是程序通过了所有测试,要么就是有哪些错误。核心模块TAP::Harness,提供了prove命令来显示你最关心的信息:

$ prove truth_values.t
truth_values.t .. 1/?
# Failed test '... and zero should not'
# at truth_values.t line 4.
# Failed test 'the empty string should be false'
# at truth_values.t line 5.
# Looks like you failed 2 tests of 4.
truth_values.t .. Dubious, test returned 2
(wstat 512, 0x200)
Failed 2/4 subtests
Test Summary Report
-------------------
truth_values.t (Wstat: 512 Tests: 4 Failed: 2)
Failed tests: 2-3

这个输出意思很明显:第二个和第三个测试条目失败了,原因和位置信息都给出了。当然失败的测试条目修复很简单,改变测试条件的布尔值就行了:

ok( ! 0, '... and zero should not' );
ok( ! '', 'the empty string should be false' );

改好后的输出:

$ prove truth_values.t
truth_values.t .. ok
All tests successful.

perldoc prove可查看更多的测试选项,比如并发运行测试,自动增加包含路径,递归运行所有t目录下的测试条目,优先运行慢测试。

如果是bash shell,可以增加以下别名,来方便使用:

alias proveall='prove -j9 --state=slow,save -lr t'

更好的比较

虽然所有自动化测试关键就是:布尔条件到底是真还是假,但是将所有条件都写成布尔形式也会有点无聊。Test::More提供其他的函数。

is()函数相当于使用Perl的eq操作符来比较2个值,如果值相等就认为测试通过:

is( 4, 2 + 2, 'addition should work' );
is( 'pancake', 100, 'pancakes are numeric' );

很显然,第一个测试会通过,而第二个会失败:

t/is_tests.t .. 1/2
# Failed test 'pancakes are numeric'
# at t/is_tests.t line 8.
# got: 'pancake'
# expected: '100'
# Looks like you failed 1 test of 2.

ok()只会提供失败测试条目的行号,is()则还会显示实际值和期望值。

is()强制为标量语境。例如,你可以这样检查一个数字的元素个数:

my @cousins = qw( Rick Kristen Alex Kaycee Eric Corey );
is @cousins, 6, 'I should have only six cousins';

当然这种写法scalar @cousins会更清晰地传达意图。

Test::More还有isnt()函数,这个就相当于ne操作符,如果不相等,测试通过,提供的也是标量语境。

is() and isnt()都是进行字符串的比较(相当于使用的是eq,ne操作符)。绝大部分情况,我们期望的就是这样工作。但有时候情况会有些复杂,这时候我们可以使用cmp_ok()函数,这个函数允许指定比较操作符:

cmp_ok( 100, $cur_balance, '<=', 'I should have at least $100' );
cmp_ok( $monkey, $ape, '==', 'Simian numifications should agree' );

类和对象也有相应的测试函数, isa_ok()用来测试一个类或对象是否继承了其他类:

my $chimpzilla = RobotMonkey->new;
isa_ok( $chimpzilla, 'Robot' );
isa_ok( $chimpzilla, 'Monkey' );

can_ok()用来验证一个类或对象是否具有某方法:

can_ok( $chimpzilla, 'eat_banana' );
can_ok( $chimpzilla, 'transform', 'destroy_tokyo' );

is_deeply()用来比较2个引用的内容是否一样:

use Clone;

my $numbers = [ 4, 8, 15, 16, 23, 42 ];
my $clonenums = Clone::clone( $numbers );

is_deeply( $numbers, $clonenums, 'clone() should produce identical items' );

如果比较失败,Test::More会尽可能的为你提供诊断信息。

这些之外Test::More还有很多其他的特定测试函数。

组织测试条目

CPAN发布的模块,要求有个名字为t的目录,且其中包含一个或多个以.t结尾的测试文件。当你使用Module::Build或ExtUtils::MakeMake来构建模块时,会在测试步骤会运行所有t/*.t文件,并输出测试结果。没有强制规定.t文件该怎么写,但有2个流行的策略可供采用:

  • 每个.t对应一个.pm文件
  • 每个.t对应一个功能

2个策略可以灵活使用,第一种可以验证你所有的模块的行为都是符合你的预期;随着工程的增长,第二种方法会更容易管理。保持测试内容的聚焦,这样会更容易维护。

测试文件的分类有助于提升开发速度。例如你要为 RobotMonkey 增加一个 breathe fire功能,你只需要运行 t/breathe_fire.t就行了。当这个功能测试通过后,再运行完整的测试以确保没有影响到其他功能。

其他测试模块

Test::More依赖一个叫Test::Builder的后端模块,Test::Builder主要用来管理测试计划和将输出做TAP适配。这样设计就可以使用多个测试模块并共用Test::Builder后端。因此可以将CPAN上几百个测试模块放在同一个程序中使用:

  • Test::Fatal帮助你测试代码抛出异常是否合理,类似Test::Exception。
  • Test::MockObject和Test::MockModule帮助你进行仿真
  • Test::WWW::Mechanize用来测试WEB程序。Plack::Test,Plack::Test::Agent和子类Test::WWW::Mechanize::PSGI甚至允许你在测试时不使用额外的WEB服务器
  • Test::Database提供函数来测试数据库的使用和滥用。DBICx::TestDatabase帮助你测试数据库schemas。
  • Test::Class提供了另一个组织测试套件的机制。它允许你创建特定测试方法的类,而且可以继承。这是一个很好重用测试套件的方法。
  • Test::Differences测试字符串和数据结构是否一样,并且在诊断信息中显示差异信息。 Test::LongString增加了类似的断言。
  • Test::Deep用来测试嵌套数据。
  • Devel::Cover会分析测试套件的执行情况,报告你的代码数量,报告覆盖率。
  • Test::Most集成了几个有用的测试模块。

可以通过Perl的QA项目来了解更多测试相关的信息。http://qa.perl.org/

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容