通常,你可以从一本书中学到很多语法知识,能写一些小程序来解决简单的问题。但是若真要写程序来解决一个现实的问题,则还需要很多纪律和对问题的理解。如何组织你的代码?你知道它是怎么工作的吗?发生错误时健壮性如何?如何让代码简洁、清晰、可维护?这都是你要考虑的问题。幸运的是,Modern Perl能帮助你回答所有这些问题。
测试
你已经测试过你的代码了。
你运行代码时,可能会出现一些报错,马上改一下,然后再来试试,这个过程就是测试。测试就是验证软件按照你预期来运行的过程。高效的测试会自动化这个过程,与其依靠手动重复的执行这些检查,不如让电脑来做。
Perl提供了很好的工具来帮助你测试。
Test::More
测试的基本单位就是断言。每个测试断言就是一个能回答是或否的问题:这段代码的行为是否符合我的期望?
程序中要测试的内容最终都会转换成一个或多个断言。复杂的程序可能会有成千上万个不同的测试项,这很好,说明这个程序是可测试的。根据行为对断言进行归类有助于提高测试集的可维护性。
我们就从核心模块Test::More和它的ok()函数来开始Perl的测试。ok()函数有2个参数,一个布尔值和一个描述此条测试目的的字符串:
ok( 1, 'the number one should be true' );
ok( 0, '... and zero should not' );
ok( '', 'the empty string should be false' );
ok( '!', '... and a non-empty string should not' );
done_testing();
函数done_testing()会告诉Test::More,程序已经执行了所有的断言。如果程序意外退出了(还没调用到该函数就意外退出了),测试框架就会通知你出现了一些错误。如果没有done_testing(),那么测试框架就不知道发生了什么。
可选的,你可以指定测试条目数:
use Test::More tests => 4;
ok( 1, 'the number one should be true' );
ok( 0, '... and zero should not' );
ok( '', 'the empty string should be false' );
ok( '!', '... and a non-empty string should not' );
这样的话,如果测试的条目数量少于或大于4个,程序就会提醒你出错了。 相对而言done_testing()更简单些,但是有时候精确更有用。
运行测试
下面这个就是该测试的输出:
ok 1 - the number one should be true
not ok 2 - ... and zero should not
# Failed test '... and zero should not'
# at truth_values.t line 4.
not ok 3 - the empty string should be false
# Failed test 'the empty string should be false'
# at truth_values.t line 5.
ok 4 - ... and a non-empty string should not
1..4
# Looks like you failed 2 tests of 4.
这样的输出格式叫做TAP(Test Anything Protocol ,http://testanything.org/ )。失败的TAP测试条目会产生诊断信息帮助调试错误。
这个测试例子很简单,只有4个断言。一个真实的程序可能有成千上万个断言。大多数情况下,你关心的是要么是程序通过了所有测试,要么就是有哪些错误。核心模块TAP::Harness,提供了prove命令来显示你最关心的信息:
$ prove truth_values.t
truth_values.t .. 1/?
# Failed test '... and zero should not'
# at truth_values.t line 4.
# Failed test 'the empty string should be false'
# at truth_values.t line 5.
# Looks like you failed 2 tests of 4.
truth_values.t .. Dubious, test returned 2
(wstat 512, 0x200)
Failed 2/4 subtests
Test Summary Report
-------------------
truth_values.t (Wstat: 512 Tests: 4 Failed: 2)
Failed tests: 2-3
这个输出意思很明显:第二个和第三个测试条目失败了,原因和位置信息都给出了。当然失败的测试条目修复很简单,改变测试条件的布尔值就行了:
ok( ! 0, '... and zero should not' );
ok( ! '', 'the empty string should be false' );
改好后的输出:
$ prove truth_values.t
truth_values.t .. ok
All tests successful.
perldoc prove可查看更多的测试选项,比如并发运行测试,自动增加包含路径,递归运行所有t目录下的测试条目,优先运行慢测试。
如果是bash shell,可以增加以下别名,来方便使用:
alias proveall='prove -j9 --state=slow,save -lr t'
更好的比较
虽然所有自动化测试关键就是:布尔条件到底是真还是假,但是将所有条件都写成布尔形式也会有点无聊。Test::More提供其他的函数。
is()函数相当于使用Perl的eq操作符来比较2个值,如果值相等就认为测试通过:
is( 4, 2 + 2, 'addition should work' );
is( 'pancake', 100, 'pancakes are numeric' );
很显然,第一个测试会通过,而第二个会失败:
t/is_tests.t .. 1/2
# Failed test 'pancakes are numeric'
# at t/is_tests.t line 8.
# got: 'pancake'
# expected: '100'
# Looks like you failed 1 test of 2.
ok()只会提供失败测试条目的行号,is()则还会显示实际值和期望值。
is()强制为标量语境。例如,你可以这样检查一个数字的元素个数:
my @cousins = qw( Rick Kristen Alex Kaycee Eric Corey );
is @cousins, 6, 'I should have only six cousins';
当然这种写法scalar @cousins会更清晰地传达意图。
Test::More还有isnt()函数,这个就相当于ne操作符,如果不相等,测试通过,提供的也是标量语境。
is() and isnt()都是进行字符串的比较(相当于使用的是eq,ne操作符)。绝大部分情况,我们期望的就是这样工作。但有时候情况会有些复杂,这时候我们可以使用cmp_ok()函数,这个函数允许指定比较操作符:
cmp_ok( 100, $cur_balance, '<=', 'I should have at least $100' );
cmp_ok( $monkey, $ape, '==', 'Simian numifications should agree' );
类和对象也有相应的测试函数, isa_ok()用来测试一个类或对象是否继承了其他类:
my $chimpzilla = RobotMonkey->new;
isa_ok( $chimpzilla, 'Robot' );
isa_ok( $chimpzilla, 'Monkey' );
can_ok()用来验证一个类或对象是否具有某方法:
can_ok( $chimpzilla, 'eat_banana' );
can_ok( $chimpzilla, 'transform', 'destroy_tokyo' );
is_deeply()用来比较2个引用的内容是否一样:
use Clone;
my $numbers = [ 4, 8, 15, 16, 23, 42 ];
my $clonenums = Clone::clone( $numbers );
is_deeply( $numbers, $clonenums, 'clone() should produce identical items' );
如果比较失败,Test::More会尽可能的为你提供诊断信息。
这些之外Test::More还有很多其他的特定测试函数。
组织测试条目
CPAN发布的模块,要求有个名字为t的目录,且其中包含一个或多个以.t结尾的测试文件。当你使用Module::Build或ExtUtils::MakeMake来构建模块时,会在测试步骤会运行所有t/*.t文件,并输出测试结果。没有强制规定.t文件该怎么写,但有2个流行的策略可供采用:
- 每个.t对应一个.pm文件
- 每个.t对应一个功能
2个策略可以灵活使用,第一种可以验证你所有的模块的行为都是符合你的预期;随着工程的增长,第二种方法会更容易管理。保持测试内容的聚焦,这样会更容易维护。
测试文件的分类有助于提升开发速度。例如你要为 RobotMonkey 增加一个 breathe fire功能,你只需要运行 t/breathe_fire.t就行了。当这个功能测试通过后,再运行完整的测试以确保没有影响到其他功能。
其他测试模块
Test::More依赖一个叫Test::Builder的后端模块,Test::Builder主要用来管理测试计划和将输出做TAP适配。这样设计就可以使用多个测试模块并共用Test::Builder后端。因此可以将CPAN上几百个测试模块放在同一个程序中使用:
- Test::Fatal帮助你测试代码抛出异常是否合理,类似Test::Exception。
- Test::MockObject和Test::MockModule帮助你进行仿真
- Test::WWW::Mechanize用来测试WEB程序。Plack::Test,Plack::Test::Agent和子类Test::WWW::Mechanize::PSGI甚至允许你在测试时不使用额外的WEB服务器
- Test::Database提供函数来测试数据库的使用和滥用。DBICx::TestDatabase帮助你测试数据库schemas。
- Test::Class提供了另一个组织测试套件的机制。它允许你创建特定测试方法的类,而且可以继承。这是一个很好重用测试套件的方法。
- Test::Differences测试字符串和数据结构是否一样,并且在诊断信息中显示差异信息。 Test::LongString增加了类似的断言。
- Test::Deep用来测试嵌套数据。
- Devel::Cover会分析测试套件的执行情况,报告你的代码数量,报告覆盖率。
- Test::Most集成了几个有用的测试模块。
可以通过Perl的QA项目来了解更多测试相关的信息。http://qa.perl.org/