分布式测试系统建设

原创：张少华

背景

随着自动化测试用例的增长，模块持续集成中的验证环节时间也随之增长。如果使用单台机器，可能需要几个小时的时间才能完成一次所有用例的运行。这里我们能想到的最直接的方法，就是增加机器资源，并行运行测试用例。我们首先使用的方法是，在jenkins中将运行时间长的模块的功能测试job，拆分为多个可并行执行的job。但即使我们封装了许多jenkins相关的操作方法，可以使用脚本快速生成一系列job，但是依然存在以下问题：

增减机器成本太高，需调整整个jenkins的任务。

并行job运行时间不固定，瓶颈为最慢的job运行的时间。

稳定性问题，并行执行机器任何一台出现问题，都会影响整体任务。

建设目标

为了解决上面的问题，当时我们期望的测试系统有以下要求：

稳定性高，比如某个机器出现问题不会影响整体任务：稳定是重中之重。

分布式执行，同一job的多台机器可并行执行，同时，多个模块之间也可以并行执行测试任务：充分利用机器资源，提升自动化测试效率。

配置方便，机器资源池维护简单：可以节省维护的人力，将时间用于更有意义的事情上。

结果报告清晰，排查问题方便：错误case日志、环境等信息及时保存。

我们并没有使用一些开源的分布式框架，因为我们的需求相对来说比较简单，而且有一些定制化的需求，同时希望之后测试同学们可以在此之上做二次开发，所以最终我们决定自己实现这一系统。

具体实现

总体设计

整个系统主要分为三个角色模块：客户端、控制中心（Master）及worker端，其中client端在。

对于一个Jenkins job触发的分布式任务，主要步骤有：

Jenkins job调用客户端发送请求到控制中心，传递job相关信息，请求创建任务。

控制中心（Master）根据请求信息创建任务，筛选case创建task列表（每一个case对应一个task，可分布式执行），分配worker。

Jenkins客户端请求控制中心查询任务状态接口，打印当前状态。

Worker端请求控制中心获取可执行的命令，做出相应的拉取代码、准备环境、执行单个case task、清理环境等命令。

所有task执行完后，jenkins客户端获取任务结果，退出任务。

详细的交互过程如下如所示：

如何实现并行执行？

由于我们的case在单台机器上不能并行执行，所以我们所说的并行是指多台机器同时执行case；在创建任务的时候，会筛选出所需执行的case，每个case将会对应创建一个task并加入task队列；worker请求命令时，会从task队列中挑选合适的task进行分配（case的运行时间长的优先级高，避免出现最后等待case运行结束时间长的情况发生）。

控制中心（Master）

控制中心包括server和后台数据两部分，后台数据库存储job信息、case信息、worker信息（资源池）、result信息、配置信息等。Server提供接口供客户端及worker端访问，分步执行的控制逻辑都在控制中心实现。

由于控制中心没有页面，所以控制中心提供了一系列接口供其他模块使用：

客户端

客户端，即jenkins job中运行的脚本，每一个jenkins job对应着一个分布式的任务。

首先需要创建任务，请求/job/create接口的时候，我们会把从jenkins job的环境变量中获取的一些信息发送给Master，如jenkins job的名称，BUILD_NUM，以及最为重要的模块信息及代码仓库、分支信息。

然后，会使用/job/status循环查询任务的状态，实时打印在控制台输出里。

最后，根据任务运行状况返回结果。

worker端

worker端，即实际case运行所在的机器，每个worker都是独立的，互不影响。通过控制中心接口不停询问自己应该执行什么操作。

首先在worker端我们添加了一个系统服务，守护进程持续执行中。

然后，worker在空闲状态的时候，会根据接口/worker_get_command循环请求控制中心，如果有命令的话，就会去执行，执行完后，将执行产生的结果、日志文件上传到日志平台；同时调用/result_update接口，把命令的运行结果传递到控制中心。

收益与问题

系统上线后，完美取代了我们之前手动jenkins分组执行自动化测试的方法，首先从服务的健壮性性及正确性来说，很少会出现因为测试环境或是工具出问题而影响整个测试任务的情况，让开发和测试同学将精力聚焦于case反映出的业务代码问题上；其次，配置简单，大大节省了维护时间；最后，由于worker资源池扩充方便，大大发挥了并行的作用，使整个测试任务效率有了很大的提升。

当然，还是存在着进一步优化的空间，比如现在的机器资源是在创建任务时分配好的，可以优化为在整个任务过程中动态调整，充分利用机器资源等。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,193评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,306评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,130评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,110评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,118评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,085评论 1赞 295
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,007评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,844评论 0赞 273
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,283评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,508评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,667评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,395评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,985评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,630评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,797评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,653评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,553评论 2赞 352

分布式测试系统建设

背景

建设目标

具体实现

收益与问题

推荐阅读更多精彩内容