如何编写更好的单元测试

本文介绍了 Graphite 改善测试文化,提高测试质量的过程中的经验,有助于致力于改善项目测试的团队思考如何采取步骤改进产品的测试。原文:Going from 0 to 1: How to write better unit tests when there are none

当我加入 Graphite 时,整个代码库中几乎没有测试。团队的五名工程师中有三人之前在 Meta 工作,并且已经将那里糟糕的测试文化当成了习惯。

在接下来两年时间里,我们慢慢改变了公司的测试文化。现在,令人高兴的是,大多数 PR(但不是全部)都带有测试。

然而,当我们编写越来越多测试时,又出现了新问题:测试架构太糟糕了。

糟糕测试架构的陷阱

我发现在工程师中有些事情是共识:

  1. 有测试总比没有好。
  2. 因为测试用户不像生产环境真实用户那样交互,测试代码的质量就不那么重要了,只要能测试代码就够了。

最终结果是,当引入测试时(就像在 Graphite 中那样),很容易编写出意大利面条式的测试代码。

但那又怎样?如果测试代码在技术上没有用于生产环境,为什么代码质量很重要?

最近,我在重读 代码整洁之道(Clean Code) 时,发现 Bob 大叔写的一个很好的故事,解释了这一陷阱:

几年前,我被邀请去指导某个团队,他们明确规定,测试代码不需要保持与生产环境代码相同的质量标准,他们允许彼此在单元测试中打破规则。“又快又脏”是他们的口号。只要测试代码能正常工作,并且测试能够覆盖生产代码,就足够了。

这个团队没有意识到的是,脏测试等同于没有测试,甚至比没有测试更糟。问题是测试必须随着生产代码的发展而改变。测试越脏,就越难改变。测试代码越复杂,就越有可能花费比编写新的生产代码更多的时间在套件中塞入新测试。当修改生产代码时,旧测试开始失败,测试代码中的混乱使得这些测试很难再次通过。因此,测试被视为一种不断增加的负担。

从一个版本到另一个版本,维护测试套件的成本不断上升。当经理问是什么原因导致工作量估算变得如此之大时,开发人员将其归咎于测试。最后,他们被迫完全放弃测试套件。

但是,如果没有测试套件,就失去了确保代码变更按预期工作的能力。因此缺陷率开始上升。随着意外缺陷数量的增加,他们开始害怕进行更改,生产环境代码开始腐烂。最终没有测试的生产代码混乱且问题百出,客户感到沮丧,感觉是测试工作造成了他们的失败。

重新审视之前的观点,我仍然同意有测试总比没有测试要好。然而,大多数工程师忽略的是 Bob 大叔在故事中所强调的:测试的关键是测试本身的架构以及随后的可维护性。

迈向更好的测试

随着我们在 Graphite 的代码库中添加更多测试,我发现自己在代码审查中一遍又一遍的重复许多相同的建议,并开始基于相同的反馈重构许多旧测试。

以下是我在内部分享的一些技巧,以帮助改进测试架构。

技巧1:清理底层代码可以帮助创建更简洁的测试

就像许多初创公司竞相发布产品一样,在 Graphite 公司,编写代码时没有考虑测试,结果是大量大型函数交织在核心业务逻辑中并产生大量副作用。

例如,考虑下面的简化方法,类似于我们经常使用的代码。该方法确定是否需要合并 PR,如果需要,则调用 GitHub API 进行合并,然后通过 Slack 发送通知:

async function mergePr(pr: Pr, context: Context) {
  if (!ciIsPassing(pr)) {
    await context.githubApi.comment.mergeFailed(pr, 'MISSING_REQUIRED_CI');
    throw new MergeFailedError();
  }

if (!prHasRequiredApprovers(pr)) {
  await context.githubApi.comment.mergeFailed(pr, 'MISSING_REQUIRED_APPROVERS');
  throw new MergeFailedError();
  }

  await context.githubApi.mergePr(pr);
  await context.sendMergedSlackNotification(pr);
}

上述方法的对应测试用例可能如下所示:

it("A PR with passing required CI and required approvers merges", () => {
  const pr = {
    org: "withgraphite",
    repo: "backend",
    number: 1,
    requiredCi: [...],
    requiredApprovers: [...],
  };
  
  const mergePr = sinon.fake(),
  const context = {
      githubApi: {
          comment: sinon.fake(),
          mergePr,
        },
        sendMergedSlackNotification,
  };
  
  await mergePr(context, pr);
  expect(mergePr.calledOnce).to.be.true;  
});

在这个简化例子中,测试本身还算不错,但还是有一些异味。

  • 有很多设置,尤其是那些打桩。这个示例分散了测试用例的焦点,使读者很难一眼就看出测试用例做了什么。

  • 打桩也增加了维护负担。考虑这样一种情况,我们稍后将扩展 mergePr 方法,在 PR 无法合并时也发送 Slack 通知。上面的测试用例将需要添加一个新的桩,即使它并没有测试此代码路径。

  • 考虑到我们想添加额外测试用例来测试当 PR 可以合并时会发生什么(即 mergePrsendMergedSlackNotification)的情况。在这个测试用例中,需要提供一个通过所有合并需求的测试 PR,如果我们稍后扩展合并需求,这个 PR 和测试用例可能也需要更新,即使我们真正想测试的是合并的副作用。

我们可以做得更好。正如之前提到的,这里的问题是架构问题。我经常发现,当测试难以编写时,代码本身的设计就很糟糕。

在后面的代码版本中,我对其进行了重构,使用命令/查询分离模式将纯逻辑从副作用中分离出来,这么做的效果很好,使每个方法更小,更集中。

function prMergeBlockers(pr: Pr) {
  const mergeBlockers = [];

  if (!ciIsPassing(pr)) {
    mergeBlockers.push('MISSING_REQUIRED_CI');
  }
  if (!prHasRequiredApprovers(pr)) {
    mergeBlockers.push('MISSING_REQUIRED_APPROVERS');
  }

  return mergeBlockers;
}

function mergePrIfPossible(pr: Pr, context: Context) {
  const mergeBlockers = prMergeBlockers(pr);
  if (mergeBlockers.length > 0) {
    await githubApi.comment.mergeFailed(pr, mergeBlockers);
  }

  mergePr(context, pr);
}

function mergePr(pr: Pr, context: Context) {
  await context.githubApi.mergePr(pr);
  await context.sendMergedSlackNotification(pr);
}

之前的测试用例现在看起来像这样:

it("A PR with passing required CI and required approvers merges", () => {
  const pr = {
    org: "withgraphite",
    repo: "backend",
    number: 1,
    requiredCi: [...],
    requiredApprovers: [...],
  };
  
  const mergeBlockers = prMergeBlockers(pr);
  
  expect(mergeBlockers.length).to.be.equal(0);
});

测试之前版本的代码时发现的问题现在已经消失了:

  • prMergeBlockers 函数允许我们在不打桩任何东西的情况下测试合并阻塞程序逻辑。

  • 如果想测试合并的副作用,可以直接调用 mergePr

额外的好处是,新代码也更容易理解。

在 Graphite 的例子中,随着我们将更多生产代码重构为这种模式,注意到在测试套件的执行中也可以进行相应的加速。在我们的测试中,数据库相关的副作用是通过在测试容器中运行一个真实的 Postgres 实例来测试的。通过尽可能重构逻辑和测试,可以减少访问数据库的次数。

技巧2:考虑使用领域特定语言

在之前改进的测试用例中,有一些东西仍然困扰着我:测试用例中的 9 行代码中,有 7 行专门用于创建假 PR 对象。

const pr = {
  org: "withgraphite",
  repo: "backend",
  number: 1,
  requiredCi: [...],
  requiredApprovers: [...],
};
const mergeBlockers = prMergeBlockers(pr);
expect(mergeBlockers.length).to.be.equal(0);

这偏离了测试的重点,读者需要关心的是,此 PR 通过了所需的 CI,并拥有所需的一组审批人。读者实际上并不关心 PR 所在的特定组织或存储库,在最差情况下,这些只会转移注意力,实际上不会影响测试的结果。

我最近喜欢的一种模式是使用轻量级领域特定语言来帮助构建测试对象。

在我们的例子中,这类似于一个基本的构建器,可以转换为前面的对象:

// Now the test contains just what we care about!
const pr = new Pr()
  .withRequiredCi()
  .withRequiredApprovers();
const mergeBlockers = prMergeBlockers(pr);
expect(mergeBlockers.length).to.be.equal(0);

这里的示例相对基本,但在我们的代码库中有复杂关系的情况下,这帮助我们删除了大量样板代码。

我们在 Graphite 测试的一个常见概念涉及创建一个具有依赖关系的 PR 图。在我们的测试中,将其简化为节点和边的列表,依靠辅助函数来完成构建实际图的工作。

nodes: [{ prNumber: 123 }, { prNumber: 5000 }, { prNumber: 314 }],
edges: [
  [{ prNumber: 123 }, { prNumber: 5000, parentPrNumber: 123 }],
],

这些小的辅助函数在断言层也很有用。测试中我们可以这样写:

assertEntriesAre({
  actual: entries,
  expected: [
    { prNumber: 13, status: "PENDING" },
    { prNumber: 42, status: "PENDING" },
    { prNumber: 314, status: "PENDING" },
    { prNumber: 500, status: "PENDING" },
  ],
});

这可以让读者专注于高层,而隐藏其中不太有趣的实现。

const assertEntriesAre = ({
  actual,
  expected,
}: {
  actual: TMergeQueue;
  expected: { prNumber: number; status: TMqEntryStatus }[];
}) => {
  expect(
    actual.map((entry) => ({
      prNumber: entry.githubPr.number,
      status: entry.status,
    }))
  ).to.deep.eq(expected);
};
技巧3:尝试将测试参数化

单个测试用例现在简洁且易于阅读,突出了特定测试用例的独特之处,让读者可以只关注需要知道的内容。

it("A PR with passing required CI and required approvers merges", () => {
  const pr = new Pr()
    .withRequiredCi()
    .withRequiredApprovers();
    
  const mergeBlockers = prMergeBlockers(pr);
  
  expect(mergeBlockers.length).to.be.equal(0);
});

考虑添加另一个测试用例,我们希望确保如果 PR CI 失败,就不会被合并。

it("PR with passing required CI and required approvers merges", () => {
  const pr = new Pr()
    .withRequiredCi()
    .withRequiredApprovers();
    
  const mergeBlockers = prMergeBlockers(pr);
  
  expect(mergeBlockers.length).to.be.equal(0);
});

// Our new test case
it("PR with required approvers but *without* required CI does not merge", () => {
  const pr = new Pr()
    .withRequiredApprovers()
    .withoutRequiredCi();
    
  const mergeBlockers = prMergeBlockers(pr);
  
  expect(mergeBlockers).to.contain('MISSING_REQUIRED_CI');
});

这样可以完成工作,但是有一些重复代码,并且很难一眼看出每个测试用例的独特之处。

我们重构一下测试,明确显示参数化:

[
  {
    desc: "A PR with passing required CI and required approvers merges",
    pr: new Pr()
      .withRequiredCi()
      .withRequiredApprovers(),
    mergeBlockers: [],
  },
  {
    desc: "PR with required approvers but *without* required CI does not merge",
    pr: new Pr()
      .withRequiredApprovers()
      .withoutRequiredCi(),
    mergeBlockers: ['MISSING_REQUIRED_CI'],
  },
].forEach((tc) => {
  it(
    tc.desc,
    () => {
      const mergeBlockers = prMergeBlockers(pr);
      
      expect(mergeBlockers).to.deep.eq(tc.mergeBlockers);
    }
  )
});

现在更容易看到每种情况的独特之处(参数和预期输出)以及共享之处(对 prMergeBlockers 的调用)。

扩展此测试以添加新测试用例或修改给定输入的输出现在也只是一个小更改,更易于创建和评审。

    ...
+   {
+     desc: "PR with required CI but *without required approvers does not merge",
+     pr: new Pr()
+       .withRequiredCi()
+       .withoutRequiredApprovers(),
+     mergeBlockers: ['MISSING_REQUIRED_APPROVERS'],
+   },
    ...
技巧4:设计测试时要考虑失败

当测试通过时,工程师通常会忽略它们,只有当测试开始失败时,才会有人开始调查到底发生了什么。

因此,第一个接触点是测试失败消息。在编写测试时,应该考虑可能向未来的工程师显示的失败消息,并考虑如何使其尽可能清晰和可行。

考虑下面的一组检查,断言数组包含两个元素,PR #42和PR #500:

expect(entries.length).to.be.eq(2);

const entriesSet = new Set(entries.map((e) => e.githubPr.number));
expect(entriesSet).to.not.contain(childPrNumber);
expect(entriesSet).to.not.contain(childPrNumber2);

expect(entriesSet).to.contain(42);
expect(entriesSet).to.contain(500);

如果数组 entries 返回 3 项而不是预期的 2 项,那么测试在第一个断言上就会失败,通知我们 entries 数组的长度是 3 而不是 2。

工程师调试的时候可能会先修改测试,输出返回的条目列表(尝试了解数组中包含哪些条目),随后重新运行测试,然后检查结果。

如果我们能预料到这是一种常见的调试模式,那么就可以并且应该在测试用例中做得更好。将上述检查替换为更简洁的单个检查,可以帮助未来的工程师跳过额外的调试步骤:

expect(entries.map(e => e.githubPr.number)).to.deep.eq([42, 500]);

结论

我在 Graphite 工作期间,已经能够通过这样的努力稳步提升测试文化。虽然这种改变需要很多年,但我发现,随着时间推移,稳定的努力和耐心会得到回报。希望这些技巧也可以帮助你和你的团队改进测试方法。

测试快乐!


你好,我是俞凡,在Motorola做过研发,现在在Mavenir做技术工作,对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI等技术始终保持着浓厚的兴趣,平时喜欢阅读、思考,相信持续学习、终身成长,欢迎一起交流学习。为了方便大家以后能第一时间看到文章,请朋友们关注公众号"DeepNoMind",并设个星标吧,如果能一键三连(转发、点赞、在看),则能给我带来更多的支持和动力,激励我持续写下去,和大家共同成长进步!

本文由mdnice多平台发布

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 230,527评论 6 544
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 99,687评论 3 429
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 178,640评论 0 383
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 63,957评论 1 318
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 72,682评论 6 413
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 56,011评论 1 329
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 44,009评论 3 449
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 43,183评论 0 290
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 49,714评论 1 336
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 41,435评论 3 359
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 43,665评论 1 374
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 39,148评论 5 365
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 44,838评论 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 35,251评论 0 28
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 36,588评论 1 295
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 52,379评论 3 400
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 48,627评论 2 380

推荐阅读更多精彩内容