实用gstack技能 —— QA

SKILL.md 文件是 Y Combinator 总裁 Garry Tan 开源的 gstack 系统的核心，它是一个将 AI 从“单一助手”升级为虚拟工程团队的操作系统。其中qa/SKILL.md这个特定文件，正是这个团队中那名不知疲倦、拥有真实浏览器的“QA 测试工程师”的工作手册。

🧬 “虚拟工程团队”中的“QA工程师”：SKILL.md 的核心理念

SKILL.md（在这里特指qa/SKILL.md）不是一个静态的提示词集合，而是一份能让 AI 模拟特定专家角色的动态指令集。

gstack 系统的核心洞见在于，用专业分工取代单一通用的 AI 助手。它将开发流程拆解为精细的角色：从制定产品战略的“CEO” (/office-hours)、锁定技术架构的“工程经理” (/plan-eng-review)，到负责视觉审查的“设计师” (/design-review) 等。而这其中，qa/SKILL.md 扮演的就是那位一丝不苟的“QA工程师”，负责对 Web 应用进行系统化的测试与 Bug 修复。

🚀 深度价值：不仅仅是“找Bug”

对全栈开发者而言，qa/SKILL.md 的价值远不止于自动化测试，它更是一种深度工作的引入、质量标准的校准和技能数字化的途径。

1. 全栈质量保障：自动化且深入

它能接管测试流程中从“检测平台”到“原子化修复与验证”的全过程，甚至通过 Playwright 控制一个真实的 Chromium 浏览器来执行测试，确保测试环境更接近用户，能够发现仅在真实浏览器渲染中才会出现的布局错乱、交互失效等复杂问题。

2. 内化的“Y Combinator”质量标准

这份文件是 Garry Tan 二十年产品与工程经验的编码化身。它遵循“Boil the Lake”（把事做完整）的原则，并内置了严格的工作纪律：

原子化修复：为每一个 Bug 修复创建独立的、可验证的 Git 提交。
分级测试策略：提供从“快速检查”到“全面体检”的三级测试深度，灵活适应不同场景。
可量化的健康报告：测试前后会产出严谨的“Ship-readiness”（可发布性）评估，而非模糊描述。

3. 技能数字化与复用的新范式

你手动测试某个特定场景的复杂步骤，可以被固化为 SKILL.md 中的一条规则，AI 能不知疲倦地重复执行。这使个人经验转化为团队资产，摆脱了对个人记忆的依赖。

⚙️ 实战运用：如何在项目中使用？

将 qa/SKILL.md 融入工作流非常直接，通常遵循“触发 - 执行 - 修复 - 决策”模式。

触发与交互方式

只需在完成一个功能或修复后，通过以下方式召唤你的 AI QA 工程师，它便会开始工作：直接对 Claude Code 说 /qa、qa、test this site 或 find bugs。

工作流深度解析：四步法

理解任务：根据指令自动选择测试深度：Quick (仅高危)、Standard (+ 中危) 或 Exhaustive (包括体验问题)。
执行测试：就像一名真实的 QA，它会直接打开浏览器，模拟用户操作，检测各种异常。
原子化修复：发现问题后，直接修改源代码，并为每个 Bug 单独创建一个 Git 提交，实现清晰可追溯的修复。
输出报告：最终生成一份包含修复前后的健康分数和“Ship-readiness”结论的决策报告。

额外限制：若你只需要一份评估报告而不希望 AI 直接修改代码，可以使用 /qa-only 命令。

💎 总结

qa/SKILL.md 以及它所代表的 gstack 系统，为全栈开发者的交付流程引入了体系化的质量保障和工程纪律。它把“勤奋的 QA 专家”这一角色，变成了一个可被任何开发者随时调用的技能。当 qa/SKILL.md 与其他角色（如 CEO、工程经理）按特定顺序串联起来，便构成了一条“从想法到上线”的完整 AI 驱动开发流水线。这或许代表了未来的一种范式：开发者的核心竞争力，越来越体现在定义流程、控制质量和做出关键决策，而非实现细节的每一行代码。

你打算在自己的项目里试试这个“AI QA工程师”吗？如果有具体的测试场景或者对 gstack 其他技能好奇，随时可以再问我～

实用gstack技能 —— QA