Claude Code 的上下文管理

在 Claude Code 中，上下文管理（Context Management） 是指高效利用大语言模型（LLM）有限的“上下文窗口”（Context Window，即模型一次能处理的 Token 数量）的技术和策略。

简单来说，就是如何让 AI 在有限的“内存”里记住最重要的信息，同时丢弃不必要的细节，以节省成本并提高回答质量。

这是一种“工具辅助 + 人为优化”的混合模式。

以下是具体的拆解：

Claude Code 内置了一些机制来减轻开发者的负担，你不需要手动去删除每一条旧消息：

自动压缩（Auto-Compaction）：这是 Claude Code 最核心的自带技术。当对话历史达到一定长度（例如填满上下文窗口的 10%-20% 或达到特定缓冲阈值）时，它会自动将之前的对话历史“压缩”成高信息密度的摘要。它会保留关键决策和结果，丢弃冗余的对话细节。
智能加载（Smart Loading）：对于 skills（技能）等功能，Claude Code 采用了类似“懒加载”的策略。它只将技能的描述（Front Matter）放入上下文，只有在真正调用该技能时，才会加载具体的执行脚本或详细指令。这大大节省了 Token。
初始化摘要（Init Summary）：当你使用 /init 命令时，Claude Code 会扫描整个项目文件，生成一个 CLAUDE.md 文件。这个文件是项目结构的摘要，而不是把所有代码文件的全文都塞进上下文。这样 AI 就能在不读取所有文件的情况下“懂”你的项目-。

尽管有自动化功能，但上下文管理目前仍是限制 AI 表现的最大瓶颈。为了获得最佳效果（高性能、低成本），开发者必须掌握以下主动管理技术：

优化 CLAUDE.md（项目大脑）：
- 不要堆砌文档：不要把整个 API 文档或大型 Style Guide 直接粘贴进去，这会导致“上下文腐烂”（Context Rot）。
- 保持精简：通过 /init 生成摘要，手动修剪不必要的规则，将文件控制在 200-500 行以内。
- 分层管理：利用 .Claude/rules 文件夹将规则拆分成小文件（如 code-style.md, testing.md），让 AI 按需读取，而不是通过一个巨大的文件灌输所有规则。
慎用 MCP 工具（Model Context Protocol）：
- MCP 工具（如连接 GitHub 或 Chrome 的插件）非常消耗 Token。仅仅挂载几个 MCP 工具可能会在还没开始对话前就消耗掉 20% 的上下文额度-。
- 技巧：如果某个 MCP 工具太臃肿，开发者应该考虑将其功能转化为轻量级的 skill（技能脚本），因为 Skill 比 MCP 更节省 Token。
善用 Plan Mode（计划模式）：
- 在开始写代码前，先进入 plan mode 让 AI 思考和规划。这避免了 AI 在 build 阶段进行无效的尝试和错误修复，从而节省大量的 Token 和时间。
主动监控与清理：
- 使用 /cost 命令随时查看 Token 消耗。
- 使用 /compact 命令手动强制压缩上下文。
- 使用 /clear 命令在切换任务时清空上下文，避免旧任务的信息干扰新任务。

Claude Code 自带的技术（如自动压缩）能让你“及格”，但要达到“优秀”，开发者必须掌握上下文管理。

如果不主动管理，项目稍微复杂一点，Token 消耗就会爆炸，AI 也会因为上下文充满了垃圾信息（Context Rot）而变笨。正如 Peter Steinberger 所说，高效使用这些工具也是一种需要学习的新技能。