2026-02-05 简讯 : Anthropic计划在超级碗期间发布Sonnet 5

头条

Anthropic计划在超级碗期间发布Sonnet 5

https://www.testingcatalog.com/anthropic-is-about-to-drop-sonnet-5-during-super-bowl-week

Anthropic计划在超级碗期间发布Claude Sonnet 5，早期测试显示其数学和编码能力强劲，可能超越Claude Opus 4.5。该模型拥有128K上下文窗口，旨在为开发者提供成本效益高的解决方案。其发布可能与超级碗LX周重合，与AI实验室针对ChatGPT和Google Gemini的营销策略保持一致。

OpenAI为MacOS发布了Codex应用

https://links.tldrnewsletter.com/cmcXed

OpenAI发布了一款新的MacOS Codex应用程序，旨在协调多个代理、并行运行任务并管理长期运行的软件项目。该应用目前可供ChatGPT免费版和Go用户使用，付费用户的速率限制翻倍。

xAI加入了SpaceX

https://www.spacex.com/updates#xai-joins-spacex

SpaceX宣布xAI已加入其组织，将埃隆·马斯克的AI实验室与这家航天公司整合。这种合作旨在结合先进的AI研究与航空航天工程，可能加速太空任务中的自主系统和机器人技术。这一合并表明了AI发展与现实硬件和探索倡议的战略一致性。

前沿

教大语言模型学会幽默

https://jokegen.sdan.io/blog

Tinker最近实现了对Moonshot的1万亿参数模型Kimi K2进行后训练。本文探讨了如何通过定性奖励来训练模型。文章展示了如何训练模型将笑话分解为可验证的属性。最终模型可以制作笑话并解释为什么笑话有趣。文章中提供了模型、代码和数据以供复制。

Clawdbot缺失的层

https://robdodson.me/posts/clawdbots-missing-layers

电子商务的发展需要时间来建立安全基础设施。同样，代理技术也有巨大潜力，但目前充满风险。代理需要一个安全堆栈，就像电子商务一样，每一层处理其他层无法处理的内容。本文讨论了AI代理所需的不同安全层。每层都代表了构建使整个生态系统成为可能的基础架构的机会。

微调开源大语言模型判断器以超越GPT-5.2

https://www.together.ai/blog/fine-tuning-open-llm-judges-to-outperform-gpt-5-2

像GPT-OSS 120B和Qwen3 235B这样的开源模型使用直接偏好优化(DPO)进行微调，以在人类偏好任务上可能超越GPT-5.2。RewardBench 2用于评估，突出了数学和安全等领域这些模型的优势。这些开源模型成本效益高，提供透明度，能够更好地与特定用例对齐，同时显著减少对昂贵封闭源替代方案的依赖。

研究

上下文管理和MCP

https://cra.mr/context-management-and-mcp

今天的模型不可避免地会出现上下文旋转问题，你无法绕过它。处理这个问题的最佳方式是利用子代理。子代理方法为解决问题提供了极大的灵活性。虽然不是完美的解决方案，但在许多使用场景中比其他当前修复方法好得多，并且接受了模型的局限性。

NVIDIA提出黄金鹅：无限RLVR任务

https://arxiv.org/abs/2601.22975

黄金鹅能够从不可验证的网络文本中合成大规模的可验证奖励(RLVR)任务。由此产生的GooseReason数据集有助于恢复模型在数学、科学和网络安全方面的性能，在多个领域超越了先前的最先进水平。

2026-02-05 简讯 : Anthropic计划在超级碗期间发布Sonnet 5