
头条
Claude's new constitution
https://www.anthropic.com/news/claude-new-constitution
Anthropic发布了Claude的新constitution。该文件详细描述了Anthropic对Claude价值观和行为的愿景,解释了Claude运营的背景和公司希望Claude成为的实体类型。Constitution是模型训练过程的关键部分,其内容直接影响Claude的行为。本文描述了新constitution的内容以及塑造Anthropic方法的一些考虑因素。
OpenAI的CEO 中东投资者会面,为至少500亿美元的融资轮次筹集资金
OpenAI的首席执行官萨姆·阿尔特曼最近与中东的投资者会面,为可能达到至少500亿美元的新投资轮次筹集资金。他最近访问了该地区,与阿布扎比的一些主要国有基金进行了交谈。这些会谈还处于早期阶段,金额可能会改变。OpenAI最近还与亚马逊进行了会谈,以筹集至少100亿美元。
Meta的新AI团队本月内部交付了首批关键模型
Meta的人工智能实验室已经内部交付了其首批高调模型。公司的首席技术官安德鲁·博斯沃思表示,这些模型显示出很大潜力。在这些模型能够以可用的方式交付给内部员工和消费者之前,还需要大量的后期训练工作。Meta正在从其2025年的重大赌注中看到有利的回报。未来两年对于推出面向消费者的產品至关重要。
前沿
Pass@K基本上是无稽之谈
https://brooker.co.za/blog/2026/01/21/pass-k.html
Pass@k是k个不同尝试中至少有一个成功的概率。这是用于代理的最常用指标之一。这个指标的问题在于它是指数级宽容的,而与代理交互的人类并没有那么宽容。Pass@k应该是很少使用的指标,并且每次使用时都需要仔细论证。
使用SGLang进行GLM4-MoE推理
https://lmsys.org/blog/2026-01-21-novita-glm4/
Novita AI推出了使用SGLang对GLM4-MoE模型的性能优化,实现了更快的首次令牌时间和更好的令牌生成速度,适用于代理编码工作负载。
Claude Code #3
https://thezvi.substack.com/p/claude-codes-3
这篇文章包含了一个关于Claude Code的新闻、教程、技巧和文章的精选列表。它涵盖了最近的升级、补充Claude Code的工具等。该文章提供了如何通过Claude Code提升技能的建议,以及对该技术发展方向的预测。
研究
1150位高级技术和业务领导者关于AI和自动化的分享
https://camunda.com/state-of-agentic-orchestration-and-automation/
AI无处不在,但有些东西阻碍了组织在生产环境中扩展和管理它们。超过1000位高级技术和业务领导者向Camunda分享了他们的挑战。在这份报告中,你会看到团队是如何管理风险并改进编排以交付可靠的AI代理的。
Devon Review:AI停止糟糕代码
https://cognition.ai/blog/devin-review
Devon Review是一个使用AI和用户体验来扩大人类对复杂代码差异理解的代码审查工具。目前免费,适用于任何公共或私有的GitHub PR。该工具在PR流程的每个步骤都有帮助。它允许开发人员在不离开审查的情况下讨论更改。
MCP不是问题,而是你的服务器:构建MCP服务器的最佳实践
https://www.philschmid.de/mcp-best-practices
当模型上下文协议(MCP)一年前爆发时,每个人都急于构建MCP服务器。一年后,大多数MCP服务器令人失望。虽然开发者将问题归咎于协议,但企业采用却讲述着不同的故事。公司正在部署MCP服务器,集成也已上线。本文分析了MCP服务器失败的原因,构建有效MCP服务器的最佳实践,以及Skill和MCP如何互补。
多路径思维用于推理任务
https://github.com/GMLR-Penn/Multiplex-Thinking
这个实现引入了令牌级别的分支合并推理,以实现更具表达力的多路径计算,同时保持令牌表示紧凑。
速读
苹果计划将Siri打造成AI聊天机器人
https://techcrunch.com/2026/01/21/apple-plans-to-make-siri-an-ai-chatbot-report-says/
苹果计划将Siri转变为聊天机器人,类似于ChatGPT,预计将在iOS 27中集成。经过改造的Siri,代号为"Campos",将支持语音和文本输入,标志着由于竞争压力的战略转变。苹果在评估了OpenAI和Anthropic等选项后,选择了Google的Gemini作为其AI合作伙伴。
Notion正在开发自定义MCPS、Workers和计算机使用功能
https://www.testingcatalog.com/notion-testing-custom-mcps-workers-and-computer-use-agent/
Notion正在扩展其自定义代理平台,包括Slack集成,并计划为自动化开发日历和邮件连接器。与第三方服务如Cursor、Linear和Ramp的集成正在开发中,以增强项目管理和金融任务。新的部分如Feed、Library和Workers将使开发人员能够创建自定义集成,而AI功能如AI协作者则增强了生产力。