2026-01-26 简讯 : Claude's new constitution


头条


Claude's new constitution

https://www.anthropic.com/news/claude-new-constitution

Anthropic发布了Claude的新constitution。该文件详细描述了Anthropic对Claude价值观和行为的愿景,解释了Claude运营的背景和公司希望Claude成为的实体类型。Constitution是模型训练过程的关键部分,其内容直接影响Claude的行为。本文描述了新constitution的内容以及塑造Anthropic方法的一些考虑因素。

OpenAI的CEO 中东投资者会面,为至少500亿美元的融资轮次筹集资金

https://www.bloomberg.com/news/articles/2026-01-21/openai-s-altman-meets-mideast-investors-for-50-billion-round

OpenAI的首席执行官萨姆·阿尔特曼最近与中东的投资者会面,为可能达到至少500亿美元的新投资轮次筹集资金。他最近访问了该地区,与阿布扎比的一些主要国有基金进行了交谈。这些会谈还处于早期阶段,金额可能会改变。OpenAI最近还与亚马逊进行了会谈,以筹集至少100亿美元。

Meta的新AI团队本月内部交付了首批关键模型

https://www.reuters.com/technology/metas-new-ai-team-has-delivered-first-key-models-internally-this-month-cto-says-2026-01-21

Meta的人工智能实验室已经内部交付了其首批高调模型。公司的首席技术官安德鲁·博斯沃思表示,这些模型显示出很大潜力。在这些模型能够以可用的方式交付给内部员工和消费者之前,还需要大量的后期训练工作。Meta正在从其2025年的重大赌注中看到有利的回报。未来两年对于推出面向消费者的產品至关重要。


前沿


Pass@K基本上是无稽之谈

https://brooker.co.za/blog/2026/01/21/pass-k.html

Pass@k是k个不同尝试中至少有一个成功的概率。这是用于代理的最常用指标之一。这个指标的问题在于它是指数级宽容的,而与代理交互的人类并没有那么宽容。Pass@k应该是很少使用的指标,并且每次使用时都需要仔细论证。

使用SGLang进行GLM4-MoE推理

https://lmsys.org/blog/2026-01-21-novita-glm4/

Novita AI推出了使用SGLang对GLM4-MoE模型的性能优化,实现了更快的首次令牌时间和更好的令牌生成速度,适用于代理编码工作负载。

Claude Code #3

https://thezvi.substack.com/p/claude-codes-3

这篇文章包含了一个关于Claude Code的新闻、教程、技巧和文章的精选列表。它涵盖了最近的升级、补充Claude Code的工具等。该文章提供了如何通过Claude Code提升技能的建议,以及对该技术发展方向的预测。


研究


1150位高级技术和业务领导者关于AI和自动化的分享

https://camunda.com/state-of-agentic-orchestration-and-automation/

AI无处不在,但有些东西阻碍了组织在生产环境中扩展和管理它们。超过1000位高级技术和业务领导者向Camunda分享了他们的挑战。在这份报告中,你会看到团队是如何管理风险并改进编排以交付可靠的AI代理的。

Devon Review:AI停止糟糕代码

https://cognition.ai/blog/devin-review

Devon Review是一个使用AI和用户体验来扩大人类对复杂代码差异理解的代码审查工具。目前免费,适用于任何公共或私有的GitHub PR。该工具在PR流程的每个步骤都有帮助。它允许开发人员在不离开审查的情况下讨论更改。

MCP不是问题,而是你的服务器:构建MCP服务器的最佳实践

https://www.philschmid.de/mcp-best-practices

当模型上下文协议(MCP)一年前爆发时,每个人都急于构建MCP服务器。一年后,大多数MCP服务器令人失望。虽然开发者将问题归咎于协议,但企业采用却讲述着不同的故事。公司正在部署MCP服务器,集成也已上线。本文分析了MCP服务器失败的原因,构建有效MCP服务器的最佳实践,以及Skill和MCP如何互补。

多路径思维用于推理任务

https://github.com/GMLR-Penn/Multiplex-Thinking

这个实现引入了令牌级别的分支合并推理,以实现更具表达力的多路径计算,同时保持令牌表示紧凑。


速读


苹果计划将Siri打造成AI聊天机器人

https://techcrunch.com/2026/01/21/apple-plans-to-make-siri-an-ai-chatbot-report-says/

苹果计划将Siri转变为聊天机器人,类似于ChatGPT,预计将在iOS 27中集成。经过改造的Siri,代号为"Campos",将支持语音和文本输入,标志着由于竞争压力的战略转变。苹果在评估了OpenAI和Anthropic等选项后,选择了Google的Gemini作为其AI合作伙伴。

Notion正在开发自定义MCPS、Workers和计算机使用功能

https://www.testingcatalog.com/notion-testing-custom-mcps-workers-and-computer-use-agent/

Notion正在扩展其自定义代理平台,包括Slack集成,并计划为自动化开发日历和邮件连接器。与第三方服务如Cursor、Linear和Ramp的集成正在开发中,以增强项目管理和金融任务。新的部分如Feed、Library和Workers将使开发人员能够创建自定义集成,而AI功能如AI协作者则增强了生产力。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容