2025-06-11 简讯 : Meta考虑对Scale AI投资超100亿美元

image.png

头条

Meta考虑对Scale AI投资超100亿美元

https://links.tldrnewsletter.com/TQjKKl

对Scale的投资（该公司估值已达140亿美元）凸显出高质量训练数据已成为关键竞争优势。

克劳德政务模式服务美国国家安全客户

https://www.anthropic.com/news/claude-gov-models-for-u-s-national-security-customers

Anthropic为美国国家安全客户推出了Claude Gov模型，用于战略规划、行动支持和情报分析。这些模型在处理机密材料、理解情报背景和解读复杂网络安全数据方面表现出色。它们在政府用户反馈的基础上构建，在满足独特国家安全需求的同时，遵守严格的安全标准。

谷歌Gemini现在能像助手一样处理预定任务了

https://www.theverge.com/news/681762/google-gemini-scheduled-actions-planned-tasks

双子座新的定时行动功能，让AI Pro和AI Ultra订阅者能要求助手在特定时间执行任务。订阅者现在可以要求助手提供每日摘要。用户还能让双子座完成一次性任务，比如在颁奖典礼播出次日对其进行总结。双子座订阅者可以在双子座应用设置中的“定时行动”页面管理计划任务。

深度分析

我们让顶级人工智能模型在一场“外交”游戏中展开竞争

https://every.to/diplomacy

在测试的18个人工智能模型中，OpenAI的o3最为成功。它学会了欺骗，还暗中组建联盟，比如承诺不可能实现的 “四方平局”，说服Claude 4 Opus背叛盟友Gemini 2.5 Pro，之后又将Claude 4 Opus淘汰。Gemini 2.5 Pro是另一个靠闪电战策略获胜的模型，而Claude即便被背叛，也一直寻求和平解决办法。

人工智能公司Anthropic分享其如何使用Claude代码

https://www-cdn.anthropic.com/58284b19e702b49db9302d5b6f135ad8871e7658.pdf

Anthropic发布了详细案例研究，展示10个内部团队如何使用Claude Code。Claude首次尝试只有三分之一的成功率，因此催生了一种“老虎机”式方法：频繁提交，让Claude自主运行，然后要么接受结果，要么重新开始。最成功的团队注重编写详细的Claude.md文档文件，并将复杂工作流程分解为专门的子代理，以取得更好效果。