
头条
Thinking Machines 以120亿美元估值融资20亿美元
没有营收也没有产品,这位前OpenAI首席技术官的初创公司从安德森·霍洛维茨基金、英伟达等公司那里获得了有史以来规模最大的种子轮融资之一。该团队三分之二的成员曾是OpenAI的员工。
英伟达将恢复在中国销售H20 GPU
https://blogs.nvidia.com/blog/nvidia-ceo-promotes-ai-in-dc-and-china/
英伟达首席执行官黄仁勋证实,在美国政府给予许可保证后,计划重启向中国销售H20 GPU,并宣布推出一款全新的、完全合规的RTX PRO GPU,专为中国工业人工智能应用打造。
VoxTral:Mistral 的开源音频模型
https://mistral.ai/news/voxtral
Mistral 发布了其首个开源音频模型套件Voxtral。它有一个供大规模使用的240亿参数模型和一个供边缘部署的30亿参数版本。
深度分析
在OpenAI工作的感悟
https://calv.info/openai-reflections
一位前OpenAI员工分享了对公司文化和使命的个人感悟,称这里工作影响独特但情况复杂。这篇帖子让人了解到关键时期的内部氛围。
Grok 可用于多种事务
https://thezvi.substack.com/p/grok-4-various-things
xAI的目标是推出能被称作“世界上最智能的人工智能”的产品,而且它成功找到了能支撑这一说法的基准测试。然而,这些基准测试具有误导性。虽说Grok 4有很强的原始智能,但在大多数实际应用中,它似乎不如OpenAI的o3。这篇文章将更细致地审视Grok 4的能力。
工程
上下文衰减:增加输入令牌如何影响大语言模型(LLM)性能
https://research.trychroma.com/context-rot
随着输入长度增加,大语言模型(LLM)性能显著下降,即便在文本检索和复制这类简单任务上也是如此。多项对照实验显示,就连前沿模型也无法统一处理上下文,输入越长,性能就越不可靠。
验证的不对称性与验证者定律
https://www.jasonwei.net/blog/asymmetry-of-verification-and-verifiers-law
验证的不对称性是指有些任务验证起来比解决起来要容易得多。这种例子随处可见,比如数独游戏,解起来要花很多时间,但检查任何一个给定的答案是否正确却很简单。关于验证的不对称性,一个最重要的认识是,借助有关任务的特殊信息,有可能增强这种不对称性——例如,手头有答案的时候,检查测试答案就很简单。人工智能在可验证的任务上可能会表现得好得多,因为解决可验证的任务要容易得多。
Block开源Goose AI智能体(GitHub仓库)
https://github.com/block/goose
一种编码人工智能代理,支持任何大语言模型后端,包括本地模型,有桌面版和命令行界面。和典型的编码代理一样,它能处理从规划到测试的端到端开发流程。
其他
风险“泡沫”:改进对进攻性网络安全主体的评估
https://www.polarislab.org/#/blog/cybersecurity-risk-bubble
提升用于攻击性网络安全任务的人工智能智能体既便宜又容易:普林斯顿大学的研究人员仅花费36美元的计算时间,通过提示优化和自我训练等简单技术,就将攻击成功率提高了40%以上。静态安全评估忽视了这种 “风险泡沫”,即对手可以低成本地调整开源模型,使其超越原本的安全设定,在网络安全领域尤其如此,因为明确的成功信号能实现快速迭代。
给超级智能系上安全带
https://underwriting-superintelligence.com/
本杰明·富兰克林发现的激励飞轮,自费城因火灾威胁发展而诞生以来,一直是平衡新技术浪潮中进步与安全的核心。它靠自身不足以快速在人工智能领域发挥作用,需要外力推动。本文概述了到2030年企业家和政策制定者在智能体、基础模型和数据中心方面必须采取的25项行动。如果西方放缓人工智能发展进程,中国可能主导21世纪,但如果西方不顾后果地加速发展,意外事件将阻碍进步,就像核电那样。
获亚马逊支持的Anthropic推出适用于金融服务的Claude AI
https://www.cnbc.com/2025/07/15/claude-ai-financial-anthropic-amazon.html
Anthropic的金融分析解决方案能帮助金融专业人士做出投资决策、分析市场和开展研究。
谷歌的人工智能安全举措
https://blog.google/technology/safety-security/cybersecurity-updates-summer-2025/
谷歌介绍了新的人工智能驱动工具及合作项目,旨在加强网络安全,其中包括智能系统和更新。
宣布亚马逊 S3 Vectors
亚马逊S3 Vectors是首个原生支持存储和查询向量的云对象存储。