2025-07-14 简讯 : Windsurf CEO 跳槽至谷歌;OpenAI收购计划告吹


头条


Windsurf CEO 跳槽至谷歌;OpenAI收购计划告吹

https://techcrunch.com/2025/07/11/windsurfs-ceo-goes-to-google-openais-acquisition-falls-apart/

在OpenAI 30亿美元的收购尝试失败后,谷歌DeepMind聘请了Windsurf首席执行官瓦伦·莫汉、联合创始人道格拉斯·陈以及关键研究人员。谷歌获得Windsurf技术的非独家许可,可在不直接掌控的情况下提升其人工智能编码能力。Windsurf因失去顶尖人才面临不确定性,目前由杰夫·王担任临时首席执行官,继续提供人工智能编码工具。

OpenAI再次推迟其开放模型的发布

https://techcrunch.com/2025/07/11/openai-delays-the-release-of-its-open-model-again/

OpenAI再次推迟其开放模型的发布。该公司原计划下周发布该模型。为进行进一步安全测试,发布已无限期推迟。OpenAI开放模型的发布是今年夏天最受期待的人工智能事件之一。

苹果将认真考虑收购米斯特拉尔

https://analyticsindiamag.com/ai-news-updates/apple-will-seriously-consider-buying-mistral-report/

苹果正认真考虑收购法国人工智能初创公司米斯特拉尔。该公司在七轮融资中总共筹集了11亿欧元。多年来,米斯特拉尔推出了一系列大小语言模型,其光学字符识别功能取得显著成效。它目前是欧洲最大的人工智能初创公司。收购这家人工智能初创公司将有力推动苹果的人工智能生态系统发展。

MoonShot AI的Kimi K2在关键基准测试中表现超过GPT-4

https://links.tldrnewsletter.com/PGkNVR

中国初创公司月之暗面人工智能(Moonshot AI)发布了Kimi K2,这是一个具有1万亿参数的开源模型,在复杂的智能体任务上能与专有模型相媲美。该模型使用新型的MuonClip优化器进行训练,可防止困扰模型开发的训练崩溃问题,有可能节省数百万的计算成本。


深度分析


异步推理的机器人控制

https://huggingface.co/blog/async-robot-inference

异步推理通过将动作预测与执行解耦,帮助机器人策略运行更顺畅,减少空闲时间,并提高现实场景中的响应能力。

XAI的Grok 4:前沿性能的压力与马斯克的偏爱因素

https://www.interconnects.ai/p/grok-4-an-o3-look-alike-in-search

xAI于7月9日推出了Grok 4。这篇文章详细介绍了该模型的方方面面。包括性能概述、早期反馈调查、Grok 4 Heavy测试,以及与OpenAI的o3 pro对比。文章还探讨了xAI缺乏差异化产品、争议和文化风险等问题。尽管Grok 4是一款令人印象深刻的模型,但它存在严重的行为风险和文化方面的担忧。


工程


当下,强化学习(RL)规模化正风靡一时。

https://threadreaderapp.com/thread/1944435412489171119.html

强化学习(RL)将继续带来更多成果,因为如果运用得当,它能发挥更大作用、对反馈更敏感,且优于监督微调。随着部署长度不断增加,研究人员可能会对强化学习有更多发现。还有更多 “S 曲线” 有待发现,这些可能是大语言模型特有的,在游戏或机器人等环境中找不到类似情况。

如何将强化学习(RL)扩展到每秒10^26次浮点运算

https://blog.jxmo.io/p/how-to-scale-rl-to-1026-flops

强化学习是构建前沿水平人工智能模型的下一个训练技术。用更多数据训练它会让它表现更好。目前的扩展方法既杂乱又复杂。找到一种利用强化学习在网络上进行下一个词预测的方法,能让模型从一般的网络数据中进行推理,而不只是从数学和代码中。

强化学习(RL)即将迎来的GPT-3时刻

https://www.mechanize.work/blog/the-upcoming-gpt-3-moment-for-rl/

GPT-3 表明,扩大语言模型规模能释放强大性能,常比精心微调的模型表现更好。在 GPT-3 之前,要实现最先进的性能,得先预训练模型,再针对特定任务进行微调。如今的强化学习(RL)仍困于类似 GPT 之前的范式。这种方法有根本局限,所产生的能力泛化性差,导致性能脆弱,在训练所见的精确情境之外就会迅速下降。强化学习领域很快将转向在数千种不同环境中进行大规模训练。有效做到这一点将产生具备强大能力、能快速适应全新任务的强化学习模型——要实现这一点,所需训练环境的规模和多样性将远超目前任何可用的环境。


其他


SpaceX将向XAI投资20亿美元

https://links.tldrnewsletter.com/4QoHWW

据报道,SpaceX同意在xAI的50亿美元融资中投资20亿美元,马斯克正不断整合其企业帝国。

适用于图形用户界面(GUI)智能体的虚拟桌面环境

https://huggingface.co/blog/screenenv

ScreenEnv是一个Python库,可在Docker中启动Ubuntu桌面环境,能让智能体与真实的图形用户界面应用程序交互,还支持用于无缝部署的模型上下文协议 。

GROK 4 HEAVY不会透露其系统提示

https://links.tldrnewsletter.com/KhSYjc

Grok 4 Heavy是Grok 4“更深入思考”的版本,目前仅在每月300美元的套餐中可用,它采取了措施防止共享其系统提示。

Meta收购语音初创公司Play AI

https://techcrunch.com/2025/07/13/meta-acquires-voice-startup-play-ai/

打造逼真人工智能语音的Play AI,将与Meta在人工智能伴侣和可穿戴设备方面的业务合并。

英特尔前首席执行官推出一项衡量人工智能对齐程度的基准测试

https://techcrunch.com/2025/07/10/former-intel-ceo-launches-a-benchmark-to-measure-ai-alignment/

英特尔前首席执行官帕特·基辛格与Gloo合作推出了Flourishing AI(FAI),用以衡量人工智能模型与人类价值观的契合度。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容