
头条
CoreWeave与OpenAI达成119亿美元合同
https://links.tldrnewsletter.com/jIBJFh
CoreWeave在首次公开募股前与OpenAI签署了一份为期五年、价值119亿美元的云计算协议,OpenAI将收购这家英伟达支持的人工智能初创公司的部分股权。
微软探索为Copilot功能开发3D游戏
微软正在为Copilot开发3D游戏体验,重点关注如Babylon.js、three.js和Unity等基于浏览器的引擎。
DeepSeek尚未接受风投资金
https://techcrunch.com/2025/03/10/deepseek-isnt-taking-vc-money-yet-here-are-3-reasons-why/
DeepSeek创始人梁文峰为保持控制权不接受外部投资,依靠其对冲基金High-Flyer的收益来筹集资金。尽管取得成功,但DeepSeek面临诸多挑战,比如中国严格的数据法规,以及因美国出口管制带来的芯片进口限制。虽然DeepSeek目前避开了外部资本,但随着公司开始转向商业化,未来仍有吸引投资的可能。
研究
视觉征求建议书
https://arxiv.org/abs/2503.01785
其中一个趋势是简单可验证的奖励和规模化强化学习。这篇论文将该策略应用于视觉语言模型,取得了巨大成功。
视频绘图工具(GitHub 仓库)
https://yxbian23.github.io/project/video-painter/
一款名为VideoPainter的视频修复新模型能有效整合背景信息,支持任意长度的视频,还使用专门的数据集和基准进行训练与评估。它的设计不止于基础修复,在高级视频处理和相关训练数据创建方面很有潜力。
检测前沿推理模型中的不当行为
https://links.tldrnewsletter.com/QU7BLv
这是OpenAI关于监测高级推理模型思维链的一份报告。前沿推理模型一有机会就会钻空子。报告显示,用大语言模型(LLM)监测其思维链来发现不当利用行为是可行的。惩罚它们的 “坏想法” 并不能阻止大多数不当行为,反而会让它们隐藏意图。
工程
小扩散(GitHub 仓库)
https://github.com/yuanchenyang/smalldiffusion
一个简约、易读且高效的工具包,用于训练扩散模型并从中采样。
飞行更安全:高速无人机的避障技术(GitHub 仓库)
https://github.com/ch9397/fixedwing-monoppo
这个仓库包含一个基于AirSim和JSBSim的、用于固定翼无人机的轻量级深度强化学习避撞系统的实施方案。
其他
通过强化学习教语言模型解数独
https://hrishbh.com/teaching-language-models-to-solve-sudoku-through-reinforcement-learning/
这项研究探索利用强化学习教人工智能语言模型解数独谜题,特别是在Qwen 2.5等模型上采用群体相对策略优化(GRPO),且不依赖外部数据或更大模型的蒸馏。研究设计了一个多方面的奖励系统,强调答案格式正确、方格结构恰当以及解答准确,以此引导模型学习数独所需的逻辑规则和空间推理能力,将它们从文本预测器转变为结构化问题解决器。
人工智能到底会消耗多少能源?好处、坏处与未知情况
https://www.nature.com/articles/d41586-025-00616-z
弗吉尼亚州卡尔佩珀县,为支持生成式人工智能,数据中心建设热潮兴起,严重影响当地电力基础设施。这些设施耗电量巨大,弗吉尼亚州的数据中心本就高度集中,能源需求预计还会上升。分析师因人工智能能耗数据有限而犯难,不过全球预测显示,尽管人工智能蓬勃发展,但数据中心在整体电力增长中仍将占较小比例 。
马斯克仍有可能阻止OpenAI转为盈利性公司。
马斯克要求暂停OpenAI转变为盈利性机构的请求被一名联邦法官驳回,不过该裁决对这一转变表示担忧。2025年将加快审判以处理重组纠纷。OpenAI向盈利模式转变面临监管审查,以及来自法律和人工智能安全层面的潜在挑战。
Gmail的“添加到日历”功能由Gemini提供支持
谷歌Gmail中的Gemini现在能检测邮件里与日历相关的内容,并提供“添加到日历”按钮,方便无缝安排日程。
稳定性人工智能公司聘请Unity的瑞安·埃利斯担任高级副总裁兼产品负责人
https://stability.ai/news/introducing-our-new-svp-head-of-product-ryan-ellis
曾在Unity工作的瑞安·埃利斯已加入Stability AI,负责产品开发,他在实时3D引擎和人工智能驱动的内容创作方面经验丰富。
播客平台Podcastle推出一款拥有超450种AI语音的文本转语音模型
Podcastle推出了Asyncflow v1.0,这是一款人工智能文本转语音模型,提供超450种人工智能语音,且训练成本低。