头条
OpenAI “Stargate” 项目延期
据报道,由于经济不稳定导致投资者犹豫,OpenAI 5000亿美元的“Stargate”数据中心计划进展艰难。
谷歌的人工智能初创企业基金
https://blog.google/technology/google-labs/ai-futures-fund/
谷歌的人工智能未来基金将投资使用DeepMind人工智能工具的初创企业,并提供模型使用权限、云服务额度、专家支持以及潜在的直接资金支持。
谷歌将加入人工智能编程助手竞赛
https://links.tldrnewsletter.com/hjRJ5g
据报道,谷歌将于5月20日的I/O大会上推出一款人工智能软件开发助手,它能助力完整的开发生命周期。此举让谷歌在日益拥挤的人工智能编码领域,直接与Anthropic的Claude Code、OpenAI的Windsurf以及众多初创公司展开竞争。此外,Gemini可能会与增强现实眼镜进行整合。
DEEP DIVES & ANALYSIS
VLM的格局与进展
https://huggingface.co/blog/vlms-2025
Hugging Face 概述了视觉语言模型是如何通过更小、更强大的架构取得进展的,实现了推理、视频理解和多模态智能体功能。
亚马逊仓库存储机器人展现潜力与局限
https://arxiv.org/abs/2505.04572
亚马逊的定制堆垛机器人在仓库作业中达到了人类的水平,凸显了当前机器人技术的前沿情况——其专用硬件和人工智能视觉能够大规模成功处理各类物品,但14%的失误率表明,尽管已有重大进展,仓库完全自动化为何仍难以实现。
随着需求减弱,中国人工智能数据中心热潮面临崩溃
https://www.technologyreview.com/2025/03/26/1113802/china-ai-data-centers-unused/amp/
中国人工智能基础设施热潮导致严重产能过剩,500多个新数据中心80%的计算资源闲置。DeepSeek的R1模型从根本上改变了市场格局,需求从注重训练的硬件转向推理优化的硬件,致使许多设施过时。尽管市场有所调整,中国仍在大力投资基础设施,以抗衡美国如5000亿美元“Stargate”计划等举措 。
工程
OpenAI的健康基准测试
https://links.tldrnewsletter.com/8DyQQa
OpenAI的HealthBench是与262位医生共同开发的一个基准,用于在真实医疗对话场景中评估人工智能模型。
大语言模型(LLMs)在多轮对话中“迷失方向”(GitHub 仓库)
https://github.com/microsoft/lost_in_conversation
大语言模型(LLMs)在多轮对话中的表现明显更差,由于不可靠以及过早做出错误假设,任务完成率平均下降39% 。
通用机器人政策框架(GitHub 仓库)
https://github.com/opendrivelab/univla
UniVLA通过推断以任务为中心的潜在动作,能够从各种机器人实体的无标签视频中进行策略学习。
其他
记者揭示融入人工智能的微妙方法
一项对路透社、《华盛顿邮报》、VentureBeat、404 Media 等媒体专业人士的调查显示,新闻编辑室在有选择地采用人工智能。他们在转录、数据分析和翻译方面接受人工智能,但拒绝用人工智能创作内容。路透社称,现在约25%的代码由人工智能生成,但许多记者仍持怀疑态度,他们更看重维护受众信任和新闻操守,而非技术效率。
Figma网站构建器
https://www.figma.com/blog/introducing-figma-sites/
Figma推出了Figma Sites,用户能直接在Figma里设计、构建和发布响应式网站,简化了从设计到投产的工作流程。
斑马9B-V2
https://huggingface.co/blog/ibm-ai-platform/bamba-9b-v2
IBM、普林斯顿大学、卡内基梅隆大学(CMU)和伊利诺伊大学厄巴纳-香槟分校(UIUC)发布了Bamba v2,这是一个基于Mamba2的模型,在3万亿个数据令牌上训练后,性能超过了Llama 3.1 8B。Bamba v2利用Mamba2架构实现了快2到2.5倍的推理速度,在L1和L2基准测试中表现出色。该团队计划进一步优化,并邀请社区合作来提升模型性能。
特朗普政府废除拜登时代的人工智能芯片出口管制措施
https://links.tldrnewsletter.com/Wl42Y8
特朗普政府取消了拜登的“人工智能传播规则”,该规则原本会限制美国技术出口。
Manus 扩大免费访问权限
https://threadreaderapp.com/thread/1921943525261742203.html
Manus 取消了等候名单,让更多人能使用其虚拟桌面人工智能代理。所有用户每天可免费完成一项任务,还能一次性获得1000积分奖励,这大大降低了这款此前备受瞩目的自动化工具的使用门槛。
一款模块化多语言大语言模型
https://kyutai.org/2025/04/30/helium.html
拥有20亿参数的大语言模型Helium 1在欧洲语言方面表现出色,且针对设备端使用进行了优化。