2025-05-15 简讯 : OpenAI “Stargate” 项目延期

头条

OpenAI “Stargate” 项目延期

https://techcrunch.com/2025/05/12/openais-stargate-project-reportedly-struggling-to-get-off-the-ground-thanks-to-tariffs/

据报道，由于经济不稳定导致投资者犹豫，OpenAI 5000亿美元的“Stargate”数据中心计划进展艰难。

谷歌的人工智能初创企业基金

https://blog.google/technology/google-labs/ai-futures-fund/

谷歌的人工智能未来基金将投资使用DeepMind人工智能工具的初创企业，并提供模型使用权限、云服务额度、专家支持以及潜在的直接资金支持。

谷歌将加入人工智能编程助手竞赛

https://links.tldrnewsletter.com/hjRJ5g

据报道，谷歌将于5月20日的I/O大会上推出一款人工智能软件开发助手，它能助力完整的开发生命周期。此举让谷歌在日益拥挤的人工智能编码领域，直接与Anthropic的Claude Code、OpenAI的Windsurf以及众多初创公司展开竞争。此外，Gemini可能会与增强现实眼镜进行整合。

DEEP DIVES & ANALYSIS

VLM的格局与进展

https://huggingface.co/blog/vlms-2025

Hugging Face 概述了视觉语言模型是如何通过更小、更强大的架构取得进展的，实现了推理、视频理解和多模态智能体功能。

亚马逊仓库存储机器人展现潜力与局限

https://arxiv.org/abs/2505.04572

亚马逊的定制堆垛机器人在仓库作业中达到了人类的水平，凸显了当前机器人技术的前沿情况——其专用硬件和人工智能视觉能够大规模成功处理各类物品，但14%的失误率表明，尽管已有重大进展，仓库完全自动化为何仍难以实现。

随着需求减弱，中国人工智能数据中心热潮面临崩溃

https://www.technologyreview.com/2025/03/26/1113802/china-ai-data-centers-unused/amp/

中国人工智能基础设施热潮导致严重产能过剩，500多个新数据中心80%的计算资源闲置。DeepSeek的R1模型从根本上改变了市场格局，需求从注重训练的硬件转向推理优化的硬件，致使许多设施过时。尽管市场有所调整，中国仍在大力投资基础设施，以抗衡美国如5000亿美元“Stargate”计划等举措。

工程

OpenAI的健康基准测试

https://links.tldrnewsletter.com/8DyQQa

OpenAI的HealthBench是与262位医生共同开发的一个基准，用于在真实医疗对话场景中评估人工智能模型。

大语言模型（LLMs）在多轮对话中“迷失方向”（GitHub 仓库）

https://github.com/microsoft/lost_in_conversation

大语言模型（LLMs）在多轮对话中的表现明显更差，由于不可靠以及过早做出错误假设，任务完成率平均下降39% 。

通用机器人政策框架（GitHub 仓库）

https://github.com/opendrivelab/univla

UniVLA通过推断以任务为中心的潜在动作，能够从各种机器人实体的无标签视频中进行策略学习。

2025-05-15 简讯 : OpenAI “Stargate” 项目延期