2025-05-15 简讯 : OpenAI “Stargate” 项目延期


头条


OpenAI “Stargate” 项目延期

https://techcrunch.com/2025/05/12/openais-stargate-project-reportedly-struggling-to-get-off-the-ground-thanks-to-tariffs/

据报道,由于经济不稳定导致投资者犹豫,OpenAI 5000亿美元的“Stargate”数据中心计划进展艰难。

谷歌的人工智能初创企业基金

https://blog.google/technology/google-labs/ai-futures-fund/

谷歌的人工智能未来基金将投资使用DeepMind人工智能工具的初创企业,并提供模型使用权限、云服务额度、专家支持以及潜在的直接资金支持。

谷歌将加入人工智能编程助手竞赛

https://links.tldrnewsletter.com/hjRJ5g

据报道,谷歌将于5月20日的I/O大会上推出一款人工智能软件开发助手,它能助力完整的开发生命周期。此举让谷歌在日益拥挤的人工智能编码领域,直接与Anthropic的Claude Code、OpenAI的Windsurf以及众多初创公司展开竞争。此外,Gemini可能会与增强现实眼镜进行整合。


DEEP DIVES & ANALYSIS


VLM的格局与进展

https://huggingface.co/blog/vlms-2025

Hugging Face 概述了视觉语言模型是如何通过更小、更强大的架构取得进展的,实现了推理、视频理解和多模态智能体功能。

亚马逊仓库存储机器人展现潜力与局限

https://arxiv.org/abs/2505.04572

亚马逊的定制堆垛机器人在仓库作业中达到了人类的水平,凸显了当前机器人技术的前沿情况——其专用硬件和人工智能视觉能够大规模成功处理各类物品,但14%的失误率表明,尽管已有重大进展,仓库完全自动化为何仍难以实现。

随着需求减弱,中国人工智能数据中心热潮面临崩溃

https://www.technologyreview.com/2025/03/26/1113802/china-ai-data-centers-unused/amp/

中国人工智能基础设施热潮导致严重产能过剩,500多个新数据中心80%的计算资源闲置。DeepSeek的R1模型从根本上改变了市场格局,需求从注重训练的硬件转向推理优化的硬件,致使许多设施过时。尽管市场有所调整,中国仍在大力投资基础设施,以抗衡美国如5000亿美元“Stargate”计划等举措 。


工程


OpenAI的健康基准测试

https://links.tldrnewsletter.com/8DyQQa

OpenAI的HealthBench是与262位医生共同开发的一个基准,用于在真实医疗对话场景中评估人工智能模型。

大语言模型(LLMs)在多轮对话中“迷失方向”(GitHub 仓库)

https://github.com/microsoft/lost_in_conversation

大语言模型(LLMs)在多轮对话中的表现明显更差,由于不可靠以及过早做出错误假设,任务完成率平均下降39% 。

通用机器人政策框架(GitHub 仓库)

https://github.com/opendrivelab/univla

UniVLA通过推断以任务为中心的潜在动作,能够从各种机器人实体的无标签视频中进行策略学习。


其他


记者揭示融入人工智能的微妙方法

https://www.cjr.org/feature-2/how-were-using-ai-tech-gina-chua-nicholas-thompson-emilia-david-zach-seward-millie-tran.php

一项对路透社、《华盛顿邮报》、VentureBeat、404 Media 等媒体专业人士的调查显示,新闻编辑室在有选择地采用人工智能。他们在转录、数据分析和翻译方面接受人工智能,但拒绝用人工智能创作内容。路透社称,现在约25%的代码由人工智能生成,但许多记者仍持怀疑态度,他们更看重维护受众信任和新闻操守,而非技术效率。

Figma网站构建器

https://www.figma.com/blog/introducing-figma-sites/

Figma推出了Figma Sites,用户能直接在Figma里设计、构建和发布响应式网站,简化了从设计到投产的工作流程。

斑马9B-V2

https://huggingface.co/blog/ibm-ai-platform/bamba-9b-v2

IBM、普林斯顿大学、卡内基梅隆大学(CMU)和伊利诺伊大学厄巴纳-香槟分校(UIUC)发布了Bamba v2,这是一个基于Mamba2的模型,在3万亿个数据令牌上训练后,性能超过了Llama 3.1 8B。Bamba v2利用Mamba2架构实现了快2到2.5倍的推理速度,在L1和L2基准测试中表现出色。该团队计划进一步优化,并邀请社区合作来提升模型性能。

特朗普政府废除拜登时代的人工智能芯片出口管制措施

https://links.tldrnewsletter.com/Wl42Y8

特朗普政府取消了拜登的“人工智能传播规则”,该规则原本会限制美国技术出口。

Manus 扩大免费访问权限

https://threadreaderapp.com/thread/1921943525261742203.html

Manus 取消了等候名单,让更多人能使用其虚拟桌面人工智能代理。所有用户每天可免费完成一项任务,还能一次性获得1000积分奖励,这大大降低了这款此前备受瞩目的自动化工具的使用门槛。

一款模块化多语言大语言模型

https://kyutai.org/2025/04/30/helium.html

拥有20亿参数的大语言模型Helium 1在欧洲语言方面表现出色,且针对设备端使用进行了优化。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容