2025-10-22 简讯 : 阿里云称新的池化系统可将英伟达GPU使用率降低82%


头条


阿里云称新的池化系统可将英伟达GPU使用率降低82%

https://www.scmp.com/business/article/3329450/alibaba-cloud-claims-slash-nvidia-gpu-use-82-new-pooling-system

阿里云新推出的Aegaeon系统将英伟达GPU的使用量减少了82%,把大型AI模型所需的GPU数量从1192个降至213个。Aegaeon在其模型市场进行了内测,通过集中GPU算力解决资源低效问题。这种集中方式能让一个GPU为多个模型服务,优化了大语言模型(LLM)的并发工作负载管理。

谷歌地图现已集成到Gemini API中

https://blog.google/technology/developers/grounding-google-maps-gemini-api/

谷歌地图现已集成到Gemini API中,开发者可以把地图数据融入具备地理空间感知能力的AI应用。该工具能提供精准的定位回复,可用于旅游、房地产、零售和物流等领域。它与谷歌搜索结合后,还能进一步提升回复质量,提供结构化数据和实时信息。

苹果员工对早期iOS 26.4版本中Siri的表现“有担忧”

https://9to5mac.com/2025/10/19/apple-employees-concerned-by-early-ios-26-4-apple-intelligence-sir-version/

苹果工程师在测试早期的iOS 26.4版本时,对Siri的表现有所担忧,尽管开发时间已经延长。内部团队正在研发两个Siri模型,一个使用设备端模型,另一个由谷歌Gemini提供支持。外界对苹果的人工智能战略仍存疑虑,这可能会导致其依赖外部解决方案。


深度分析


与安德烈·卡帕西一起召唤幽灵

https://www.youtube.com/watch

在一场广泛的对话中,安德烈·卡帕西探讨了通用人工智能(AGI)的经济影响、强化学习的局限性、自动驾驶研究的经验教训,以及他对未来教育的展望。

安德烈·卡帕西谈通用人工智能时间表、动物与幽灵等话题

https://threadreaderapp.com/thread/1979644538185752935.html

安德烈·卡帕西最近参加了一档播客节目,在节目里他聊了通用人工智能(AGI)的发展时间、动物与幽灵、强化学习、人工智能智能体,还有工作自动化等话题。播客里有些解释没说明白。这篇文章对卡帕西在播客里聊的话题进行了拓展,来把事情讲清楚。文章还附上了卡帕西之前对这些话题讨论的链接。

使用人工智能的实用指南

https://www.oneusefulthing.org/p/an-opinionated-guide-to-using-ai

人们购买付费AI订阅服务时最常犯的错误,就是使用自动模式。在这种模式下,系统会选择性能较差的模型。其实,大家应该手动选择更强大、在实际工作中更少出错的智能模式。本指南涵盖了一些实用建议,比如什么时候用免费模型就够了,什么时候该花20美元订阅付费服务;为什么以前在旧模型上管用的提问技巧现在不管用了;以及为什么要明确要求AI扮演批评者的角色,以免和一个只会附和的“老好人”对话。


工程


探索OpenAI的深度研究API模型O4-MINI-DEEP-RESEARCH

https://til.simonwillison.net/llms/o4-mini-deep-research

o4-mini深度研究模型的输入/输出代币费用为每百万2美元/8美元。它只能通过响应API使用。OpenAI建议在后台模式下运行。本文快速介绍一下该模型的能力。

用于边缘人工智能的珊瑚神经处理单元

https://developers.googleblog.com/en/introducing-coral-npu-a-full-stack-platform-for-edge-ai/

谷歌的Coral NPU是一个开源平台,专为低功耗、始终在线的边缘人工智能设计。它能解决边缘设备和可穿戴设备的碎片化、性能和隐私等关键问题。

时态图上的共形预测

https://arxiv.org/abs/2507.02151

NCPNET通过基于扩散的非一致性得分和效率感知优化,将共形预测应用于动态图。


其他


我们正处于人工智能研究的“绅士科学家”时代

https://www.seangoedecke.com/ai-and-informal-science/

在科学发展早期,新发现很简单。很多发现都是在培养兴趣爱好时获得的。要想获得2026年诺贝尔物理学奖,你得是全身心投入物理学领域的物理学家。人工智能研究仍处于“科学发展早期”阶段。虽然很多论文看起来复杂,但人工智能研究的发现往往没那么复杂。我们对人工智能能力的很多了解都来自用户的非正规实验。

英伟达展示其首款在美国制造的图灵晶圆

https://www.engadget.com/big-tech/nvidia-shows-off-its-first-blackwell-wafer-manufactured-in-the-us-192836249.html

英伟达展示了在亚利桑那州凤凰城台积电半导体制造厂生产的首批Blackwell晶圆。Blackwell 架构现已可量产。英伟达仍在扩大其在美国的制造版图。它计划通过与台积电、富士康等公司合作,在美国投入5万亿美元建设人工智能基础设施。

生成式AI的全球行业趋势

https://www.similarweb.com/corp/wp-content/uploads/2025/10/attachment-Global-AI-Tracker-1.pdf

这份报告研究了生成式AI的全球行业趋势,数据截至10月10日。它涵盖了通用AI工具、角色与聊天、设计与图像生成、写作与内容创作、教育科技AI、客户支持等行业。报告统计的是域名层面的总访问量,未统计API使用情况或集成情况。

谷歌人工智能工作室更新

https://blog.google/technology/developers/ai-studio-updates-more-control/

谷歌AI Studio推出了新的用户体验改进,以减少操作阻碍,统一开发者工作区。

OpenAI“丢脸”的数学能力

https://techcrunch.com/2025/10/19/openais-embarrassing-math/

Meta的扬·勒昆和DeepMind首席执行官杰米斯·哈萨比斯公开嘲讽了OpenAI。此前OpenAI副总裁凯文·韦尔称GPT - 5解决了10个此前未解的埃尔德什问题,但维护该问题列表的数学家澄清说,这些问题标记为“未解决”只是因为他个人不知道解法。

博通第五大客户(价值100亿美元)不是苹果,也不是XAI

https://threadreaderapp.com/thread/1978834774786445562.html

安途普公司正从博通购买张量处理单元(TPU)。

WhatsApp 修改条款,禁止通用聊天机器人使用其平台

https://techcrunch.com/2025/10/18/whatssapp-changes-its-terms-to-bar-general-purpose-chatbots-from-its-platform/

从1月15日起,Meta将禁止AI模型供应商在WhatsApp上分发他们的AI助手。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容