
头条
Google推出Gemini 3 Flash
https://blog.google/products/gemini/gemini-3-flash/
Google推出了Gemini 3 Flash,这是一个快速、轻量级的模型,旨在以更低的延迟提供前沿级别的智能。它被设计用来帮助用户快速学习、计划和构建各种日常任务和应用。
Google与Meta合作削弱NVIDIA的软件优势
Google和Meta正在合作一个新项目,使Google的张量处理单元更好地运行PyTorch。此举旨在削弱Nvidia在AI计算市场长期以来的主导地位。TorchTPU将消除阻碍TPU芯片采用的关键障碍。它将使现有的基于PyTorch软件构建的基础架构完全兼容TPU。Google正在考虑开源部分软件以加快采用速度。
Grok语音Agent API
https://links.tldrnewsletter.com/1mTsaU
xAI已向所有开发者开放了在特斯拉车辆中使用的Grok语音堆栈。该API在Big Bench Audio中排名第一,首次音频时间低于1秒,每分钟成本仅为0.05美元(是OpenAI实时API的一半)。
前沿
Oracle股价下跌43%,尽管报告了5230亿美元的剩余履约义务
Oracle的股价从9月份的高点下跌了43%,尽管报告了5230亿美元的“剩余履约义务”。其中约3000亿美元来自与OpenAI的五年协议,但分析师对OpenAI(年收入仅约200亿美元)能否支付感到怀疑。Nvidia搁置的1000亿美元OpenAI投资(9月宣布但尚未签署)加剧了人们对AI基础设施中循环交易的焦虑。
AGI确实可能发生—从计算角度看
当前模型严重低估硬件性能:DeepSeek-V3和Llama-4在训练期间只实现了约20%的FLOP利用率,推断运行时的利用率也处于个位数,因为自回归模型受制于从内存加载权重而不是计算。我们看到的模型也是滞后的指标,它们在上一代硬件上训练,这些硬件未针对现代集群的巨大规模和最新训练方法进行优化。
Agent攻击:AI如何摧毁并重建市场护城河
https://www.caseyaccidental.com/p/when-agents-attack-how-ai-collapses
AI agents,如OpenAI发布的那些,通过接管发现、交易和供应工作流程来威胁市场护城河,从而摧毁传统的营销漏斗。市场必须通过优化品牌体验、个性化互动和整合供应来适应,以维持价值。创始人应专注于高频市场,巩固客户关系,并探索新的变现策略,如订阅或数据许可,以保持竞争力。
研究
什么是Claude Code的计划模式?
https://lucumr.pocoo.org/2025/12/17/what-is-plan-mode/
计划模式是Claude Code中的一个功能,它会在用户批准计划前暂停执行。在Claude Code中,计划是一个由Claude在计划模式下写入到Claude计划文件夹的markdown文件。用户可以在Claude执行任务之前查看和编辑计划。这个工具增加了用户界面的复杂性,减少了魔法般的体验。它复制了自然语言已经能做到的事情,使用户体验稍微不那么自然。
使用Opal在Gemini应用中构建交互式迷你应用
https://blog.google/technology/google-labs/mini-apps-opal-gemini-app-experiment/
Opal是一个构建AI驱动迷你应用的工具。现在可以直接在Gemini网页应用中使用。用户可以用它创建实验性的Gems来解锁更定制化的Gemini体验。这个工具可以在Gems管理器中找到。
Chatterbox(GitHub仓库)
https://github.com/resemble-ai/chatterbox
Chatterbox是一个开源的最先进的文本转语音(TTS)模型,支持多语言、情感控制和零样本语音克隆。
速读
Jassy任命27岁亚马逊资深工程师领导AGI组织
https://www.theregister.com/2025/12/17/jassy_taps_peter_desantis_to_run_agi/
Peter DeSantis,AWS实用计算副总裁,将他的两个团队从AWS转移到一个名为“AGI”的单位。该单位将直接向Andy Jassy汇报,即亚马逊的GenAI首席产品市场主管和CEO。AI和与AI相关的计算现在已成为整个亚马逊的事情,而不仅仅是AWS的事情。该单位正在构建非常重要的东西,因此亚马逊将最资深的AWS领导者之一调任负责所有这些工作。
中国“曼哈顿计划”挑战西方AI芯片
中国科学家已经建造了一台工作的EUV光刻机原型,这是价值2.5亿美元的工具,只有ASML知道如何制造,而且美国自2018年以来一直阻止将其出售给中国。一支前ASML工程师团队在高度保密的深圳实验室中逆向工程了这些机器,招募人员获得假身份和高达70万美元的奖金。该原型尚未生产出工作芯片,但有消息人士预计将在2028-2030年实现。
你知道缓存提示或缓存token到底是什么吗?ngrok指南
https://ngrok.com/blog/prompt-caching
缓存提示便宜10倍,速度快85%。真正被缓存的不是响应,而是注意力机制中的K和V矩阵。详见ngrok的精确数学公式。
随着免费计划,OpenAI、Google在印度争夺用户和训练数据
ChatGPT在印度的日活跃用户同比增长600%至7300万,是其美国基地的两倍多,因为OpenAI将其Go计划免费提供了一年。
Opera全球推出Neon浏览器并提供付费早期访问
https://www.testingcatalog.com/icymi-opera-launches-neon-browser-globally/
Opera在全球推出了其Neon浏览器,并提供每月19.90美元的付费早期访问,目标是AI高级用户。
OpenAI正与亚马逊就可能超过100亿美元的投资进行谈判
在另一个循环交易中,OpenAI正寻求来自亚马逊的100亿美元投资,同时达成使用AWS Trainium芯片的协议。