
头条
OpenAI 准备推出带自定义控制功能的 ChatGPT 群组聊天功能
https://www.testingcatalog.com/openai-readies-chatgpt-group-chats-with-custom-controls/
ChatGPT正在开发新的群聊功能,允许多个用户加入同一场对话,既能互相交流,也能和AI在同一个聊天界面互动。群成员可自定义讨论的系统提示语,还能控制AI的回复时机。该功能可能会随即将到来的季节性更新推出。
实时版 Scribe V2 来袭!
https://elevenlabs.io/blog/introducing-scribe-v2-realtime
Scribe v2 Realtime是一款低延迟的语音转文本模型,能在150毫秒内完成实时转录。它支持超90种语言,专为智能体应用场景打造。该模型在30种常用欧亚语言中的准确率达93.5%。可以通过ElevenLabs的API或在ElevenLabs智能体中直接使用Scribe v2 Realtime。
据报道,杨立昆计划离开Meta
据报道,Meta首席人工智能科学家杨立昆准备离开公司,去开创自己专注于世界模型的事业。他离职时,Meta正在进行大规模人工智能业务重组,包括成立Meta超级智能实验室,而且人工智能发展战略调整后内部矛盾不断。
字节跳动推出中国最便宜的AI代码助手,每月仅需1.3美元
豆包代码种子模型是一款代码助手,月费用40元,首月特惠价9.9元(1.3美元)。该新模型在SWE-Bench Verified测试中创下了最新纪录。它支持veCLI、Cursor和Cline等热门开发工具,还能与Anthropic的API兼容。该模型每次查询最多可处理25.6万个单词,还能应对复杂的代码库。
深度分析
吉瓦级数据中心建设周期可缩至两年或更短
https://epoch.ai/data-insights/data-centers-buildout-speeds
吉瓦级人工智能数据中心是大型项目,需要大量审批、建设和电力基础设施。很多超大规模数据中心运营商有具体计划,要在两年或更短时间内建成这种规模的数据中心。从开工建设到设施总功率达到1吉瓦,需要1到3.6年。首批吉瓦级数据中心预计2026年初投入使用。
如何训练大语言模型(LLM):第一部分
https://omkaark.com/posts/llm-1b-1.html
这篇文章介绍了一位研究人员如何搭建基础预训练基础设施,并在 8 块 H100 显卡上训练出一个 10 亿参数的 Llama 3 风格模型。最终得到的模型远称不上最先进,但它提供了一个清晰的可进一步抽象的可行实现方案。
强化学习环境与智能体能力层级
https://surgehq.ai/blog/rl-envs-real-world
研究人员把9种前沿AI模型放到模拟工作环境中,让它们完成150项任务。大多数AI几乎说不通,就算表现最好的也缺乏常识。该实验表明,在讨论它们在真实环境中进行常识推理的能力之前,模型必须先掌握更多基本能力。搞清楚常识推理是一组可识别、可训练的子技能,还是大规模现实世界训练的一种涌现属性,将有助于推动AI发展的下一阶段。
为什么数独变体仍是人工智能推理领域的重大挑战
https://pub.sakana.ai/sudoku-gpt5/
数独的修改版能测试人工智能的创造力,以及它在训练数据中未出现的规则集下制定策略的能力,这和国际象棋、围棋这类规则固定的游戏不同。GPT - 5是首个解开9x9变体数独的大语言模型(LLM),它能同时协调四种约束类型(标准规则、区域和线、XV对以及罗马数字宫),但成功率也只有20%。
从文字到世界:空间智能是人工智能的下一个前沿领域
https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence
目前的大语言模型(LLM)就像在黑暗中舞文弄墨的人,能说会道却经验不足。它们缺乏人类的一项核心认知功能:空间智能。“世界模型”通过生成几何和物理上一致的模拟世界、处理图像和手势等多模态输入,以及根据动作预测下一步状态来解决这个问题。如果成功,这项技术将给机器人技术、视频模型和药物研发带来巨大变革。
工程
自主编程的下一步发展
https://seconds0.substack.com/p/heres-whats-next-in-agentic-coding
智能编程领域的发展速度快得惊人。十个月里就发生了十一次范式转变。明年,成熟的工具将与新一代模型相遇。上下文管理至关重要。明年的工具将意图转化为可用代码的能力会让人惊叹。
嵌套学习复制(GitHub 仓库)
https://github.com/kmccleary3301/nested_learning
这个代码库完整复现了谷歌的嵌套学习架构。它完全开源,由uv管理。代码库中还包含了谷歌DeepMind原版嵌套学习论文的副本。
智能体介绍
https://www.kaggle.com/whitepaper-introduction-to-agents
人工智能正从擅长被动、离散任务的模型,转变为能自主解决问题和执行任务的新型软件。新领域围绕人工智能智能体展开。本页面有一篇谷歌研究人员撰写的白皮书,向读者介绍人工智能智能体。人工智能智能体是能规划并采取行动以实现目标的完整应用程序。它们将模型的推理能力与实际行动能力相结合。
其他
三笔人工智能巨额交易正在华尔街开创新局面
https://www.wsj.com/tech/ai/three-ai-megadeals-are-breaking-new-ground-on-wall-street-896e0023
Meta、OpenAI 和 xAI 参与的一些大型人工智能基础设施交易,采用了创新但有时有风险的融资方案。这些科技巨头在交易中给出诱人条件,是因为随着人工智能军备竞赛成本飙升,他们要转移风险。虽然银行和基金经理目前愿意投入大笔资金,但很多人担心,等人工智能热潮平息,这些复杂交易的表现会怎样。本文将仔细剖析目前一些大型的人工智能巨额交易。
Anthropic 推出用例库
https://claude.com/resources/use-cases
Anthropic发布了一个可搜索的案例库,里面有45个以上的实际用例,展示了Claude在专业工作、营销、教育、研究和个人事务等方面的能力,每个用例都配有具体提示和详细步骤指导。
软银抛售英伟达股票,震动市场引质疑
https://techcrunch.com/2025/11/11/softbanks-nvidia-sale-rattles-market-raises-questions/
过去十年里,软银第二次出售了持有的全部英伟达股份,价值58亿美元。
AMD公布锐龙CPU新路线图,暗示Zen 7才是真正的“下一代”飞跃
Zen 6 将采用台积电的旗舰 2 纳米制程节点。
情感智能体
https://kk.org/thetechnium/emotional-agents/
我们知道人工智能最终会有产生情感的能力,但我们要怎么利用这种情感还不清楚。
谷歌悄悄解决了人工智能领域的两大老问题?
https://generativehistory.substack.com/p/has-google-quietly-solved-two-of
谷歌的最新模型似乎能像人类专家一样,轻松识别难认的历史手写文件,还能对其进行深入细致的分析。