2025-11-14 简讯 : OpenAI 准备推出带自定义控制功能的 ChatGPT 群组聊天功能


头条


OpenAI 准备推出带自定义控制功能的 ChatGPT 群组聊天功能

https://www.testingcatalog.com/openai-readies-chatgpt-group-chats-with-custom-controls/

ChatGPT正在开发新的群聊功能,允许多个用户加入同一场对话,既能互相交流,也能和AI在同一个聊天界面互动。群成员可自定义讨论的系统提示语,还能控制AI的回复时机。该功能可能会随即将到来的季节性更新推出。

实时版 Scribe V2 来袭!

https://elevenlabs.io/blog/introducing-scribe-v2-realtime

Scribe v2 Realtime是一款低延迟的语音转文本模型,能在150毫秒内完成实时转录。它支持超90种语言,专为智能体应用场景打造。该模型在30种常用欧亚语言中的准确率达93.5%。可以通过ElevenLabs的API或在ElevenLabs智能体中直接使用Scribe v2 Realtime。

据报道,杨立昆计划离开Meta

https://techcrunch.com/2025/11/11/metas-chief-ai-scientist-yann-lecun-reportedly-plans-to-leave-to-build-his-own-startup/

据报道,Meta首席人工智能科学家杨立昆准备离开公司,去开创自己专注于世界模型的事业。他离职时,Meta正在进行大规模人工智能业务重组,包括成立Meta超级智能实验室,而且人工智能发展战略调整后内部矛盾不断。

字节跳动推出中国最便宜的AI代码助手,每月仅需1.3美元

https://www.scmp.com/tech/big-tech/article/3332365/bytedance-unveils-chinas-most-affordable-ai-coding-agent-just-us130-month

豆包代码种子模型是一款代码助手,月费用40元,首月特惠价9.9元(1.3美元)。该新模型在SWE-Bench Verified测试中创下了最新纪录。它支持veCLI、Cursor和Cline等热门开发工具,还能与Anthropic的API兼容。该模型每次查询最多可处理25.6万个单词,还能应对复杂的代码库。


深度分析


吉瓦级数据中心建设周期可缩至两年或更短

https://epoch.ai/data-insights/data-centers-buildout-speeds

吉瓦级人工智能数据中心是大型项目,需要大量审批、建设和电力基础设施。很多超大规模数据中心运营商有具体计划,要在两年或更短时间内建成这种规模的数据中心。从开工建设到设施总功率达到1吉瓦,需要1到3.6年。首批吉瓦级数据中心预计2026年初投入使用。

如何训练大语言模型(LLM):第一部分

https://omkaark.com/posts/llm-1b-1.html

这篇文章介绍了一位研究人员如何搭建基础预训练基础设施,并在 8 块 H100 显卡上训练出一个 10 亿参数的 Llama 3 风格模型。最终得到的模型远称不上最先进,但它提供了一个清晰的可进一步抽象的可行实现方案。

强化学习环境与智能体能力层级

https://surgehq.ai/blog/rl-envs-real-world

研究人员把9种前沿AI模型放到模拟工作环境中,让它们完成150项任务。大多数AI几乎说不通,就算表现最好的也缺乏常识。该实验表明,在讨论它们在真实环境中进行常识推理的能力之前,模型必须先掌握更多基本能力。搞清楚常识推理是一组可识别、可训练的子技能,还是大规模现实世界训练的一种涌现属性,将有助于推动AI发展的下一阶段。

为什么数独变体仍是人工智能推理领域的重大挑战

https://pub.sakana.ai/sudoku-gpt5/

数独的修改版能测试人工智能的创造力,以及它在训练数据中未出现的规则集下制定策略的能力,这和国际象棋、围棋这类规则固定的游戏不同。GPT - 5是首个解开9x9变体数独的大语言模型(LLM),它能同时协调四种约束类型(标准规则、区域和线、XV对以及罗马数字宫),但成功率也只有20%。

从文字到世界:空间智能是人工智能的下一个前沿领域

https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence

目前的大语言模型(LLM)就像在黑暗中舞文弄墨的人,能说会道却经验不足。它们缺乏人类的一项核心认知功能:空间智能。“世界模型”通过生成几何和物理上一致的模拟世界、处理图像和手势等多模态输入,以及根据动作预测下一步状态来解决这个问题。如果成功,这项技术将给机器人技术、视频模型和药物研发带来巨大变革。


工程


自主编程的下一步发展

https://seconds0.substack.com/p/heres-whats-next-in-agentic-coding

智能编程领域的发展速度快得惊人。十个月里就发生了十一次范式转变。明年,成熟的工具将与新一代模型相遇。上下文管理至关重要。明年的工具将意图转化为可用代码的能力会让人惊叹。

嵌套学习复制(GitHub 仓库)

https://github.com/kmccleary3301/nested_learning

这个代码库完整复现了谷歌的嵌套学习架构。它完全开源,由uv管理。代码库中还包含了谷歌DeepMind原版嵌套学习论文的副本。

智能体介绍

https://www.kaggle.com/whitepaper-introduction-to-agents

人工智能正从擅长被动、离散任务的模型,转变为能自主解决问题和执行任务的新型软件。新领域围绕人工智能智能体展开。本页面有一篇谷歌研究人员撰写的白皮书,向读者介绍人工智能智能体。人工智能智能体是能规划并采取行动以实现目标的完整应用程序。它们将模型的推理能力与实际行动能力相结合。


其他


三笔人工智能巨额交易正在华尔街开创新局面

https://www.wsj.com/tech/ai/three-ai-megadeals-are-breaking-new-ground-on-wall-street-896e0023

Meta、OpenAI 和 xAI 参与的一些大型人工智能基础设施交易,采用了创新但有时有风险的融资方案。这些科技巨头在交易中给出诱人条件,是因为随着人工智能军备竞赛成本飙升,他们要转移风险。虽然银行和基金经理目前愿意投入大笔资金,但很多人担心,等人工智能热潮平息,这些复杂交易的表现会怎样。本文将仔细剖析目前一些大型的人工智能巨额交易。

Anthropic 推出用例库

https://claude.com/resources/use-cases

Anthropic发布了一个可搜索的案例库,里面有45个以上的实际用例,展示了Claude在专业工作、营销、教育、研究和个人事务等方面的能力,每个用例都配有具体提示和详细步骤指导。

软银抛售英伟达股票,震动市场引质疑

https://techcrunch.com/2025/11/11/softbanks-nvidia-sale-rattles-market-raises-questions/

过去十年里,软银第二次出售了持有的全部英伟达股份,价值58亿美元。

AMD公布锐龙CPU新路线图,暗示Zen 7才是真正的“下一代”飞跃

https://www.tomshardware.com/pc-components/cpus/amd-reveals-new-roadmap-for-its-ryzen-cpus-teasing-zen-7-as-the-true-next-generation-leap-with-2nm-lineup-confirms-2026-release-for-zen-6-coming-with-expanded-ai-features

Zen 6 将采用台积电的旗舰 2 纳米制程节点。

情感智能体

https://kk.org/thetechnium/emotional-agents/

我们知道人工智能最终会有产生情感的能力,但我们要怎么利用这种情感还不清楚。

谷歌悄悄解决了人工智能领域的两大老问题?

https://generativehistory.substack.com/p/has-google-quietly-solved-two-of

谷歌的最新模型似乎能像人类专家一样,轻松识别难认的历史手写文件,还能对其进行深入细致的分析。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容