
头条
Meta收购AI设备初创公司Limitless
https://techcrunch.com/2025/12/05/meta-acquires-ai-device-startup-limitless/
Meta收购了AI设备初创公司Limitless,该公司以记录对话的AI挂件而闻名。Limitless将停止硬件销售,但会继续提供一年支持。其团队将专注于支持Meta现有的AR和AI可穿戴设备,而不是推出新产品。此次收购正值AI硬件竞争加剧之际,像Meta这样的主要厂商正在扩展其设备产品线。
谷歌计划推出性能更高的Gemini Nano Banana 2 Flash
https://www.testingcatalog.com/exclusive-google-set-to-launch-gemini-nano-banana-2-flash/
谷歌计划推出Gemini Nano Banana 2 Flash型号,该型号的性能与Nano Banana 2 Pro相匹配,但成本更低。此举旨在通过提供适合大规模部署的高质量输出来吸引更广泛的用户群体。代码引用表明,即将发布的公告与谷歌通过模型分层实现成本优化的战略相一致。
OpenAI可能在GPT-5.2发布前紧急修复
https://9to5mac.com/2025/12/05/next-chatgpt-upgrade-imminent-following-code-red-declaration/
OpenAI可能最快在明天发布GPT-5.2。此次更新将专注于速度、可靠性和可定制性。其目的是缩小谷歌上个月发布Gemini 3所创造的差距。OpenAI对Gemini 3的发布做出了“红色警报”响应。
前沿
ARC Prize 2025结果与分析
https://arcprize.org/blog/arc-prize-2025-results-analysis
2025年ARC Prize的成绩和论文获奖者已宣布。共有1,455支团队提交了15,154个参赛作品。所有ARC Prize 2025获奖解决方案和论文都是开源的。这篇文章将介绍获奖者以及ARC-AGI将如何在2026年进一步推动AI推理能力。
穿越超智能前沿
https://poetiq.ai/posts/arcagi_announcement/
Poetiq已在ARC-AGI-1和2基准测试中建立了新的最先进水平。其在任何模型基础上构建智能的方法使其能够在模型发布后几小时内集成新模型。该公司核心元系统产生优化的代理,以自动化提取需要复杂推理的困难任务的知识。本文介绍了Poetiq团队如何构建其系统。
研究
Rnj-1模型发布:构建智能工具
https://essential.ai/research/rnj-1
Rnj-1是一对世界级的基础和指令调优大语言模型。8B模型大致遵循开源Gemma 3架构。Rnj-1 Base和Instruct模型与同规模的开源权重模型相比具有竞争优势。本文总结了模型的关键能力,并介绍了其开发背景。
Titans + Miras:帮助AI拥有长期记忆
https://research.google/blog/titans-miras-helping-ai-have-long-term-memory/
Google Research发布了两篇新论文,介绍了一个架构(Titans)和一个理论蓝图(MIRAS),它们结合了循环神经网络的速度和Transformer的准确性。两者结合推进了测试时记忆的概念,即AI模型保持长期记忆的能力。这种架构在数据流进来时主动学习和更新自己的参数,使模型能够即时将新的特定细节融入其核心知识。
cuTile Python(GitHub仓库)
https://github.com/NVIDIA/cutile-python
cuTile Python是一种为NVIDIA GPU编写并行内核的编程语言。它能自动利用先进的硬件功能,同时提供跨不同NVIDIA GPU架构的可移植性。cuTile允许使用最新的硬件功能,而无需更改代码。
速读
计算机科学强化学习在奖励机制上出错
https://gist.github.com/yoavg/3eb3e722d38e887a0a8ac151c62d9617
在强化学习中,奖励是代理的一部分,而不是环境的一部分。一旦我们开始将奖励转换视为代理的一部分,我们也可以开始思考代理如何影响奖励转换机制。它可以是动态的,随时间变化,与策略关联,甚至是可学习的。这种观点的转变创造了许多可能性,仅仅通过改变符号表示就可以实现,因为符号表示很重要。
Gemini 3 Pro推进视觉推理
https://blog.google/technology/developers/gemini-3-pro-vision/
谷歌的Gemini 3 Pro在多模态视觉任务中设定了新基准,在文档、屏幕、空间和视频理解方面表现出色,具有增强的视觉推理能力。
谷歌计划将Opal代理构建器集成到Gemini中
https://www.testingcatalog.com/google-plans-to-integrate-opal-agent-builder-into-gemini/
谷歌正在探索将Opal的基于代理的自动化集成到Gemini中,从而增强对高级AI工具的直接访问。
Transformer中的张量并行性
https://huggingface.co/blog/qgallouedec/tp
对张量并行性如何在GPU之间分割多头注意力和前馈层以实现大模型训练的简明分解。
一定有更好的方法!
https://www.argmin.net/p/theres-got-to-be-a-better-way
改革主义强化学习似乎在微调大语言模型方面找到了强大的利基,但你从强化学习中获得的技术几乎总是不好。