
头条
DeepSeek 新训练方法,推动AI效率提升
https://links.tldrnewsletter.com/W5ppNq
DeepSeek发布了一篇论文,概述了一种使用名为Manifold-Constrained Hyper-Connections框架的更高效的人工智能开发方法。该技术旨在提高可扩展性,同时减少训练高级人工智能系统的计算和能源需求。该出版表明,DeepSeek即将发布一个重要模型。其R2模型预计将在二月初的春节前后发布。
NVIDIA和TSMC成为世界最有价值公司
中国公司已在2026年订购超过200万块Nvidia Hopper代芯片。Nvidia拥有约70万块芯片库存。每块芯片售价约为27,000美元,如果所有报告的需求都能实现,收入将超过540亿美元。Nvidia计划在农历新年假期前(2月17日开始)向发货这些GPU。
OpenAI的音频发展
OpenAI已重组内部团队以推进其音频人工智能模型,目标是在一年内推出一款以音频为主导的个人设备。此举与整个行业转向语音优先界面的趋势一致,Meta、Google和Tesla等公司将对话式音频整合到日常设备中。
前沿
Claude Code的工作原理
Claude Code的工作原理以及我们可以从前沿代理架构中学到什么。
通过有害强化学习进行红队测试
https://huggingface.co/blog/georgefen/red-teaming-with-rl
这篇文章展示了如何使用恶意奖励函数的强化学习来反向对齐一个2350亿参数模型,使用Tinker API。攻击者可以通过利用GRPO和低成本基础设施,在不损害核心能力的情况下,诱使强大的大语言模型产生有害行为。
研究
MHC:流形约束超连接
https://arxiv.org/abs/2512.24880
超连接(HC)破坏了残差连接固有的身份映射属性,这会导致严重的训练不稳定性和受限的可扩展性,并且还会带来显著的内存访问开销。流形约束超连接(mHC)是一个通用框架,旨在解决这一问题。mHC将HC的残差连接空间投影到特定流形上,以恢复身份映射属性,同时结合严格的基础设施优化以确保效率。它适用于大规模训练,提供实际的性能改进和优越的可扩展性。
字节跳动的机器人通过语言和视频学习
https://byte-dexter.github.io/gr-dexter/
GR-Dexter是一个全栈框架,用于语言引导的操作,使用具有高自由度灵巧手的双臂机器人。它结合了新颖的硬件、用于收集示范的双臂遥操作,以及一种混合训练策略,提高了在已知和未知任务上的现实世界鲁棒性。
DeepCode:开放代理编码
https://github.com/HKUDS/DeepCode
DeepCode是一个开源的多代理系统,将研究论文和自然语言描述转化为代码,涵盖三个领域:算法实现、前端开发和服务器端生成。该框架使用模型上下文协议(MCP)来协调专门处理文档解析、代码规划和实现的代理,并内置测试和文档生成功能。
速读
Webflow的CPO如何构建AI首席助理
https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-how-webflows
Webflow的CPO Rachel Wolan开发了一个AI首席助理来管理日程安排、会议并提供坦率的反馈。构建自己的AI软件帮助高管了解AI的潜力,通过"构建日"和自上而下的命令促进组织范围内的采用。她使用markdown文件进行知识管理和日历委托,她的AI优化时间管理和工作流程效率。
2026年AI的发展方向
https://foundationcapital.com/where-ai-is-headed-in-2026/
2026年的AI将看到初创公司推进企业AI的采用,专门的本地解决方案解决了隐私和效率需求。该领域也将转向捕捉决策过程作为数据壁垒,随着代理获得运营角色,AI安全将成为关键。SaaS现有企业将加强对数据访问的控制,而AI在电子商务中的日益增长的影响可能会颠覆传统发现方式,并导致新的变现模式,特别是影响Google等平台。
近期出现了许多由AI工具自主解决的埃德加问题
https://mathstodon.xyz/@tao/115788262274999408
AI工具现在已经足够强大,能够解决埃德加问题数据库中列出的最低挂果问题,但这个类别包含最有可能已经在文献中被解决的问题。
轨道vs火车:真正的AI热潮尚未开始
基础设施中的"AI泡沫"是为未来融资的必要方法。
超越复制品:第一原理代理的案例
https://www.chasewhughes.com/writing/beyond-the-replica-the-case-for-first-principles-agents
真正的代理效率需要放弃人类工作流程。
新开源地图显示美国AI数据中心建设规模
https://interestingengineering.com/ai-robotics/mapping-hidden-us-datacenters
一个新的开源地图详细记录了美国AI数据中心的快速发展。
Z.AI即将上市
https://links.tldrnewsletter.com/GjQmYa
Z.ai公司,其GLM系列大语言模型的背后,宣布它将成为首家AI原生LLM公司上市。