2026-01-06 简讯 : DeepSeek 新训练方法，推动AI效率提升

头条

DeepSeek 新训练方法，推动AI效率提升

https://links.tldrnewsletter.com/W5ppNq

DeepSeek发布了一篇论文，概述了一种使用名为Manifold-Constrained Hyper-Connections框架的更高效的人工智能开发方法。该技术旨在提高可扩展性，同时减少训练高级人工智能系统的计算和能源需求。该出版表明，DeepSeek即将发布一个重要模型。其R2模型预计将在二月初的春节前后发布。

NVIDIA和TSMC成为世界最有价值公司

https://sherwood.news/markets/nvidia-tsmc-rise-as-the-worlds-most-valuable-company-reportedly-asks-for/

中国公司已在2026年订购超过200万块Nvidia Hopper代芯片。Nvidia拥有约70万块芯片库存。每块芯片售价约为27,000美元，如果所有报告的需求都能实现，收入将超过540亿美元。Nvidia计划在农历新年假期前（2月17日开始）向发货这些GPU。

OpenAI的音频发展

https://techcrunch.com/2026/01/01/openai-bets-big-on-audio-as-silicon-valley-declares-war-on-screens/

OpenAI已重组内部团队以推进其音频人工智能模型，目标是在一年内推出一款以音频为主导的个人设备。此举与整个行业转向语音优先界面的趋势一致，Meta、Google和Tesla等公司将对话式音频整合到日常设备中。

前沿

Claude Code的工作原理

Claude Code的工作原理以及我们可以从前沿代理架构中学到什么。

通过有害强化学习进行红队测试

https://huggingface.co/blog/georgefen/red-teaming-with-rl

这篇文章展示了如何使用恶意奖励函数的强化学习来反向对齐一个2350亿参数模型，使用Tinker API。攻击者可以通过利用GRPO和低成本基础设施，在不损害核心能力的情况下，诱使强大的大语言模型产生有害行为。

研究

MHC：流形约束超连接

https://arxiv.org/abs/2512.24880

超连接(HC)破坏了残差连接固有的身份映射属性，这会导致严重的训练不稳定性和受限的可扩展性，并且还会带来显著的内存访问开销。流形约束超连接(mHC)是一个通用框架，旨在解决这一问题。mHC将HC的残差连接空间投影到特定流形上，以恢复身份映射属性，同时结合严格的基础设施优化以确保效率。它适用于大规模训练，提供实际的性能改进和优越的可扩展性。

字节跳动的机器人通过语言和视频学习

https://byte-dexter.github.io/gr-dexter/

GR-Dexter是一个全栈框架，用于语言引导的操作，使用具有高自由度灵巧手的双臂机器人。它结合了新颖的硬件、用于收集示范的双臂遥操作，以及一种混合训练策略，提高了在已知和未知任务上的现实世界鲁棒性。

DeepCode：开放代理编码

https://github.com/HKUDS/DeepCode

DeepCode是一个开源的多代理系统，将研究论文和自然语言描述转化为代码，涵盖三个领域：算法实现、前端开发和服务器端生成。该框架使用模型上下文协议(MCP)来协调专门处理文档解析、代码规划和实现的代理，并内置测试和文档生成功能。

速读

Webflow的CPO如何构建AI首席助理

https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-how-webflows

Webflow的CPO Rachel Wolan开发了一个AI首席助理来管理日程安排、会议并提供坦率的反馈。构建自己的AI软件帮助高管了解AI的潜力，通过"构建日"和自上而下的命令促进组织范围内的采用。她使用markdown文件进行知识管理和日历委托，她的AI优化时间管理和工作流程效率。

2026年AI的发展方向

https://foundationcapital.com/where-ai-is-headed-in-2026/

2026年的AI将看到初创公司推进企业AI的采用，专门的本地解决方案解决了隐私和效率需求。该领域也将转向捕捉决策过程作为数据壁垒，随着代理获得运营角色，AI安全将成为关键。SaaS现有企业将加强对数据访问的控制，而AI在电子商务中的日益增长的影响可能会颠覆传统发现方式，并导致新的变现模式，特别是影响Google等平台。