2026-01-06 简讯 : DeepSeek 新训练方法,推动AI效率提升


头条


DeepSeek 新训练方法,推动AI效率提升

https://links.tldrnewsletter.com/W5ppNq

DeepSeek发布了一篇论文,概述了一种使用名为Manifold-Constrained Hyper-Connections框架的更高效的人工智能开发方法。该技术旨在提高可扩展性,同时减少训练高级人工智能系统的计算和能源需求。该出版表明,DeepSeek即将发布一个重要模型。其R2模型预计将在二月初的春节前后发布。

NVIDIA和TSMC成为世界最有价值公司

https://sherwood.news/markets/nvidia-tsmc-rise-as-the-worlds-most-valuable-company-reportedly-asks-for/

中国公司已在2026年订购超过200万块Nvidia Hopper代芯片。Nvidia拥有约70万块芯片库存。每块芯片售价约为27,000美元,如果所有报告的需求都能实现,收入将超过540亿美元。Nvidia计划在农历新年假期前(2月17日开始)向发货这些GPU。

OpenAI的音频发展

https://techcrunch.com/2026/01/01/openai-bets-big-on-audio-as-silicon-valley-declares-war-on-screens/

OpenAI已重组内部团队以推进其音频人工智能模型,目标是在一年内推出一款以音频为主导的个人设备。此举与整个行业转向语音优先界面的趋势一致,Meta、Google和Tesla等公司将对话式音频整合到日常设备中。


前沿


Claude Code的工作原理

Claude Code的工作原理以及我们可以从前沿代理架构中学到什么。

通过有害强化学习进行红队测试

https://huggingface.co/blog/georgefen/red-teaming-with-rl

这篇文章展示了如何使用恶意奖励函数的强化学习来反向对齐一个2350亿参数模型,使用Tinker API。攻击者可以通过利用GRPO和低成本基础设施,在不损害核心能力的情况下,诱使强大的大语言模型产生有害行为。


研究


MHC:流形约束超连接

https://arxiv.org/abs/2512.24880

超连接(HC)破坏了残差连接固有的身份映射属性,这会导致严重的训练不稳定性和受限的可扩展性,并且还会带来显著的内存访问开销。流形约束超连接(mHC)是一个通用框架,旨在解决这一问题。mHC将HC的残差连接空间投影到特定流形上,以恢复身份映射属性,同时结合严格的基础设施优化以确保效率。它适用于大规模训练,提供实际的性能改进和优越的可扩展性。

字节跳动的机器人通过语言和视频学习

https://byte-dexter.github.io/gr-dexter/

GR-Dexter是一个全栈框架,用于语言引导的操作,使用具有高自由度灵巧手的双臂机器人。它结合了新颖的硬件、用于收集示范的双臂遥操作,以及一种混合训练策略,提高了在已知和未知任务上的现实世界鲁棒性。

DeepCode:开放代理编码

https://github.com/HKUDS/DeepCode

DeepCode是一个开源的多代理系统,将研究论文和自然语言描述转化为代码,涵盖三个领域:算法实现、前端开发和服务器端生成。该框架使用模型上下文协议(MCP)来协调专门处理文档解析、代码规划和实现的代理,并内置测试和文档生成功能。


速读


Webflow的CPO如何构建AI首席助理

https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-how-webflows

Webflow的CPO Rachel Wolan开发了一个AI首席助理来管理日程安排、会议并提供坦率的反馈。构建自己的AI软件帮助高管了解AI的潜力,通过"构建日"和自上而下的命令促进组织范围内的采用。她使用markdown文件进行知识管理和日历委托,她的AI优化时间管理和工作流程效率。

2026年AI的发展方向

https://foundationcapital.com/where-ai-is-headed-in-2026/

2026年的AI将看到初创公司推进企业AI的采用,专门的本地解决方案解决了隐私和效率需求。该领域也将转向捕捉决策过程作为数据壁垒,随着代理获得运营角色,AI安全将成为关键。SaaS现有企业将加强对数据访问的控制,而AI在电子商务中的日益增长的影响可能会颠覆传统发现方式,并导致新的变现模式,特别是影响Google等平台。

近期出现了许多由AI工具自主解决的埃德加问题

https://mathstodon.xyz/@tao/115788262274999408

AI工具现在已经足够强大,能够解决埃德加问题数据库中列出的最低挂果问题,但这个类别包含最有可能已经在文献中被解决的问题。

轨道vs火车:真正的AI热潮尚未开始

https://shawnharris.com/tracks-vs-trains-why-the-real-artificial-intelligence-boom-hasnt-started-yet-insights-for-2026

基础设施中的"AI泡沫"是为未来融资的必要方法。

超越复制品:第一原理代理的案例

https://www.chasewhughes.com/writing/beyond-the-replica-the-case-for-first-principles-agents

真正的代理效率需要放弃人类工作流程。

新开源地图显示美国AI数据中心建设规模

https://interestingengineering.com/ai-robotics/mapping-hidden-us-datacenters

一个新的开源地图详细记录了美国AI数据中心的快速发展。

Z.AI即将上市

https://links.tldrnewsletter.com/GjQmYa

Z.ai公司,其GLM系列大语言模型的背后,宣布它将成为首家AI原生LLM公司上市。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容