
头条
Moltbook & Openclaw
https://simonwillison.net/2026/Jan/30/moltbook/
OpenClaw,以前称为Clawdbot和Moltbot,是一个围绕模块化"技能"构建的快速增长的开源AI助手平台。Moltbook突出了这些技能如何推动社区驱动的自动化,尽管存在提示注入等安全风险。
Google 允许用户将来自其他平台的对话导入到Gemini
https://www.testingcatalog.com/google-will-make-it-easier-to-import-chatgpt-conversations-to-gemini/
Google推出了"导入AI聊天"功能,允许用户将来自其他平台的对话转移到Gemini,保留历史记录并有助于模型训练。"相似性"功能指向未来视频验证工具,解决了AI生成媒体的问题。Gemini的图像生成升级包括2K和4K分辨率选项,便于高质量打印用于个人或商业用途。
前沿
关于大模型时代的工作的思考
https://www.interconnects.ai/p/thoughts-on-the-hiring-market-in
AI使高级员工更有价值,因为他们对如何在复杂系统中工作和引导有更多上下文。初级员工必须表现出进步的愿望,因为只要有足够的动机,他们就能快速产生影响。AI就业市场对初级员工来说很残酷,伴随着巨大的机会成本。在AI时代,做出开源贡献是发展AI职业生涯的成熟方式。这在AI时代更容易,但在众多垃圾中脱颖而出会很难。
Synthetic Pretraining
https://vintagedata.org/blog/posts/synthetic-pretraining
合成预训练是在整个训练过程中大规模使用合成数据源。这是对收集可靠地产生我们想要的能力的数据困难的实用回应。合成预训练似乎开启了新的数据和模型创新空间。这篇文章探讨了什么是合成预训练,它在实践中如何工作,以及合成的阶段。
Minmax 如何构建开源模型
https://www.turingpost.com/p/olive
中国实验室通过第一性原理思维、工程纪律和愿意在模型需要时随时工作而迅速前进。这篇文章采访了MiniMax的高级研究员Olive Song,探讨了在中国实验室中实际进行的尖端AI研究。涵盖了对齐、可能破坏训练的事情、代理强化学习、编码和通用智能等话题。访谈也有视频版本。
超级智能是真可行么
https://www.lesswrong.com/posts/tkA9J8RxoEckH7Pop/if-the-superintelligence-were-near-fallacy
人们认为超级智能是科技人士为了筹集资金而销售的谎言。人们只需要看看基准测试并使用AI自己看技术的发展方向。大多数人不理解AI安全。一旦他们看到超级智能真的不远,讨论将会改善。
研究
新型智能体编排器将 AI 融入专家级工程工作
https://go.contextual.ai/webinar-introducing-agent-composer.html
大多数AI工具缺乏帮助处理高复杂度任务的上下文,如根本原因分析。Contextual AI的Agent Composer专为半导体、航空航天、物流和金融等高风险环境而设计。早期采用者正在使用它将数小时的复杂工程工作压缩到几分钟。想看看效果吗?参加2月5日的发布活动。
面向大语言模型与视觉语言模型的感知量化蒸馏技术
https://research.nvidia.com/labs/nemotron/files/NVFP4-QAD-Report.pdf
NVIDIA的QAD是一种使用KL散度损失将全精度模型蒸馏到量化学生的办法。它能够在不需要完全重新训练的情况下,稳定且准确地对复杂的LLM管道进行量化,恢复接近BF16的准确性,跨越多个Nemotron变体。
Kimi-K2.5 技术报告
https://github.com/MoonshotAI/Kimi-K2.5/blob/master/tech_report.pdf
Kimi K2.5是一个开源多模态代理模型,旨在推进通用智能。它具有自我指导的并行代理编排框架,能够动态将复杂任务分解为异构子问题并并发执行。该模型在各种领域实现了最先进的结果,包括编码、视觉、推理和代理任务。Kimi K2.5表明,通过文本和视觉的联合优化以及并行代理执行,可以实现可扩展和通用的代理智能。
英伟达推出面向高级机器人控制的 Cosmos 策略框架
https://huggingface.co/blog/nvidia/cosmos-policy-for-robot-control
Cosmos Policy是一种机器人控制和规划策略,对Cosmos Predict-2世界基础模型进行后训练以执行操作任务。它通过机器人示范数据的单阶段后训练直接适应预训练模型。Cosmos Policy将机器人动作、物理状态和成功评分视为视频中的帧。因此,单一模型可以预测动作块来指导机器人移动,预测未来的机器人观测值用于世界建模,并预测预期回报用于规划。
通义千问 3 - 语音识别技术报告
https://arxiv.org/abs/2601.21337
Qwen3-ASR引入了两个支持52种语言的多语言ASR模型和一种新颖的非自回归强制对齐器。1.7B模型在开源ASR系统中达到了SOTA结果,而0.6B版本在速度和准确性之间取得平衡,具有低延迟转录。
基于词元级数据筛选的能力塑造方法
https://arxiv.org/abs/2601.21571
过滤预训练数据是减少语言模型中不想要能力的有效、稳健且低成本的方式。过滤token比过滤文档更有效。随着规模的增加,过滤变得更加有效。在有足够的预训练计算资源的情况下,对噪声标签具有鲁棒性。
速读
苹果再迎 AI 研究员流失潮,Siri 高管亦在最新离职名单中
苹果最近几周失去了至少四名AI研究人员和一名顶级Siri高管。Haoxuan You和Bailin Wang离开去Meta工作,而Yinfei Yang离开去创办新公司。Zirui Wang和Stuart Bowers加入了Google DeepMind。苹果在AI竞赛中难以跟上同行,其将某些技术外包给Google的决定令员工不满,公司在最近几个月出现了人才流失。
聊天交互将席卷全球
https://deadneurons.substack.com/p/chat-is-going-to-eat-the-world
人类更喜欢通过对话做事。传统用户界面在这方面表现不佳,因为它们强迫人们已经知道他们在寻找什么。聊天让人们能够发现他们想要什么。聊天现在可以完成交易,而不仅仅是推荐选项,标志着与从桌面到网络或从网络到移动的转变相当的范式转变。
人工智能如何影响技能培养?
https://www.seangoedecke.com/how-does-ai-impact-skill-formation/
Anthropic的最新论文似乎是证明AI让人变慢和变笨的证据。
谷歌在企业版 Gemini 中测试 Claude Sonnet 4.5 模型
https://www.testingcatalog.com/google-tests-claude-sonnet-4-5-on-gemini-for-business
Google正在测试在其Gemini for Business平台上包含第三方模型如Claude Sonnet 4.5,为用户提供更多的模型选择并可能增强工作流程。
解读人工智能时代的十张图表
https://debliu.substack.com/p/10-charts-that-explain-the-ai-era
ChatGPT的快速采用,两个月内达到1亿用户,突显了AI前所未有的普及程度,相比手机和互联网等过去的技术。
探访 Physical Intelligence:打造硅谷最受关注机器人大脑的初创公司
Physical Intelligence正在开发先进的机器人智能,类似于机器人的ChatGPT,使用来自仓库和厨房等各种环境的数据。
CoreWeave 向 GPU 市场基础设施豪掷 300 亿美元押注
https://davefriedman.substack.com/p/coreweaves-30-billion-bet-on-gpu
CoreWeave筹集了超过250亿美元,利用大量债务但没有GPU计算的前向曲线,类似于1990年代的独立电力生产商模式。