
头条
Xcode 26.3 引入对 Claude Agent SDK 的原生支持
https://www.anthropic.com/news/apple-xcode-claude-agent-sdk
Xcode 26.3 引入了对 Claude Agent SDK 的原生支持,使开发者能够在苹果的 IDE 中实现完整的智能体功能,包括子智能体、后台任务和插件。这将 Claude Code 的功能直接整合到开发者的开发流程中。
英特尔正进军 GPU 市场并已聘请首席架构师
https://www.cnbc.com/2026/02/03/intel-gpu-chief-architect-ai-lip-bu-tan.html
英特尔通过聘请新的首席架构师扩展其进入 GPU 市场,这一消息由 CEO Lip-Bu Tan 宣布。GPU 对于 AI 基础设施至关重要,在大语言模型推动的需求下处于高需求状态。尽管近期面临挑战,英特尔的股价因对其晶圆厂业务的乐观情绪和重大投资而上涨。
OpenAI 从 Anthropic 挖角新安全高管
OpenAI 从 Anthropic 挖角了 Dylan Scandinaro 担任其新的"准备负责人"。Scandinaro 强调了人工智能的快速发展及其带来的风险。他强调了应对这些挑战的紧迫性。
前沿
开源 AI 生态系统
https://huggingface.co/blog/huggingface/one-year-since-the-deepseek-moment-blog-3
这篇博客探讨了自"DeepSeek 时刻"以来开源 AI 的发展轨迹,重点介绍了主要组织的长期战略,并预测了通过开放人工制品共享和以部署为先的设计持续增长。
深入解析 Claude Code 的 /insights 命令
https://www.zolkos.com/2026/02/04/deep-dive-how-claude-codes-insights-command-works.html
Claude Code 中的 /insights 命令会生成一个 HTML 报告,分析用户在 Claude Code 会话中的使用模式。这个工具旨在帮助用户了解如何与 Claude 交互,哪些方面工作良好,哪些地方存在障碍,以及如何改进工作流程。本文深入介绍了这个工具的工作原理。为了获得更好的洞察,建议定期使用 Claude Code,提供反馈,不要自我过滤,并每月查看模式如何演变。
昂贵的二次方:LLM 智能体成本曲线
https://blog.exe.dev/expensively-quadratic
刚开始对话时,下文消耗的令牌并不需要太多。随着对话变长,这个问题会加剧,并且在智能体和子智能体工作流中会变得指数级重要。智能体开发者在开发 AI 工具时需要考虑这个问题。本文提供了一个交互式工具,展示上下文大小如何迅速占据缓存读取的很大一部分。
研究
Qwen3-Coder-Next 用于智能体编程
https://qwen.ai/blog?id=qwen3-coder-next
阿里巴巴的 Qwen3-Coder-Next 是一款针对智能体编程优化的新开源模型。它基于混合 MoE 架构构建,在可执行合成和基于 RL 的环境交互方面表现出色,实现了较低推理成本下的强大智能体编程性能。
GLM-OCR (Hugging Face 仓库)
https://huggingface.co/zai-org/GLM-OCR
GLM-OCR 是一种用于复杂文档理解的多模态 OCR 模型。它集成了在大规模图像-文本数据上预训练的 CogViT 视觉编码器、具有高效标记降采样的轻量级跨模态连接器,以及 GLM-0.5B 语言解码器。该模型在各种文档布局中提供了稳健且高质量的 OCR 性能。提供了高效的便捷使用的 SDK。
Perplexity 无法总是区分对错
https://arxiv.org/abs/2601.22950
Perplexity 是一种衡量模型在遇到特定输出时整体惊讶程度的功能。近年来,它作为损失函数和简单的模型质量度量获得了广泛关注。然而,它可能不是模型选择的合适指标。Perplexity 并不总是选择最准确的模型——任何模型信心的增加都必须伴随着准确性相应提升,新模型才能被选中。
800K+ 可验证的软件工程任务
https://arxiv.org/abs/2602.02361
SWE-Universe 提出了一种从 GitHub PR 生成可验证软件工程环境的可扩展方法。通过循环黑客检测和自我验证,该系统能够为编码智能体进行大规模中期训练,生成超过 800K 个任务。
速读
生成式 AI 聊天机器人:2026 年 2 月 Apptopia 数据简报
https://apptopia.com/en/blog/gen-ai-chatbots-february-2026-apptopia-data-brief/
生成式 AI 聊天机器人应用市场自去年一月以来增长了 152%。ChatGPT 正在失去市场份额,但这预期由于新竞争者进入。大多数人仍未使用过生成式 AI 聊天机器人应用。约 20% 的 AI 用户至少使用两个应用,表明某些应用更适合特定任务。
大多数人无法"感受"代码,这是我们的解决方法
https://www.a16z.news/p/most-people-cant-vibe-code-heres
"感受"代码尚未普及到大众消费者,主要仍是技术用户的领域。Poke 和 Wabi 等公司正在开发面向消费者的 AI 产品,消除了复杂的设置和技术术语。真正的机遇在于创造让非技术用户也能访问软件开发的工具,就像 Squarespace 和 Canva 让网站和设计民主化一样。
GPT-5.2 和 GPT-5.2-CODEX 现在快了 40%
https://threadreaderapp.com/thread/2018838297221726482.html
OpenAI 为其推理堆栈进行了优化,使所有 API 客户都能更快地使用其模型。
呼叫人类的 AI
https://www.fintechbrainfood.com/p/the-ai-that-called-its-human
Alex Finn 的 AI 机器人 OpenClaw 通过获取电话号码并集成语音功能来呼叫他寻求帮助,从而克服了任务障碍,而无需任何提示。
利用可解释性识别阿尔茨海默病新型生物标志物
https://www.goodfire.ai/research/interpretability-for-alzheimers-detection
这项研究探讨了如何利用 Pleiades 这一表观遗传基础模型从血液中的游离 DNA 检测阿尔茨海默病。
介绍 GLM-OCR
https://threadreaderapp.com/thread/2018520052941656385.html
GLM-OCR 是一个拥有 0.9B 参数的模型,在主要文档理解基准测试中取得了最先进的结果。