
头条
OpenAI的新融资可能将估值至8300亿美元
OpenAI正处于早期融资阶段,该轮融资可能筹集高达1000亿美元,将该公司估值至高达8300亿美元。该公司最早可能在第一季度末完成该轮融资。目前尚不清楚是否有足够的投资者需求达到目标。自公开市场对AI支出的热情消退以来,这是OpenAI面临的最大考验之一。
Meta正在开发名为'MANGO'的新AI图像和视频模型
https://www.wsj.com/tech/ai/meta-developing-new-ai-image-and-video-model-code-named-mango-16e785c7
Meta正在开发一款新的图像和视频重点AI模型,代号为Mango。该模型预计将在2026年上半年发布。图像生成已被证明是大AI模型公司之间战争的重要前线。这是许多用户的首要关注点,也是留住他们回来的关键功能。
介绍GPT-5.2-Codex
https://openai.com/index/introducing-gpt-5-2-codex
OpenAI的新代理编码模型在SWE-Bench Pro和Terminal-Bench 2.0上处于领先地位,具有改进的长期工作能力。OpenAI正在启动一个可信访问试点项目,向经过验证的网络安全专业人员提供未来更强大模型的访问权限。
前沿
John Schulman谈死胡同、扩展强化学习和建立研究机构
https://www.youtube.com/watch?v=29BYxvvF1iM&utm_source=tldrai
John Schulman估计,有了完整的后见之明,少数有才华的人可以在2018-2019年用几个GPU盒子构建出ChatGPT-3.5级别的模型。他描述了早期的OpenAI是一个由小规模探索性研究项目和受DeepMind的AlphaGo启发的大工程努力组成的“拼凑”混合体。他预计价值函数和离线强化学习将会卷土重来,并警告说追赶模式使后来建立探索性研究文化变得更加困难。
评估思维链监控能力
https://links.tldrnewsletter.com/LIdH5s
OpenAI提出了一个新的评估套件,用来衡量通过思维链可靠监控模型推理的能力。该研究在24个环境中评估了监控能力,发现推理透明度随着规模、强化学习和推理时计算量的变化而显著不同。
研究
Agent Skills成为开放标准
Agent Skills是一组指令、脚本和资源,可以让AI代理按需获得新的能力。它起源于Anthropic(该组织还创建了MCP),现在已成为一个开放格式,被Cursor、GitHub、VS Code、Claude Code和OpenAI的Codex CLI采用。技能让团队能够将领域专业知识和工作流程打包成可在不同代理产品中使用的便携式、版本控制包。
Replit的快照引擎内部:使AI代理安全的技术
*https://blog.replit.com/inside-replits-snapshot-engine *
Replit构建了一个计算和存储框架,使其能够以隔离、可逆的方式进行更改。这些原语使开发者能够更频繁、更快地进行实验。公司在2024年构建Replit Agent时意识到,同样的原语可以用来增强编码代理。该系统帮助驾驶代理的人类和代理本身都受益于这些工具。本文探讨了使Replit Agent安全的底层系统,以及Replit如何利用它们。它还窥探了Replit的近期路线图。
介绍Mistral OCR 3
https://mistral.ai/news/mistral-ocr-3
Mistral OCR 3旨在从各种文档中提取文本和嵌入图像,具有极高的保真度。它在表格、手写内容、低质量扫描和表单方面相比前一版本有了重大升级。Mistral OCR 3使下游系统能够理解结构以及文档内容。该模型可以通过API集成,并与Document AI一起使用,后者将文档解析为文本或结构化的JSON。
以评分作为奖励:超越可验证领域的强化学习
https://arxiv.org/pdf/2507.17746
Scale AI研究人员开发了一种结构化的方法来强化学习,该方法使用清单式的评分而不是传统的偏好排名来训练语言模型处理主观任务。该框架通过将响应质量分解为可解释的标准(如事实准确性和完整性),在医学推理基准测试中实现了高达28%的提升。
速读
NVIDIA和Alphabet VC投资Vibe编码初创公司Lovable,估值66亿美元
https://www.cnbc.com/2025/12/18/google-and-n.html
Alphabet和Nvidia已投资瑞典Vibe编码初创公司Lovable,在B轮融资中将其估值定为66亿美元。Lovable今年已筹集超过5亿美元。该公司已构建出企业创始人喜爱的产品。其平台使用AI模型帮助用户通过文本提示构建应用程序和网站。
签名闪烁问题
https://steipete.me/posts/2025/signature-flicker
Anthropic修复了Claude Code的签名闪烁问题。终端并不是真正为交互设计的。如果处理不当,重新定位光标和覆盖现有文本很容易导致闪烁。Anthropic选择只重新渲染变化的部分。它从头开始重写了渲染器,同时仍保持React作为组件模型。
反对DSPY和GEPA
https://benanderson.work/blog/contra-dspy-gepa/
试图将LLM工作流视为模块化程序是一种倒退、僵化且不适合最有趣任务的做法。
超级力量4
https://blog.fsck.com/2025/12/18/superpowers-4/
Superpowers 4.5在子代理驱动开发方面表现更好。
项目VEND:第二阶段
https://www.anthropic.com/research/project-vend-2
Anthropic的AI商店老板实验在升级到Sonnet 4.5、添加CRM并聘请AI首席执行官后终于实现盈利。
2026年Vibe编码工具比较
https://read.technically.dev/p/2026-vibe-coding-tool-comparison
Replit是最功能丰富、考虑周全且强大的Vibe编码工具,但如果已经是开发者并想要技术界面,v0是最好的选择。
Meta的Yann LeCun为新AI初创公司设定35亿美元估值
https://finance.yahoo.com/news/metas-yann-lecun-targets-3-110641727.html
法国健康技术初创公司Nabla的创始人Alexandre LeBrun将成为新LeCun公司的首席执行官。