2025-12-23 简讯 : OpenAI的新融资可能将估值至8300亿美元

头条

OpenAI的新融资可能将估值至8300亿美元

https://www.wsj.com/tech/ai/openais-new-fundraising-round-could-value-startup-at-as-much-as-830-billion-93de9f7c

OpenAI正处于早期融资阶段，该轮融资可能筹集高达1000亿美元，将该公司估值至高达8300亿美元。该公司最早可能在第一季度末完成该轮融资。目前尚不清楚是否有足够的投资者需求达到目标。自公开市场对AI支出的热情消退以来，这是OpenAI面临的最大考验之一。

Meta正在开发名为'MANGO'的新AI图像和视频模型

https://www.wsj.com/tech/ai/meta-developing-new-ai-image-and-video-model-code-named-mango-16e785c7

Meta正在开发一款新的图像和视频重点AI模型，代号为Mango。该模型预计将在2026年上半年发布。图像生成已被证明是大AI模型公司之间战争的重要前线。这是许多用户的首要关注点，也是留住他们回来的关键功能。

介绍GPT-5.2-Codex

https://openai.com/index/introducing-gpt-5-2-codex

OpenAI的新代理编码模型在SWE-Bench Pro和Terminal-Bench 2.0上处于领先地位，具有改进的长期工作能力。OpenAI正在启动一个可信访问试点项目，向经过验证的网络安全专业人员提供未来更强大模型的访问权限。

前沿

John Schulman谈死胡同、扩展强化学习和建立研究机构

https://www.youtube.com/watch?v=29BYxvvF1iM&utm_source=tldrai

John Schulman估计，有了完整的后见之明，少数有才华的人可以在2018-2019年用几个GPU盒子构建出ChatGPT-3.5级别的模型。他描述了早期的OpenAI是一个由小规模探索性研究项目和受DeepMind的AlphaGo启发的大工程努力组成的“拼凑”混合体。他预计价值函数和离线强化学习将会卷土重来，并警告说追赶模式使后来建立探索性研究文化变得更加困难。

评估思维链监控能力

https://links.tldrnewsletter.com/LIdH5s

OpenAI提出了一个新的评估套件，用来衡量通过思维链可靠监控模型推理的能力。该研究在24个环境中评估了监控能力，发现推理透明度随着规模、强化学习和推理时计算量的变化而显著不同。

研究

Agent Skills成为开放标准

https://agentskills.io/home

Agent Skills是一组指令、脚本和资源，可以让AI代理按需获得新的能力。它起源于Anthropic（该组织还创建了MCP），现在已成为一个开放格式，被Cursor、GitHub、VS Code、Claude Code和OpenAI的Codex CLI采用。技能让团队能够将领域专业知识和工作流程打包成可在不同代理产品中使用的便携式、版本控制包。

Replit的快照引擎内部：使AI代理安全的技术

*https://blog.replit.com/inside-replits-snapshot-engine *

Replit构建了一个计算和存储框架，使其能够以隔离、可逆的方式进行更改。这些原语使开发者能够更频繁、更快地进行实验。公司在2024年构建Replit Agent时意识到，同样的原语可以用来增强编码代理。该系统帮助驾驶代理的人类和代理本身都受益于这些工具。本文探讨了使Replit Agent安全的底层系统，以及Replit如何利用它们。它还窥探了Replit的近期路线图。

介绍Mistral OCR 3

https://mistral.ai/news/mistral-ocr-3

Mistral OCR 3旨在从各种文档中提取文本和嵌入图像，具有极高的保真度。它在表格、手写内容、低质量扫描和表单方面相比前一版本有了重大升级。Mistral OCR 3使下游系统能够理解结构以及文档内容。该模型可以通过API集成，并与Document AI一起使用，后者将文档解析为文本或结构化的JSON。

以评分作为奖励：超越可验证领域的强化学习

https://arxiv.org/pdf/2507.17746

Scale AI研究人员开发了一种结构化的方法来强化学习，该方法使用清单式的评分而不是传统的偏好排名来训练语言模型处理主观任务。该框架通过将响应质量分解为可解释的标准（如事实准确性和完整性），在医学推理基准测试中实现了高达28%的提升。

2025-12-23 简讯 : OpenAI的新融资可能将估值至8300亿美元