2025-11-18 简讯 : 谷歌下周将发布Nano Banana Pro


头条


谷歌下周将发布由 Gemini 3 Pro 驱动的 Nano Banana Pro

https://www.testingcatalog.com/google-to-release-nano-banana-pro-powered-by-gemini-3-pro-next-week/

谷歌计划下周推出Gemini 3和Nano Banana Pro。该公司一直会同时更新其系列中的Gemini模型,预计这次也会全面推出。“Pro”这一标识表明,谷歌计划在其平台生态系统中提供易用且适用于生产的生成式工具。

我们正在推出 GPT - 5.1 和新的定制功能

https://links.tldrnewsletter.com/K2SotX

GPT - 5.1现已向用户推出。它有8种独特的聊天风格,方便用户设定适合自己的语气和风格。这次Reddit问答活动邀请了OpenAI团队的成员。

获OpenAI支持的FutureHouse推出Kosmos AI科学家

https://edisonscientific.com/articles/announcing-kosmos

FutureHouse(正在向商业分拆公司爱迪生科学过渡)推出了一款人工智能科学家,每次运行能阅读1500篇论文,运行4.2万行分析代码。测试用户估计,Kosmos运行一次的成果,他们自己要花6个月才能完成,其结论准确率达79.4%,不过该系统有时会得出统计学上显著但科学上无关的结果。它已经有了7项发现,其中3项重现了未发表的研究成果,4项带来了新见解,包括一项在人体组织中得到验证的与阿尔茨海默病相关的发现。Kosmos每次运行收费200美元,还为学术界提供大量免费使用机会。


深度分析


10亿Token挑战:寻找完美的预训练组合

https://huggingface.co/blog/codelion/optimal-dataset-mixing

大多数现代语言模型需要大量计算资源和数月的训练时间。这篇文章探讨了如何找到最佳方法,创建高效的预训练数据集,从而在大幅减少数据使用量的同时实现高性能。文章揭示了关于数据集混合策略、课程测试失败模式以及合成内容“最佳区间”的关键见解。最终的混合方案始终优于复杂的课程策略,能避免灾难性失败,同时保持出色的泛化能力。

惨痛教训

https://www.hyperdimensional.co/p/the-bitter-lessons

比赛有明确的界限和终点线。但中美之间的人工智能“竞赛”并非如此。目前没人知道人工智能会走向何方,这个领域仍在探索中。中美采取了发挥各自独特优势的不同策略。两国陷入了结构性冲突,似乎难以达成和谐。


工程


我们刚在Claude API中推出了结构化输出功能。

https://threadreaderapp.com/thread/1989409186674098595.html

Claude Sonnet 4.5和Opus 4.1现在已开放结构化输出公测。Haiku 4.5的支持也即将推出。如果没有结构化输出,即便精心设置提示,Claude也可能生成格式错误的JSON响应或使工具输入无效,导致应用程序出错。结构化输出能约束Claude的回应,使其遵循特定模式。这样就能确保输出有效且可解析,便于后续处理。

AMP 中的上下文管理

https://ampcode.com/guides/context-management

上下文窗口是大语言模型(LLM)生成输出时接收的全部输入。它包含消息、模型的回复、工具调用,以及模型为“推理”输出的思考模块。用户和模型之间的所有交互都会进入上下文窗口。本文将为用户介绍Amp提供的一些管理上下文窗口内容的方法。

Depth Anything-3

https://github.com/ByteDance-Seed/depth-anything-3

深度万物3(DA3)能从单视图或多视图图像中估算出空间一致的深度,无需考虑相机姿态。它借助普通的Transformer主干架构和单一深度射线表示法,简化了架构和训练过程。

黑盒大语言模型(LLM)的蒸馏

https://ytianzhu.github.io/Generative-Adversarial-Distillation/

GAD推出了一种新方法,仅用生成的文本,无需获取输出概率,就能从黑盒大语言模型(LLM)中提炼知识。它通过对抗学习,让学生模型与判别器对抗训练,实现策略内模仿。


其他


人工智能是一种新的计算模式

https://threadreaderapp.com/thread/1990116666194456651.html

人工智能让我们可以通过设定目标来编写程序。如果一项任务能被验证,就能训练神经网络把它完成得非常出色。任务的可验证性越强,就越适合用人工智能实现自动化。

萨蒂亚·纳德拉对人工智能平台的反思

https://x.com/satyanadella/status/1989755076353921404

微软和OpenAI、英伟达共同设计了新的AI超级工厂,整合了三代前沿训练系统,还引入AMD用于GPT推理,以丰富硬件组合。该公司打算扩大这一基础设施规模,让企业可以自行训练和运行模型,无需把价值和控制权交给大型AI供应商。制药、制造和教育等行业用AI来缩短时间、提高产量时,将带来最大影响,创造共赢的经济收益。

40年来,他对人工智能的看法一直是对的,现在他觉得大家都错了。

https://www.wsj.com/tech/ai/yann-lecun-ai-meta-0058b13c

杨立昆可能很快离开Meta,去创办一家专注世界模型的初创公司,因为他认为大语言模型在追求超级智能的道路上是死胡同。

SAKANA AI 荣膺日本最具价值独角兽企业

https://asia.nikkei.com/business/technology/artificial-intelligence/sakana-ai-takes-crown-as-japan-s-most-valuable-unicorn

Sakana AI从包括三菱日联金融集团(MUFG)、桑坦德银行(Santander)和美国风投公司在内的投资者那里筹集了1.32亿美元,估值被推高至约26亿美元,创下了日本未上市初创企业的纪录。

OpenAI 称已修复 ChatGPT 的破折号问题

https://techcrunch.com/2025/11/14/openai-says-its-fixed-chatgpts-em-dash-problem/

OpenAI修复了ChatGPT一直存在的破折号使用问题,用户可以通过自定义指令禁用该功能。

谷歌地图发布新AI工具,可创建交互式项目

https://techcrunch.com/2025/11/10/google-maps-releases-new-ai-tools-to-let-you-create-interactive-projects/

谷歌地图引入了人工智能工具,包括构建器代理和MCP服务器,让开发者能用地图数据创建交互式项目。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容