2025-11-24 简讯 : Gemini 3 Pro Image


头条


Gemini 3 Pro Image

https://deepmind.google/models/gemini-image/pro/

Nano Banana Pro,也就是Gemini 3 Pro Image,号称能实现工作室级别的图像生成和编辑。它能处理文本(这一直是个难题),呈现连贯的多角色场景,还能结合现实世界知识来制作信息图表。

ChatGPT 协作新方式

https://fidjisimo.substack.com/p/a-new-way-to-collaborate-in-chatgpt

群聊功能现已在全球范围内向ChatGPT免费版、Go版、Plus版和Pro版开放。用户现在可以邀请最多20人,和ChatGPT一起群聊。群聊是可选功能,和私聊分开。群聊中不会共享个人ChatGPT记忆,也不会产生新记忆。用户只能通过邀请加入群聊,可以随时选择退出或移除群成员。


深度分析


关于人工智能的一些想法

https://links.tldrnewsletter.com/Zoctff

Gemini 3 表明,预训练的规模法则依然有效。这意味着,Blackwell 模型明年推出时,性能可能会大幅提升。GPT - 5 并不能证明规模法则失效,该模型旨在降低推理成本,而非提升性能。虽然 Gemini 3 是在 TPU 上训练的,但预训练关键在于连贯的浮点运算次数,所以训练结果移植到 Blackwell 芯片上应该没问题。

OpenAI 在面向消费者的 AI 领域赢不了谷歌

https://nextword.substack.com/p/openai-cant-beat-google-in-consumer

只要还局限于聊天机器人模式,OpenAI 在面向消费者的人工智能领域就赢不了谷歌。OpenAI 近期推出的产品表现不佳。它需要新的产品形态来推动业务增长。谷歌的数据优势尽显,其众多应用带来的小优势也在不断积累。微软和亚马逊面临失去最大人工智能业务量的风险。

规模增长的壁垒是海市蜃楼。

https://tomtunguz.com/gemini-3-proves-pretraining-scaling-laws-intact/

Gemini 3 表明,模型在扩展时增加算力仍能提升性能。它和 Gemini 2.5 参数数量相同,但性能大幅提升。谷歌将这些提升归功于预训练和后训练,还表示提升空间似乎无限。该模型发布是自 OpenAI 的 o1 以来最有力的证据,证明当算法改进与更强大的算力结合时,预训练扩展依然有效。


工程


Parallel Extract

https://threadreaderapp.com/thread/1991568991954034727.html

Parallel Extract是一个API,能从URL获取内容并以Markdown格式返回。它基于与Parallel的搜索、任务、全查找和监控API相同的专有网络索引和检索基础设施构建。Parallel Extract可以从最难处理的网站可靠地提取信息。开发者可以在Parallel开发者平台免费试用Extract。

推出 Cline-Bench:面向智能编码的真实世界开源基准测试

https://cline.bot/blog/cline-bench-initiative

Cline - bench 是一项新计划,旨在根据真实的开源开发场景,创建高保真基准测试和强化学习环境。人工智能模型已有显著进展,但该领域仍缺少能代表实际工程工作的严格开源基准测试。模型实验室需要能揭示实际问题的评估。Cline - bench 通过创建能体现实际工程限制的研究级环境,为人工智能研发的下一阶段提供支持。

Autocomplete

https://adrs-ucb.notion.site/autocomp

Autocomp是一个优化张量加速器代码的框架。它能帮助硬件设计师充分发挥张量加速器的性能。在AWS Trainium上,Autocomp的表现比人类专家内核编写者高出17倍。它可移植性强,使用方便。


其他


ACT - 1

https://links.tldrnewsletter.com/8vhawt

ACT - 1是一个前沿的机器人基础模型,训练时未使用任何机器人数据。它是用特殊的技能捕捉手套训练出来的,这种手套能在任何地方收集数据,不用移动机器人。在接触密集型任务中,基于手套的数据收集比远程操作能产生更高质量的数据。在帖子里能看到周日机器人公司的Memo机器人用ACT - 1模型执行任务的视频。

OpenAI的主导地位是硅谷前所未有的

https://www.cnbc.com/2025/10/11/open-ai-silicon-valley-tech-startup.html

OpenAI在人工智能领域占据主导地位,其财务状况神秘,还制定了在数据中心、应用程序和设备等方面的快速扩张战略。首席执行官山姆·奥特曼与英伟达、博通、甲骨文和AMD建立了积极的合作关系,这显示出其有5000亿美元的增长潜力。尽管有人担心竞争问题,但行业领袖认为OpenAI的快速发展既是挑战,也是优势,引发了人工智能投资的“淘金热心态”。

双子座模型中的AI图像验证

https://blog.google/technology/ai/ai-image-verification-gemini-app/

谷歌已将基于SynthID的AI图像验证功能集成到Gemini应用中,用户通过简单查询,就能直接查看图像是否由谷歌AI生成或编辑。

用GPT - 5加速科学研究的早期实验

https://links.tldrnewsletter.com/BCcc0Y

OpenAI发布了与多所机构合作的案例研究,这些机构包括牛津大学、伯克利大学和劳伦斯利弗莫尔国家实验室。研究显示,GPT - 5能帮助研究人员在几分钟内解决原本需要数月才能解决的问题。

富士康与OpenAI合作开展人工智能硬件制造

https://links.tldrnewsletter.com/R2Qx21

在一系列备受瞩目的交易中,最近OpenAI将与富士康合作,设计数据中心机架和人工智能硬件组件。

AI2的Olmo3技术报告

https://allenai.org/papers/olmo3

Olmo3 是一套全新的全开源模型,规模分别为70亿和320亿参数。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容