
头条
Gemini 3 Pro Image
https://deepmind.google/models/gemini-image/pro/
Nano Banana Pro,也就是Gemini 3 Pro Image,号称能实现工作室级别的图像生成和编辑。它能处理文本(这一直是个难题),呈现连贯的多角色场景,还能结合现实世界知识来制作信息图表。
ChatGPT 协作新方式
https://fidjisimo.substack.com/p/a-new-way-to-collaborate-in-chatgpt
群聊功能现已在全球范围内向ChatGPT免费版、Go版、Plus版和Pro版开放。用户现在可以邀请最多20人,和ChatGPT一起群聊。群聊是可选功能,和私聊分开。群聊中不会共享个人ChatGPT记忆,也不会产生新记忆。用户只能通过邀请加入群聊,可以随时选择退出或移除群成员。
深度分析
关于人工智能的一些想法
https://links.tldrnewsletter.com/Zoctff
Gemini 3 表明,预训练的规模法则依然有效。这意味着,Blackwell 模型明年推出时,性能可能会大幅提升。GPT - 5 并不能证明规模法则失效,该模型旨在降低推理成本,而非提升性能。虽然 Gemini 3 是在 TPU 上训练的,但预训练关键在于连贯的浮点运算次数,所以训练结果移植到 Blackwell 芯片上应该没问题。
OpenAI 在面向消费者的 AI 领域赢不了谷歌
https://nextword.substack.com/p/openai-cant-beat-google-in-consumer
只要还局限于聊天机器人模式,OpenAI 在面向消费者的人工智能领域就赢不了谷歌。OpenAI 近期推出的产品表现不佳。它需要新的产品形态来推动业务增长。谷歌的数据优势尽显,其众多应用带来的小优势也在不断积累。微软和亚马逊面临失去最大人工智能业务量的风险。
规模增长的壁垒是海市蜃楼。
https://tomtunguz.com/gemini-3-proves-pretraining-scaling-laws-intact/
Gemini 3 表明,模型在扩展时增加算力仍能提升性能。它和 Gemini 2.5 参数数量相同,但性能大幅提升。谷歌将这些提升归功于预训练和后训练,还表示提升空间似乎无限。该模型发布是自 OpenAI 的 o1 以来最有力的证据,证明当算法改进与更强大的算力结合时,预训练扩展依然有效。
工程
Parallel Extract
https://threadreaderapp.com/thread/1991568991954034727.html
Parallel Extract是一个API,能从URL获取内容并以Markdown格式返回。它基于与Parallel的搜索、任务、全查找和监控API相同的专有网络索引和检索基础设施构建。Parallel Extract可以从最难处理的网站可靠地提取信息。开发者可以在Parallel开发者平台免费试用Extract。
推出 Cline-Bench:面向智能编码的真实世界开源基准测试
https://cline.bot/blog/cline-bench-initiative
Cline - bench 是一项新计划,旨在根据真实的开源开发场景,创建高保真基准测试和强化学习环境。人工智能模型已有显著进展,但该领域仍缺少能代表实际工程工作的严格开源基准测试。模型实验室需要能揭示实际问题的评估。Cline - bench 通过创建能体现实际工程限制的研究级环境,为人工智能研发的下一阶段提供支持。
Autocomplete
https://adrs-ucb.notion.site/autocomp
Autocomp是一个优化张量加速器代码的框架。它能帮助硬件设计师充分发挥张量加速器的性能。在AWS Trainium上,Autocomp的表现比人类专家内核编写者高出17倍。它可移植性强,使用方便。
其他
ACT - 1
https://links.tldrnewsletter.com/8vhawt
ACT - 1是一个前沿的机器人基础模型,训练时未使用任何机器人数据。它是用特殊的技能捕捉手套训练出来的,这种手套能在任何地方收集数据,不用移动机器人。在接触密集型任务中,基于手套的数据收集比远程操作能产生更高质量的数据。在帖子里能看到周日机器人公司的Memo机器人用ACT - 1模型执行任务的视频。
OpenAI的主导地位是硅谷前所未有的
https://www.cnbc.com/2025/10/11/open-ai-silicon-valley-tech-startup.html
OpenAI在人工智能领域占据主导地位,其财务状况神秘,还制定了在数据中心、应用程序和设备等方面的快速扩张战略。首席执行官山姆·奥特曼与英伟达、博通、甲骨文和AMD建立了积极的合作关系,这显示出其有5000亿美元的增长潜力。尽管有人担心竞争问题,但行业领袖认为OpenAI的快速发展既是挑战,也是优势,引发了人工智能投资的“淘金热心态”。
双子座模型中的AI图像验证
https://blog.google/technology/ai/ai-image-verification-gemini-app/
谷歌已将基于SynthID的AI图像验证功能集成到Gemini应用中,用户通过简单查询,就能直接查看图像是否由谷歌AI生成或编辑。
用GPT - 5加速科学研究的早期实验
https://links.tldrnewsletter.com/BCcc0Y
OpenAI发布了与多所机构合作的案例研究,这些机构包括牛津大学、伯克利大学和劳伦斯利弗莫尔国家实验室。研究显示,GPT - 5能帮助研究人员在几分钟内解决原本需要数月才能解决的问题。
富士康与OpenAI合作开展人工智能硬件制造
https://links.tldrnewsletter.com/R2Qx21
在一系列备受瞩目的交易中,最近OpenAI将与富士康合作,设计数据中心机架和人工智能硬件组件。
AI2的Olmo3技术报告
https://allenai.org/papers/olmo3
Olmo3 是一套全新的全开源模型,规模分别为70亿和320亿参数。