
头条
Meta的人工智能负责人探讨在App中使用谷歌、OpenAI的模型
https://links.tldrnewsletter.com/7QcJip
在开发Llama 5的过渡阶段,Meta正考虑将谷歌和OpenAI的模型集成到自家应用中。该公司内部已在编码工作中使用Anthropic。
OpenAI计划在印度建立数据中心,大力推进“星门”扩张
OpenAI计划在印度新建一个大型数据中心。目前它正在寻找当地合作伙伴来协助建立该数据中心,其容量至少将达到1千兆瓦。该项目的确切地点和时间尚不清楚。OpenAI准备在新德里开设办事处,并正在招聘以扩充当地团队。它已承诺与印度政府就其12亿美元的“印度人工智能使命”展开合作,该使命旨在为印度打造大语言模型。
深度分析
深入了解VLLM:高吞吐量大语言模型推理系统剖析
https://www.aleksagordic.com/blog/vllm
这是对现代高吞吐量大语言模型(LLM)推理系统核心组件和先进功能的技术解析,从PagedAttention的内存管理突破,到实现大规模人工智能部署高效性的分布式服务架构。
人工智能与就业
https://www.noahpinion.blog/p/ai-and-jobs-again
如果人工智能真的减少了软件开发和客户服务领域的劳动力需求,那为什么公司一方面不招22岁的年轻人,另一方面却急于招聘同行业的中年员工呢?而且为什么工资没有随着就业需求下降呢?近期有关人工智能对劳动力影响的研究言过其实了,是挑选数据得出的结果。
人工智能的二阶效应
https://tomtunguz.com/mdb-earnings-2025-08-27/
人工智能供应商收入超过传统软件,新订单量翻倍,影响了MongoDB的Atlas,Atlas业务复苏,增长29%。原生人工智能公司因Atlas可扩展的向量搜索能力,越来越多地选择它,过去两个季度新增客户超5000家。这种由人工智能驱动的需求转变不仅推动了MongoDB的发展,也对更广泛的软件分销渠道产生重大影响。
工程
大语言模型推理前沿综述:推理扩展、学习推理与智能体系统
https://arxiv.org/pdf/2504.09037
大语言模型(LLM)推理方法可分为两个维度:模式(推理时与基于训练)和架构(独立与智能体系统)。在向智能体工作流程转变的过程中,已经从最初类似o1的推理扩展转向像DeepSeek-R1这样的学习推理方法。
R-4B:双模式多模态大语言模型(GitHub 仓库)
https://github.com/yannqi/R-4B
R-4B是一种多模态大语言模型(LLM),它使用双模式训练框架,能在逐步推理和直接回答之间自适应切换。
其他
Compiling Dinner
https://gist.github.com/breadchris/5877d1ab8381526bb81b551ffd5d1768
透过编译器的视角看世界,会让日常系统不再那么神秘,而更像可编程的环境。传统上,构建编译器需要深厚的专业知识和极大的耐心。大语言模型改变了这一局面。现在可以用简单的英语描述规则,让模型勾勒出用于词法分析、语法分析和执行这些规则的代码。编译器以前是专家们的小众领域。如今,任何人都可以为自己感兴趣的领域勾勒出一个编译器,并能立即看到意图和执行之间的联系 。
纯粹的运气如何让这个加勒比小岛屿靠网址赚数百万
https://www.bbc.com/news/articles/cn5xdp427veo.amp
安圭拉在80年代获得.ai域名时意外收获一笔财富。这个拥有1.6万人口的加勒比地区,如今每年从超85万个.ai域名中获利3900万美元,近四分之一的政府收入来自那些花70万美元购买域名(比如you.ai)的公司。
谷歌测试全新 NotebookLM 语音及音频形式:简报、评论、辩论
谷歌正在NotebookLM中测试新语音和三种新的音频概述形式(摘要、评论和辩论)。
Runway的世界模型引发机器人行业关注
以人工智能视频生成工具闻名的Runway,正看到机器人和自动驾驶公司对其世界模型有需求,用于模拟和训练。
人工智能公司Anthropic将开始基于聊天记录训练其人工智能模型
https://www.theverge.com/anthropic/767507/anthropic-user-data-consumers-ai-models-training-privacy
Anthropic将开始用用户聊天和编码数据训练其人工智能模型,除非用户在9月28日前选择退出。
软件价值的杠铃策略
https://mehmetmhy.com/posts/barbell_theory/
在人工智能时代,销售软件不是个好的商业模式,因为任何功能都能很快被复制。