
头条
Cursor 的200美元至尊套餐
https://www.cursor.com/en/blog/new-tier
Anysphere推出了固定价格的Ultra套餐,其计算能力比Pro套餐高得多,这得益于与主要模型供应商的长期合作。
双子座2.5更新可用情况
https://developers.googleblog.com/en/gemini-2-5-thinking-model-updates/
谷歌全面推出Gemini 2.5 Pro和Flash,Flash-Lite首次开启预览,并引入可控“思考”预算,在提高推理准确性的同时为开发者提供灵活性。
山姆·奥特曼谈Meta 1亿美元的挖角
在一期播客中,OpenAI首席执行官证实,Meta曾以九位数薪酬招揽研究人员加入其超级智能团队,但称几乎没人跳槽,还借此机会嘲讽了Meta的招聘行动。
深度分析
如何避免因人工智能而丢掉工作
https://80000hours.org/agi/guide/skills-ai-makes-valuable/
这份职业指南指出,有些技能会在自动化程度提高的情况下反而变得更有价值,比如人工智能部署、领导力和政府关系。它建议知识型工作者干脆跳过传统的入门级岗位,提倡从事副业项目和初创企业的工作,因为人工智能正在削弱传统企业的层级架构。
理解并为大语言模型(LLMs)中的键值缓存(KV Cache)编写代码
https://magazine.sebastianraschka.com/p/coding-the-kv-cache-in-llms
键值(KV)缓存可在大语言模型(LLM)推理过程中存储中间注意力计算结果,以避免重复计算。逐词生成 “时光飞逝(Time flies fast)” 时,模型通常会在每一步重新计算 “Time” 和 “flies” 的注意力,但缓存这些值能将速度提高5倍。本教程先从使用基本缓存缓冲区和位置跟踪修改一个124M参数的GPT模型开始,再到如预分配内存和滑动窗口等可用于生产的优化措施,以解决长序列中线性增长且成本过高的内存问题。
OpenAI构建智能体实用指南
https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf
本指南强调,先从单智能体入手,再涉足多智能体系统。可采用管理器模式,即一个智能体通过工具调用或去中心化交接来协调其他智能体进行点对点任务分配。关键要点包括:将防护措施设为分层防御(基于大语言模型的分类器、正则表达式过滤器和审核应用程序编程接口);针对复杂的长期任务设计工具;构建由失败阈值或高风险行为触发的人工介入机制 。
工程
利用大模型进行实时动作分块
https://www.physicalintelligence.company/research/real_time_chunking
与聊天机器人或图像生成器不同,机器人必须实时运行——输入和输出之间的延迟会对性能产生明显影响。虽然视觉-语言-动作(VLA)模型在开放世界泛化方面取得了不错的成果,但运行速度可能较慢。本文介绍了一种名为实时分块的算法,它能实现无间断的实时执行。该算法适用于任何基于扩散或流的VLA,且无需改变训练时间。
用于MI-EGG解码的时空注意力机制(GitHub代码库)
https://github.com/snailpt/TCANet
TCANet融合多尺度卷积、时间压缩和堆叠自注意力机制,对运动想象脑电图进行建模。
迷你Max发布开源权重推理模型M1(GitHub仓库)
https://github.com/MiniMax-AI/MiniMax-M1
MiniMax的4560亿参数模型采用了带有“闪电注意力”的混合专家混合架构,能处理100万个词元的上下文(是DeepSeek R1的8倍),在生成10万个词元长度时所需的每秒浮点运算次数减少25% 。
其他
O3 转为职业(选手/战队 ,需结合具体语境确定完整含义)
https://thezvi.substack.com/p/o3-turns-pro
o3-pro似乎比o3能给出更好的答案,但等待时间要长得多。大规模使用API成本高得让人望而却步,所以用户不妨通过聊天界面并行查询。o3-pro和o3面向同样的小众群体,所以考虑使用Opus的用户可能更愿意选择Opus,而非o3-pro,或者在使用o3-pro的同时也用Opus。o3降价80%似乎比o3-pro更有影响力——o3-pro在很大程度上仍是一款“仅用于特殊情况”的模型。
我们向70多名议员简报人工智能威胁后所了解到的情况
https://links.tldrnewsletter.com/sHMTpl
关于人工智能风险的简报显示,大多数英国议员缺乏深入的人工智能知识,且面临能力限制,这制约了对人工智能问题的研究。这些简报很受欢迎,三分之一的议员公开支持降低人工智能风险的行动。有效的宣传推广包括持续跟进,以及借助知名人工智能权威人士的言论来表明与人工智能相关的灭绝风险的严重性。
Meta与普拉达的人工智能智能眼镜
https://techcrunch.com/2025/06/17/meta-is-reportedly-building-ai-smart-glasses-with-prada-too/
Meta正与普拉达合作开发引领时尚的人工智能眼镜,业务范围已超越与雷朋的合作,而且有迹象显示未来产品线会更丰富,可能很快就会推出售价360美元的奥克利眼镜。
XAI正在洽谈43亿美元股权融资和50亿美元债务融资事宜
https://links.tldrnewsletter.com/s3niSb
这家人工智能初创公司每月消耗10亿美元,需要新资金。周二是债券发售的承诺截止日期,在人工智能领域融资竞争激烈的情况下,这将考验投资者的兴趣。
谷歌双子座玩《宝可梦》时慌了神
https://techcrunch.com/2025/06/17/googles-gemini-panicked-when-playing-pokemon/
Gemini 2.5 Pro陷入多种状况,这致使它模拟出恐慌情绪——在压力下它做出了糟糕又仓促的决定。
人工智能初创公司Anysphere收到风投报价,估值超180亿美元
https://finance.yahoo.com/news/ai-startup-anysphere-fields-vc-010417332.html
热门人工智能代码编辑器Cursor的开发商Anysphere,已有投资者与其接洽一项交易,该交易将使其估值翻倍。
WhatsApp将允许用户打造自己的人工智能聊天机器人并在应用内使用
https://9to5mac.com/2025/06/04/whatsapp-ai-chatbot/
WhatsApp正在测试一项“AI Studio”功能,用户无需编码就能创建定制聊天机器人。