2025-06-20 简讯 : Cursor 的200美元至尊套餐

头条

Cursor 的200美元至尊套餐

https://www.cursor.com/en/blog/new-tier

Anysphere推出了固定价格的Ultra套餐，其计算能力比Pro套餐高得多，这得益于与主要模型供应商的长期合作。

双子座2.5更新可用情况

https://developers.googleblog.com/en/gemini-2-5-thinking-model-updates/

谷歌全面推出Gemini 2.5 Pro和Flash，Flash-Lite首次开启预览，并引入可控“思考”预算，在提高推理准确性的同时为开发者提供灵活性。

山姆·奥特曼谈Meta 1亿美元的挖角

https://www.youtube.com/watch

在一期播客中，OpenAI首席执行官证实，Meta曾以九位数薪酬招揽研究人员加入其超级智能团队，但称几乎没人跳槽，还借此机会嘲讽了Meta的招聘行动。

深度分析

如何避免因人工智能而丢掉工作

https://80000hours.org/agi/guide/skills-ai-makes-valuable/

这份职业指南指出，有些技能会在自动化程度提高的情况下反而变得更有价值，比如人工智能部署、领导力和政府关系。它建议知识型工作者干脆跳过传统的入门级岗位，提倡从事副业项目和初创企业的工作，因为人工智能正在削弱传统企业的层级架构。

理解并为大语言模型（LLMs）中的键值缓存（KV Cache）编写代码

https://magazine.sebastianraschka.com/p/coding-the-kv-cache-in-llms

键值（KV）缓存可在大语言模型（LLM）推理过程中存储中间注意力计算结果，以避免重复计算。逐词生成 “时光飞逝（Time flies fast）” 时，模型通常会在每一步重新计算 “Time” 和 “flies” 的注意力，但缓存这些值能将速度提高5倍。本教程先从使用基本缓存缓冲区和位置跟踪修改一个124M参数的GPT模型开始，再到如预分配内存和滑动窗口等可用于生产的优化措施，以解决长序列中线性增长且成本过高的内存问题。

OpenAI构建智能体实用指南

https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf

本指南强调，先从单智能体入手，再涉足多智能体系统。可采用管理器模式，即一个智能体通过工具调用或去中心化交接来协调其他智能体进行点对点任务分配。关键要点包括：将防护措施设为分层防御（基于大语言模型的分类器、正则表达式过滤器和审核应用程序编程接口）；针对复杂的长期任务设计工具；构建由失败阈值或高风险行为触发的人工介入机制。

工程

利用大模型进行实时动作分块

https://www.physicalintelligence.company/research/real_time_chunking

与聊天机器人或图像生成器不同，机器人必须实时运行——输入和输出之间的延迟会对性能产生明显影响。虽然视觉-语言-动作（VLA）模型在开放世界泛化方面取得了不错的成果，但运行速度可能较慢。本文介绍了一种名为实时分块的算法，它能实现无间断的实时执行。该算法适用于任何基于扩散或流的VLA，且无需改变训练时间。

用于MI-EGG解码的时空注意力机制（GitHub代码库）

https://github.com/snailpt/TCANet

TCANet融合多尺度卷积、时间压缩和堆叠自注意力机制，对运动想象脑电图进行建模。

迷你Max发布开源权重推理模型M1（GitHub仓库）

https://github.com/MiniMax-AI/MiniMax-M1

MiniMax的4560亿参数模型采用了带有“闪电注意力”的混合专家混合架构，能处理100万个词元的上下文（是DeepSeek R1的8倍），在生成10万个词元长度时所需的每秒浮点运算次数减少25% 。

2025-06-20 简讯 : Cursor 的200美元至尊套餐