头条
ElevenLabs发布个人AI语音助手
https://elevenlabs.io/blog/introducing-11ai
11.ai是一款低延迟语音助手,它利用MCP与Perplexity、Linear、Slack和Notion集成,以执行多步骤工作流程。
谷歌推出Imagen 4
https://developers.googleblog.com/en/imagen-4-now-available-in-the-gemini-api-and-google-ai-studio/
最新模型显著提升了图像内的文本生成能力,这一直是各图像模型的薄弱环节。所有输出都带有谷歌的SynthID水印。
Anthropic在人工智能合理使用方面赢得重大胜利
阿尔苏普法官裁定,Anthropic将合法购买的书籍用于人工智能训练属于合理使用。这一裁决不涉及Anthropic从互联网获取的盗版书籍,针对这些盗版书籍造成的损失将另案审理裁定。
深度分析
适用于设备端机器人技术的双子座2.5
https://developers.googleblog.com/en/gemini-25-for-robotics-and-embodied-intelligence/
谷歌详细介绍了具备空间感知多模态推理和代码生成能力的Gemini 2.5 Pro和Flash,如何通过实时应用程序编程接口(Live API)在机器人上本地运行,以标记场景、制定任务计划,并将语音指令转化为可执行动作。
代币化即将迎来惨痛教训。
https://lucalp.dev/bitter-lesson-tokenization-and-blt/
标记化应该被一种能更好利用计算和数据的通用方法所取代。本文探讨了标记化的作用及其脆弱性,并阐述了摒弃它的理由。随后研究了颇具潜力的候选方案字节潜在Transformer(Byte Latent Transformer)可能产生的影响。
AI 与五大科技巨头
https://stratechery.com/2025/checking-in-on-ai-and-the-big-five/
有影响力的科技分析师本·汤普森称,如果大语言模型(LLMs)确实带来变革,而扎克伯格最近的人才收购行动失败,Meta将成为人工智能时代的“聚友网”。汤普森认为,尽管微软与OpenAI的关系日益紧张,但微软对Azure-OpenAI API的独家访问权是关键优势。他还认为亚马逊与Anthropic的合作最为稳固,并警告称谷歌仍易受搜索业务被颠覆的影响。
工程
生成式模型中的连续流
https://arxiv.org/abs/2506.18747
ContinualFlow通过向能量重新加权的目标进行流匹配,从模型分布中减去不需要的区域,避免了完全重新训练,且无需原始样本即可运行。
谷歌云将A2A捐赠给Linux基金会
https://developers.googleblog.com/en/google-cloud-donates-a2a-to-linux-foundation/
Linux 基金会在北美开源峰会上宣布,与亚马逊网络服务、思科、谷歌、微软、Salesforce、SAP 和 ServiceNow 共同启动 Agent2Agent 项目。这个新的独立实体将让各公司紧密合作,借助 Agent2Agent 协议及其他互操作性技术,打造一个开放且可互操作的人工智能智能体生态系统。该项目将由 Linux 基金会托管,谷歌会移交协议规范作为项目起始基础。Linux 基金会的中立管理将确保项目不偏向任何供应商,由社区推动发展 。
登顶之路:Xbow 是如何做到的
https://xbow.com/blog/top-1-how-xbow-did-it/
自动渗透测试工具XBOW登上了HackerOne排行榜榜首。该机器人无需人工干预,可快速扩展规模,短短几小时就能完成全面渗透测试,运作方式与人类渗透测试员很相似。它已报告数千个经确认的漏洞,其中很多影响到知名公司的重要目标。
其他
WARP全新智能开发环境助力开发者使用AI编码智能体开展工作
https://links.tldrnewsletter.com/Vt1blo
Warp推出了一个智能开发环境,帮助开发者与人工智能编码智能体交互,超越了传统的集成开发环境(IDE)和终端。这个新工具便于基于提示的代码生成、管理和调试,还集成了人工智能监督功能。Warp的综合环境被定位为其他人工智能开发工具的优质替代方案,拥有超50万用户,且定价具有竞争力。
人工智能道德地位的利害关系
https://links.tldrnewsletter.com/Fqpxt9
随着先进人工智能在社会中变得愈发不可或缺,人工智能被视为“道德受体”的可能性引发了伦理担忧。由于人工智能训练可能涉及痛苦,确定人工智能的意识和道德地位对防止虐待至关重要。这个问题虽然复杂,但促使我们审视自身价值观,以及人工智能迅速融入我们文明所带来的影响。
Databricks与Perplexity联合创始人承诺投入1亿美元用于人工智能研究
安迪·康温斯基的劳德研究所旨在资助“有益的”人工智能研究,首先会向加州大学伯克利分校新成立的人工智能系统实验室投入15美元,为期7年。
将视觉预训练扩展至4K分辨率
PS3利用选择性编码实现高达4K分辨率的高效视觉预训练,为VILA-HD模型奠定基础。
OpenAI 长文本基准测试(Hugging Face 平台)
https://huggingface.co/datasets/openai/mrcr
用于评估大语言模型(LLM)区分隐藏在上下文中多个关键信息能力的长上下文数据集。