
头条
Perplexity Labs
https://links.tldrnewsletter.com/sUYtq0
Perplexity推出了Perplexity Labs,让专业用户借助网页浏览和代码执行等工具生成报告、电子表格、仪表盘和简单应用程序,从而将想法付诸实践 。
用于上下文图像生成的FLUX.1 KONTEXT
https://bfl.ai/announcements/flux-1-kontext
黑森林实验室发布了FLUX.1 Kontext,这是一套基于文本和图像的上下文图像编辑与生成的流匹配模型。
Anthropic开源用于人工智能可解释性的电路追踪工具
https://www.anthropic.com/research/open-source-circuit-tracing
这些工具能生成“归因图”,用于追踪大语言模型在内部如何做决策,揭示输出背后的逐步推理过程。该库可与流行的开源模型配合使用,还包含一个交互式的Neuronpedia前端,用于探索模型回路。
深度分析
全球第二的人工智能实验室与无可争议的重量级冠军
https://threadreaderapp.com/thread/1928071179115581671.html
DeepSeek R1 0528在人工分析智能指数中从60提升到了68。这使得该模型的智能程度高于xAI的Grok 3 mini、英伟达的Llama Nemotron Ultra、Meta的Llama 4 Maverick和阿里巴巴的通义千问3 253,与谷歌的Gemini 2.5 Pro相当。该模型在架构没有任何变化的情况下,相比前几代全面提升了智能水平。如今,开源模型和闭源模型之间的差距比以往任何时候都小。
前OpenAI安全研究员解读人工智能推理变革
https://lilianweng.github.io/posts/2025-05-01-thinking/
莉莲·翁发表了一项全面的技术调查,将测试时的计算与人类心理学联系起来,借鉴卡尼曼的“快思考与慢思考”来解释为什么模型在回答前有额外计算步骤时表现更好。该综述涵盖了思维链背后的科学、驱动o1和R1的强化学习方法,以及奖励破解带来的对齐风险。
工程
聊天机器人文本转语音(GitHub 仓库)
https://github.com/resemble-ai/chatterbox
Resemble AI发布了一款开源TTS模型,在基准测试中表现超过ElevenLabs,还具备情感夸张控制功能。
使用Renderformer实现全局光照(GitHub仓库)
https://microsoft.github.io/renderformer/
RenderFormer是一种神经渲染器,能基于三角形的场景表示,在具备完整全局光照的情况下,直接生成逼真的图像。它无需针对任何场景进行训练或微调。
网络评测——对比人工智能浏览器代理的新方法
https://blog.skyvern.com/web-bench-a-new-way-to-compare-ai-browser-agents/
Web Bench是用于评估网页浏览代理的新数据集。它包含452个不同网站上的5750项任务。根据Web Bench,Anthropic Sonnet 3.7 CUA目前处于领先水平 。
更便宜的VLM训练(GitHub代码库)
https://github.com/facebookresearch/zero
Meta的研究人员推出了一种名为零样本嫁接的方法,该方法用一个源自大型大语言模型(LLM)浅层的较小替代模型来训练视觉编码器。这能将视觉语言模型(VLM)的训练成本降低约45%,同时在迁移到完整大语言模型(LLM)时,性能保持不变甚至有所提升。
其他
我最近明白了一点,就是把人工智能研究视为一个“最高性能领域” 。
https://threadreaderapp.com/thread/1928174505148698909.html
“极致表现领域”指的是这样一些行业:人们只要在工作的某一方面表现出色,就能成为世界级人才。就算你在相关技能方面不怎么样也没关系,只要能产生重大影响就行。在某一方面的卓越能力,比在工作其他方面的不足更重要。在极致表现领域工作是一种奢侈,因为这里允许失败,压力通常也是自己给自己的 。
人工智能需求增长1000倍
https://tomtunguz.com/nvda-2025-05-29/
英伟达报告称,从简单人工智能向更复杂推理转变,实现显著增长,推动人工智能需求大幅提升。超大规模数据中心每周部署近7.2万块GPU,仅微软的令牌生成量就增长了五倍。尽管人们努力缩小模型规模,但需求增加仍需要更多被称为“人工智能工厂”的数据中心。
谷歌发布MedGemma医疗人工智能模型
https://developers.google.com/health-ai-developer-foundations/medgemma
MedGemma是基于Gemma 3构建的开源模型,有40亿参数多模态和270亿参数纯文本两种版本。
Hugging Face推出两款完全开源的人形机器人
https://techcrunch.com/2025/05/29/hugging-face-unveils-two-new-humanoid-robots/
在收购Pollen Robotics仅一个月后,Hugging Face就推出了全尺寸人形机器人HopeJR,以及用于测试人工智能应用的桌面机器人Reachy Mini。
特拉华州审查OpenAI向盈利性转变一事
特拉华州总检察长聘请了一家银行来独立评估OpenAI的重组计划,这可能会让该公司向盈利模式转变的行动变得复杂。
马斯克试图阻止OpenAI与阿联酋的人工智能交易,原因是XAI被排除在外
马斯克很懊恼,由他的私人对手山姆·奥特曼领导的OpenAI被选为阿联酋人工智能园区项目的合作方。
VIBE编程平台正火爆起来。
https://threadreaderapp.com/thread/1928154833514836382.html
数据显示,人们在为自己而非全世界制造东西,但建设者们显然很兴奋。
人工智能编码工具和集成开发环境完整列表
https://threadreaderapp.com/thread/1928096496987066604.html
一位开发者测试了46种不同的人工智能编码工具,为每个平台提供了详细对比和使用案例。