登录注册写文章

2025-06-03 简讯 : Perplexity Labs

2025-06-03 简讯 : Perplexity Labs

头条

Perplexity Labs

https://links.tldrnewsletter.com/sUYtq0

Perplexity推出了Perplexity Labs，让专业用户借助网页浏览和代码执行等工具生成报告、电子表格、仪表盘和简单应用程序，从而将想法付诸实践。

用于上下文图像生成的FLUX.1 KONTEXT

https://bfl.ai/announcements/flux-1-kontext

黑森林实验室发布了FLUX.1 Kontext，这是一套基于文本和图像的上下文图像编辑与生成的流匹配模型。

Anthropic开源用于人工智能可解释性的电路追踪工具

https://www.anthropic.com/research/open-source-circuit-tracing

这些工具能生成“归因图”，用于追踪大语言模型在内部如何做决策，揭示输出背后的逐步推理过程。该库可与流行的开源模型配合使用，还包含一个交互式的Neuronpedia前端，用于探索模型回路。

深度分析

全球第二的人工智能实验室与无可争议的重量级冠军

https://threadreaderapp.com/thread/1928071179115581671.html

DeepSeek R1 0528在人工分析智能指数中从60提升到了68。这使得该模型的智能程度高于xAI的Grok 3 mini、英伟达的Llama Nemotron Ultra、Meta的Llama 4 Maverick和阿里巴巴的通义千问3 253，与谷歌的Gemini 2.5 Pro相当。该模型在架构没有任何变化的情况下，相比前几代全面提升了智能水平。如今，开源模型和闭源模型之间的差距比以往任何时候都小。

前OpenAI安全研究员解读人工智能推理变革

https://lilianweng.github.io/posts/2025-05-01-thinking/

莉莲·翁发表了一项全面的技术调查，将测试时的计算与人类心理学联系起来，借鉴卡尼曼的“快思考与慢思考”来解释为什么模型在回答前有额外计算步骤时表现更好。该综述涵盖了思维链背后的科学、驱动o1和R1的强化学习方法，以及奖励破解带来的对齐风险。

工程

聊天机器人文本转语音（GitHub 仓库）

https://github.com/resemble-ai/chatterbox

Resemble AI发布了一款开源TTS模型，在基准测试中表现超过ElevenLabs，还具备情感夸张控制功能。

使用Renderformer实现全局光照（GitHub仓库）

https://microsoft.github.io/renderformer/

RenderFormer是一种神经渲染器，能基于三角形的场景表示，在具备完整全局光照的情况下，直接生成逼真的图像。它无需针对任何场景进行训练或微调。

网络评测——对比人工智能浏览器代理的新方法

https://blog.skyvern.com/web-bench-a-new-way-to-compare-ai-browser-agents/

Web Bench是用于评估网页浏览代理的新数据集。它包含452个不同网站上的5750项任务。根据Web Bench，Anthropic Sonnet 3.7 CUA目前处于领先水平。

更便宜的VLM训练（GitHub代码库）

https://github.com/facebookresearch/zero

Meta的研究人员推出了一种名为零样本嫁接的方法，该方法用一个源自大型大语言模型（LLM）浅层的较小替代模型来训练视觉编码器。这能将视觉语言模型（VLM）的训练成本降低约45%，同时在迁移到完整大语言模型（LLM）时，性能保持不变甚至有所提升。

其他

我最近明白了一点，就是把人工智能研究视为一个“最高性能领域” 。

https://threadreaderapp.com/thread/1928174505148698909.html

“极致表现领域”指的是这样一些行业：人们只要在工作的某一方面表现出色，就能成为世界级人才。就算你在相关技能方面不怎么样也没关系，只要能产生重大影响就行。在某一方面的卓越能力，比在工作其他方面的不足更重要。在极致表现领域工作是一种奢侈，因为这里允许失败，压力通常也是自己给自己的。

人工智能需求增长1000倍

https://tomtunguz.com/nvda-2025-05-29/

英伟达报告称，从简单人工智能向更复杂推理转变，实现显著增长，推动人工智能需求大幅提升。超大规模数据中心每周部署近7.2万块GPU，仅微软的令牌生成量就增长了五倍。尽管人们努力缩小模型规模，但需求增加仍需要更多被称为“人工智能工厂”的数据中心。

谷歌发布MedGemma医疗人工智能模型

https://developers.google.com/health-ai-developer-foundations/medgemma

MedGemma是基于Gemma 3构建的开源模型，有40亿参数多模态和270亿参数纯文本两种版本。

Hugging Face推出两款完全开源的人形机器人

https://techcrunch.com/2025/05/29/hugging-face-unveils-two-new-humanoid-robots/

在收购Pollen Robotics仅一个月后，Hugging Face就推出了全尺寸人形机器人HopeJR，以及用于测试人工智能应用的桌面机器人Reachy Mini。

特拉华州审查OpenAI向盈利性转变一事

https://techcrunch.com/2025/05/29/delaware-attorney-general-reportedly-hires-a-bank-to-evaluate-openais-restructuring-plan/

特拉华州总检察长聘请了一家银行来独立评估OpenAI的重组计划，这可能会让该公司向盈利模式转变的行动变得复杂。

马斯克试图阻止OpenAI与阿联酋的人工智能交易，原因是XAI被排除在外

https://www.cnbc.com/2025/05/29/musk-altman-ai-rivalry-complicating-trumps-dealmaking-in-middle-east.html

马斯克很懊恼，由他的私人对手山姆·奥特曼领导的OpenAI被选为阿联酋人工智能园区项目的合作方。

VIBE编程平台正火爆起来。

https://threadreaderapp.com/thread/1928154833514836382.html

数据显示，人们在为自己而非全世界制造东西，但建设者们显然很兴奋。

人工智能编码工具和集成开发环境完整列表

https://threadreaderapp.com/thread/1928096496987066604.html

一位开发者测试了46种不同的人工智能编码工具，为每个平台提供了详细对比和使用案例。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

2025-05-21 简讯 : Trump 向中东敞开人工智能芯片大门
头条 Trump 向中东敞开人工智能芯片大门 [https://links.tldrnewsletter.com/...
数科每日阅读 39评论 0赞 0
2025-05-22 简讯 : 谷歌推出独立的 NotebookLM 应用
头条谷歌推出独立的 NotebookLM 应用 [https://techcrunch.com/2025/05/...
数科每日阅读 1,040评论 0赞 0

2025-05-15 简讯 : OpenAI “Stargate” 项目延期
头条 OpenAI “Stargate” 项目延期[https://techcrunch.com/2025/05/...
数科每日阅读 503评论 0赞 0
2025-04-24 简讯 : Embed 4：企业多模态搜索
头条 Embed 4：企业多模态搜索[https://cohere.com/blog/embed-4] http...
数科每日阅读 548评论 0赞 0
2025-03-10 简讯 : Stability ai 为AI 驱动的内容业务获得投资
头条 Stability ai 为AI 驱动的内容业务获得投资 [https://stability.ai/new...
数科每日阅读 1,117评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文