2025-06-06 简讯 : Notebook LM 现已支持公开分享


头条


Notebook LM 现已支持公开分享

https://blog.google/technology/google-labs/notebooklm-public-notebooks/

谷歌的NotebookLM现在允许用户通过链接公开分享笔记本。查看者可以与人工智能生成的摘要和问题进行互动,而源内容仍为只读。

Yoshua Bengio 的人工智能安全实验室

https://techcrunch.com/2025/06/03/yoshua-bengio-launches-lawzero-a-nonprofit-ai-safety-lab/

约书亚·本吉奥创立了LawZero,这是一个非营利性人工智能安全实验室,获得了主要慈善捐赠者3000万美元的资金支持。

GitHub 宣布推出 Copilot Spaces 功能

https://github.blog/changelog/2025-05-29-introducing-copilot-spaces-a-new-way-to-work-with-code-and-context/

“Spaces”功能让开发者可以为Copilot整理代码、文档和自定义指令,将其打造成可在各组织间共享的专业领域专家。添加到“Spaces”的文件和代码库会随代码更改自动更新。


深度分析


借助 TRL 和 VLLM 实现高效在线学习

https://huggingface.co/blog/vllm-colocate

Hugging Face将vLLM直接集成到TRL中,以减少使用在线学习算法GRPO进行训练时的低效率问题。

我那些对人工智能持怀疑态度的朋友全是疯子。

https://fly.io/blog/youre-all-nuts/

一位资深开发者批评许多技术精湛的程序员仍因早期聊天机器人的体验而拒绝大语言模型(LLMs),他们没看到现代编码工具能自主浏览代码库、运行测试并在失败时迭代改进。他驳斥了常见的反对观点:无论代码来源如何,开发者在合并前都会进行审查;当工具能自动编译、捕捉错误并不断重试直至测试通过时,“幻觉”问题就无关紧要了。大语言模型(LLMs)或许会取代开发者,但就像软件工程师让旅行社代理人、唱片店店员等无数职业实现自动化一样。

为什么我的时间线比一些嘉宾的稍长

https://www.dwarkesh.com/p/timelines-june-2025

过去十年,前沿系统训练算力的提升推动了人工智能的进步。但这种情况在十年后难以为继。2030年后,人工智能的进步将主要源于算法进展。然而,由于容易取得的成果已被摘取,每年实现通用人工智能的可能性大幅下降 。


工程


DNA表征学习

https://arxiv.org/abs/2506.01833

SPACE是一种用于基因组图谱预测的监督学习方法,它采用了专家混合模型。

基于扩散的医疗疗法

https://arxiv.org/abs/2506.01533

DIME是一种基于扩散的模型,旨在估计相互依存的医疗结果的联合分布。

JIGSAWSTACK推出开源深度研究工具(GitHub仓库)

https://jigsawstack.com/blog/introducing-jigsawstack-deep-research

该框架能协调大语言模型(LLMs)、递归网络搜索和结构化推理,生成人类需要数小时甚至数天才能完成的报告。JigsawStack可让用户控制研究深度、广度、模型选择和输出格式,同时保持较高的引用透明度。


其他


能让初创公司市场进入团队占据优势的潮流编码创意

https://www.growthunhinged.com/p/gtm-vibecoding-ideas

一位创业顾问展示了如何用Bolt.new在不到两小时内为一家制造业SaaS公司打造一个精致的投资回报率计算器,将电子表格变成能为高管勾勒价值的互动工具。其他例子还有会议信息抓取工具、会议筹备仪表盘,以及功能原型制作。这些以前需要工程团队或高价代理商来做,现在每月订阅费只需约70美元。这意味着非技术团队也能证明自身价值,比竞争对手行动更快。

我们什么时候会为人工智能劳动力支付额外费用?

https://tomtunguz.com/premium-ai-labor/

人工智能智能体的表现常常优于人类,成本却只是人类的一小部分。由于技术仍在发展,且存在可感知的风险,所以目前它们还没有收取高价。Waymo在大幅提升安全性的同时,价格仍低于其他选择,这反映了初创企业普遍的定价策略。不过,在人工智能持续的警觉性和处理能力至关重要的情况下,可能会出现高价。

预测与解释人工智能模型性能:一种新的评估方法

https://www.microsoft.com/en-us/research/blog/predicting-and-explaining-ai-model-performance-a-new-approach-to-evaluation/

微软研究人员开发了ADeLe,这是一个通过18种认知和基于知识的量表评估人工智能模型,来预测和解释其在新任务上表现的框架。ADeLe发现了当前基准测试的局限性,并为各种大语言模型(LLM)创建了详细的能力概况,突出了它们在优势、劣势和特定能力方面的差异。该框架预测人工智能成功的准确率达88%,有望改进人工智能评估、政策制定和部署。

OpenAI的漏洞报告

https://links.tldrnewsletter.com/QVRW2L

OpenAI推出一项政策,用于协同披露其人工智能系统发现的第三方软件漏洞。

亚马逊和米高梅加速制作一部关于山姆·奥特曼的电影。

https://www.hollywoodreporter.com/movies/movie-news/luca-guadagnino-to-direct-openai-movie-1236236357/

该制片厂有意邀请安德鲁·加菲尔德饰演阿尔特曼,莫妮卡·巴巴罗(《完全陌生的人》)饰演首席技术官米拉·穆拉蒂,尤拉·鲍里索夫(《阿诺拉》)饰演联合创始人伊利亚·苏茨克维。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容