头条
Anthropic的研究人员追踪大语言模型(LLMs)的思维过程
https://links.tldrnewsletter.com/DLwIsX
Anthropic的两项新研究追踪了Claude模型的内部路径,揭示了规划行为、跨语言的共享概念空间以及虚构推理的实例。
OpenAI扩大网络安全资助计划
https://links.tldrnewsletter.com/qPSIEO
OpenAI 已概述其为支持原生人工智能网络安全研究正在开展的工作。目前这些工作包括小额资助,以及拓展模型隐私和智能体安全等领域。
Claude 3.7 Sonnet 在劳动领域的使用趋势
https://links.tldrnewsletter.com/aTA92B
Anthropic最新报告揭示了Claude 3.7 Sonnet在编码、教育和医疗任务中的使用情况。它为人工智能如何增强或使不同职业自动化提供了新见解。
研究
基于扩散的反事实分析
https://arxiv.org/abs/2503.20595
这篇论文介绍了两种利用扩散模型在图像回归任务中生成反事实解释的方法,强调了像素空间和潜在空间方法在稀疏性和质量方面的权衡。
曼巴混合体
https://arxiv.org/abs/2501.16295v1
Mamba混合模型将模态感知稀疏性引入状态空间模型(SSMs),实现高效多模态预训练。在文本、图像和语音模态方面,它达到了与Transformer类似的性能,但计算成本大幅降低 。
机械可解释性中的开放性问题
https://arxiv.org/abs/2501.16496
这是一篇很棒的论文,探讨了在试图理解知识和技能在语言模型内部是如何呈现时,该领域面临的一些挑战和未解难题。
工程
测量视觉模型中的内部偏差(GitHub 仓库)
https://github.com/aaronserianni/attention-iou
一种利用注意力图来量化视觉模型内部偏差的新指标。它能够识别混杂特征,且超越了基于群体的准确率差异。
图像模型的无引导训练
https://arxiv.org/abs/2501.15420v1
无引导训练(GFT)让视觉生成模型无需无分类器引导(CFG),在不牺牲性能的前提下降低了计算成本。与基于蒸馏的方法不同,GFT从头开始训练,对现有代码库只需做极少修改。
一种通用原子间势(GitHub 仓库)
https://github.com/lab-cosmo/pet-mad
PET-MAD是一种基于MAD数据集训练的通用原子间势模型,能够预测元素周期表中复杂材料建模所需的能量和力。
其他
FLUX图像修复(Hugging Face模型库)
https://huggingface.co/spaces/SkalskiP/FLUX.1-inpaint
新的强大扩散模型Flux支持图像修复。
HUGGING FACE自定义重排器训练
https://huggingface.co/blog/train-reranker
这篇文章介绍了如何使用Sentence Transformers 4.0微调高性能重排模型,小型专业版本的模型表现优于许多大型公共重排模型。
人工智能预测模型是天气预报领域的重大突破
https://www.earth.com/news/ai-prediction-model-is-a-major-breakthrough-in-weather-forecasting/
剑桥大学开发的Aardvark Weather能在台式电脑上实现快速的人工智能天气预报。与传统模型相比,它所需数据和计算能力更少。在多个指标上,它的准确度超过了像美国全球预报系统(GFS)这样的传统系统,还能提供定制化、特定地点的预报。该系统容易获取,让天气预报更普及,即使在基础设施有限的地区也能使用 。
亚马逊云科技生成式人工智能高管离职创办初创公司
https://techcrunch.com/2025/03/19/aws-generative-ai-exec-leaves-to-launch-startup/
拉杰·阿加瓦尔将离开亚马逊网络服务(AWS),去创办一家新公司。他在AWS担任生成式人工智能总经理一职。
浏览器应用程序Browser Use获1700万美元融资,该工具让人工智能“智能体”浏览网站更轻松
Y Combinator 孵化的初创公司 Browser Use,通过将网站元素转换成类似文本的格式,提升人工智能代理在网站上的导航能力。
借助由 Llama 驱动的模拟进行 XR 培训
https://ai.meta.com/blog/cornerstone-transforming-training-llama/
Cornerstone正借助XR和Llama 3.1模型变革企业培训,能快速创建个性化模拟,具备智能虚拟导师和实时多语言功能。