
头条
Mistra 推出超快速聊天助手
https://mistral.ai/en/news/all-new-le-chat
Mistra 推出超快速聊天助手,每秒能处理1000个单词。它采用Mistra 强大的先进编码模型和一个不错的界面,可协助完成多项任务。
皮卡视频编辑
https://pikartai.com/pikaddition/
Pika Labs推出了Pikadditions,这是一款视频到视频的人工智能工具,能在保持真实感的同时将物体和角色无缝融入视频中。
谷歌的科学领域人工智能政策框架
https://blog.google/technology/ai/ai-future-of-scientific-leadership/
谷歌为政策制定者勾勒出一个政策框架,还给出可行措施,以借助人工智能加速科学发现。该框架强调在科研界要负责任地应用人工智能,并加强合作。
研究
分析功能流程,以加强语言模型的理解和引导
https://arxiv.org/abs/2502.03032
这篇论文介绍了一种新方法,用一种无数据余弦相似度技术来追踪稀疏自动编码器发现的特征在大语言模型连续层中的演变情况,该技术能映射特征的持续性、转变和出现情况。论文展示了由此产生的跨层特征图如何通过特征操纵实现对模型的直接行为控制,同时通过精细的流程图为模型计算提供原理性见解 。
语言智能体的更智能搜索
https://arxiv.org/abs/2502.02584v1
QLASS为语言智能体引入一种由Q值引导的逐步搜索方法,该方法通过提供中间奖励来改善决策。这种方式提高了推理效率,还减少了对带标注数据的依赖 。
联邦学习用于处理含噪声数据
https://arxiv.org/abs/2408.04301v1
FedELC是一个两阶段框架,旨在通过解决客户端数据集中的标签噪声问题来加强联邦学习。
工程
音频盒美学(GitHub 仓库)
https://github.com/facebookresearch/audiobox-aesthetics
这个代码库包含根据多个指标对音频文件进行评分的模型。它可用于检索,甚至可作为强化学习奖励的信号。
伙伴机器人规划器(GitHub 仓库)
https://github.com/facebookresearch/partnr-planner
脸书开发了一款用于训练人机协作系统的工具包。
衡量大语言模型(LLM)的相似性
https://model-similarity.github.io/
CAPA是一种基于共享错误评估模型相似性的指标。
其他
深入了解大语言模型(3小时视频)
安德烈j·卡帕西又发布了一个极具教育意义的视频,深入探讨了语言模型开发的诸多方面,包括预训练、减轻幻觉以及训练后处理。
用于开放 3D 理解的数据集
一个用于3D深度学习和3D生成式人工智能的、以物体为中心的新数据集。
动视特效
视频动态内容插入。DynVFX在水和烟雾等各种动态内容添加方面表现出色。但在基于角色的内容插入方面还有提升空间。
OpenAI 业务拓展至德国
OpenAI宣布计划在未来几个月内在慕尼黑开设一家新办事处。
合成人物数据集(Hugging Face平台)
https://huggingface.co/datasets/argilla/FinePersonas-v0.1
优质人物数据集是一个庞大的包含2100万人的数据集,从优质网络教育资源中提取而来。