头条
AI 短视频《VEO 2》即将登陆 YouTube
https://blog.youtube/news-and-events/veo-2-shorts/
YouTube已将DeepMind的Veo 2集成到“梦想屏幕”中,用户能通过文本提示生成高质量AI视频片段。
Adobe火萤视频模型
Adobe推出Firefly视频模型,为视频和音频创作提供对知识产权友好、商业上安全的生成式人工智能工具。
谷歌人工智能与女性癌症研究
https://blog.google/technology/health/google-ai-institute-womens-cancers/
谷歌已与女性癌症研究所合作,加强人工智能驱动的癌症研究,重点是改善乳腺癌和妇科癌症的治疗效果。
研究
用于推测解码的专家混合模型
https://arxiv.org/abs/2502.06282
杰奇罗通过使用专家混合模型生成多样预测来增强推测解码,降低候选结果之间的相关性并提高推理速度。
CLIP中的后门攻击
https://arxiv.org/abs/2502.01385v1
研究人员发现,CLIP模型极易遭受投毒后门攻击,用极少的投毒数据就能实现近100%的攻击成功率。他们提出一种利用局部离群点检测的有效检测方法,还发现了现有数据集中存在的非故意后门。
移动大语言模型(Hugging Face模型库)
https://huggingface.co/collections/facebook/mobilellm-6722be18cb86c20ebe113e95
Meta发布了其小型但强大且适合移动设备的语言模型的检查点。
工程
参数更少的大语言模型(GitHub 仓库)
https://github.com/joaopauloschuler/less-parameters-llm
研究人员证明,大语言模型(LLMs)在将非嵌入参数减少多达77%的同时,仍能保持学习能力。通过用优化的子网络取代密集层,他们用少得多的资源实现了相当的性能。
借助掩码增强自回归预测实现更好推理(GitHub 仓库)
https://github.com/scitix/MEAP
MEAP利用仅解码器的Transformer将掩码语言模型集成到下一个词预测中。通过对一小部分输入词进行掩码处理,它在维持推理能力的同时,提升了信息检索任务的表现。
大语言模型(LLMs)的复杂功能基准测试(GitHub 仓库)
https://github.com/thudm/complexfuncbench
这个代码库包含用于在复杂函数调用上评估人工智能模型的基准和工具。
其他
亿万富翁们谈论用自动化取代工作
https://techcrunch.com/2025/02/04/this-week-in-ai-billionaires-talk-automating-jobs-away/
OpenAI正与软银合作,利用人工智能实现白领工作流程自动化,这引发了对大规模失业的担忧。OpenAI还推出了一款用于研究的新人工智能智能体和o3-mini推理模型,而欧盟则实施了对高风险人工智能系统的禁令。此外,字节跳动的悦模型能根据提示生成音乐,Anthropic推出“宪法分类器”以加强人工智能安全措施。
为什么人工智能是一场哲学变革
https://www.noemamag.com/why-ai-is-a-philosophical-rupture/
托拜厄斯·里斯认为,生成式人工智能挑战了长期存在的人机区分,带来了需要哲学层面重新思考的新智能形式。人工智能超越传统理解模式运行的能力,显示出其改变人类认知和自我意识的潜力。里斯主张在人工智能开发中融入哲学思考,以探索和应对人机共生这一新领域。
欧盟发布《人工智能法案》所禁止的人工智能应用指南
欧盟人工智能法案的合规期限已过,促使欧盟委员会为开发者发布遵守新人工智能法规的指南。违反诸如社会评分等禁止使用的案例可能会面临重罚。这些指南旨在明确规定,但不具有法律约束力。正式通过尚待翻译。
OpenAI更新模型规格
https://links.tldrnewsletter.com/bbiSrs
OpenAI已在CC0许可下发布了一份更新后的模型规格文档,在维持安全保障措施的同时,强化了透明度、可定制性及知识自由等原则。
深入研究涉足Gemini安卓应用
https://9to5google.com/2025/02/04/gemini-deep-research-android/
Gemini的首个智能特性“深度研究”现已在安卓系统上线,支持通过定制计划进行多步骤网络研究。