头条
与Eudia 一起看法律工作的未来
尤迪娅获得1.05亿美元A轮融资,将通过增强智能改变法律业务流程,提升法律团队能力而非取而代之。尤迪娅与知名首席法务官合作,旨在简化法律流程,让法务部门从成本中心转变为战略价值驱动部门。这标志着财富500强企业的法务职能正朝着由人工智能赋能的方向发生重大转变。
Spotify与ElevenLabs合作,提升人工智能旁白有声读物
https://newsroom.spotify.com/2025-02-20/spotify-opens-up-support-for-elevenlabs-audiobook-content/
Spotify现在允许有声读物使用ElevenLabs的人工智能语音技术进行朗读,作者可以通过Findaway Voices上传人工智能朗读的作品。该功能支持29种语言的朗读,不过发布需通过审核流程。
Together AI宣布获得3.05亿美元B轮融资
https://www.together.ai/blog/together-ai-announcing-305m-series-b
Together AI宣布完成3.05亿美元的B轮融资,由General Catalyst和Prosperity7领投,英伟达和Salesforce Ventures等投资者参与。这笔投资将巩固Together AI在人工智能云解决方案领域的领先地位,重点支持开源人工智能模型和英伟达Blackwell GPU部署。Together AI的平台可实现高效的人工智能应用开发,提供企业级推理、训练和模型微调。该公司已计划扩大基础设施,以支持生态系统的快速发展。
研究
通义 2.5 VL 技术报告
https://arxiv.org/abs/2502.13923
来自通义团队的最强开源权重视觉语言模型报告。
用高斯点云训练的端到端驾驶强化学习模型
https://arxiv.org/abs/2502.13144
有趣的概念验证论文,使用了由3D高斯面片渲染的逼真环境。总体碰撞率降低了三分之二。
扩散模型的模型引导
https://arxiv.org/abs/2502.12154v1
这篇论文介绍了Model-Guidance(MG),这是一种通过纳入后验概率来改进扩散模型训练的目标方法,能显著提升训练速度和推理效率,并在ImageNet 256基准测试中取得了顶尖成绩。
工程
用于大语言模型预训练的高效网络爬取(GitHub 仓库)
https://github.com/cxcscmu/Crawl4LLM
由于文本提取性能差,网络爬虫获取的大部分数据都被丢弃了。这项工作大幅提高了保存的文档数量,并利用这些文档在一小部分抓取的数据上训练更强的模型。
开源推理器ZERO(GitHub代码库)
https://github.com/Open-Reasoner-Zero/Open-Reasoner-Zero
零推理范式的开放复现。训练数据、脚本和权重全都是开源的。
评估大语言模型(LLMs)中的事实性(GitHub 仓库)
https://github.com/Babelscape/LLM-Oasis
LLM-Oasis是一个大规模数据集,用于训练和评估用于评估大语言模型(LLM)输出事实性的系统。
其他
一位人工智能“炼金术士”及其DeepSeek之旅
https://craftedminds.substack.com/p/an-ai-alchemist-and-his-deepseek
对冲基金经理梁文峰推出了自筹资金的开源人工智能平台DeepSeek。该平台凭借DeepSeek-R1等创新大语言模型迅速获得全球关注,这些模型可与OpenAI的模型相媲美。DeepSeek采用更具成本效益的训练方法,还能兼容消费级硬件,引发了大型科技公司和小机构的兴趣。梁文峰在幻方量化取得成功后,专注于开源人工智能开发,强调合作与技术进步,而非受商业压力左右 。
FLEX 1图像生成模型(Hugging Face平台)
https://huggingface.co/ostris/Flex.1-alpha
社区的一个有趣副业项目。这是一个基于Flux Schnell微调的模型,这意味着它遵循Apache许可协议。它被设计为能在80亿参数下微调,运行速度相当快,且不牺牲性能。
PyTorch编译器路线图
https://dev-discuss.pytorch.org/t/meta-pytorch-team-2025-h1-roadmaps/2794
PyTorch编译团队明年的开发路线图。
奥拉马对话(GitHub 仓库)
https://github.com/shinhyo/OllamaTalk
一款不错的Flutter应用,为Ollama提供了简洁的前端界面。
在iOS系统上用谷歌镜头搜索屏幕内容
https://blog.google/products/google-lens/lens-on-ios-ai-overviews/
谷歌镜头现在允许iPhone用户在Chrome浏览器或谷歌应用程序中,通过高亮显示或点击等手势,直接在屏幕上进行视觉搜索。