头条
GROK 3似乎曾短暂屏蔽对特朗普和马斯克不利的言论
马斯克的Grok 3人工智能模型在错误信息查询中曾短暂屏蔽有关唐纳德·特朗普和马斯克的内容,但在用户反馈后恢复。xAI的工程负责人证实,一名员工出于好意做了这一改动,但这与公司价值观不符。此前一些模型有左倾倾向,马斯克希望让Grok保持政治中立 。
亚马逊Alexa增强版
https://www.aboutamazon.com/news/devices/new-alexa-generative-artificial-intelligence
亚马逊推出了Alexa+,这是其语音助手的升级版。Alexa+是由生成式人工智能驱动的助手,更智能,也更能像人一样对话。
ElevenLabs的语音转文本
https://elevenlabs.io/blog/meet-scribe
ElevenLabs将推出自己的转录模型Scribe。它将高精度支持99种语言,具备逐字时间戳、说话人识别,以及适应真实环境音频的能力。
研究
QWQ Max 预览
https://qwenlm.github.io/blog/qwq-max-preview/
通义千问预览了一款推理模型,该模型在数学和代码方面取得了出色成绩。它打算与强大的Max模型一起开放权重发布此模型。
本地模型充当“小跟班”
https://hazyresearch.stanford.edu/blog/2025-02-24-minions
Hazy Research发现,如果你通过Ollama使用本地模型,并使用长上下文云模型作为编排器,就能以17%的成本实现97%的任务性能。
大语言模型中的系统2思维
https://arxiv.org/abs/2502.17419v1
一项针对像OpenAI的o1/o3和DeepSeek的R1这类推理大语言模型(LLMs)的调查,该调查分析了它们的逐步逻辑推理能力,并将它们的性能与人类认知能力进行了对比测试 。
工程
用于PDF文本提取的OLMOCR
https://olmocr.allenai.org/blog
艾伦人工智能公司通过在20多万份PDF文件上持续微调通义万相视觉大模型(Qwen VL),训练出了一款强大的PDF文件提取模型。
人工智能安全评估(GitHub 仓库)
https://github.com/thu-coai/AISafetyLab
AISafetyLab是一个全面的人工智能安全框架,涵盖攻击、防御和评估。它包括模型、数据集、实用工具,以及一份精心整理的人工智能安全相关论文列表。
基于调查微调的民意预测(GitHub 仓库)
https://github.com/josephjeesungsuh/subpop
SubPOP推出用于微调大语言模型(LLMs)的大型数据集,以预测调查回应分布,缩小预测差距并提升对未知调查的泛化能力 。
其他
MAGMA:用于多模态人工智能智能体的基础模型(Hugging Face 中心)
https://huggingface.co/microsoft/Magma-8B
Magma是用于视觉智能体任务的全新基础模型,在视频理解和UI导航方面表现出色。它很容易进行调整。
Claude AI助力Alexa+
https://www.anthropic.com/news/claude-and-alexa-plus
Anthropic公司的Claude AI现已通过亚马逊云服务Bedrock集成到Alexa+中,在增强其功能的同时,还具备强大的安全防护,可防止越狱和滥用。
微软发布新的专为多模态处理优化的Phi模型
微软发布了两款新的开源语言模型Phi-4-mini和Phi-4-multimodal,强调硬件效率和多模态处理。Phi-4-mini有38亿个参数,专注于文本任务;Phi-4-multimodal有56亿个参数,能处理文本、图像、音频和视频。这两款模型性能优于同等规模的其他模型,将以MIT许可协议在Hugging Face上提供。
查塔医疗公司筹集810万美元
查塔医疗(Charta Health)在贝恩资本风险投资公司(Bain Capital Ventures)领投下筹集810万美元,用于加强人工智能驱动的计费前病历审查,减少计费错误并挽回损失的收入。
FLORA为创意人士推出Cursor
https://threadreaderapp.com/thread/1894794612398792974.html
FLORA是首款为创意专业人士打造的、由人工智能驱动的创意工作流程工具,能让他们的创意产出提高10倍。
谷歌新人工智能视频模型VEO 2每秒收费50美分
https://techcrunch.com/2025/02/23/googles-new-ai-video-model-veo-2-will-cost-50-cents-per-second/
谷歌的Veo 2人工智能视频模型每秒0.5美元,相当于每分钟30美元。