2025-02-29 简讯 : GROK 3似乎曾短暂屏蔽对特朗普和马斯克不利的言论


头条


GROK 3似乎曾短暂屏蔽对特朗普和马斯克不利的言论

https://techcrunch.com/2025/02/23/grok-3-appears-to-have-briefly-censored-unflattering-mentions-of-trump-and-musk/

马斯克的Grok 3人工智能模型在错误信息查询中曾短暂屏蔽有关唐纳德·特朗普和马斯克的内容,但在用户反馈后恢复。xAI的工程负责人证实,一名员工出于好意做了这一改动,但这与公司价值观不符。此前一些模型有左倾倾向,马斯克希望让Grok保持政治中立 。

亚马逊Alexa增强版

https://www.aboutamazon.com/news/devices/new-alexa-generative-artificial-intelligence

亚马逊推出了Alexa+,这是其语音助手的升级版。Alexa+是由生成式人工智能驱动的助手,更智能,也更能像人一样对话。

ElevenLabs的语音转文本

https://elevenlabs.io/blog/meet-scribe

ElevenLabs将推出自己的转录模型Scribe。它将高精度支持99种语言,具备逐字时间戳、说话人识别,以及适应真实环境音频的能力。


研究


QWQ Max 预览

https://qwenlm.github.io/blog/qwq-max-preview/

通义千问预览了一款推理模型,该模型在数学和代码方面取得了出色成绩。它打算与强大的Max模型一起开放权重发布此模型。

本地模型充当“小跟班”

https://hazyresearch.stanford.edu/blog/2025-02-24-minions

Hazy Research发现,如果你通过Ollama使用本地模型,并使用长上下文云模型作为编排器,就能以17%的成本实现97%的任务性能。

大语言模型中的系统2思维

https://arxiv.org/abs/2502.17419v1

一项针对像OpenAI的o1/o3和DeepSeek的R1这类推理大语言模型(LLMs)的调查,该调查分析了它们的逐步逻辑推理能力,并将它们的性能与人类认知能力进行了对比测试 。


工程


用于PDF文本提取的OLMOCR

https://olmocr.allenai.org/blog

艾伦人工智能公司通过在20多万份PDF文件上持续微调通义万相视觉大模型(Qwen VL),训练出了一款强大的PDF文件提取模型。

人工智能安全评估(GitHub 仓库)

https://github.com/thu-coai/AISafetyLab

AISafetyLab是一个全面的人工智能安全框架,涵盖攻击、防御和评估。它包括模型、数据集、实用工具,以及一份精心整理的人工智能安全相关论文列表。

基于调查微调的民意预测(GitHub 仓库)

https://github.com/josephjeesungsuh/subpop

SubPOP推出用于微调大语言模型(LLMs)的大型数据集,以预测调查回应分布,缩小预测差距并提升对未知调查的泛化能力 。


其他


MAGMA:用于多模态人工智能智能体的基础模型(Hugging Face 中心)

https://huggingface.co/microsoft/Magma-8B

Magma是用于视觉智能体任务的全新基础模型,在视频理解和UI导航方面表现出色。它很容易进行调整。

Claude AI助力Alexa+

https://www.anthropic.com/news/claude-and-alexa-plus

Anthropic公司的Claude AI现已通过亚马逊云服务Bedrock集成到Alexa+中,在增强其功能的同时,还具备强大的安全防护,可防止越狱和滥用。

微软发布新的专为多模态处理优化的Phi模型

https://siliconangle.com/2025/02/26/microsoft-releases-new-phi-models-optimized-multimodal-processing-efficiency/

微软发布了两款新的开源语言模型Phi-4-mini和Phi-4-multimodal,强调硬件效率和多模态处理。Phi-4-mini有38亿个参数,专注于文本任务;Phi-4-multimodal有56亿个参数,能处理文本、图像、音频和视频。这两款模型性能优于同等规模的其他模型,将以MIT许可协议在Hugging Face上提供。

查塔医疗公司筹集810万美元

https://www.linkedin.com/posts/charta-health_these-engineers-raised-81-million-for-a-activity-7300517850991976448-Y8dc

查塔医疗(Charta Health)在贝恩资本风险投资公司(Bain Capital Ventures)领投下筹集810万美元,用于加强人工智能驱动的计费前病历审查,减少计费错误并挽回损失的收入。

FLORA为创意人士推出Cursor

https://threadreaderapp.com/thread/1894794612398792974.html

FLORA是首款为创意专业人士打造的、由人工智能驱动的创意工作流程工具,能让他们的创意产出提高10倍。

谷歌新人工智能视频模型VEO 2每秒收费50美分

https://techcrunch.com/2025/02/23/googles-new-ai-video-model-veo-2-will-cost-50-cents-per-second/

谷歌的Veo 2人工智能视频模型每秒0.5美元,相当于每分钟30美元。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容