马斯克旗下xAI发布Grok 3 自称超越GPT-4o、DeepSeek-v3

2月18日消息,今日,马斯克旗下人工智能公司xAI发布了大模型Grok 3。

在大模型能力方面,在数学推理、科学逻辑推理和代码写作上,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。

在AIME'24数学能力测试中,Grok-3取得了52分,明显高于DeepSeek-V3的39分。

在GPQA科学知识评估中,Grok-3以75分的优异成绩领先DeepSeek-V3的65分。

此外,在LCB Oct-Feb编程能力测试中,Grok-3也以57分的成绩超越了DeepSeek-V3的36分。

据xAI官方介绍,Grok 3 在训练过程调用了 10 万个 Nvidia H100芯片,较前代产品 Grok 2 使用的 15000 个 GPU 实现了数倍的跨越式提升。(御风)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容