从奥数金牌到满分冲刺：AI正在改写数学界的“天才神话”

去年夏天，一条消息在科技圈和数学圈炸了锅：OpenAI的实验性推理模型和谷歌DeepMind的Gemini Deep Think，在国际数学奥林匹克竞赛（IMO）里双双拿下了金牌，成为了史上首批达到IMO金牌水准的AI系统。

可能很多朋友对IMO没什么概念，咱们用大白话讲清楚：这是全球高中生数学竞赛的绝对天花板，每年只有全世界最顶尖的600多名数学天才有资格参赛，满分42分，只有排名前8%的选手能拿到金牌。咱们平时觉得高考数学最后一道压轴题已经难到头皮发麻，而IMO的6道题，每一道都比高考压轴题难上几个量级，尤其是最后一题，往往是“全世界只有个位数选手能做出来”的地狱难度，2025年的IMO最后一题，全球也只有6个选手成功解出。

而去年这两个AI，在和人类选手完全一样的规则下——两个4.5小时的考试时段，不能联网，不能用计算器，只能靠自己的推理用自然语言写出完整的解题过程，硬生生解出了6道题里的5道，拿到了35分的金牌线成绩。谷歌的成绩更是拿到了IMO组委会的官方认证，评委给出的评价是“解法思路清晰、表达准确，大部分内容简单易懂”，这不是靠暴力计算堆出来的答案，是真的像人类数学家一样完成了逻辑严谨的推理证明。

但就像很多朋友注意到的，它们都倒在了最后一题面前。OpenAI的团队后来回忆，哪怕投入了大量的计算资源，模型最后还是写下了“我不知道”。这道题难住AI的，不是计算量，而是数学里最珍贵的“创造性灵光一现”——它需要选手跳出常规的解题框架，把数论、组合数学、代数等多个领域的知识融会贯通，找到一个前人没走过的解题路径，这恰恰是过去AI最薄弱的地方。

也正是因为这个遗憾，很多人都和这位朋友一样，做出了一个大胆的预测：今年6月的IMO，AI不仅要拿下更多金牌，还要彻底攻克这最后一道难关，冲击满分。

这个预测绝不是凭空想象，而是AI发展的必然趋势。咱们回头看，2024年的IMO，谷歌的模型还只拿到了银牌，解出了4道题，仅仅一年之后，就完成了从银牌到金牌的跨越，多解出了一道题。而从2025年到2026年的这一年里，AI的推理能力正在以肉眼可见的速度爆发。

去年的AI，已经突破了传统的“思维链”模式，学会了像人类一样“长时间深度思考”，OpenAI的模型甚至能持续100分钟的连续推理，谷歌则用“并行思维路径”技术，让模型同时探索多条解题方向，交叉验证找到最优解。而这一年里，不管是OpenAI、谷歌这些海外巨头，还是国内的DeepSeek、字节跳动、阿里、智谱等厂商，都在疯狂加码AI的复杂推理能力。去年年底，国内的DeepSeek就已经发布了能达到IMO金牌水准的开源数学模型，打破了海外巨头的技术垄断。

这也是为什么我们敢说，今年的IMO赛场上，绝对不会只有两家AI参赛，很可能会出现超过5个大模型拿下金牌的盛况。

为什么各家大厂都挤破头要参加这场数学竞赛？因为IMO的金牌，就是AI通用推理能力的“金字招牌”。咱们普通人用AI，最怕的就是它一本正经地胡说八道，算个数都能出错，而能在IMO拿金牌，意味着AI的逻辑推理、严谨性、复杂问题拆解能力都达到了顶尖水准。这个能力，不只是能解数学题，还能用到代码编写、科研攻关、金融分析、工业设计等几乎所有领域，是AI从“聊天工具”变成“生产力工具”的核心门槛。

对各家厂商来说，在IMO上拿出亮眼成绩，就是最硬核的技术秀，是给用户和企业客户最直接的信心保证，相当于在AI界的“高考”里拿下了状元，自然能吸引更多用户和合作伙伴。

最后，很多朋友都问，咱们的豆包，会不会参加今年的IMO，能拿到什么样的成绩？

首先可以肯定的是，字节跳动在AI推理能力上的技术积累，一直走在行业前列。作为字节跳动自研的大模型，豆包的核心能力迭代，一直把复杂逻辑推理、数学计算作为重点方向。去年海外巨头拿下IMO金牌的技术核心，比如长时间深度思考、多路径并行推理、严谨的证明生成能力，在国内大模型上都已经有了突破性的进展，豆包也在这些领域持续深耕。

如果站上IMO的赛场，豆包完全有能力冲击银牌，甚至有很大概率拿下金牌。当然，我们也要客观承认，想要冲击满分、攻克最后一道最难的题，还需要在数学创造性、跨领域知识融合的“灵光一现”上，实现更大的突破。但按照现在AI技术的迭代速度，今年的赛场上，我们很可能会看到不止一个AI模型，交出满分的答卷。

其实说到底，AI参加IMO，从来都不是为了取代人类的数学天才，更不是为了证明AI比人类聪明。从1997年深蓝战胜国际象棋棋王，到2016年AlphaGo击败围棋大师，再到今天AI站上IMO的领奖台，AI每一次突破，都是在拓展人类智慧的边界。

未来，这些能解奥数难题的AI，不会变成冷冰冰的解题机器，而是会成为人类数学家的助手，帮我们验证复杂的猜想、处理海量的计算、探索那些人类单靠自己很难攻克的数学难题，甚至帮我们解开宇宙的底层规律。

今年6月的IMO，注定会被写入AI发展史。我们或许会见证，AI彻底拿下人类数学皇冠上的这颗明珠，而更值得期待的是，在这之后，AI会带着人类的智慧，走向更远的地方。

从奥数金牌到满分冲刺：AI正在改写数学界的“天才神话”

从奥数金牌到满分冲刺：AI正在改写数学界的“天才神话”

相关阅读更多精彩内容

友情链接更多精彩内容