30B参数模型裸考奥赛夺金:上海AI实验室SU-01靠10万Token推理达到IMO金牌水平

(AI 资源之家讯)一个仅有 30B 参数的中等规模模型,竟然在完全不调用外部工具的情况下,拿到了国际数学和物理奥赛的金牌成绩。这不是科幻小说,这是上海人工智能实验室最新发布的研究成果。

中等模型挑战奥赛天花板

5 月 19 日,上海人工智能实验室联合团队正式公布了科学推理模型 SU-01。这款基于 30B-A3B 架构的模型,采用了创新性的通专融合训练方案,在 IMO 2025 数学奥赛和 USAMO 2026 数学竞赛中均取得 35 分的成绩,达到了金牌级水平。更令人震惊的是,在 IPhO 2024/2025 国际物理奥赛任务中,SU-01 同样跨过了金牌线。

这意味着什么?在传统认知中,要达到奥赛金牌水平的 AI 推理能力,往往需要千亿甚至万亿参数级别的超大模型。SU-01 用 30B 参数就做到了,训练推理成本大幅降低,为 AI 的广泛落地提供了全新可能。

10 万 Token 推理的秘密武器

SU-01 的核心突破在于三阶段训练和推理流程。研究团队不是简单地堆数据、堆算力,而是设计了一套融合训练机制,让通用模型在数学、物理等专业领域实现深度专业化。更关键的是,它仅依靠自然语言推理,通过 10 万 Token 的推理扩展即可达到奥赛金牌水平,完全不依赖外部数学工具或代码解释器。

论文显示,SU-01 在 USAMO 2026 的推理轨迹中,初始解答中位长度合理,展现了模型对问题的深刻理解而非简单的模式匹配。这种自然推理能力,距离真正的 AI 科学发现只有一步之遥。

AI 资源之家观察

SU-01 的发布释放了一个重要信号:中国在 AI 基础科学研究领域正在从跟随走向引领。中等模型实现顶尖推理能力的路线,不仅降低了技术门槛,更证明了在算力受限条件下,算法创新完全可以弥补硬件差距。对于关注 AI 技术前沿的读者来说,AI 资源之家将持续追踪这类国产 AI 原创突破,第一时间带来深度解读。

正文完
post-qrcode
 0
admin
版权声明:本站原创文章,由 admin 于2026-05-21发表,共计750字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。