30B参数模型裸考奥赛夺金：上海AI实验室SU-01靠10万Token推理达到IMO金牌水平

（AI 资源之家讯）一个仅有 30B 参数的中等规模模型，竟然在完全不调用外部工具的情况下，拿到了国际数学和物理奥赛的金牌成绩。这不是科幻小说，这是上海人工智能实验室最新发布的研究成果。

5 月 19 日，上海人工智能实验室联合团队正式公布了科学推理模型 SU-01。这款基于 30B-A3B 架构的模型，采用了创新性的通专融合训练方案，在 IMO 2025 数学奥赛和 USAMO 2026 数学竞赛中均取得 35 分的成绩，达到了金牌级水平。更令人震惊的是，在 IPhO 2024/2025 国际物理奥赛任务中，SU-01 同样跨过了金牌线。

这意味着什么？在传统认知中，要达到奥赛金牌水平的 AI 推理能力，往往需要千亿甚至万亿参数级别的超大模型。SU-01 用 30B 参数就做到了，训练推理成本大幅降低，为 AI 的广泛落地提供了全新可能。

SU-01 的核心突破在于三阶段训练和推理流程。研究团队不是简单地堆数据、堆算力，而是设计了一套融合训练机制，让通用模型在数学、物理等专业领域实现深度专业化。更关键的是，它仅依靠自然语言推理，通过 10 万 Token 的推理扩展即可达到奥赛金牌水平，完全不依赖外部数学工具或代码解释器。

论文显示，SU-01 在 USAMO 2026 的推理轨迹中，初始解答中位长度合理，展现了模型对问题的深刻理解而非简单的模式匹配。这种自然推理能力，距离真正的 AI 科学发现只有一步之遥。

SU-01 的发布释放了一个重要信号：中国在 AI 基础科学研究领域正在从跟随走向引领。中等模型实现顶尖推理能力的路线，不仅降低了技术门槛，更证明了在算力受限条件下，算法创新完全可以弥补硬件差距。对于关注 AI 技术前沿的读者来说，AI 资源之家将持续追踪这类国产 AI 原创突破，第一时间带来深度解读。

正文完

发表至： AI大模型

2026年5月21日

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

阶跃星辰完成25亿美元融资产业链资本集体入场备战港股IPO

字节提出视觉生成第三种路线挑战扩散与自回归

Anthropic推出Claude Design进军视觉创作

清华00后团队HRM-Text震撼登场：用1500美元训练出媲美大模型的效果

央行等三部门重磅出手：AI设备和软件纳入专项贷款8000亿支持

30B参数模型裸考奥赛夺金：上海AI实验室SU-01靠10万Token推理达到IMO金牌水平

中等模型挑战奥赛天花板

10 万 Token 推理的秘密武器

AI 资源之家观察

苹果iOS 27全面转向AI：Siri独立App对标ChatGPT 苹果智能生态迎来最大重构

中国AI企业注册量首破70万产业加速扩张

企业将token消耗纳入绩效考核引发管理困境

福布斯中国AI科技企业TOP 50重磅发布：具身智能与大模型成最强赛道

GAITC 2026杭州落幕全球AI最强大脑齐聚具身智能与大模型成最热议题

30B参数模型裸考奥赛夺金：上海AI实验室SU-01靠10万Token推理达到IMO金牌水平

中等模型挑战奥赛天花板

10 万 Token 推理的秘密武器

AI 资源之家观察

苹果iOS 27全面转向AI：Siri独立App对标ChatGPT 苹果智能生态迎来最大重构

中国AI企业注册量首破70万产业加速扩张

企业将token消耗纳入绩效考核引发管理困境

福布斯中国AI科技企业TOP 50重磅发布：具身智能与大模型成最强赛道

GAITC 2026杭州落幕 全球AI最强大脑齐聚 具身智能与大模型成最热议题

GAITC 2026杭州落幕全球AI最强大脑齐聚具身智能与大模型成最热议题