谷歌AI联合数学家破解60年数学悬案

(AI 资源之家讯)5 月 9 日,谷歌 DeepMind 推出 AI 联合数学家多智能体系统,在 FrontierMath Tier 4 自主模式下斩获 48% 正确率,刷新数学 AI 基准 SOTA。更引人注目的是,牛津大学教授 Marc Lackenby 借助该系统攻克了群论领域几十年无解的 Kourovka Notebook 第 21.10 号问题,AI 正式成为数学家的真正研究搭档。

## AI 与数学家的协作模式

攻克第 21.10 号问题的过程极为精彩。AI 系统首次给出的证明是错误的,但系统内的审查 Agent 自动揪出了漏洞。Lackenby 看到审查结果后突然意识到如何填补这个漏洞,通过反复与 AI 配合最终完成了证明。这一过程揭示了 AI 与人类数学家的最佳协作模式:AI 负责生成候选证明和审查验证,人类数学家负责把握直觉方向和填补关键跳跃。

## 多智能体系统的设计

AI 联合数学家采用多智能体架构,包含证明生成 Agent、审查验证 Agent 和知识检索 Agent。生成 Agent 负责产出候选证明,审查 Agent 以严格的数学标准检查每一步推理,知识检索 Agent 则从数学文献数据库中为推理提供支撑。三个 Agent 协同工作,在自主模式下达到了 48% 的正确率——这意味着近一半的数学问题 AI 可以完全自主解决。

## 数学 AI 的新纪元

48% 的自主解题率标志着数学 AI 进入新纪元。此前 AI 在数学领域的表现主要集中在计算和特定类型的问题上,对于需要创造性跳跃的高等数学问题几乎束手无策。AI 联合数学家的成功表明,通过多智能体协作和严格的审查机制,AI 正在逼近数学研究的核心地带。数学家不会失业,但他们的工作方式将深刻改变。

正文完
post-qrcode
 0
admin
版权声明:本站原创文章,由 admin 于2026-05-11发表,共计676字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。