谷歌AI联合数学家破解60年数学悬案

（AI 资源之家讯）5 月 9 日，谷歌 DeepMind 推出 AI 联合数学家多智能体系统，在 FrontierMath Tier 4 自主模式下斩获 48% 正确率，刷新数学 AI 基准 SOTA。更引人注目的是，牛津大学教授 Marc Lackenby 借助该系统攻克了群论领域几十年无解的 Kourovka Notebook 第 21.10 号问题，AI 正式成为数学家的真正研究搭档。

## AI 与数学家的协作模式

攻克第 21.10 号问题的过程极为精彩。AI 系统首次给出的证明是错误的，但系统内的审查 Agent 自动揪出了漏洞。Lackenby 看到审查结果后突然意识到如何填补这个漏洞，通过反复与 AI 配合最终完成了证明。这一过程揭示了 AI 与人类数学家的最佳协作模式：AI 负责生成候选证明和审查验证，人类数学家负责把握直觉方向和填补关键跳跃。

## 多智能体系统的设计

AI 联合数学家采用多智能体架构，包含证明生成 Agent、审查验证 Agent 和知识检索 Agent。生成 Agent 负责产出候选证明，审查 Agent 以严格的数学标准检查每一步推理，知识检索 Agent 则从数学文献数据库中为推理提供支撑。三个 Agent 协同工作，在自主模式下达到了 48% 的正确率——这意味着近一半的数学问题 AI 可以完全自主解决。

## 数学 AI 的新纪元

48% 的自主解题率标志着数学 AI 进入新纪元。此前 AI 在数学领域的表现主要集中在计算和特定类型的问题上，对于需要创造性跳跃的高等数学问题几乎束手无策。AI 联合数学家的成功表明，通过多智能体协作和严格的审查机制，AI 正在逼近数学研究的核心地带。数学家不会失业，但他们的工作方式将深刻改变。

正文完