图灵奖得主Bengio发布GRAM递归推理模型:16步超越320步 串行推理的神话被彻底终结

(AI 资源之家讯)5 月 24 日,图灵奖得主 Yoshua Bengio 团队在 arXiv 发布重磅论文,提出 GRAM(Generative Recursive reAsoning Models,生成式递归推理模型)框架,用概率性多轨迹递归彻底颠覆了传统确定性推理范式。这一成果不仅在极难数独任务上达到 97% 准确率,更以 16 步递归加 20 条并行采样碾压所有确定性基线在 320 步时的表现,为大模型推理能力开辟了全新路径。

传统递归推理的根本缺陷

当前大模型推理的主流方法以思维链(Chain-of-Thought)为代表,本质上是确定性的单轨迹串行推理。这种范式面对多解问题(如 N 皇后问题)时容易陷入局部最优,且只能通过不断增加推理深度来提升表现。Bengio 团队指出,这种确定性限制正是当前推理模型的根本瓶颈所在。

GRAM 的两大核心创新

GRAM 的核心创新在于将确定性递归升级为概率性多轨迹推理。首先是随机引导机制:模型在每步递归中引入可学习的高斯随机噪声,使得同一问题可以探索多条不同的推理路径。其次是层次化架构设计:模型分为高层和低层两个组件,随机性仅注入高层以引导整体推理方向,低层则负责精确的状态更新。这种设计既保留了推理的方向性,又打开了探索的多样性空间。

更为关键的是,GRAM 引入了双轴推理扩展策略:深度扩展通过增加递归步数深化单条推理链,宽度扩展通过并行采样多条推理轨迹覆盖更大的解空间。两者结合使得模型在不增加单条推理链复杂度的前提下,通过并行计算显著提升推理质量。

碾压性实验结果

在 Sudoku-Extreme(极难数独)任务中,GRAM 达到 97.0% 准确率,远超传统递归模型 TRM 的 87.4% 和 HRM 的 55.0%。在 N -Queens 8x8 任务中,GRAM 接近最优覆盖率且准确率最高,而确定性模型最高覆盖率仅为 36.1%。消融实验进一步证实:去掉随机性或引导机制任何一个,模型表现都急剧下降甚至归零,说明两者缺一不可。

从聊天工具到科学推理的跨越

GRAM 的意义远超技术层面。它呼应了 LeCun 关于真正智能应在潜在空间中规划推理的长期观点,为 AGI 路线提供了一个具体可行的实现路径。同一框架在结构化推理、约束满足和无条件生成三类任务上均表现优异,展示了强大的泛化能力。正如 AI 资源之家持续关注的,2026 年大模型的竞争正从单纯堆参数转向推理架构创新,GRAM 的出现预示着推理效率的量级提升即将到来。

正文完
post-qrcode
 0
admin
版权声明:本站原创文章,由 admin 于2026-05-25发表,共计992字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。