图灵奖得主Bengio发布GRAM递归推理模型：16步超越320步串行推理的神话被彻底终结

（AI 资源之家讯）5 月 24 日，图灵奖得主 Yoshua Bengio 团队在 arXiv 发布重磅论文，提出 GRAM（Generative Recursive reAsoning Models，生成式递归推理模型）框架，用概率性多轨迹递归彻底颠覆了传统确定性推理范式。这一成果不仅在极难数独任务上达到 97% 准确率，更以 16 步递归加 20 条并行采样碾压所有确定性基线在 320 步时的表现，为大模型推理能力开辟了全新路径。

当前大模型推理的主流方法以思维链（Chain-of-Thought）为代表，本质上是确定性的单轨迹串行推理。这种范式面对多解问题（如 N 皇后问题）时容易陷入局部最优，且只能通过不断增加推理深度来提升表现。Bengio 团队指出，这种确定性限制正是当前推理模型的根本瓶颈所在。

GRAM 的核心创新在于将确定性递归升级为概率性多轨迹推理。首先是随机引导机制：模型在每步递归中引入可学习的高斯随机噪声，使得同一问题可以探索多条不同的推理路径。其次是层次化架构设计：模型分为高层和低层两个组件，随机性仅注入高层以引导整体推理方向，低层则负责精确的状态更新。这种设计既保留了推理的方向性，又打开了探索的多样性空间。

更为关键的是，GRAM 引入了双轴推理扩展策略：深度扩展通过增加递归步数深化单条推理链，宽度扩展通过并行采样多条推理轨迹覆盖更大的解空间。两者结合使得模型在不增加单条推理链复杂度的前提下，通过并行计算显著提升推理质量。

在 Sudoku-Extreme（极难数独）任务中，GRAM 达到 97.0% 准确率，远超传统递归模型 TRM 的 87.4% 和 HRM 的 55.0%。在 N -Queens 8x8 任务中，GRAM 接近最优覆盖率且准确率最高，而确定性模型最高覆盖率仅为 36.1%。消融实验进一步证实：去掉随机性或引导机制任何一个，模型表现都急剧下降甚至归零，说明两者缺一不可。

GRAM 的意义远超技术层面。它呼应了 LeCun 关于真正智能应在潜在空间中规划推理的长期观点，为 AGI 路线提供了一个具体可行的实现路径。同一框架在结构化推理、约束满足和无条件生成三类任务上均表现优异，展示了强大的泛化能力。正如 AI 资源之家持续关注的，2026 年大模型的竞争正从单纯堆参数转向推理架构创新，GRAM 的出现预示着推理效率的量级提升即将到来。

正文完

发表至： AI大模型

2026年5月25日

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

清华00后团队HRM-Text震撼登场：用1500美元训练出媲美大模型的效果

DeepSeek两天两次降价百万token仅2分

千问PC端上线AI语音输入功能

千问C端应用团队四篇论文入选ICML和ACL顶会

DeepSeek融资700亿估值450亿美元：V4-Pro API永久降价75% 颠覆AI行业定价逻辑

图灵奖得主Bengio发布GRAM递归推理模型：16步超越320步串行推理的神话被彻底终结

传统递归推理的根本缺陷

GRAM 的两大核心创新

碾压性实验结果

从聊天工具到科学推理的跨越

苹果iOS 27全面转向AI：Siri独立App对标ChatGPT 苹果智能生态迎来最大重构

中国AI企业注册量首破70万产业加速扩张

企业将token消耗纳入绩效考核引发管理困境

福布斯中国AI科技企业TOP 50重磅发布：具身智能与大模型成最强赛道

GAITC 2026杭州落幕全球AI最强大脑齐聚具身智能与大模型成最热议题

图灵奖得主Bengio发布GRAM递归推理模型：16步超越320步 串行推理的神话被彻底终结

传统递归推理的根本缺陷

GRAM 的两大核心创新

碾压性实验结果

从聊天工具到科学推理的跨越

苹果iOS 27全面转向AI：Siri独立App对标ChatGPT 苹果智能生态迎来最大重构

中国AI企业注册量首破70万产业加速扩张

企业将token消耗纳入绩效考核引发管理困境

福布斯中国AI科技企业TOP 50重磅发布：具身智能与大模型成最强赛道

GAITC 2026杭州落幕 全球AI最强大脑齐聚 具身智能与大模型成最热议题

图灵奖得主Bengio发布GRAM递归推理模型：16步超越320步串行推理的神话被彻底终结

GAITC 2026杭州落幕全球AI最强大脑齐聚具身智能与大模型成最热议题