机器人终局论物理AGI路线图引热议

(AI 资源之家讯)5 月 9 日,英伟达高级研究科学家 Jim Fan 提出的物理 AGI 路线图引发行业热议。他提出视频世界模型作为第二预训练范式、世界行动模型等核心观点,为人形机器人从当前的功能执行走向通用智能提供了清晰的技术演进路径。

## 视频世界模型的新范式

Jim Fan 认为,当前大模型的预训练主要依赖文本数据,但物理世界的运行规律无法仅从文本中充分学习。他提出将视频世界模型作为第二预训练范式——让 AI 从海量视频中学习物理世界的运动规律、因果关系和空间结构。这与婴儿通过观察世界来学习的逻辑一致。当前多家机器人公司已在采集真实世界的操作视频来训练模型,验证了这一思路的可行性。

## 世界行动模型的核心架构

路线图中最核心的概念是世界行动模型,简称 WAM。与当前主流的视觉 - 语言 - 动作模型不同,WAM 将世界理解和行动执行统一在一个模型中。传统方法是先理解环境再决定动作,WAM 则是理解与行动一体化——对世界的理解本身就包含了行动的意图。这种架构更接近人类直觉式的行动方式,有望大幅提升机器人在开放环境中的泛化能力。

## 从专用到通用的跨越

Jim Fan 的路线图描绘了从当前专用机器人到物理 AGI 的演进路径:第一阶段是特定任务的模仿学习,第二阶段是场景泛化的视频预训练,第三阶段是通用行动的 WAM。这一路径与语言模型从专用到通用的发展轨迹高度一致,为整个机器人行业提供了清晰的技术灯塔。

正文完
post-qrcode
 0
admin
版权声明:本站原创文章,由 admin 于2026-05-11发表,共计583字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。