清华00后团队HRM-Text震撼登场：用1500美元训练出媲美大模型的效果

（AI 资源之家讯）清华 00 后校友王冠团队联合 MIT 发布的 HRM-Text 模型，正在用一种近乎颠覆性的方式改写 AI 行业的游戏规则。仅用 10 亿参数、400 亿 token 和约 1500 美元的训练成本，HRM-Text 就实现了可媲美主流大模型的性能表现。

传统大模型的训练思路可以概括为暴力美学：更多的参数、更多的数据、更多的算力。但 HRM-Text 采用了完全不同的技术路线。通过创新的分层循环模型架构，HRM-Text 仅使用标准基线模型百分之一到九百分之一的训练 token，以及九十六分之一到四百三十二分之一的计算量，就达到了令人瞩目的性能水平。这意味着训练一个大模型的成本可能从数千万美元降到几千美元。

HRM-Text 的核心创新在于用分层循环模块取代了 Transformer 的标准注意力机制。模型通过在不同层级之间循环传递信息，用更少的参数捕获更长的依赖关系。配合专门针对指令 - 回复对优化的训练策略，小模型展现出了远超其体量的理解能力和生成质量。

在 AI 资源之家看来，HRM-Text 如果能够持续验证和迭代，将对整个 AI 生态产生深远影响。当训练一个高性能模型不再需要堆叠数千张 GPU，中小企业甚至个人开发者也能参与到模型创新中来。这不仅会加速 AI 技术的多元化发展，也可能催生出一批专注于垂直领域的轻量级精品模型。大模型的垄断格局，或许正在被这股架构创新的浪潮悄然改写。

正文完

发表至： AI大模型

2026年5月27日

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

Anthropic自然语言自编码器揭秘AI思维

DeepSeek V4发布推理成本仅对手千分之一

教宗与Anthropic创始人将联袂发布AI通谕：全球最大宗教机构直面人工智能伦理大考

李飞飞押注AI游戏平台Astrocade融资5600万美元自然语言生成游戏时代来临

浙大阿里发布Unified Thinker架构：AI视觉生成先三思后落笔

清华00后团队HRM-Text震撼登场：用1500美元训练出媲美大模型的效果

1/900 的 Token 用出同等效果

从小参数到高性能的范式转移

AI 民主化的新可能

苹果iOS 27全面转向AI：Siri独立App对标ChatGPT 苹果智能生态迎来最大重构

中国AI企业注册量首破70万产业加速扩张

企业将token消耗纳入绩效考核引发管理困境

福布斯中国AI科技企业TOP 50重磅发布：具身智能与大模型成最强赛道

GAITC 2026杭州落幕全球AI最强大脑齐聚具身智能与大模型成最热议题

清华00后团队HRM-Text震撼登场：用1500美元训练出媲美大模型的效果

1/900 的 Token 用出同等效果

从小参数到高性能的范式转移

AI 民主化的新可能

苹果iOS 27全面转向AI：Siri独立App对标ChatGPT 苹果智能生态迎来最大重构

中国AI企业注册量首破70万产业加速扩张

企业将token消耗纳入绩效考核引发管理困境

福布斯中国AI科技企业TOP 50重磅发布：具身智能与大模型成最强赛道

GAITC 2026杭州落幕 全球AI最强大脑齐聚 具身智能与大模型成最热议题

GAITC 2026杭州落幕全球AI最强大脑齐聚具身智能与大模型成最热议题