当整个 AI 行业都在拼命堆算力、拼参数的时候,一家位于美国迈阿密、仅有 13 人的小公司 Subquadratic 悄悄扔出了一枚重磅炸弹。他们发布了全球首个基于 SSA 架构的大模型 SubQ,不仅支持 1200 万 Token 的超长上下文,更将计算量较 Transformer 减少了整整一千倍,运行成本仅为 Claude Opus 的 5%。这条消息一出,立刻在 AI 技术圈引发了剧烈震动。
从 Transformer 到 SSA,这是 AI 架构的一次根本性跳跃。自 2017 年 Transformer 问世以来,几乎所有主流大模型都沿用了这一架构,但其计算复杂度随序列长度呈二次方增长的顽疾始终无解。SSA 架构的出现,直接绕过了这一瓶颈,在保证模型效果接近甚至超越旗舰水平的同时,将算力需求压缩到了前所未有的量级。
SubQ 模型的发布意味着什么?首先,超长上下文的门槛被彻底打破。1200 万 Token 意味着你可以一次性输入整部小说、整套代码仓库甚至完整的法律卷宗,而不用担心被截断或丢失上下文。其次,千倍的算力缩减意味着运行大模型不再需要动辄数千张 GPU 的集群,中小型机构甚至个人开发者都有机会在有限硬件上部署接近旗舰性能的模型。
从行业格局来看,SSA 架构的问世可能重新洗牌大模型竞争的底层逻辑。过去两年,OpenAI、Google、Anthropic 等巨头之间的竞争本质上是算力军备竞赛,谁拥有更多 GPU 谁就更有优势。但如果 SSA 架构被验证可行,这种靠堆算力取胜的范式将被彻底颠覆,算力不再是护城河,算法创新才是。
当然,SubQ 目前还处于早期阶段,在实际生产环境中的稳定性、生态兼容性和规模化部署能力仍需进一步验证。但它向我们展示了一个清晰的方向:AI 的未来不一定要靠更多的芯片,更聪明的架构同样可以打开天花板。AI 资源之家将持续关注 SSA 架构的后续发展,为读者带来第一手的技术解读和行业分析。