(AI 资源之家讯)4 月 30 日,蚂蚁集团百灵大模型团队正式开源万亿级综合旗舰模型 Ling-2.6-1T。该模型采用 MLA 与 LinearAttention 的混合架构,主打 "快思考" 机制,旨在降低 Token 消耗与推理延迟,让万亿级模型真正进入开发者和企业的生产工作流。
## 架构创新
Ling-2.6-1T 的架构设计颇具巧思。MLA(Multi-Head Latent Attention)与 LinearAttention 的混合架构,在保持模型性能的同时大幅降低了计算复杂度。"快思考" 机制通过优化推理路径,减少不必要的深度推理步骤,在简单任务上实现毫秒级响应,在复杂任务上保持高质量输出。
## 工程落地能力
Ling-2.6-1T 具备从代码生成到缺陷修复的完整工程落地能力,并与主流 Agent 框架高度兼容,适用于多工具、多步骤、多约束的复杂场景。此前,Ling-2.6-flash 曾以匿名模型 Elephant Alpha 蝉联 OpenRouter 热榜多日,证明了蚂蚁在大模型领域的实力。
## 开源意义
万亿级参数模型的开源在国内尚属首次。此前,Ling-2.6-flash 已先期开源并获得了开发者社区的广泛好评。Ling-2.6-1T 的开源将进一步丰富国产开源大模型的生态,为企业和开发者提供更多选择,降低 AI 应用的开发门槛。
正文完