(AI 资源之家讯)5 月 9 日,百度正式发布新一代基础大模型文心 5.1,凭借自主研发的多维弹性预训练技术,仅以业界同规模模型约 6% 的预训练成本就实现了基础效果的领先,登上 LMArena 搜索榜国内第一、全球第四。文心 5.1 的发布引发行业高度关注,被视为 DeepSeek V4 系列的强力竞争者。
## 6% 成本如何实现
文心 5.1 的核心技术突破在于多维弹性预训练。该技术于文心 5.0 发布时提出,核心思路是一次训练生成多种规模模型。文心 5.1 充分继承了文心 5.0 的知识,并将总参数压缩至更小规模,同时通过知识蒸馏和弹性路由技术保持了旗舰级的基础能力。这意味着训练一次大模型后,可以高效地派生出多个不同规模的实用模型,大幅摊薄了单模型的训练成本。
## 搜索能力登顶国内
在 LMArena 搜索榜单中,文心 5.1 以 1223 分登顶国内第一、全球第四,成为该榜单中唯一入围的中国大模型。搜索能力是大模型实用性的关键指标——能否准确理解复杂查询并返回精准结果,直接影响用户体验。文心 5.1 在多跳推理和长文档理解场景中表现突出,这与百度在搜索引擎领域多年积累的查询理解能力密切相关。
## 对国产大模型格局的影响
文心 5.1 的发布使国产大模型竞争格局更加激烈。DeepSeek V4 系列在开源生态和编程能力上占优,文心 5.1 则在搜索和成本效率上形成差异化。百度方面透露,文心 5.1 已全面接入百度搜索和文心一言,日均服务请求量突破 10 亿次。当低成本遇上高能力,国产大模型的内卷正在加速。
正文完