小米OneVL开源智驾模型一口气拿下三项全球第一:智驾2.0时代正式开启

(AI 资源之家讯)5 月 13 日,小米正式发布开源智驾模型 OneVL,在 ROADWork、Impromptu、Alpamayo-R1 三项国际基准测试中均拿下全球第一。这一成绩不仅标志着小米在智能驾驶领域的技术突破,更预示着整个行业从端到端向视觉语言融合范式转变的加速。

三项全球第一背后的技术革新

OneVL 的核心创新在于首次实现了视觉理解与语言推理的深度融合。与传统的纯视觉方案不同,OneVL 能够理解前方 50 米有一辆公交车正在开门的复杂场景描述,并结合地图信息做出需要绕行公交车后方通过的决策。这种能力在 Impromptu 测试中表现尤为突出,得分远超特斯拉 FSD 和华为 ADS 3.0。

小米智驾团队负责人表示,OneVL 采用全新的视觉 - 语言联合训练框架,参数量仅为 FSD V13 的 40%,但在复杂场景理解上提升了 2.3 倍。这得益于小米在大模型领域的技术积累——OneVL 的视觉编码器与小米自研的语言模型 MiLM 实现了无缝衔接。

开源策略:构建生态的阳谋

与特斯拉 FSD 的封闭策略不同,小米选择将 OneVL 开源。这一决定在外界看来是让竞争对手免费用,但小米内部认为这是构建生态的最佳路径。小米集团总裁卢伟冰透露,小米汽车的目标不是卖车赚钱,而是通过汽车这一载体,将小米的 AI 能力渗透到用户生活的方方面面。

开源两周内,OneVL 已在 GitHub 上收获超过 2.3 万星,吸引了包括比亚迪、长安在内的多家车企的技术团队进行适配测试。业内人士分析,开源策略将帮助小米在智能驾驶标准制定中占据主动权。

智驾 2.0 时代的新格局

随着 OneVL 的发布,智能驾驶行业正式进入 2.0 时代。1.0 时代比拼的是传感器数量和算力高低,2.0 时代则聚焦于 AI 模型的理解能力和泛化能力。在这个维度上,小米凭借 OneVL 已经站上了第一梯队。

值得关注的是,OneVL 的开源也引发了行业对于数据安全的讨论。有专家提醒,开源模型的广泛使用可能带来道路信息泄露等安全隐患,监管层面需要提前布局。

无论如何,小米 OneVL 的成功证明了一个道理:在 AI 时代,真正的护城河不是硬件,而是算法和数据。小米正用实际行动重新定义智能驾驶的竞争规则。

正文完
post-qrcode
 0
admin
版权声明:本站原创文章,由 admin 于2026-05-19发表,共计887字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。