(AI 资源之家讯)5 月 13 日,小米正式发布开源智驾模型 OneVL,在 ROADWork、Impromptu、Alpamayo-R1 三项国际基准测试中均拿下全球第一。这一成绩不仅标志着小米在智能驾驶领域的技术突破,更预示着整个行业从端到端向视觉语言融合范式转变的加速。
三项全球第一背后的技术革新
OneVL 的核心创新在于首次实现了视觉理解与语言推理的深度融合。与传统的纯视觉方案不同,OneVL 能够理解前方 50 米有一辆公交车正在开门的复杂场景描述,并结合地图信息做出需要绕行公交车后方通过的决策。这种能力在 Impromptu 测试中表现尤为突出,得分远超特斯拉 FSD 和华为 ADS 3.0。
小米智驾团队负责人表示,OneVL 采用全新的视觉 - 语言联合训练框架,参数量仅为 FSD V13 的 40%,但在复杂场景理解上提升了 2.3 倍。这得益于小米在大模型领域的技术积累——OneVL 的视觉编码器与小米自研的语言模型 MiLM 实现了无缝衔接。
开源策略:构建生态的阳谋
与特斯拉 FSD 的封闭策略不同,小米选择将 OneVL 开源。这一决定在外界看来是让竞争对手免费用,但小米内部认为这是构建生态的最佳路径。小米集团总裁卢伟冰透露,小米汽车的目标不是卖车赚钱,而是通过汽车这一载体,将小米的 AI 能力渗透到用户生活的方方面面。
开源两周内,OneVL 已在 GitHub 上收获超过 2.3 万星,吸引了包括比亚迪、长安在内的多家车企的技术团队进行适配测试。业内人士分析,开源策略将帮助小米在智能驾驶标准制定中占据主动权。
智驾 2.0 时代的新格局
随着 OneVL 的发布,智能驾驶行业正式进入 2.0 时代。1.0 时代比拼的是传感器数量和算力高低,2.0 时代则聚焦于 AI 模型的理解能力和泛化能力。在这个维度上,小米凭借 OneVL 已经站上了第一梯队。
值得关注的是,OneVL 的开源也引发了行业对于数据安全的讨论。有专家提醒,开源模型的广泛使用可能带来道路信息泄露等安全隐患,监管层面需要提前布局。
无论如何,小米 OneVL 的成功证明了一个道理:在 AI 时代,真正的护城河不是硬件,而是算法和数据。小米正用实际行动重新定义智能驾驶的竞争规则。