从「被迫替代」到「主动选择」:一个质变的信号
2026 年 4 月 24 日,DeepSeek V4 发布并宣布全面适配华为昇腾芯片。这个消息的意义,远超一个技术适配公告——它标志着国产 AI 算力替代,正在从「被迫替代」走向「主动选择」。
过去几年,中国企业使用国产 AI 芯片,很大程度上是因为「别无选择」——美国的芯片出口管制,使得英伟达的高端 GPU 无法自由获取。在这种被迫替代的情况下,企业使用国产芯片时的心态是:「能用就行,不指望用得很好」。这种心态,导致了很多国产芯片「装机了但很少实际使用」的尴尬局面。
但 DeepSeek V4 主动选择适配华为昇腾,传达了一个不同的信号:国产芯片的能力,已经达到了「值得主动适配」的水平。DeepSeek 作为全球最优秀的 AI 研究机构之一,它对芯片的选择,是基于技术考量的理性决策,而非政治压力或政策要求。当最优秀的 AI 团队开始主动选择国产芯片时,说明国产芯片的能力已经在某些维度上具备了真实的竞争力。
华为昇腾生态:从硬件到软件的全栈突破
华为昇腾芯片在过去一年取得了显著的技术进展。在硬件层面,最新的昇腾 910C 芯片在 FP16 计算性能上已经接近英伟达 A100 的水平,而在 INT8 推理性能上甚至有所超越。更重要的是,昇腾芯片在能效比方面具有优势——在同样的计算性能下,昇腾的功耗更低,散热要求更宽松。
但华为昇腾真正的突破,发生在软件生态层面。过去,昇腾芯片最大的劣势不是硬件性能,而是软件生态的不成熟。英伟达的 CUDA 生态,经过十多年的发展,已经成为了 AI 计算的事实标准。几乎所有的 AI 框架、库和工具,都优先支持 CUDA。相比之下,华为的 CANN 软件栈虽然功能逐步完善,但在开发者的认知度和使用习惯上,仍有明显差距。
2026 年,华为在软件生态方面投入了巨大的资源。CANN 的 API 兼容性大幅提升,使得原本基于 CUDA 开发的代码,可以以较小的改动迁移到昇腾平台上。同时,华为与 PyTorch、MindSpore 等主流 AI 框架的深度合作,也使得昇腾平台在框架支持方面更加完善。
DeepSeek V4 对昇腾的适配,就是这些软件生态努力的直接成果。根据 DeepSeek 的测试数据,在昇腾平台上运行 V4 模型,推理效率达到 A100 平台的 85% 左右。这个数字虽然还没有完全追平,但对于大多数推理场景来说,已经完全「够用」。
国产 AI 芯片竞争格局
华为昇腾并非中国唯一的国产 AI 芯片玩家。2026 年,中国的国产 AI 芯片产业已经形成了多层级、多赛道的竞争格局。
在训练芯片赛道,华为昇腾 910C 是最强的选手,主要面向大型模型的训练需求。寒武纪的 MLU 系列和壁仞的 BR100 系列也在训练芯片赛道中积极布局,但单卡性能与昇腾和英伟达仍有差距。
在推理芯片赛道,竞争更加激烈。寒武纪的 MLU370、海光信息的 DCU、燧原科技的云燧 T 系列,都在推理场景中展现出了不错的性价比。特别是对于边缘推理场景(如手机、摄像头、IoT 设备),国产推理芯片的竞争力更强。
在 AI 加速器芯片赛道,一些新兴企业正在探索差异化路线。比如,一些企业专注于稀疏化计算——通过降低模型精度和利用计算稀疏性,在较低的算力条件下实现可接受的推理效果。这种思路特别适合对精度要求不高但需要大量推理的场景(如推荐系统、广告投放等)。
从「能用」到「好用」:三个关键跨越
国产 AI 芯片要从「能用」迈向「好用」,需要实现三个关键跨越。
第一个跨越是「性能追赶」。在单卡计算性能上,国产芯片与英伟达最新 GPU 仍有较大差距(特别是在 FP8 和 FP4 等低精度计算方面)。这个差距的缩小,需要芯片制程工艺的持续进步和芯片架构的持续创新。在当前美国对华芯片制造设备出口管制的背景下,这个跨越可能需要更长的时间。
第二个跨越是「生态完善」。CUDA 生态的优势,不仅仅在于技术本身,更在于全球数百万开发者的使用习惯和知识积累。要让开发者从 CUDA 迁移到国产软件栈,需要提供流畅的迁移工具、完善的文档和教程、以及活跃的社区支持。这个跨越,可能比性能追赶更具挑战性。
第三个跨越是「场景验证」。国产芯片需要在足够多的实际场景中,被足够多的企业验证和使用,才能建立起广泛的市场信任。DeepSeek V4 对昇腾的适配,是一个重要的场景验证案例。但仅有一个案例远远不够——还需要在更多企业、更多场景中积累成功经验。
东数西算与国产算力的协同效应
国产 AI 芯片的发展,与「东数西算」工程形成了重要的协同效应。「东数西算」的核心逻辑是:把 AI 算力需求集中在东部沿海地区,把算力设施建设在西部电力充沛地区,通过高速网络连接。
西部地区的可再生能源(水电、风电、光伏)丰富,电力成本低廉,非常适合大规模部署 AI 数据中心。而国产 AI 芯片的能效比优势,在西部的数据中心中可以发挥更大的价值——更低的功耗意味着更低的电费和散热成本,在电力成本敏感的西部数据中心中,这种优势会被放大。
此外,国产芯片在国内供应链中的自主可控优势,也使其在「东数西算」工程中更具吸引力。国产芯片不面临出口管制的风险,可以在国内自由流通和部署。这种供应链安全性,在当前地缘政治环境下,是一个非常重要的考量因素。
随着「东数西算」工程的持续推进,以及国产 AI 芯片性能和生态的不断完善,国产算力替代有望在 2026 年下半年到 2027 年进入加速阶段。届时,中国 AI 产业的算力基础,将从「以进口芯片为主」逐步转向「以国产芯片为主」,实现真正意义上的算力自主可控。