BT财经

境内金融信息服务备案编号:

【京金信备(2021)5号】

2026年05月08日

注册 / 登录

英伟达中国市场份额“归零”的那一天,国产AI芯片三大门派谁能填上这个坑?

 

 

这个数字,比任何研报都更有力量。

黄仁勋在最新财报季的表态里,亲口承认:英伟达在中国AI加速器市场的份额,已经降至零。

这句话值得停在这里想一想。

2020年以前,英伟达在中国AI芯片市场的份额高达95%——几乎是全面垄断。从95%到0,不是因为英伟达技术变差了,而是美国的出口管制把英伟达的高端芯片彻底挡在了中国门外。

现在的问题是:这个坑,谁在填?

国产AI芯片的三大门派,来了。

这不是一场谁最强的比赛。这是三条完全不同的路,打着完全不同的用户。

第一门派:华为昇腾——全产业链纵深派

华为是中国AI芯片市场唯一一家能从芯片到框架到服务全栈交付的玩家。

DeepSeek V4大模型发布首日即适配华为昇腾等八大国产芯片,推理性能据称达英伟达特供版的2.87倍,成本仅为1/4。这个数字标志着一件事:CUDA生态的垄断,在中国市场被实质性打破了。

2025年华为昇腾出货量约81.2万张,贡献了国产总出货量近五成的份额。其护城河是全自主可控——昇腾芯片配合MindSpore框架与CANN构成计算架构,成为国内极少数能提供从芯片到软件栈一体化交付的厂商。在政企、运营商、金融机构等对稳定性和国产化要求极高的场景,这是一个极大的竞争优势。

昇腾的真实护城河:不是芯片性能,是交付能力。

一个国有银行或者运营商采购AI算力,他需要的不是最快的芯片,而是“出问题有人接电话、系统有人维护、安全合规有人负责”。华为能做到这一点,其他门派大多数做不到。

昇腾的真实短板:生态封闭和迁移成本。

MindSpore目前支持的模型数量远不及英伟达CUDA生态的零头。一个原来基于CUDA开发的团队迁移到昇腾,要付出相当高的重写成本。这决定了昇腾的主战场是政企而非互联网大厂。

第二门派:海光DCU——兼容迁移派

如果说华为昇腾是“全产业链纵深”,那海光DCU走的就是完全相反的路——最小迁移成本。

海光DCU的技术路线类似AMD的ROCm生态,与CUDA高度兼容。开发者可以用hipify工具自动转换CUDA代码,对于PyTorch用户,安装支持DCU的特定分支后,大部分代码可以直接运行。

这意味着什么?一个已经在英伟达上跑起来的AI系统,迁移到海光DCU的成本,是三个门派里最低的。

2025年海光信息营收突破40亿元,CPU和DCU两条产品线同步增长,在金融、电信、互联网等行业AI推理场景中实现规模化落地。

海光的真实护城河:迁移门槛最低,是替换英伟达存量应用的最优路径。

对于那些过去重度依赖英伟达、现在被迫寻找替代方案的企业来说,海光DCU是阻力最小的选择——不用大幅重写代码,不用重构开发工具链,跑起来再说。

海光的真实短板:在超大规模模型训练(如千亿参数以上的基础模型训练)这个场景,海光DCU的集群稳定性和多卡通信延迟,目前仍落后于昇腾。这是架构层面的差异,短期内难以弥合。

第三门派:寒武纪——推理场景专精派

寒武纪是三个门派里商业化进程最戏剧性的那个。

它用了大约六个季度,从连续亏损的硬科技公司,变成了单季净利超10亿的“A股新股王”。

寒武纪思元590芯片2025年出货近10万颗,2026年预计30万颗。摩根士丹利发布报告称,寒武纪在中芯国际的代工生产已逐步稳定,产能瓶颈正在被打通。

寒武纪的主战场,从一开始就不是训练——而是推理。

简单说:训练是“让AI学会一件事”,需要极大算力、长时间跑、容错率高;推理“让AI用学到的东西服务用户”,需要低延迟、低功耗、规模化部署。推理芯片的竞争逻辑和训练芯片完全不同。大规模商业化的AI应用——搜索推荐、广告投放、智能客服——都在推理侧。字节跳动、腾讯、阿里这些互联网大厂的推理侧算力需求,是AI商业化时代最巨大的增量市场。

寒武纪的真实护城河:推理性能对成本的比值,当前在国产芯片里最优。

寒武纪的真实短板:客户高度集中,字节跳动是其最大客户,而字节自己也在研发芯片。

三门派并排放:谁在什么场景能填上英伟达的坑?

政企、运营商、金融算力采购场景——大型政策性AI部署→华为昇腾(全栈交付)

存量系统替换、英伟达迁移场景——已有CUDA代码的迁移→海光DCU(最低迁移成本)

互联网大厂推理算力场景——AI商业化大规模推理部署→寒武纪(推理性价比)

超大规模基础模型训练场景——千亿参数以上训练集群→仍有差距,华为昇腾最接近

这张表是这篇文章真正要交给你的东西。

下次再有人问“国产替代,买哪个”,你可以先问他一个问题:你要替代的是英伟达在哪个场景的哪种需求?

说一句让大家清醒的话

黄仁勋说的“归零”,描述的是英伟达AI加速器在中国的高端市场份额。这是真实的。

但“归零”不等于国产芯片已经完全填上了那个坑。

训练侧的超大规模集群,国产芯片在多卡通信延迟和集群稳定性上,仍和英伟达有代差。软件生态上,CUDA积累了近二十年、百万开发者的工具链,昇腾CANN目前支持的模型数量依然有明显差距。

“归零”的意思是:英伟达失去了中国市场的入场券。国产替代的终局,还没有到来。

这场竞争,刚刚打完开局。

这不是“中国芯片赢了英伟达”的故事。这是中国AI算力第一次在自己的市场上,真正有了选择权。

 

作 者 | 知予

本文仅为信息分享与行业分析,不构成任何投资建议、投资分析意见或交易邀约。市场有风险,投资需谨慎。任何人依据本文内容作出的投资决策,风险与盈亏自行承担,作者及发布平台不承担任何法律责任。

该文为BT财经原创文章,未经许可不得擅自使用、复制、传播或改编该文章,如构成侵权行为将追究法律责任。



版权声明:本文版权归BT财经所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。
帮助中心
联系我们
联系我们

 

商务合作:

 

公司地址

北京市丰台区汉威国际广场一区一号楼629

 

 

商务合作

周先生

Tel: +86-17743514315

Email: info@btimes.com.cn

官方微信公众号

北京领讯时代信息技术有限公司 | Copyright ©️ 2026 财经时报 版权所有 京ICP备19043396号-7

京公网安备 11010602007380号 | 境内金融信息服务备案编号:京金信备(2021)5号

网信算备110106674807801230011号


声明:未经授权,不得复制、转载或以其他方式使用本网站的内容。BT财经尽最大努力确保数据准确,但不保证数据绝对正确。