中国AI硬件投资调研:DeepSeek V4脱离CUDA后的产业链机会

16 min readAI · investment · hardware · China · DeepSeek

一、Claims 验证:哪些是真的,哪些是假的

Claim验证结果证据等级来源
DeepSeek V4 为华为昇腾做了大幅架构调整,推迟数月✅ 真Tier 3-4Awesome Agents:推理栈从CUDA迁移到CANN,推迟3次
V4 有「MegaMoE融合算子」在昇腾跑通❌ 假该术语不存在于DeepSeek V4技术报告。实际创新是通用operator fusion
Jensen Huang说「In China, we have now dropped to zero」✅ 真Tier 4 (SEC+视频)AOL/Yahoo Finance:2026.4.30 SCSP节目原话
NVIDIA预计下季度中国收入为零✅ 真Tier 4 (SEC Filing)NVIDIA Q4 FY2026 Filing:「not assuming any Data Center compute revenue from China」
V4推理完全跑在昇腾上✅ 真(推理端)Tier 3多源确认CANN推理栈已production
V4训练跑在昇腾910B/910C⚠️ 部分真Tier 2-3Digital Applied:用了Ascend但落后NVIDIA数代
NIST评估V4 Pro成本效率优于美国同级模型⚠️ 待验证Tier 2文章引用但原始CAISI报告URL未能独立确认
中国AI走「token efficiency」路线⚠️ 框架性观点作者分析有数据支撑(V4定价、MoE架构),但这是分析框架不是事实claim

关键结论:核心事实成立 — NVIDIA中国归零、DeepSeek V4确实在昇腾上跑推理、大厂确实在追加华为订单。但「MegaMoE」是假的,「完全脱离CUDA」是夸大的(训练端还没完全到位)。


二、哪些国产AI硬件产品被实际应用了

硬实锤(有独立证据的实际部署)

公司产品实锤客户/信号对标美国
华为Ascend 910B/910C/950PRDeepSeek(V4推理)、SiliconFlow、ByteDance、Alibaba、Tencent追加订单(Reuters)A100/H100级
华为Atlas 900 A3 SuperPod商用部署300+套(华为官网)、384 NPU集群DGX SuperPod
寒武纪MLU590青海移动DeepSeek部署、苏宁科技
寒武纪MLU370阿里云、百度、招行、浪潮/中国移动
海光信息DCU系列20+行业/300+场景、ZStack私有化部署、天翼云一体机AMD MI系列
燧原科技CloudBlazer庆阳/无锡/成都数万卡部署、美图推理算力
天数智芯BI-V150290+客户、900+次部署、累计交付5.2万片(招股书)
摩尔线程MTT S4000信通院验证+DeepSeek 671B适配、6.6亿KUAE集群订单

弱实锤(有产品但大规模部署证据不足)

公司产品状态
壁仞科技BR100/BR104早期产品受制裁影响,后续产品在推,但大规模实战证据最弱

核心判断

华为昇腾是主线,不是之一。 其他公司更像「国产替代并行路线」或「特定场景卡位」。如果要买「中国版NVIDIA」的逻辑,标的指向华为生态链,不是寒武纪本身。


三、供应链全景

[芯片设计]                         [美国对标]
 华为海思/昇腾(未上市)              NVIDIA
 寒武纪(688256) / 海光(688041)     AMD
        ↓
[芯片制造]
 中芯国际(688981/00981) N+2/类7nm   TSMC
 良率: 2024底~20% → 2025~40%
        ↓
[先进封装]
 长电科技(600584) XDFOI             TSMC CoWoS
 通富微电(002156) 2.5D/3D           
        ↓
[存储/HBM]
 长鑫存储(未上市) HBM2样品阶段      SK Hynix HBM3E
 长江存储(未上市) NAND/SSD           Micron
        ↓
[网络互联]
 华为HCCS/灵衢(未上市)              NVLink/NVSwitch
 中际旭创(300308) 800G光模块         Broadcom/Coherent
        ↓
[AI服务器]
 华为Atlas(未上市)                   DGX/HGX
 H3C(紫光000938) / 神州鲲泰(000034)  Dell/SMCI
 浪潮(000977) / 曙光(603019)
        ↓
[数据中心基础设施]
 英维克(002837) / 申菱(301018) 液冷   Vertiv
 科华(002335) / 科士达(002518) 电力
 万国数据(GDS/9698) IDC运营          Equinix/CoreWeave

最硬的三个瓶颈

  1. SMIC先进制程良率+产能 — 华为再能设计,出不来就是出不来
  2. HBM量产 — 长鑫还在HBM2样品阶段,SK Hynix已经HBM3E量产
  3. 软件生态(CANN vs CUDA) — 2025.8才全面开源,适配新模型仍多花1-2个月

深入:SMIC(中芯国际)— 整条链的单点瓶颈

注:SMIC = Semiconductor Manufacturing International Corporation = 中芯国际。不要和SMCI(Super Micro Computer,美国服务器公司,有财务丑闻)混淆。

为什么SMIC是唯一不可绕过的单点: 华为可以设计芯片,寒武纪也可以,海光也可以。但造?只有中芯国际。整条链上所有设计公司最终都收敛到这一家代工厂。

技术现实:

  • 华为昇腾910C → SMIC N+2制程 → DUV多重曝光(没有EUV光刻机,被禁运)
  • TSMC用EUV一次曝光到位;SMIC只能用DUV反复对准曝光多次,每多一次就多一个出错机会
  • 制程名义到了「类7nm」(N+2),但良率低、成本高、产能受限

良率数据(Reuters/FT/TrendForce交叉验证):

时间良率来源
2024年底~20%Reuters
2025年~40%FT/TrendForce
商业化通常需要70-80%+行业常识

20%良率 = 一片晶圆上切出来的芯片只有1/5能用,其他4/5报废。即使提升到40%,每颗能用的芯片实际吃掉2.5颗的晶圆面积成本。华为能拿到的芯片总量 = 良率 × 产能的乘积。

产能约束: MERICS评估称国产芯片「既不如西方芯片强,也没那么充足」。Reuters报道大厂V4发布后抢购Ascend 950但交付周期是瓶颈——不是华为不想卖,是SMIC出不来那么多。Bloomberg传闻华为计划年产50万颗,但实际产能不透明,所有来源指向同一结论:供不应求。

投资两面性:

  • 利好:唯一代工方、良率提升=弹性释放、供不应求有定价权、国家级战略资产
  • 风险:40%良率仍远低于商业化水平、没有EUV每前进一步都更难、估值已反映预期、美国若松动出口限制可能分流需求

和美国链的关键区别: TSMC是确定性兑现(有订单就能交货),SMIC是概率性兑现(能不能造出来、什么时候、成本多高都有不确定性)。这也解释了为什么服务器整机弹性最弱——出货完全取决于上游芯片供给。

股价: 港股(00981)过去1年+62%,A股(688981)+34%。港股弹性大一倍,可能和估值更低、外资更看重「国产替代稀缺性」有关。


四、上市公司股票表现

核心标的一览(数据来源:腾讯金融API前复权日K)

公司代码交易所AI业务过去1年近3月V4后
中际旭创300308SZSE创业板800G光模块+837%+64%+1015%
英维克002837SZSE液冷散热+287%+3%+341%
申菱环境301018SZSE创业板数据中心温控+237%+88%+285%
华虹半导体01347HKEX特色代工+271%+32%+257%
兆易创新603986SSE存储/MCU+163%+21%+201%
寒武纪688256SSE科创板AI芯片设计+151%+70%+155%
海光信息688041SSE科创板CPU/DCU+122%+33%+118%
通富微电002156SZSE封装测试+118%+22%+127%
中芯国际-H00981HKEX晶圆代工+62%+9%+58%
长电科技600584SSE封装测试+49%+15%+55%
浪潮信息000977SZSEAI服务器+47%+29%+61%
中科曙光603019SSEAI服务器/HPC+49%+11%+56%
中芯国际-A688981SSE科创板晶圆代工+34%+7%+35%
紫光股份000938SZSEH3C/服务器+29%+36%+33%

整体中位数:过去1年 +120%,近3月 +25%,V4后 +123%

板块排序(从强到弱)

光模块/液冷/温控 > 芯片设计 > 封测/特色代工 > 服务器整机

这不是在交易「谁最像NVIDIA」,而是在交易「谁最卡住国产算力扩张的真实瓶颈」。

对比美国AI硬件牛市(2023.1 → 2025.6)

美国涨幅中国对标涨幅(1年)
NVDA+709%寒武纪+151%
SMCI+578%中际旭创+837%
AVGO+391%
DELL+216%浪潮信息+47%
MU+150%兆易创新+163%
AMD+89%海光信息+122%

观察:中国的「铲子股」(中际旭创、英维克、申菱)弹性甚至超过美国对标。但核心芯片设计(寒武纪/海光)的涨幅显著低于NVDA,原因是中国没有一家公司像NVIDIA那样同时垄断芯片+软件+生态。


五、投资论点判断

论点强度:中偏强

成立的部分:

  • ✅ 需求侧验证:DeepSeek V4跑通昇腾、大厂追加订单、高盛上修中国AI capex +65%
  • ✅ 政策底:国家数据局、算力网、AI+政策持续推进
  • ✅ 板块整体在走美国2023年中后的「扩散」逻辑

未成立的部分:

  • ❌ 还没出现「NVIDIA财报一夜证伪所有怀疑」的单一催化事件
  • ❌ 产业链大面积利润兑现还没发生
  • ❌ SMIC产能/HBM/软件生态三大约束未解

阶段判断:正当时,但要选方向

类比美国时间线,中国现在更像 2023年H2到2024年Q1 — 叙事已点燃、关键验证开始出现、资金在找「谁真的吃到订单」。

状态美国当时中国现在
催化剂ChatGPT + NVDA Q1暴涨DeepSeek R1/V4 + 华为订单追加
扩散路径GPU→ASIC→网络→服务器→存储→电力光模块/液冷先涨 → 芯片设计 → 服务器整机
估值NVDA从40x PE涨到60x+寒武纪PE已天价、海光也不便宜
产业兑现开始:NVDA收入翻倍早期:订单有,大面积收入兑现还没

最大风险

  1. SMIC良率/产能 — MERICS明确写了:国产芯片「既不如西方芯片强,也没那么充足」
  2. 美国政策松动 — 如果重新放货,国产替代斜率直接被打断
  3. 估值透支 — 寒武纪按「国产NVIDIA」定价但没有NVIDIA的收入,如果兑现慢会杀估值

六、操作建议

框架

不要买「国产替代」概念标签。要买三重交集

  • ✅ 有订单兑现(不只是预期)
  • ✅ 有生态卡位(不是随便谁都能做)
  • ✅ 受益于产能约束(越紧缺越涨价)

强度排序

优先级方向标的逻辑
🔴 最强AI基础设施(液冷/光模块/温控)中际旭创、英维克、申菱环境无论谁的芯片赢,算力扩就需要散热和互联
🟠 强芯片设计龙头寒武纪、海光信息国产替代核心,但估值已高,更适合回调买
🟡 中封测/代工通富微电、中芯国际(港股)卡脖子环节,良率提升=弹性释放
🟢 跟涨服务器整机浪潮信息、紫光股份跟涨不领涨,弹性最弱

未覆盖但值得追踪的华为昇腾链扩展标的

神州数码(000034)、拓维信息、高新发展、深南电路、兴森科技、意华股份、华丰科技

下一步动作

  • 跟踪华为Ascend 950/950PR实际出货节奏(Reuters/TrendForce月报)
  • 关注SMIC下一次良率/产能披露
  • 观察寒武纪/海光下一个季报是否有订单→收入转化
  • CANN开发者生态进展(GitHub stars、社区活跃度)

七、来源索引

Tier 4 (最高可信度 — SEC filing / 官方数据)

Tier 3 (独立报道 — Reuters / FT / 研究机构)

Tier 2 (市场叙事 — 券商/财经媒体)

  • 平安证券2025中期策略:计算机行业3月冲高与DeepSeek催化
  • 东方财富:115只DeepSeek概念股113只年内上涨
  • 中信建投:2025国产算力「最确定方向」
  • TrendForce:CXMT + 通富微电HBM样品开发

数据来源

  • 股价数据:腾讯金融API前复权日K线,交叉验证Investing/AASTOCKS
  • 美股对标:StatMuse/Macrotrends月度收盘价