中国AI硬件投资调研:DeepSeek V4脱离CUDA后的产业链机会
一、Claims 验证:哪些是真的,哪些是假的
| Claim | 验证结果 | 证据等级 | 来源 |
|---|---|---|---|
| DeepSeek V4 为华为昇腾做了大幅架构调整,推迟数月 | ✅ 真 | Tier 3-4 | Awesome Agents:推理栈从CUDA迁移到CANN,推迟3次 |
| V4 有「MegaMoE融合算子」在昇腾跑通 | ❌ 假 | — | 该术语不存在于DeepSeek V4技术报告。实际创新是通用operator fusion |
| Jensen Huang说「In China, we have now dropped to zero」 | ✅ 真 | Tier 4 (SEC+视频) | AOL/Yahoo Finance:2026.4.30 SCSP节目原话 |
| NVIDIA预计下季度中国收入为零 | ✅ 真 | Tier 4 (SEC Filing) | NVIDIA Q4 FY2026 Filing:「not assuming any Data Center compute revenue from China」 |
| V4推理完全跑在昇腾上 | ✅ 真(推理端) | Tier 3 | 多源确认CANN推理栈已production |
| V4训练跑在昇腾910B/910C | ⚠️ 部分真 | Tier 2-3 | Digital Applied:用了Ascend但落后NVIDIA数代 |
| NIST评估V4 Pro成本效率优于美国同级模型 | ⚠️ 待验证 | Tier 2 | 文章引用但原始CAISI报告URL未能独立确认 |
| 中国AI走「token efficiency」路线 | ⚠️ 框架性观点 | 作者分析 | 有数据支撑(V4定价、MoE架构),但这是分析框架不是事实claim |
关键结论:核心事实成立 — NVIDIA中国归零、DeepSeek V4确实在昇腾上跑推理、大厂确实在追加华为订单。但「MegaMoE」是假的,「完全脱离CUDA」是夸大的(训练端还没完全到位)。
二、哪些国产AI硬件产品被实际应用了
硬实锤(有独立证据的实际部署)
| 公司 | 产品 | 实锤客户/信号 | 对标美国 |
|---|---|---|---|
| 华为 | Ascend 910B/910C/950PR | DeepSeek(V4推理)、SiliconFlow、ByteDance、Alibaba、Tencent追加订单(Reuters) | A100/H100级 |
| 华为 | Atlas 900 A3 SuperPod | 商用部署300+套(华为官网)、384 NPU集群 | DGX SuperPod |
| 寒武纪 | MLU590 | 青海移动DeepSeek部署、苏宁科技 | — |
| 寒武纪 | MLU370 | 阿里云、百度、招行、浪潮/中国移动 | — |
| 海光信息 | DCU系列 | 20+行业/300+场景、ZStack私有化部署、天翼云一体机 | AMD MI系列 |
| 燧原科技 | CloudBlazer | 庆阳/无锡/成都数万卡部署、美图推理算力 | — |
| 天数智芯 | BI-V150 | 290+客户、900+次部署、累计交付5.2万片(招股书) | — |
| 摩尔线程 | MTT S4000 | 信通院验证+DeepSeek 671B适配、6.6亿KUAE集群订单 | — |
弱实锤(有产品但大规模部署证据不足)
| 公司 | 产品 | 状态 |
|---|---|---|
| 壁仞科技 | BR100/BR104 | 早期产品受制裁影响,后续产品在推,但大规模实战证据最弱 |
核心判断
华为昇腾是主线,不是之一。 其他公司更像「国产替代并行路线」或「特定场景卡位」。如果要买「中国版NVIDIA」的逻辑,标的指向华为生态链,不是寒武纪本身。
三、供应链全景
[芯片设计] [美国对标]
华为海思/昇腾(未上市) NVIDIA
寒武纪(688256) / 海光(688041) AMD
↓
[芯片制造]
中芯国际(688981/00981) N+2/类7nm TSMC
良率: 2024底~20% → 2025~40%
↓
[先进封装]
长电科技(600584) XDFOI TSMC CoWoS
通富微电(002156) 2.5D/3D
↓
[存储/HBM]
长鑫存储(未上市) HBM2样品阶段 SK Hynix HBM3E
长江存储(未上市) NAND/SSD Micron
↓
[网络互联]
华为HCCS/灵衢(未上市) NVLink/NVSwitch
中际旭创(300308) 800G光模块 Broadcom/Coherent
↓
[AI服务器]
华为Atlas(未上市) DGX/HGX
H3C(紫光000938) / 神州鲲泰(000034) Dell/SMCI
浪潮(000977) / 曙光(603019)
↓
[数据中心基础设施]
英维克(002837) / 申菱(301018) 液冷 Vertiv
科华(002335) / 科士达(002518) 电力
万国数据(GDS/9698) IDC运营 Equinix/CoreWeave
最硬的三个瓶颈
- SMIC先进制程良率+产能 — 华为再能设计,出不来就是出不来
- HBM量产 — 长鑫还在HBM2样品阶段,SK Hynix已经HBM3E量产
- 软件生态(CANN vs CUDA) — 2025.8才全面开源,适配新模型仍多花1-2个月
深入:SMIC(中芯国际)— 整条链的单点瓶颈
注:SMIC = Semiconductor Manufacturing International Corporation = 中芯国际。不要和SMCI(Super Micro Computer,美国服务器公司,有财务丑闻)混淆。
为什么SMIC是唯一不可绕过的单点: 华为可以设计芯片,寒武纪也可以,海光也可以。但造?只有中芯国际。整条链上所有设计公司最终都收敛到这一家代工厂。
技术现实:
- 华为昇腾910C → SMIC N+2制程 → DUV多重曝光(没有EUV光刻机,被禁运)
- TSMC用EUV一次曝光到位;SMIC只能用DUV反复对准曝光多次,每多一次就多一个出错机会
- 制程名义到了「类7nm」(N+2),但良率低、成本高、产能受限
良率数据(Reuters/FT/TrendForce交叉验证):
| 时间 | 良率 | 来源 |
|---|---|---|
| 2024年底 | ~20% | Reuters |
| 2025年 | ~40% | FT/TrendForce |
| 商业化通常需要 | 70-80%+ | 行业常识 |
20%良率 = 一片晶圆上切出来的芯片只有1/5能用,其他4/5报废。即使提升到40%,每颗能用的芯片实际吃掉2.5颗的晶圆面积成本。华为能拿到的芯片总量 = 良率 × 产能的乘积。
产能约束: MERICS评估称国产芯片「既不如西方芯片强,也没那么充足」。Reuters报道大厂V4发布后抢购Ascend 950但交付周期是瓶颈——不是华为不想卖,是SMIC出不来那么多。Bloomberg传闻华为计划年产50万颗,但实际产能不透明,所有来源指向同一结论:供不应求。
投资两面性:
- 利好:唯一代工方、良率提升=弹性释放、供不应求有定价权、国家级战略资产
- 风险:40%良率仍远低于商业化水平、没有EUV每前进一步都更难、估值已反映预期、美国若松动出口限制可能分流需求
和美国链的关键区别: TSMC是确定性兑现(有订单就能交货),SMIC是概率性兑现(能不能造出来、什么时候、成本多高都有不确定性)。这也解释了为什么服务器整机弹性最弱——出货完全取决于上游芯片供给。
股价: 港股(00981)过去1年+62%,A股(688981)+34%。港股弹性大一倍,可能和估值更低、外资更看重「国产替代稀缺性」有关。
四、上市公司股票表现
核心标的一览(数据来源:腾讯金融API前复权日K)
| 公司 | 代码 | 交易所 | AI业务 | 过去1年 | 近3月 | V4后 |
|---|---|---|---|---|---|---|
| 中际旭创 | 300308 | SZSE创业板 | 800G光模块 | +837% | +64% | +1015% |
| 英维克 | 002837 | SZSE | 液冷散热 | +287% | +3% | +341% |
| 申菱环境 | 301018 | SZSE创业板 | 数据中心温控 | +237% | +88% | +285% |
| 华虹半导体 | 01347 | HKEX | 特色代工 | +271% | +32% | +257% |
| 兆易创新 | 603986 | SSE | 存储/MCU | +163% | +21% | +201% |
| 寒武纪 | 688256 | SSE科创板 | AI芯片设计 | +151% | +70% | +155% |
| 海光信息 | 688041 | SSE科创板 | CPU/DCU | +122% | +33% | +118% |
| 通富微电 | 002156 | SZSE | 封装测试 | +118% | +22% | +127% |
| 中芯国际-H | 00981 | HKEX | 晶圆代工 | +62% | +9% | +58% |
| 长电科技 | 600584 | SSE | 封装测试 | +49% | +15% | +55% |
| 浪潮信息 | 000977 | SZSE | AI服务器 | +47% | +29% | +61% |
| 中科曙光 | 603019 | SSE | AI服务器/HPC | +49% | +11% | +56% |
| 中芯国际-A | 688981 | SSE科创板 | 晶圆代工 | +34% | +7% | +35% |
| 紫光股份 | 000938 | SZSE | H3C/服务器 | +29% | +36% | +33% |
整体中位数:过去1年 +120%,近3月 +25%,V4后 +123%
板块排序(从强到弱)
光模块/液冷/温控 > 芯片设计 > 封测/特色代工 > 服务器整机
这不是在交易「谁最像NVIDIA」,而是在交易「谁最卡住国产算力扩张的真实瓶颈」。
对比美国AI硬件牛市(2023.1 → 2025.6)
| 美国 | 涨幅 | 中国对标 | 涨幅(1年) |
|---|---|---|---|
| NVDA | +709% | 寒武纪 | +151% |
| SMCI | +578% | 中际旭创 | +837% |
| AVGO | +391% | — | — |
| DELL | +216% | 浪潮信息 | +47% |
| MU | +150% | 兆易创新 | +163% |
| AMD | +89% | 海光信息 | +122% |
观察:中国的「铲子股」(中际旭创、英维克、申菱)弹性甚至超过美国对标。但核心芯片设计(寒武纪/海光)的涨幅显著低于NVDA,原因是中国没有一家公司像NVIDIA那样同时垄断芯片+软件+生态。
五、投资论点判断
论点强度:中偏强
成立的部分:
- ✅ 需求侧验证:DeepSeek V4跑通昇腾、大厂追加订单、高盛上修中国AI capex +65%
- ✅ 政策底:国家数据局、算力网、AI+政策持续推进
- ✅ 板块整体在走美国2023年中后的「扩散」逻辑
未成立的部分:
- ❌ 还没出现「NVIDIA财报一夜证伪所有怀疑」的单一催化事件
- ❌ 产业链大面积利润兑现还没发生
- ❌ SMIC产能/HBM/软件生态三大约束未解
阶段判断:正当时,但要选方向
类比美国时间线,中国现在更像 2023年H2到2024年Q1 — 叙事已点燃、关键验证开始出现、资金在找「谁真的吃到订单」。
| 状态 | 美国当时 | 中国现在 |
|---|---|---|
| 催化剂 | ChatGPT + NVDA Q1暴涨 | DeepSeek R1/V4 + 华为订单追加 |
| 扩散路径 | GPU→ASIC→网络→服务器→存储→电力 | 光模块/液冷先涨 → 芯片设计 → 服务器整机 |
| 估值 | NVDA从40x PE涨到60x+ | 寒武纪PE已天价、海光也不便宜 |
| 产业兑现 | 开始:NVDA收入翻倍 | 早期:订单有,大面积收入兑现还没 |
最大风险
- SMIC良率/产能 — MERICS明确写了:国产芯片「既不如西方芯片强,也没那么充足」
- 美国政策松动 — 如果重新放货,国产替代斜率直接被打断
- 估值透支 — 寒武纪按「国产NVIDIA」定价但没有NVIDIA的收入,如果兑现慢会杀估值
六、操作建议
框架
不要买「国产替代」概念标签。要买三重交集:
- ✅ 有订单兑现(不只是预期)
- ✅ 有生态卡位(不是随便谁都能做)
- ✅ 受益于产能约束(越紧缺越涨价)
强度排序
| 优先级 | 方向 | 标的 | 逻辑 |
|---|---|---|---|
| 🔴 最强 | AI基础设施(液冷/光模块/温控) | 中际旭创、英维克、申菱环境 | 无论谁的芯片赢,算力扩就需要散热和互联 |
| 🟠 强 | 芯片设计龙头 | 寒武纪、海光信息 | 国产替代核心,但估值已高,更适合回调买 |
| 🟡 中 | 封测/代工 | 通富微电、中芯国际(港股) | 卡脖子环节,良率提升=弹性释放 |
| 🟢 跟涨 | 服务器整机 | 浪潮信息、紫光股份 | 跟涨不领涨,弹性最弱 |
未覆盖但值得追踪的华为昇腾链扩展标的
神州数码(000034)、拓维信息、高新发展、深南电路、兴森科技、意华股份、华丰科技
下一步动作
- 跟踪华为Ascend 950/950PR实际出货节奏(Reuters/TrendForce月报)
- 关注SMIC下一次良率/产能披露
- 观察寒武纪/海光下一个季报是否有订单→收入转化
- CANN开发者生态进展(GitHub stars、社区活跃度)
七、来源索引
Tier 4 (最高可信度 — SEC filing / 官方数据)
- NVIDIA Q4 FY2026 SEC Filing
- 华为官网:Atlas 900 A3 SuperPod规格、灵衢UnifiedBus、昇腾社区Powered by Ascend
Tier 3 (独立报道 — Reuters / FT / 研究机构)
- Awesome Agents - DeepSeek V4 CANN Stack Three Delays
- AOL/Yahoo - Jensen Huang「dropped to zero」
- Digital Applied - DeepSeek V4 Analysis
- Reuters: Big Chinese tech firms scramble to secure Huawei AI chips (2025)
- Reuters: Huawei Ascend 950 test orders / SMIC N+2 manufacturing (2024-2025)
- MERICS: China AI chip substitution risk assessment
- Goldman Sachs: China AI capex +65% forecast
Tier 2 (市场叙事 — 券商/财经媒体)
- 平安证券2025中期策略:计算机行业3月冲高与DeepSeek催化
- 东方财富:115只DeepSeek概念股113只年内上涨
- 中信建投:2025国产算力「最确定方向」
- TrendForce:CXMT + 通富微电HBM样品开发
数据来源
- 股价数据:腾讯金融API前复权日K线,交叉验证Investing/AASTOCKS
- 美股对标:StatMuse/Macrotrends月度收盘价