第 2 层 · 工艺层
核心问题:AI 半导体的约束已经从“有没有 GPU”下沉到 N3 晶圆、HBM、800V 电源、SiC/GaN、CPO / 光子互连、Active LSI / interposer 这些工艺和材料边界。
✦ 智慧压缩
┌──────────────────────────────────────────────────────────────────┐
│ 工艺层的元判断: │
│ │
│ AI 硬件短缺不是一个瓶颈,而是一串物理边界的接力。 │
│ 2023-2024 是 CoWoS;2024-2025 是电力;2025-2027 是 N3 + HBM。 │
│ │
│ 这意味着定价权会沿着“最难扩的工艺”迁移: │
│ TSMC N3 → HBM / DRAM → 800V SiC/GaN → CPO / Active LSI。 │
│ │
│ 关键不是找一个赢家,而是识别哪个工艺环节正在从背景变成约束。 │
└──────────────────────────────────────────────────────────────────┘
主要论点
S02 · TSMC N3 逻辑晶圆成为 AI 瓶颈
- 来源 xray:The Great AI Silicon Shortage,TSMC Earnings / New N3 Fabs
- 核心断言:AI 加速器的瓶颈从“只有 CoWoS”叙事转向 TSMC N3 逻辑晶圆。2026 起 Rubin、AMD MI400、Google TPU v7/v8、AWS Trainium3、Meta MTIA、NVLink / Tomahawk / Spectrum 等都挤向 N3 / N3P / N3E。
- 关键数字 / 时间:
- 2025-2026:TSMC N3 逻辑晶圆 成为主瓶颈
- 2026:AI 占 N3 晶圆 约 60%
- 2027:AI 占 N3 晶圆 约 86%
- 2026 H2:N3 实际利用率 >100%
- 释放 5% N3 晶圆:约 +0.1M Rubin / +0.3M TPU v7
- 释放 25% N3 晶圆:约 +0.7M Rubin / +1.5M TPU v7
- 现状:进行中。魏哲家的 1Q26 表述和 3 座新 N3 fab 是确认边(E005)。
S03 · HBM 结构性短缺至 2028
- 来源 xray:Great AI Silicon Shortage,Storage Supercycle,SK Hynix HBM4,ISSCC 2026 CPO / HBM4 / Active LSI
- 核心断言:HBM 短缺不是独立内存故事,而是与 N3、DRAM、NAND 和封装共同组成 AI 供给上限。HBM 每增加 1GB,会挤出 3-4GB 普通 DRAM 级别的供给。
- 关键数字 / 时间:
- HBM3E:1 晶圆 HBM3E ≈ 3 晶圆 普通 DRAM 的 机会成本
- HBM4:1 晶圆 HBM4 接近 4 晶圆 普通 DRAM
- 2026:HBM 100% 售罄
- 2027:大概率 售罄
- 2028:才可能真正好转
- NVIDIA Blackwell → Rubin:HBM 容量 +50%
- Rubin → Rubin Ultra:HBM 容量约 4x
- HBM4 样例:36GB / 12-high / 3.3TB/s / 13Gb/s pin
- 现状:进行中。CAE 已有 S03 = ID 97。
S25 · N3 与 HBM 双瓶颈锁定逻辑和内存
- 来源 xray:Great AI Silicon Shortage,AI Semiconductor Endgame,TPU Silicon Bottleneck
- 核心断言:N3 和 HBM 不是两个独立问题,而是互相锁死的双瓶颈。只有 N3 没有 HBM,加速器出不来;只有 HBM 没有 N3,逻辑端会被 TSMC 分配卡住。
- 关键数字 / 时间:
- 2026-2027:N3 + HBM 双瓶颈窗口
- Rubin、TPU、MI400、Trainium3 同时吃 N3
- HBM4 / HBM4E 推高 DRAM 晶圆挤出效应
- 现状:进行中。E006 / E007 是主边:S02 → S25,S03 → S25。
S05 · 800V 供应链继承
- 来源 xray:Citrini Semis Memo: Supply Chain Inheritance
- 核心断言:AI 不是从零建设 电源供应链,而是继承 EV、太阳能、自动化产业过去 10 年已经规模化的 800V / 电力电子 能力。
- 关键数字 / 时间:
- 2017:Porsche Taycan 800V 动力总成
- 2025-05:NVIDIA 技术博客将 800V DC 机架底层技术指向 EV / solar
- 2027:Rubin 600kW GPU 机架
- 54V → 800V:机架电力架构换挡
- Rubin Ultra GPU:2500W / 0.7V = 3500A
- H100 → Rubin Ultra:多相功率传输相数约 4x
- 现状:进行中。CAE 已有 S05 = ID 98。
S22 · SiC/GaN 800V Power BOM Migration
- 来源 xray:Supply Chain Inheritance,Wolfspeed Deep Dive,AI Data Center Cost Breakdown
- 核心断言:800V 机架电力 把 SiC / GaN 从 EV / solar 供应链 拉进 AI 数据中心电源 BOM。AI 继承的是同一片晶圆、同一套设备、同一批供应商。
- 关键数字 / 时间:
- 2018 → 2024:SiC 市场 6 年约 12x,至约 $3.5B
- 2026:Rubin 平台首次 AI 需求点
- 2028-2030:Rubin Ultra 爬坡 + hyperscaler 800V 承诺
- 2030:AI 基础设施可能占 SiC 总需求约 50%
- Wolfspeed Mohawk Valley:全球唯一商用 200mm SiC fab
- 300mm SiC:2026-01 demo 单晶
- 200mm SiC + 70×76mm package:圆形晶圆限制;300mm 可切 4 个
- 现状:进行中。S22 → S06 是 WOLF 重估的工艺根。
S16 · 光子与 CPO 把带宽问题推入工艺层
- 来源 xray:Citrini Let There Be Light,Citrini Photonics,ISSCC 2026 CPO / HBM4 / Active LSI
- 核心断言:当铜互连 / 电互连到达功耗和距离边界,带宽瓶颈会向光子互连、CPO、Active LSI、SOI、MOCVD、晶圆键合等工艺层转移。
- 关键数字 / 时间:
- Pluggable transceiver:约 30W/端口
- CPO:约 9W/端口
- Jensen GTC 2025 算术:1M GPU 需要 6M transceiver,约 180MW
- NVIDIA Quantum-X Photonics:2026 H1 出货计划
- Spectrum-X Photonics Ethernet:2026 H2,102.4Tb/s,512×800G 端口
- TSMC Active LSI:32Gb/s,0.07pJ/b ETT,388um shoreline
- aLSI PHY 收缩 18%,能耗 0.36pJ/b
- 现状:观察中。S16 是 S17 Blackwell / 机架级系统护城河的下一代工艺输入。
链路
| 起点 | 终点 | 关系 | 含义 |
|---|---|---|---|
| S01 | S02 | 确认 | 魏哲家 / TSMC 表态和新 N3 fab 确认 N3 逻辑瓶颈。 |
| S02 | S25 | 因果 | N3 短缺是双瓶颈的逻辑侧。 |
| S03 | S25 | 因果 | HBM 短缺是双瓶颈的内存侧。 |
| S03 | S04 | 因果 | HBM 晶圆分配挤出普通 DRAM / NAND,形成存储超级周期。 |
| S05 | S22 | 因果 | 800V 继承直接驱动 SiC/GaN 电源 BOM 迁移。 |
| S22 | S06 | 因果 | SiC/GaN 迁移是 Wolfspeed 重估的工艺底座。 |
| S16 | S17 | 赋能 | CPO / 光子互连帮助机架级系统继续扩带宽。 |
| S16 | S25 | 约束 | 先进封装 / 互连 是 N3 + HBM 双瓶颈旁边的新约束。 |
关键摘句
"不再是 CoWoS 包装短缺;不再是 HBM 内存短缺;是 TSMC N3 逻辑晶圆 短缺。" — SemiAnalysis xray
"AI 不在自建供应链 —— 它在继承 EV / 太阳能 / 自动化产业。" — Citrini xray
"600kW rack:只有 800V 才能物理实现。" — Citrini xray
"HBM4 + CPO + Active LSI + UCIe-S 不是四个独立故事。" — ISSCC 2026 xray
"两条路径消耗的上游材料和设备完全相同。" — Citrini Photonics xray
术语引用
监控信号
| 信号 | 利好 | 利空或削弱 |
|---|---|---|
| TSMC 2026-Q2 / Q3 N3 表述 | S01, S02, S25 | 魏哲家回到泛 AI 表述;N3 fab 排期滑坡 |
| HBM4 qualification / 分配 | S03, S25 | Samsung / Micron 加速扩供导致 2028 前缓解 |
| DRAM / NAND 现货和合约价格 | S04 | 普通 DRAM 利润率回落,HBM 挤出效应不再硬约束 |
| Hyperscaler 800V 承诺 | S05, S22 | 800V 停留在 NVIDIA 参考设计 |
| WOLF Mohawk 利用率 / AI 设计导入 | S06, S22 | 利用率 迟迟不上 50%+ |
| CPO / 光子互连量产时间 | S16 | CPO 继续后移且 pluggable 供应充足 |
| aLSI / CoWoS-L 采用 | S16, S25 | Active interposer 只停留在 demo / paper |
OB 参考补强
| 来源 | 补强点 | 对应论点 |
|---|---|---|
| SemiAnalysis: Scaling the Memory Wall | HBM 路线图、DRAM 晶圆机会成本、memory wall 的结构性解释。 | S03, S04, S25 |
| SemiAnalysis: Co Packaged Optics | CPO TCO 和 scale-out interconnect 功耗边界。 | S16, S17 |
| SemiAnalysis: Energizing AI | 从 VRM / 48V / 电源转换补齐 800V 供应链继承的前史。 | S05, S22 |
| Citrini: Let There Be Light | Photonics / CPO 供应链和 TSMC COUPE 路线。 | S16 |
| Citrini: Semis Memo: Muscle Memory | memory、optics、ASIC、testing 之间的供应链记忆和轮动。 | S03, S16, S23 |
未解疑问
- N3 shortage 和 HBM shortage 哪个会先被 supply response 缓解?现在更像 N3 由 TSMC 资本开支 缓解,HBM 由 memory vendor incentive 缓解,但两者节奏不同。
- 800V adoption 是 NVIDIA 主导 标准,还是 hyperscaler 通用 标准?只有后者能把 SiC/GaN 论点 从 trade 变成 cycle。
- CPO 的主时间线是 2026 H1/H2 真实出货,还是 2027-2028 量产?这个差异决定上游设备是提前涨完还是还有 财报追赶。
- Samsung HBM4 / SF4 base die 会不会把 HBM 论点 和 Samsung second-来源 论点 合并成同一条 Korea 工艺交易?