参考文献与 OB 补充
这页把 SemiAnalysis、Stratechery、Citrini Research 三个 OB raw vault 中与半导体知识库最相关的材料筛成一个二级参考库。它不是主数据源;主数据源仍是 24 篇 xray、论点 JSON 和 DAG 边账本。
使用规则
| 层级 | 用法 |
|---|---|
| xray | 主引用,决定当前知识库的 25 个论点和 30 条边 |
| OB 核心参考 | 补强背景、原文核对、未来论点候选 |
| OB 其他文章 | fallback,只在 xray 未覆盖时使用 |
判断标准:一篇 OB 文章只有在能强化“需求 → 工艺 → 架构 → 标的 → 电力 / 政策”链条时才进入核心参考。
OB lens 补强(不是新论点)
这一节是 OB raw vault 对现有 S01-S25 的 lens 补强,不进入
_input/thesis-extraction.json,也不出现在 DAG / panorama。如果某条补强累积足够独立证据并跨多个 xray 确认,再考虑提案为 S26+ 新论点。
速查映射:
| OB lens | 强化的 S-ID |
|---|---|
| L1. N3/HBM 硬分配 | S02, S03, S25 |
| L2. 自研芯片威胁 NVIDIA 利润 | S11, S13, S14 |
| L3. GPU → rack-level system | S17, S21, S22 |
| L4. 电力三件事(接入 / 可调度 / 负载质量) | S15, S19, S20 |
| L5. TPU 供应链是第二地图 | S13, S14, S23 |
| L6. 光互连生存路径 | S16, S17 |
| L7. Agentic 需求看 token + capex | S10, S12, S24 |
L1. N3/HBM 是硬分配层,不只是零部件短缺
SemiAnalysis 和 Stratechery 都把 AI 需求落到同一个机制:TSMC N3 晶圆、HBM、先进封装和客户优先级构成一个联合分配系统。
这会强化 S02 / S03 / S25:2026-2027 的核心问题不是“有没有 GPU”,而是谁能拿到 N3 + HBM 组合。
L2. 自研芯片先威胁 NVIDIA 利润率和议价权,再威胁出货量
TPU / Trainium / XPU 不是立刻消灭 NVIDIA,而是给 hyperscaler 一个可谈判的 outside option。
CUDA / PyTorch、机架系统和部署节奏仍保护 NVIDIA 近期需求;但 Google TPU、AWS Trainium 和 OpenAI / Broadcom 这类路径会压缩长期利润率叙事。
L3. 产品边界从 GPU die 推到 rack-level system
Rubin / Vera / CPX、Blackwell NVL、CPO、800V、电力、CPU 控制平面和 BMC 不是散点。
它们共同说明竞争单位已经从单颗 GPU 变成“机架 + 网络 + 电力 + 冷却 + 软件部署节奏”。
L4. 电力瓶颈拆成三件事:接入、可调度发电、负载质量
AI 数据中心不只需要更多电。它还需要更快的电网接入、可调度的天然气 / 涡轮机 / 变电站,以及能承受训练负载波动的电力质量。
这强化 S15 / S19 / S20:电力已经从成本项变成政策和物理上线条件。
L5. TPU 供应链是第二张 AI infrastructure 地图
Citrini 的 TPU 供应链框架把 Google TPU 从“Google 是否打赢 NVIDIA”转成一张供应商地图:先进封装、HBM、高端 PCB、基板、光交换、功率管理、热管理。
这补强 S13 / S14 / S23,也避免把 TPU 论点写成单公司叙事。
L6. 光互连从优化项变成生存路径
当 scale-out 带宽继续上升,pluggable optics、电互连和传统交换路径会越来越受功耗 / 成本 / 距离约束。
CPO、OCS、silicon photonics、Active LSI 和先进封装会变成 S16 / S17 的下一组关键观察点。
L7. Agentic 需求要看 token 强度和基础设施承诺
用户数不是最好的 AI 半导体需求指标。更好的指标是 token throughput、agent per user、模型竞争强度、capex 锁定、N3/HBM 分配和电力预约。
这补强 S10 / S12 / S24。
核心参考清单
SemiAnalysis
| 文章 | 日期 | 主要用途 | 支撑论点 |
|---|---|---|---|
| The Great AI Silicon Shortage | 2026-03-12 | N3 + HBM 双瓶颈、AI 对 N3 分配的挤占 | S02, S03, S25 |
| Scaling the Memory Wall: The Rise and Roadmap of HBM | 2025-08-12 | HBM 路线图、memory wall、DRAM 挤出 | S03, S04, S25 |
| Co Packaged Optics (CPO) | 2026-01-02 | CPO TCO、scale-out interconnect、功耗约束 | S16, S17 |
| Vera Rubin: Extreme Co-Design | 2026-02-26 | Rubin / Vera / NVLink 机架级协同设计 | S17 |
| Another Giant Leap: Rubin CPX | 2025-09-11 | 推理专用化、rack 架构升级 | S10, S17 |
| Google TPUv7 | 2025-11-28 | TPU 外部化、Anthropic / Google 需求、N3 压力 | S13, S14, S25 |
| AWS Trainium3 Deep Dive | 2025-12-05 | AWS 自研芯片路线、custom silicon 比较 | S14, S25 |
| How Much Do GPU Clusters Really Cost? | 2026-04-20 | GPU cluster 成本结构、电力和网络物理约束 | S15, S17 |
| AI Training Load Fluctuations at Gigawatt-scale | 2025-06-26 | 训练负载波动与电网风险 | S15, S19 |
| Energizing AI | 2023-08-01 | 电源交付、VRM、48V / 800V 迁移背景 | S05, S22, S06 |
Stratechery
| 文章 | 日期 | 主要用途 | 支撑论点 |
|---|---|---|---|
| TSMC Earnings, The TSMC Brake Revisited | 2026-01-21 | TSMC 投资不足、foundry 竞争必要性 | S01, S02, S08 |
| TSMC Earnings, New N3 Fabs, The Nvidia Ramp | 2026-04-20 | 新 N3 fab、NVIDIA ramp、TSMC 确认边 | S01, S02 |
| Anthropic’s New TPU Deal | 2026-04-07 | Anthropic 算力短缺、Google TPU 联盟 | S13, S14, S25 |
| Building Power for AI | 2026-01-08 | AI labs 如何用需求反向建设电力基础设施 | S15, S19 |
| Nvidia Earnings; Power, Scarcity, and Marginal Costs | 2025-11-24 | 电力稀缺、边际成本、OpenAI 资本开支压力 | S12, S15 |
| OpenAI Buys TBPN, Tech and the Token Tsunami | 2026-04-06 | token tsunami 需求框架 | S10, S12 |
Citrini Research
| 文章 | 日期 | 主要用途 | 支撑论点 |
|---|---|---|---|
| Carving Up the TPU | 2025-11-27 | TPU vs NVIDIA、切换成本、TPU 供应商地图 | S13, S14, S23 |
| Semis Memo: Muscle Memory | 2026-01-26 | memory、optics、ASIC、testing 的供应链记忆 | S03, S16, S23 |
| Let There Be Light | 2026-03-12 | photonics / CPO 入门与供应链 | S16, S17 |
| Stargate: A Citrini Field Trip | 2025-09-29 | gas turbine、substation、MEP、fiber、现场建设 | S15, S19 |
| Agentic Utilities | 2026-03-25 | agentic demand 与 utility / grid 约束 | S12, S15, S19 |
| Power Struggle: Natural Gas | 2025-10-18 | 天然气作为可调度电力瓶颈 | S15, S20 |
分层补强位置
| 层级 | OB 最有价值的补强 |
|---|---|
| 物理层 | GPU cluster 成本、电网接入、training load fluctuation、Stargate 实体建设 |
| 工艺层 | N3/HBM、HBM roadmap、CPO、power delivery、photonic packaging |
| 架构层 | Rubin / Vera rack-level co-design、TPU externalization、Trainium3、agentic inference |
| 标的层 | TPU supplier basket、advanced packaging、HBM、PCB/substrate、power / thermal suppliers |
| 需求层 | token tsunami、Anthropic compute crunch、agentic utilities、capex persistence |
| 政策层 | foundry competition、power fast-track、dispatchable gas、grid stability |
后续论点候选
| 候选论点 | 建议层级 | 触发条件 |
|---|---|---|
| Google TPU merchant / franchise model | 架构 / 标的 | Google 更明确地向 Meta、Anthropic、neocloud、sovereign AI 输出 TPU |
| 可调度电力溢价 | 物理 / 政策 | hyperscaler 继续锁定天然气、涡轮机、substation 和 behind-the-meter power |
| AI 负载质量风险 | 物理 / 政策 | 训练负载波动对电网稳定性形成可观测事故或政策反应 |
| CPO / OCS 分叉 | 工艺 / 架构 | NVIDIA CPO 与 Google OCS 路线开始形成不同供应商池 |
| AWS Trainium lane | 架构 | Trainium3 / 4 被外部客户或 AWS 内部规模化采用 |