semi.x.fish

参考文献与 OB 补充

这页把 SemiAnalysis、Stratechery、Citrini Research 三个 OB raw vault 中与半导体知识库最相关的材料筛成一个二级参考库。它不是主数据源;主数据源仍是 24 篇 xray、论点 JSON 和 DAG 边账本。

使用规则

层级用法
xray主引用,决定当前知识库的 25 个论点和 30 条边
OB 核心参考补强背景、原文核对、未来论点候选
OB 其他文章fallback,只在 xray 未覆盖时使用

判断标准:一篇 OB 文章只有在能强化“需求 → 工艺 → 架构 → 标的 → 电力 / 政策”链条时才进入核心参考。

OB lens 补强(不是新论点)

这一节是 OB raw vault 对现有 S01-S25 的 lens 补强,不进入 _input/thesis-extraction.json,也不出现在 DAG / panorama。如果某条补强累积足够独立证据并跨多个 xray 确认,再考虑提案为 S26+ 新论点。

速查映射:

OB lens强化的 S-ID
L1. N3/HBM 硬分配S02, S03, S25
L2. 自研芯片威胁 NVIDIA 利润S11, S13, S14
L3. GPU → rack-level systemS17, S21, S22
L4. 电力三件事(接入 / 可调度 / 负载质量)S15, S19, S20
L5. TPU 供应链是第二地图S13, S14, S23
L6. 光互连生存路径S16, S17
L7. Agentic 需求看 token + capexS10, S12, S24

L1. N3/HBM 是硬分配层,不只是零部件短缺

SemiAnalysis 和 Stratechery 都把 AI 需求落到同一个机制:TSMC N3 晶圆、HBM、先进封装和客户优先级构成一个联合分配系统。

这会强化 S02 / S03 / S25:2026-2027 的核心问题不是“有没有 GPU”,而是谁能拿到 N3 + HBM 组合。

L2. 自研芯片先威胁 NVIDIA 利润率和议价权,再威胁出货量

TPU / Trainium / XPU 不是立刻消灭 NVIDIA,而是给 hyperscaler 一个可谈判的 outside option。

CUDA / PyTorch、机架系统和部署节奏仍保护 NVIDIA 近期需求;但 Google TPU、AWS Trainium 和 OpenAI / Broadcom 这类路径会压缩长期利润率叙事。

L3. 产品边界从 GPU die 推到 rack-level system

Rubin / Vera / CPX、Blackwell NVL、CPO、800V、电力、CPU 控制平面和 BMC 不是散点。

它们共同说明竞争单位已经从单颗 GPU 变成“机架 + 网络 + 电力 + 冷却 + 软件部署节奏”。

L4. 电力瓶颈拆成三件事:接入、可调度发电、负载质量

AI 数据中心不只需要更多电。它还需要更快的电网接入、可调度的天然气 / 涡轮机 / 变电站,以及能承受训练负载波动的电力质量。

这强化 S15 / S19 / S20:电力已经从成本项变成政策和物理上线条件。

L5. TPU 供应链是第二张 AI infrastructure 地图

Citrini 的 TPU 供应链框架把 Google TPU 从“Google 是否打赢 NVIDIA”转成一张供应商地图:先进封装、HBM、高端 PCB、基板、光交换、功率管理、热管理。

这补强 S13 / S14 / S23,也避免把 TPU 论点写成单公司叙事。

L6. 光互连从优化项变成生存路径

当 scale-out 带宽继续上升,pluggable optics、电互连和传统交换路径会越来越受功耗 / 成本 / 距离约束。

CPO、OCS、silicon photonics、Active LSI 和先进封装会变成 S16 / S17 的下一组关键观察点。

L7. Agentic 需求要看 token 强度和基础设施承诺

用户数不是最好的 AI 半导体需求指标。更好的指标是 token throughput、agent per user、模型竞争强度、capex 锁定、N3/HBM 分配和电力预约。

这补强 S10 / S12 / S24。

核心参考清单

SemiAnalysis

文章日期主要用途支撑论点
The Great AI Silicon Shortage2026-03-12N3 + HBM 双瓶颈、AI 对 N3 分配的挤占S02, S03, S25
Scaling the Memory Wall: The Rise and Roadmap of HBM2025-08-12HBM 路线图、memory wall、DRAM 挤出S03, S04, S25
Co Packaged Optics (CPO)2026-01-02CPO TCO、scale-out interconnect、功耗约束S16, S17
Vera Rubin: Extreme Co-Design2026-02-26Rubin / Vera / NVLink 机架级协同设计S17
Another Giant Leap: Rubin CPX2025-09-11推理专用化、rack 架构升级S10, S17
Google TPUv72025-11-28TPU 外部化、Anthropic / Google 需求、N3 压力S13, S14, S25
AWS Trainium3 Deep Dive2025-12-05AWS 自研芯片路线、custom silicon 比较S14, S25
How Much Do GPU Clusters Really Cost?2026-04-20GPU cluster 成本结构、电力和网络物理约束S15, S17
AI Training Load Fluctuations at Gigawatt-scale2025-06-26训练负载波动与电网风险S15, S19
Energizing AI2023-08-01电源交付、VRM、48V / 800V 迁移背景S05, S22, S06

Stratechery

文章日期主要用途支撑论点
TSMC Earnings, The TSMC Brake Revisited2026-01-21TSMC 投资不足、foundry 竞争必要性S01, S02, S08
TSMC Earnings, New N3 Fabs, The Nvidia Ramp2026-04-20新 N3 fab、NVIDIA ramp、TSMC 确认边S01, S02
Anthropic’s New TPU Deal2026-04-07Anthropic 算力短缺、Google TPU 联盟S13, S14, S25
Building Power for AI2026-01-08AI labs 如何用需求反向建设电力基础设施S15, S19
Nvidia Earnings; Power, Scarcity, and Marginal Costs2025-11-24电力稀缺、边际成本、OpenAI 资本开支压力S12, S15
OpenAI Buys TBPN, Tech and the Token Tsunami2026-04-06token tsunami 需求框架S10, S12

Citrini Research

文章日期主要用途支撑论点
Carving Up the TPU2025-11-27TPU vs NVIDIA、切换成本、TPU 供应商地图S13, S14, S23
Semis Memo: Muscle Memory2026-01-26memory、optics、ASIC、testing 的供应链记忆S03, S16, S23
Let There Be Light2026-03-12photonics / CPO 入门与供应链S16, S17
Stargate: A Citrini Field Trip2025-09-29gas turbine、substation、MEP、fiber、现场建设S15, S19
Agentic Utilities2026-03-25agentic demand 与 utility / grid 约束S12, S15, S19
Power Struggle: Natural Gas2025-10-18天然气作为可调度电力瓶颈S15, S20

分层补强位置

层级OB 最有价值的补强
物理层GPU cluster 成本、电网接入、training load fluctuation、Stargate 实体建设
工艺层N3/HBM、HBM roadmap、CPO、power delivery、photonic packaging
架构层Rubin / Vera rack-level co-design、TPU externalization、Trainium3、agentic inference
标的层TPU supplier basket、advanced packaging、HBM、PCB/substrate、power / thermal suppliers
需求层token tsunami、Anthropic compute crunch、agentic utilities、capex persistence
政策层foundry competition、power fast-track、dispatchable gas、grid stability

后续论点候选

候选论点建议层级触发条件
Google TPU merchant / franchise model架构 / 标的Google 更明确地向 Meta、Anthropic、neocloud、sovereign AI 输出 TPU
可调度电力溢价物理 / 政策hyperscaler 继续锁定天然气、涡轮机、substation 和 behind-the-meter power
AI 负载质量风险物理 / 政策训练负载波动对电网稳定性形成可观测事故或政策反应
CPO / OCS 分叉工艺 / 架构NVIDIA CPO 与 Google OCS 路线开始形成不同供应商池
AWS Trainium lane架构Trainium3 / 4 被外部客户或 AWS 内部规模化采用