semi.x.fish

第 5 层 · 需求层

核心问题:AI 硬件需求不是“更多用户用 chatbot”这么简单,而是 token throughput、agentic 工作负载、资本开支承诺、高强度用户密度把硬件需求从用户数解耦出来。

✦ 智慧压缩

┌──────────────────────────────────────────────────────────────────┐
│  需求层的元判断:                                           │
│                                                                  │
│  AI 需求的最深变化是:需求不再线性绑定 mass adoption。             │
│  一个高强度用户可以驱动多个 agent;一个企业工作流                  │
│  可以持续消耗 token;一个模型实验可以直接转成 N3/HBM 分配。   │
│                                                                  │
│  所以半导体需求的观测对象应从“用户数”切到:                         │
│  token throughput、agent ratio、资本开支锁定、电力 / 内存负载。    │
└──────────────────────────────────────────────────────────────────┘

主要论点

S12 · Agency 悖论驱动算力需求

S10 · 答案式 vs Agentic 推理分叉

S24 · Agentic CPU 与控制平面的可投资性

S15 · 电力和电网成为 AI 硬约束

S01 / S02 · 需求在 foundry 层得到确认

需求链路

graph LR
  Agency[S12 Agency 悖论] --> Inference[S10 答案式 vs Agentic]
  Inference --> Control[S24 CPU / BMC 控制平面]
  Inference --> Memory[S03 HBM / DRAM / NAND]
  Inference --> N3[S02 TSMC N3]
  N3 --> Dual[S25 N3 + HBM 双瓶颈]
  Memory --> Dual
  Dual --> Capex[S15 电力 / 电网 / 数据中心]

需求指标表

信号优于原因
Token throughputMAUtoken 直接映射 compute / memory 需求
Agent per user席位数1 人多 agent 会解耦用户数和算力
HBM 分配GPU headline带宽是真实 throughput 上限
N3 晶圆分配资本开支 headline先进逻辑是加速器出货上限
已锁定 MW / GW已公告数据中心电力接入决定实际上线节奏
CPU / BMC attachGPU 数量agentic 控制平面的硬件侧证据
DRAM / NAND pricingHBM-only pricingagentic 内存层级的外溢信号

关键摘句

“1 个 agency × 多 agent = 需求无需 mass adoption 也会急剧上升。” — Agency 悖论

“GPU 生成 token;CPU 让 agents 继续运转。” — Citrini 控制平面论点

“Token throughput = HBM × bandwidth。” — AI 半导体终局综合

“TSMC 这种沉默 actor 觉醒,是 论点 兑现的最强信号。” — TSMC 财报 xray

“需求不是希望,是已经在投的混凝土和设备。” — TSMC / 资本开支 综合

术语引用

监控信号

信号强化削弱
Claude Code / Codex / Cursor token concentrationS12, S10使用面变宽但单用户 token 深度不足
企业 agentic 工作流支出S12, S24席位增长但 token 强度不足
Hyperscaler 在市场怀疑中维持资本开支S01, S02, S15资本开支暂停,或从建设转向回购
TSMC / SK Hynix / Samsung 表述一致S02, S03, S25应用侧 hype 与供应商表述背离
电力采购和电网连接进展S15数据中心公告缺少电力路径
服务器 DRAM / NAND 价格强度S04, S18HBM 紧缺但内存层级需求未扩散

OB 参考补强

来源补强点对应论点
Stratechery: OpenAI and the Token Tsunami把 AI 需求从 MAU 转成 token tsunami,适合补强 token throughput 口径。S10, S12
Stratechery: Anthropic's New TPU DealAnthropic compute crunch 是 agentic coding / enterprise workflow 把需求推向硬件分配的应用侧证据。S12, S13, S25
Stratechery: Nvidia Earnings; Power, Scarcity, and Marginal Costs电力稀缺和边际成本把“需求强”翻译成 capex / power / marginal supply 约束。S12, S15
SemiAnalysis: InferenceMAX推理 benchmark 应拆成 throughput、latency、interactive load,而不是单一 tokens/sec。S10, S11
Citrini: Agentic UtilitiesAgentic 需求最终会碰到 utility / grid 约束,说明需求层和政策层已经耦合。S12, S15, S19

未解疑问