郭明錤:Nvidia Vera Rubin/VR200 NVL72 重点更新(整合最新产业调查与黄仁勋 2026 CES 演讲)

用户头像
挖掘机找蓝翔
 · 广东  

🤖 郭明錤:Nvidia Vera Rubin/VR200 NVL72 重点更新(整合最新产业调查与黄仁勋 2026 CES 演讲)

📛 AI 服务器更名与规格区分 Nvidia 将 AI 服务器 VR200 NVL144(基于裸片)更名为 VR200 NVL72(基于封装)。 我的调查显示,VR200 NVL72 分为 Max Q 与 Max P 两种功率配置: 黄仁勋在演讲中提到的是 NVL72,而非此前的 NVL144; Max Q 与 Max P 的硬件设计相同; Max Q 的 GPU / 整机功耗(TGP/TDP):约 1.8/190(kW); Max P 的 GPU / 整机功耗(TGP/TDP):约 2.3/230(kW); 两者功耗均显著高于 GB300 NVL72 的 1.4/140(kW); 因应资料中心供电规格,不同功率配置提升了安装弹性。这一改变也意味着 Nvidia 开始注意到物理世界对部署 AI 伺服器的限制,并将其反映在产品规格上。 🔧 GPU 散热设计升级 VR200 NVL72 Max Q 与 Max P 的 GPU 散热设计均升级: 两者均采用微通道冷板(micro-channel cold plate;MCCP)搭配镀金散热盖(gold-plated lid); 市场原本高度期待 GPU TGP 达 2.3kW 后会采用微通道盖板(micro-channel lid;MCL),但 MCL 最快需到 2027 年下半年才会量产。 🚀 算力与供电规格提升 受益于 GPU、HBM 与 NVLink Switch 规格升级,VR200 NVL72 的 AI 训练 / 推理算力约是 GB300 NVL72 的 3.5/5 倍,整机供电也因此大幅提升: VR200 NVL72 的电源架(power shelf)升级为 33U 110kW(6×18.3kW PSU),而 GB300 NVL72 最普遍的是 81U 33kW(6×5.5kW PSU); VR200 NVL72 的电源架采用 3+1 备援设计; VR200 NVL72 的电力连线(power whip)提升到 100A(GB300 NVL72 为 60A),这对资料中心供电要求更高(如母线(busway)与插接管箱(tap-off box)等设计)。 ❄️ 散热更依赖液冷方案 VR200 NVL72 的散热设计更依赖液冷: 计算单元(Compute)与 NVSwitch 托盘均采用无风扇设计(fanless); 整机冷却液流量(TCS flow)几乎增加 100%(对比 GB300 NVL72),有利于 CDU、分歧管、水冷版与 QD 规格 / 数量升级; 整机风量(Air flow)需求则降低约 80%(以 CFM 计,对比 GB300 NVL72)。 🛠️ Compute 托盘采用全新设计 VR200 NVL72 的 Compute 托盘首度采用中板(midplane)、落實無線設計(cableless): 中板的关键规格包括:44 层(22+22)、M9 覆铜层压板(EM896K3)、尺寸约 420*60(mm); 黄仁勋提到,受益于此设计,Compute 托盘的组装时间由 2 小时显著降低到 5 分钟(对比 GB300 NVL72)。 📅 投产与出货时程 2026 年 Rubin CoWoS 投片量约 30-35 万片,预计在 2026 年第一季度初开始小量试产,并于 2026 年第二季度末量产; VR200 NVL72 的整机组装量预计在 2026 年第三季度,考虑到良率爬坡,预计 2026 年 / 2026 年上半年整机出货量约 5,000-7,000 台。 ⚡ 后续机型规划 当整机功耗达约 200kW 时,54V 配电会开始遭遇显著的空间占用(铜排 / 线材)与转换效率瓶颈,因此 VR200 NVL72 可视为 Oberon 整机的最后一代方案; 后续面对 AI 算力提升带来的挑战,将采用支援 800V HVDC 的次世代 Kyber 整机设计因应。

$麦格米特(SZ002851)$ $胜蓝股份(SZ300843)$ $奕东电子(SZ301123)$