【东吴电子陈海进】AI基建,光板铜电—Rubin ultra Scale up&out方案梳理
🔔此前我们在深度报告《AI基建,光板铜电:主流算力芯片Scale up& out方案全解析》中对Rubin NVL 144、谷歌TPU V7 Ironwood、AWS Trainium 3 Teton Max、Meta Minevra四款产品Scale up& out方案进行了全面深入的解析。近期海外媒体对Rubin Ultra机柜Scale up CPO方案进行了分析,我们在此延续《AI基建,光板铜电》框架再做整理,欢迎探讨! 💡Tips:《Scale up&out》报告链接网页链接
⭕Rubin ultra NVL 576以4个Canister堆叠,每个Canister中配置36个Compute tray,9个Switch tray,中部以正交背板进行互联的方案呈现。该方案已在2025年3月GTC、2025年5月Computex、2025年10月GTC,2026年1月CES大会中多次演示。
📍Rubin ultra的4 die GPU模组单向互联带宽为28.8Tbps,整机柜144颗GPU模组,总带宽达到4147.2Tbps。在遵循计算侧与交换侧带宽双向对称的设计原则下,Scale up扩展时交换侧需提供4147.2Tbps带宽以完成144颗GPU之间的互联。 📌Compute tray与Switch tray之间通过正交背板互联,其方案为6个Switch tray提供36颗14.4Tbps NVSwitch芯片与Compute tray互联,4个Canister合计14.4Tbps6颗6tray4Canister=2073.6Tbps带宽。 📌Canister间的Switch tray之间通过CPO进行互联,其方案为3个Switch Tray提供18颗14.4Tbps NVSwitch芯片,以2:1收敛比互联。4个Canister合计14.4Tbps6颗3 tray4 Canister*2收敛比=2073.6Tbps带宽。2073.6Tbps/3.2Tbps=648,跨Canister互联又对应648颗3.2Tbps光引擎,则整机柜144颗GPU模组:Scale up光引擎比例为1:4.5。 📍此外,Rubin Ultra的Scale out网络也会采用CPO,其compute tray中每张CX10网卡也会用CPO的形式合封一个3.2T的光引擎。则整机柜144颗GPU模组:Scale out光引擎比例为1:1。 🔥由此,Rubin ultra NVL 576机柜Scale up&out光引擎比例为1:5.5。
产业链相关公司: 正交背板:菲利华、东材科技、胜宏科技等。 CPO:致尚科技、罗博特科、炬光科技等。
风险提示:供应链波动风险,下游需求不及预期,行业竞争加剧。 🎁欢迎联系:东吴电子 陈海进/解承堯