用户头像
zhouanhua920224
 · 浙江  

$沃尔核材(SZ002130)$ 华为:新架构采用铜连接,大幅减少光模块需求,搭建8192卡集群超节点

摘要:华为预判中国半导体制造工艺将在相当长时间处于落后状态,但可持续的算力只能基于实际可获得的芯片制造工艺,因此,如何开创计算架构,打造 “超节点+集群”算力解决方案来持续满足算力需求,就成为必须解决的问题。华为通过多种机架内架构的对比,得到了机架内采用2D-FM(2D 全连接架构)的UB-Mesh方案。这种方案对比通用的Clos方案,将网络基础设施成本在系统总成本中的占比从 67% 降至 20%—— 这主要得益于高性能交换机与长距离光模块 / 光纤用量的减少。nD-FullMesh 拓扑减少了对高带宽交换机与长距离光互联的依赖,转而最大限度利用短距离直接互联。例如,短距离无源铜缆占总线缆消耗的 86.7%。这种设计大幅降低了交换机与光模块的成本,同时提升了系统可靠性 —— 因为铜缆与连接器比光模块更稳定。据评估,UB-Mesh 相较于基准 Clos 架构,节省了 98% 的高基数交换机与 93% 的光模块。并且,由于交换机与光模块的用量大幅减少,UB-Mesh 的维护性开支同样相较于 Clos 架构降低约 35%。最终 UB-Mesh 的成本效益达到基准 Clos 架构的 2.04 倍,而性能损失仅为Clos架构的6%。华为的新产品Atlas 950超节点(SuperPod),拥有8个UB-Mesh-Pod相比英伟达同样将在明年下半年上市的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍。

文章内容请见我的长文,今天晚上也会分享给大家。以下是我的个人观点。

对比原英伟达NVL144方案,华为方案以56.8倍规模达到其6.7倍算力(统计是以华为口径的进行的),这是一个以大规模换取提升的方案,是半导体工艺落后的无奈之举,但也是国内通信行业,尤其是高速铜缆通讯的良机,要到达与英伟达同等算力,需要部署的机柜数量和所需的铜缆量成倍上升。华为机架内方案是无源铜缆DAC,因为只有足够低的成本才可能支持如此大规模部署,而这样大量的部署更推动了铜缆的业绩叙事。对于本身通讯起家的华为,对于光通讯的熟悉程度本就超过大多数企业。但华为依然不执著于光叙事,而是踏实的依照成本考量,是值得肯定的,也体现了铜缆的优势所在。铜缆的技术栈国内已经掌握的非常通透,铜缆方案真正可复制,可大规模使用的。$华丰科技(SH688629)$ $沃尔核材(SZ002130)$