AI工厂的矛盾,看CPO技术的必然性和紧迫性

用户头像
闷得而蜜
 · 广东  

在 AI 浪潮汹涌澎湃的当下,英伟达的战略目标是打造AI 工厂,作为支撑 AI 技术蓬勃发展的关键基础设施,其技术架构的革新显得尤为重要。今天,咱们就从 AI 工厂的视角,来深入剖析 CPO 技术的必然性和紧迫性。

当前AI工厂的架构继承自传统数据中心

在传统的企业数据中心中,一级交换机集成在每个服务器机架内,允许直接通过铜缆连接到服务器,并最大限度地降低电源和组件的复杂性。这种架构足以满足以 CPU 为中心的工作负载,且网络需求适中。

相比之下,NVIDIA 率先打造的现代 AI 工厂拥有超高密度的计算机架和数千个 GPU,这些 GPU 的架构设计使其能够协同完成一项任务。这要求整个数据中心拥有最大的带宽和最小的延迟,因此需要新的拓扑结构,将一级交换机迁移到行尾。这种配置极大地增加了服务器和交换机之间的距离,使得光纤网络至关重要。因此,功耗和光学元件数量显著增加,现在网卡到交换机以及交换机到

点击查看全文