私下发吧,免得惹一身骚
王鹏认为,CPO相比可插拔光模块会带来产业链的关键环节转移,传统光模块制造商需要在CPO产业链中找到新的定位。系统组装/生产厂商需要承担更多CPO散热、光学耦合以及性能和可靠性测试等工作,此外,封装工艺复杂性、互操作生态、系统可靠性、可量产程度、现场维护性等均需要更多时间解决。
王鹏介绍,阿里云基于400G以太网的智算集群2023年开始规模上线,支持千卡~十万卡GPU灵活部署;基于800G以太网的智算集群将于2026年开始规模上线,支持千卡~十万卡GPU灵活部署。
在演讲中,王鹏还介绍了阿里云的光模块演进路径。从2014年设计40G光模块,到2017年批量交付100G光模块,2021年和2022年,阿里云实现传统数据中心和智算中心的200G光模块批量交付。2023年,400G光模块批量交付。预计2025年在智算中心导入800G光模块,2026年开始导入1.6T光模块。
在光模块技术方案上,Q112 400G及以下速率,采用单多模混布策略,VCSEL/SiPh/EML为主,LPO小批量部署;OSFP 800G (单波100G),采用单多模混布策略,VCSEL/SiPh/EML为主,LPO/LRO技术储备;OSFP 1.6T(单波200G),预计单模技术为主流应用,SiPh和EML方案为主,LPO/LRO技术储备;3.2T光模块暂未启动预研,预计单模技术为主流应用,SiPh和EML方案为主,LPO/LRO/NPO/CPO技术储备。
王鹏最后总结说,近3年内,阿里云智算架构主要聚焦400G、800G、1.6T光模块的批量部署应用。可插拔光模块仍是短中期主力方案,NPO相比CPO可能落地更快,技术演进需循序渐进,避免“为了CPO而CPO”,在带宽、功耗、成本、可靠性之间找到最优解,才是业务发展的主流选择。只有产业协同,才能让光互联真正从“连接”走向“赋能”,支撑AI时代的算力革命。