OCS,交换机的AI革命!转贴
研报精选
15小时前 · 知名券商研究员研报精华分享
关注
OCS,全称Optical Circuit Switch,光电路交换机,是基于全光信号直接交换的通信设备。OCS交换机其核心在于无需光电转换即可实现光信号的路由与转发。
相比于传统交换机而言,OCS交换机有以下特点:
1. 低延迟:光信号直接交换,消除传统交换机的光电转换和缓存排队时延,谷歌实测延迟降低50%以上。
2. 高能效比:无需高功耗交换芯片,单机架能耗降低40%,契合绿色数据中心趋势。
3. 无阻塞带宽:支持400×400端口级联,单端口速率可达800G/1.6T,满足AI集群海量数据吞吐需求。
4. 拓扑重构能力:通过软件定义动态调整光路,适应大模型训练中节点通信模式的实时变化。
OCS从根本上解决了信号转换带来的延迟和能耗问题,信号转换效率理论上限达到传统电交换机的1000倍,而功耗仅为传统电交换机的十分之一左右,这对于电力成本占运营支出大头的超大规模数据中心而言意义重大,因此成为下一代数据中心网络的理想选择。
简言之,OCS是交换机大趋势,而全球AI竞赛、算力需求爆发式增长正在加速这场交换机的变革。
以海外巨头谷歌为例,其Gemini Ultra、Meta Llama3等超大规模模型训练需数千TPU/GPU互联,传统电交换机面临带宽瓶颈(如英伟达NVLink 4的3.2Tbps带宽已逼近物理极限)。
谷歌在其TPU v4集群中引入OCS后,成功实现了性能的大度提升,以及能耗的显著降低,同时由于减少了光电转换环节,系统复杂度降低,故障点相应减少,验证了其在超大规模AI计算场景中的实用价值。
预计2025年谷歌TPU出货200万颗,2026年将达到300万颗。根据200万颗TPU组网测算,仅谷歌一家就将带动约2.3万台OCS交换机出货,这一数字足以支撑起一个规模可观的细分市场。
从Finisar的订单节奏来看,目前OCS月产量已达1200台,2024-2026年每年维持翻倍需求增长,反映出谷歌对OCS的采用正在加速。
同时,2025年8月,开放计算项目基金会 (OCP) 宣布成立全新光路交换 (OCS) 子项目,创始成员包括谷歌、英伟达、Coherent、微软等科技巨头。这一行业协作组织将推动开放式光交换技术标准的制定,解决互操作性问题,降低采用门槛,对OCS技术的普及具有深远意义。
标准化进程的加速预示着OCS将从少数巨头的专有技术逐步转变为开放、通用的解决方案。
OCS 技术目前主要有四种实现方案:
1. MEMS 方案:以谷歌和Lumentum为代表厂商,具有低串扰、极化和波长不敏感、良好可扩展性等优势;
2. 数字液晶技术:由Coherent主导开发,适用于特定波长范围内的精确控制;
3. 压电Directlight光束偏转技术:代表厂商为Polatis,响应速度快且损耗低;
4. 光波导方案:则由iPronics等公司推动,适合高密度集成应用。
恒为科技在OCS交换机的发展,目前应该国内仅仅只有恒为走在前面了。
近日,香港科技大学智能网络与系统实验室(iSING Lab)的论文MixNet被国际通信网络领域顶级会议SIGCOMM 2025[1]接收,恒为科技作为研究团队成员之一,与麻省理工大学、北京大学、厦门大学、Meta一起提出了一种面向混合专家模型训练的光电混合可重构网络架构,用区域性动态拓扑打破静态网络的性能与成本瓶颈。
图为“论文标题及作者”
[1]SIGCOMM,Special Interest Group on Data Communication,即数据通信专业组,是ACM组织在通信网络领域历史最为悠久也最为权威的学术会议之一。
今年的第39届SIGCOMM 2025 将于9 月8日-11日在葡萄牙科英布拉举行。届时,恒为科技将公布更详细的OCS光交换产品系统方案细节。
恒为科技将陆续推出多款OCS光交换产品,涵盖不同切换时延指标和端口规模的光交换设备,能有效满足算力集群持续演进的全光交换场景需求。结合本次MixNet的研究成果,为大规模MoE训练和新型智算超节点的高效能组网开辟了全新技术路径。