很多人还在讨论800G、1.6T光模块。但谷歌已经在干另一件事——换互联架构。
而每一次算力架构的变化,都会诞生一个新的高弹性环节。这一次,叫做——OCS(Optical Circuit Switch,全光交换)。过去两年,光模块暴涨,本质是:AI算力规模爆炸 → GPU数量暴增 → 光互联带宽需求暴涨。
但当单集群规模从几百张卡,走到几千张、上万张卡时,问题出现了:电交换机延迟越来越高、功耗随端口速率指数上升、ASIC升级需要整机替换。这时,传统电交换开始成为瓶颈。谷歌选择了一条完全不同的路——直接在光域完成交换。
这意味着:不经过交换芯片、不解析协议、速率透明、延迟极低
一个关键数据:OCS可帮助AI集群整体功耗降低30%以上
在万卡级集群里,功耗=成本。30%的节省,足够改变架构选择。很多人以为OCS是概念。实际上:2022年,TPU4开始导入OCS,4096颗TPU需要48台300端口OCS,到了最新的TPU7(Ironwood):9216颗芯片48台600端口OCS,端口直接翻倍。
而更关键的是:谷歌从“自研+代工”模式,正在转向整机采购。
目前市场规模并不大:2025年约4亿美元,2029年预计超25亿美元,CAGR接近58% 。
注意几个关键词:目前90%以上来自谷歌,微软 / Meta / 英伟达刚开始测试,还未进入全面扩散期,这和当年800G光模块何其相似。
我们回顾800G爆发的逻辑:GPU升级带动带宽升级、龙头客户先行、技术路径明确、单机价值量大、出货量呈指数增长。现在OCS具备同样的条件。
一台600端口OCS,成本大约5万美元。核心价值集中在:MEMS阵列(价值量占比最高)、光纤准直阵列、钒酸钇材料、透镜、V型槽结构件。
目前主流是MEMS路线。液晶、压电、硅光都在探索,但:2025年90%以上份额仍由MEMS占据 所以投资逻辑很简单:先押MEMS链条、硅光属于远期弹性
产业链可以分三层:
现在阶段类似:2023年初的800G。客户单点爆发、产业链刚开始确认、市场尚未充分定价。真正的大行情,往往出现在:第二家、第三家CSP正式大规模导入。如果微软或Meta确认上量,市场预期会瞬间抬升。
谷歌已经完成了架构升级。从电交换 → 光交换。当算力进入万卡时代,“交换方式”比“模块速率”更重要。如果800G是带宽升级的第一波红利,那么OCS,可能是AI互联架构升级的第二波红利。