CPO,将会进一步强化光模块龙头的地位

用户头像
精干的投资飞侠
 · 上海  

很多人最近被 CPO(Co-Packaged Optics)带节奏,觉得光模块行业要被“先进封装+硅光”一波端掉,甚至有人喊出“模块厂会失去话语权”。
我想说,这种观点属于典型的“看懂了概念,但没看懂产业”。

CPO不是洪水猛兽,但更不是一夜颠覆。
它不是新游戏,而是光通信这场游戏的第十关

1. CPO真正的逻辑:不是取消光模块,而是把光模块拆解重构

CPO的核心不是“去掉光”,而是把光从板级/机箱级推进到封装级,把电互连距离缩短,降低功耗,提升带宽密度。

但问题也很清楚:
当光引擎被封进几万美金的 GPU/交换芯片旁边,光学世界的每一个小问题,都会变成天价灾难。

在可插拔时代,良率差一点,报废的是几百美金的模块;
在 CPO 时代,良率差一点,报废的可能是一整颗 10 万美金的封装。

这就是为什么,CPO永远不是“能不能跑通”的问题,而是“能不能量产”的问题。

2. ELS不是细节,而是产业共识:激光必须外置

很多人没有意识到,CPO最大的风险点并不是硅光 PIC,而是激光器

激光是光学系统里最像“耗材”的部件:
功率衰减、噪声变差、阈值电流上升,这是物理规律,迟早发生。

如果把激光封在 CPO 封装里不可更换,意味着:

激光坏了,整包封装报废,甚至整机报废。

这种维护模式对 hyperscaler 来说是不可接受的。

所以行业推动 ELS(External Laser Source,外置激光源)几乎是必然选择。
ELS 的意义很简单:把最容易老化的部件做成可插拔、可替换,让系统维护回到数据中心熟悉的模式。

这也是为什么 OIF 推出 ELSFP 这种标准化外置激光方案。
说白了,这不是“削弱模块厂”,而是告诉你:

CPO时代,光源这块必须交给真正懂光的人。

3. 光引擎不一定更容易坏,但它更难做、更坏不起

有人会说:既然激光外置,那是不是意味着光引擎就不容易坏?
不对。

光引擎的问题不是“用久了坏”,而是三件事:

1)良率问题
对准偏一点点,插损就爆表;
耦合损耗超一点,误码率就崩。

2)漂移问题
温度循环、封装应力释放、粘接材料老化,都会让光路慢慢漂。

3)维修问题
光引擎坏了,你不是换模块,而是换板、换整包封装。

所以光引擎不一定比激光更容易坏,但它的特点是:

它一旦坏,代价比ELS大100倍。

这就是为什么 CPO 的门槛不是“能不能做出样机”,而是“能不能做到像CPU一样可靠”。

4. 英伟达也没有完整的光引擎设计与量产能力

很多人以为英伟达无所不能。
但现实是:英伟达擅长的是 GPU架构、SerDes、电互连、系统设计,它可以定义接口和性能目标,但它不可能像做CUDA一样把光学良率靠软件堆出来。

光引擎涉及:

光纤对准

光学色散

耦合损耗

温漂漂移

激光老化

可靠性验证

大规模量产良率爬坡

这些东西是典型“制造业+光学工艺”的世界,不是“芯片设计”的世界。

英伟达可以画蓝图,但真正能把它量产出来的,一定是中际、新易盛这种在光模块行业摸爬滚打十几年的玩家。

5. 台积电COUPE平台是什么?它解决“能不能封进去”,不保证“封进去就能量产”

台积电确实推出了 COUPE(Compact Universal Photonic Engine)平台。
你可以把它理解成:

一套让光引擎更容易融入先进封装体系(CoWoS/SoIC)的封装工艺平台。

它能提供接口标准化、封装流程能力,让光电协同更像“可工程化的流程”。

但必须明确一点:

COUPE解决的是“能不能封进去”,它并不能保证“封进去后良率必然爆表”。
光学良率不是靠平台口号解决的,而是靠大量试错、长期数据积累、工艺窗口控制堆出来的。

6. CPO最恐怖的点:良率是乘法,不是加法

这才是 CPO 争论的核心——良率的乘法效应

假设光引擎单体良率已经非常强,达到 99%。听起来很高对吧?
但如果一颗交换机芯片旁边集成 144 个光引擎(51.2T/102.4T 这种规模很常见),整机良率是多少?

整机良率 = 0.99^144 ≈ 23.6%

也就是说:

单体99%良率,整机只有不到四分之一概率能一次做出来。

剩下三分之二以上,要么返工,要么报废,要么拆机重封装。
你告诉我哪个云厂商敢用这种方案大规模部署?

再看 GPU 封装场景。
假设一颗 GPU 封装价值 10 万美金,光引擎单体良率 99%,意味着:

每100颗GPU,就有1颗因为光学问题直接报废。

10万美金 × 1% = 1000美金的期望损失。
而这还不包括 CoWoS 产能浪费、交付延期、系统停机损失、客户赔偿。

在 hyperscaler 的资本开支体系里,这不是“成本上升”,这是“资本燃烧”。

所以 CPO 的量产门槛不是 99%,而是 99%根本不够。
必须接近 99.9% 甚至更高,才可能走向规模化。

7. 为什么台积电、博通不会愿意承担光学风险?答案很简单:坏不起

台积电的 CoWoS 产能是用来生产 10 万美金芯片的。
它不可能愿意把先进封装产线变成“光纤对准实验室”。

博通擅长 ASIC 和 SerDes 没错,但光学耦合、可靠性、温漂漂移,这不是它的主战场。
更关键的是:

在 CPO 时代,一旦光学问题导致整包封装报废,责任和赔偿是天价。

所以产业链的最优路径一定是:

光专家(模块厂)把光引擎做成标准件

封装厂(台积电)负责封装集成

芯片厂(英伟达/博通)负责系统定义

这不是“谁淘汰谁”,而是“谁负责谁擅长的部分”。

8. 如果没有模块厂趟雷,CPO永远停在PPT和小规模试验

光学世界最残酷的一点是:
实验室跑通没有意义,只有量产良率才有意义。

对准精度、耦合损耗、温漂漂移、可靠性数据,这些都是靠十几年规模出货堆出来的。

中际、新易盛这些公司过去二十年做的事情,就是在不断趟雷:

400G趟雷

800G趟雷

1.6T趟雷

现在进入 CPO,只是趟雷的难度更高、代价更大。

所以说 CPO 会“杀死模块厂”,属于逻辑反了:

没有模块厂,CPO根本活不了。

9. 可插拔 + NPO + CPO 三轨并行,才是最聪明的战略

从产业演进来看,未来很长时间一定是并存:

99%的数据中心继续用可插拔模块(稳定、可维护)

顶级AI训练集群局部试点CPO(追求极致功耗效率)

NPO/LPO等过渡路线持续扩张

所以 IDC、LightCounting 等机构长期观点基本一致:
可插拔仍将主导未来几年市场,而 CPO 的大规模商业化需要时间。

结论很清楚:
CPO就算提前落地,也不可能明年就全面替代。

10. CPO反而会强化龙头:门槛提高,中小厂更难追赶

很多人忽略了一个视角:

CPO可能不是削弱龙头,而是强化龙头。

原因很简单:CPO门槛大幅提升,中小厂没有:

大规模量产良率控制经验

硅光芯片设计能力

英伟达联合开发资格

台积电合作先进封装资源

可靠性验证资金与人才储备

在 CPO 时代,光引擎被封进几万美金的 GPU 旁边,任何失误都是灾难。
新玩家即便做出样机,没有过去十多年堆出来的良率数据,你凭什么让英伟达台积电相信你?

CPO不是重新起跑,而是进入淘汰赛。

11. 中际与新易盛:真正的“双龙逻辑”

中际旭创是全球 CPO 技术储备最完整的光模块厂商之一。
它的优势在于:专利、产品、客户、量产经验都很深。

新易盛虽然 CPO 起步稍晚,但战略非常务实:
用 LPO 抢占 2-3 年过渡期红利,积累现金流,然后加大研发投入追赶 CPO。

更关键的是:CPO时代真正能活下来的不是“会讲故事的人”,而是“能爬良率的人”。

中际和新易盛,恰恰是最会爬良率的玩家。

12. 如果你是云厂商CTO,你绝不会全面切换CPO,而是局部试点+长期并存

如果你是微软/谷歌的 CTO,你最理性的路径一定是:

1)仅在顶级 AI 训练超级计算集群试点 CPO,追求极致能效
2)其他绝大多数数据中心继续用可插拔模块,保证稳定与可维护
3)同时推进 NPO/LPO 等路径作为备选方案,对冲路线风险

因为 hyperscaler 的目标不是激进迭代,而是稳健并行。
他们的资本开支是上千亿美元级别,任何“赌一条路线”的策略都不现实。

结论:CPO不会消灭模块厂,反而会让光模块龙头更强

CPO当然重要,但它不是革命,而是升级。
它不是颠覆,而是把光学门槛抬高到更残酷的高度。

当光引擎被封进几万美金的芯片旁边,故障成本变成 GPU价值的100倍,产业链会自动筛选掉不靠谱的玩家。

所以真正的结局很可能是:

可插拔继续贡献现金流,
NPO/LPO提供过渡增量,
CPO成为高端集群的未来方向,
而头部模块厂在CPO时代话语权不减反增。

很多人觉得 CPO 是新游戏,大家可以重新起跑。错了。
CPO 是这个游戏的第十关。
中际和新易盛已经打通了前九关,装备(专利)、血条(现金流)、地图(客户信任)全是满的。
新玩家想直接进第十关?你连门票(量产良率)都买不起。

所谓的颠覆,在 CPO 时代只是强强联盟的开始。$罗博特科(SZ300757)$ $中际旭创(SZ300308)$ $新易盛(SZ300502)$