【资料翻译】SemiAnalysis:CPO手册(五)

用户头像
麦田来客
 · 安徽  

写在前面:第一,该报告所有权属于SemiAnalysis,系本人为学习而尝试翻译,若有错误在我,若侵权请及时联系我删除;第二,为何看SemiAnalysis,因为在我学习经历中,普通人可以获取的公开资料信息中,AI半导体领域我认为它专题报告的价值是首位的,其次才是香港那平台的调研纪要和野村证券的专题报告。第三,为何此时说CPO。曾记否那个简历被删除的来自WW的工程师备注里在狗子从业三年,也就是说三四年前当大家看不清未来时,某公司已经认准液冷是行业发展红利爆发的必然。我认为两三年后CPO也必然是AI红利爆发的必然所在,柯基的经历虽然受惠于大佬的眼界、信息能力、宏观判断、个股挖掘能力,但是大哥们毕竟有功成名就退隐江湖的时候,屌丝仍然需要提升自我修养才能避免命运轮回。第四,全文85页,59252字。分五篇。所发文字本人历时一周,通读五遍,用三个工具校对三遍。同时,与一般的翻译稿不同,本人的版本补充了被隐藏的收费内容,具体评述各受益公司。虽然本人接触CPO也有近十个年头,但是毕竟非此专业的行外,如有错误,欢迎网友指正。以下是正文:
————————————————

光中介层支持将输入输出接口(I/O)布置在芯片的任意位置,原因在于光波导中的信号传输损耗可忽略不计,彻底打破了我们熟知的沿边接口布局限制。此外,该技术还能完全消除串扰问题:不同光波导内的光信号,不会像密集排布的铜缆走线中的电信号那样产生干扰——因为光信号会被高度约束在波导纤芯内部,仅有极微弱的倏逝波会渗透到外层包层中。这种从底层重构的输入输出(I/O)设计与布局方案,充分释放了光子技术的应用潜力。

来源:天体AI

资料来源:CelestialAI、Marvell

光中介层或将光信号传导至先进封装内部的技术理念,与莱特马特公司(Lightmatter)的解决方案存在若干相似之处——二者均将光信号路由至逻辑芯片下方,以此规避沿边接口的物理限制,但同时也存在几项关键差异。

天神人工智能公司(CelestialAI)采用的光子桥接结构,本质上与硅桥接结构(可类比台积电CoWoS-L硅桥)类似;而莱特马特公司则采用一种尺寸更大的多掩膜版光子中介层,该中介层可承载多枚独立芯片。莱特马特公司的技术理念在应用规模上更具前瞻性:其M1000三维光子超级芯片计划采用面积达4000平方毫米的中介层,同时还致力于在中介层内部实现光路交换功能,并达成高达114太比特/秒的总聚合带宽。

资料来源:CelestialAI、Marvell

最后,天神人工智能公司(CelestialAI)推出了光子互联架构™内存设备(PFMA)。这是一款基于台积电5纳米工艺打造的高带宽、低延迟可扩展互联设备,内置网内内存功能,总带宽高达115.2太比特/秒,可连接16枚专用集成电路(ASIC),且为每枚专用集成电路提供7.2太比特/秒的可扩展互联带宽。

值得关注的是,光子互联架构™内存设备是全球首款在芯片中心区域集成片上光输入输出接口的硅基器件,这一设计可将芯片边缘稀缺的物理输入输出接口资源预留出来,专门用于部署内存控制器。凭借这一特性,该设备能够作为承载键值缓存(KVCache)卸载任务的“热”内存层,部署于主中央处理器(CPU)内存与外部存储之间。

天神人工智能公司(CelestialAI)技术的核心差异化优势,在于其对电吸收调制器(EAM)的采用。本文第三部分已详细阐述了电吸收调制器的工作原理,并探讨了该器件应用过程中的优势与权衡取舍。由于理解电吸收调制器的优缺点是把握天神人工智能公司市场推广策略的关键,在此我们将上述讨论内容重点复述如下。

相较于微环调制器(MRM)与马赫-曾德尔干涉仪调制器(MZI),电吸收调制器(EAM)具备多项优势:

显然,电吸收调制器与微环调制器均配备控制逻辑电路和加热器,用于抵消温度变化带来的影响,但从本质上讲,电吸收调制器对温度的敏感度更低。与微环调制器相比,在50℃以上的环境中,电吸收调制器的热稳定性表现更为优异,而微环调制器在此温度区间内对温度极为敏感。微环调制器的温度系数通常为70–90皮米/摄氏度,这意味着温度每变化2摄氏度,其谐振波长偏移量就会达到0.14纳米——这一偏移幅度远超0.1纳米的临界阈值,一旦超出该阈值,微环调制器的性能便会彻底崩溃。相比之下,电吸收调制器可承受高达35摄氏度的瞬时温度突变。这一耐受特性对天神人工智能公司(CelestialAI)的技术方案而言尤为关键,因为其电吸收调制器集成于中介层内部,且位于一款功耗高达数百瓦的高性能处理器(XPU)计算引擎下方。此外,电吸收调制器还能适应约80摄氏度的高环境温度,这一特性使其同样适用于那些与高性能处理器相邻而非置于其下方的芯粒应用场景。

与马赫-曾德尔干涉仪调制器相比,电吸收调制器的体积更小、功耗更低。马赫-曾德尔干涉仪调制器体积相对庞大,需要较高的电压摆幅,因此需对串并收发器(SerDes)进行放大,以实现0–5伏的电压摆幅。马赫-曾德尔调制器(MZM)的尺寸量级约为12000平方毫米,电吸收调制器的尺寸约为250平方毫米(规格为5×50毫米),而微环调制器的尺寸则介于25至225平方毫米之间(对应直径为5–15毫米)。不仅如此,为了维持这类大尺寸器件的偏置电压稳定,马赫-曾德尔干涉仪调制器的加热器也需要消耗更多功率

另一方面,将锗硅(GeSi)基电吸收调制器(EAM)用于共封装光学(CPO)技术也存在若干弊端:

●业界普遍认为,基于硅或氮化硅材料制备的调制器物理结构(如微环调制器(MRM)与马赫-曾德尔干涉仪调制器(MZI)),其耐久性与可靠性远优于锗硅基器件。诚然,鉴于锗基器件的工艺难度与集成复杂性,许多人对锗硅基器件的可靠性心存顾虑,但天神人工智能公司(CelestialAI)提出,锗硅基电吸收调制器的工作原理本质上与光电探测器相反,而光电探测器现已广泛应用于各类光收发模块,因此该类调制器的可靠性是有据可依的。

●锗硅调制器的本征带边波长处于C波段(即1530纳米–1565纳米)。若要通过量子阱设计将其波长调节至O波段(即1260纳米–1360纳米),是一项极具挑战性的工程难题。这意味着锗硅基电吸收调制器大概率只能配套用于端到端封闭的CPO系统,难以便捷地融入开放式芯粒生态体系。

●相较于技术成熟的O波段连续波(CW)激光器产业链,围绕C波段激光器构建配套生态体系可能会出现规模不经济的问题。当前大多数数据通信激光器均面向O波段设计,但天神人工智能公司也指出,1577纳米波长的XGS-PON激光器已实现大规模量产,这类激光器主要应用于民用光纤到户(FTTH)与企业专线互联场景。

●锗硅基电吸收调制器的插入损耗约为4–5分贝,而微环调制器与马赫-曾德尔干涉仪调制器的插入损耗均处于3–5分贝区间。此外,微环调制器可直接对不同波长的光信号进行复用,而电吸收调制器若要实现粗波分复用(CWDM)或密集波分复用(DWDM),则需额外配备复用器,这会导致系统的潜在损耗预算小幅增加。

总体而言,天神人工智能公司(CelestialAI)始终致力于其定制化互联链路的技术创新——该公司的方案不依赖任何速率转换芯片,能实现更优的时延表现与功耗效率,且可适配多种不同类型的通信协议。正如前文所述,天神人工智能公司是业内主要厂商中唯一一家将电吸收调制器(EAM)作为主流调制方案的企业。这一技术路线带来的一项关键影响在于,该公司需要投入额外精力,将其电吸收调制器的设计方案整合至代工厂的工艺流程中;而其他共封装光学(CPO)企业则可直接依托台积电的COUPE封装平台,因为该平台的工艺设计套件(PDK)中已内置了微环调制器(MRM)及相关温控加热器的成熟方案。

来源:天神AI

短期内,天神人工智能公司(CelestialAI)为该芯粒的发布制定了一份目标宏大的时间表。美满电子科技(Marvell)在交易摘要中披露,预计到2028年1月末(即美满电子科技2028财年年末,简称2028财年末),来自天神人工智能公司的营收年化率将达到5亿美元。在巴克莱全球科技大会上,美满电子科技进一步补充称,这一营收年化率有望在2028日历年年底前翻倍至10亿美元(2028日历年的大部分时间均属于美满电子科技2029财年,该财年截止于2029年1月末),这意味着从当下至2027年年底的两年时间里,该产品需完成商业化落地。

作为交易条款的一部分,向CelestialAI股东额外支付22.5亿美元取决于该公司到2029年1月(Marvell2029财年结束-即F1/29)实现至少20亿美元的累计收入。实现全额支付的第一个里程碑。到2029年1月,累计收入将达到5亿美元,占支出的三分之一。预计退出F1/29的10亿美元收入运行率是盈利金额的一半,这意味着Celestial需要在订单簿中添加更多客户才能实现20亿美元的盈利目标。

资料来源:CelestialAI、Marvell

关于CelestialAI收购,Marvell于2025年12月2日发布了一份8-K报告,发行了亚马逊认股权证,行权价为截至2030年12月31日为87.0029美元。这些认股权证“基于亚马逊在2030年12月31日之前间接或直接购买光子结构产品”,强烈表明AWS的Trainium将成为目标产品,因为该产品将于2027年底开始增长。在Marvell的行业分析师日上,CelestialAI讨论了一家大型超大规模企业如何选择它们为先进人工智能系统提供光学互连,这些系统将在该超大规模企业的下一代处理器中投入批量生产。这一点,加上交易摘要中的盈利时间和产品收入指导,表明CelestialAI的目标是在Trainium4中部署其解决方案。

资料来源:MarvellSEC文件

我们对天神人工智能公司(CelestialAI)的探讨,将以进一步阐述其首款即将面市的可扩展互联解决方案收尾。该方案将围绕其16太比特/秒光子互联链路构建,并与一款芯粒相集成。光纤接入单元(FAU)通过光栅耦合器与信道波导相连。一款可扩展互联交换机专用集成电路(ASIC)——很可能是美满电子科技(Marvell)的115.2太比特/秒可扩展互联专用集成电路——将借助这条光子互联链路与光子互联架构(PF)芯粒,与高性能处理器(XPU)实现光互联。尽管天神人工智能公司预计,其初期推向市场的营收大部分将由这款芯粒贡献,但该公司将自身定位为一家系统级解决方案供应商,并已规划了多款基于光子技术的内存扩展解决方案,这些方案将在首款可扩展互联网络解决方案面市后陆续推出。

利用光子技术,通过多层交换机架构来扩大可扩展互联系统的规模,并非全新概念,只是该方案目前远未实现商业化落地。这类方案可采用类似GB200芯片NVL576架构的拓扑结构——该架构包含两层交换机,且各层交换机之间通过OSFP光收发模块与光纤实现互联。天神人工智能公司(CelestialAI)的多层交换机架构方案与之类似,但省去了实体光收发模块的使用环节。

不过,该方案与NVL576架构的核心差异在于:其可扩展互联专用集成电路(ASIC)兼具路由器与内存终端的双重功能,而英伟达的NVSwitch交换机仅负责在图形处理器(GPU)之间转发高带宽链路数据。这一区别至关重要,因为天神人工智能公司的核心卖点在于,其可扩展互联解决方案能够突破硅基芯片沿边接口的物理限制——这一限制直接决定了高性能处理器(XPU)可挂载的高带宽内存(HBM)堆栈数量。

为实现这一目标,方案将原本直接挂载于XPU的HBM堆栈,替换为一枚与光子互联架构(PhotonicFabric)相连的芯粒,而该光子互联架构则对应一个共享HBM资源池。这个共享HBM资源池的载体是光子互联架构设备(PFA)——这是一款2U机架式设备,由16枚光子互联架构专用集成电路组成,每枚专用集成电路均配备一个端口。每枚专用集成电路均采用2.5层封装工艺,集成了两组容量为36GB的第三代增强型高带宽内存(HBM3E)以及八组外置的第五代双倍数据率同步动态随机存储器(DDR5)

来源:天神AI

光输入输出接口(即光子互联架构知识产权模块)被直接集成于专用集成电路的中心区域,而非布置在芯片沿边位置,由此可将芯片沿边的接口资源预留出来,用于其他功能场景。

来源:天神AI

从整体视角来看,每个光子互联架构设备(PFA)模块都是一台16端口交换机,最多可支持16台高性能处理器(XPU)接入。不同于让每台XPU直接连接交换机的全部16个端口,全互联通信是在交换机机框内部完成的——与每台交换机专用集成电路(ASIC)相连的光纤接入单元(FAU),会分别与交换机的16个输入输出接口(I/O)建立连接。基于这一设计,每台XPU在机框外部仅需通过一条光纤链路,即可接入交换机的一个端口。

来源:天神AI

通过将内存部署于高性能处理器(XPU)外部,并集成至共享交换接口中,数据会被汇总整合,随后集群内的所有高性能处理器(XPU)均可通过全归约通信集合操作,从该共享内存池中存取数据。

all-reducecommunicationcollective译为全归约通信集合操作,是分布式计算领域的核心通信模式,指集群中所有节点先各自计算局部数据,再通过规约操作得到全局结果,并将结果同步至每一个节点。

来源:天神AI

莱特马特公司Lightmatter

莱特马特公司(Lightmatter)因其光中介层产品——Passage™M1000三维光子超级芯片而闻名业界。同时,该公司正针对共封装光学(CPO)技术路线图的不同阶段,推出多款解决方案,并有多款芯粒已在台积电(TSMC)完成流片。

面向市场的首款解决方案,将是2026至2027年间推出的近封装光学(NPO)光引擎。在近封装光学方案中,光引擎会焊接在基板上,通过铜缆实现高性能处理器(XPU)上的长距离串并收发器(LRSerDes)与光引擎的互联。莱特马特的这款光引擎最多可支持3个光纤接入单元(FAU),每个光纤接入单元配备40根光纤,光纤总数可达120根。近封装光学的战略逻辑基于如下考量:超大规模数据中心运营商在采用共封装光学技术的初期,会先通过近封装光学积累实际运行经验,这一方式可降低产品落地风险——运营商无需“押注”共封装光学,最终可灵活选择光学或铜缆可扩展互联方案,实现与高性能处理器或交换机上长距离串并收发器的对接。

由于莱特马特的光引擎方案基于台积电COUPE技术与格芯(GF)45纳米SPCLO工艺打造,因此具备多重性能扩展路径。该光引擎单通道可通过100吉波特脉冲幅度调制4电平编码(PAM4)实现200吉比特/秒的单向传输速率;也可搭配8通道密集波分复用(DWDM8)支持200吉比特/秒的脉冲幅度调制4电平编码传输,或搭配16通道密集波分复用(DWDM16)支持100吉比特/秒的脉冲幅度调制4电平编码传输,从而实现单根光纤3.2太比特的传输带宽。

其他部分共封装光学(CPO)厂商选择采用商用激光器生态体系,而莱特马特公司(Lightmatter)则自主研发了一款名为GUIDE的外置激光器产品,该产品目前已进入样品测试阶段。传统激光器需对磷化铟(InP)晶圆进行切割,以制备分立的激光二极管;而作为业界首款超大规模光子集成(VLSP)激光器,GUIDE属于全新品类——它可将数百枚磷化铟激光器集成到单一硅芯片上,支持高达50太比特/秒的带宽。莱特马特公司宣称,该产品搭载了独有的控制技术,能够对数量庞大的磷化铟激光器进行管理;同时,通过超额配置磷化铟激光器的数量,可在部分器件失效时切换至正常二极管,实现“自修复”功能,进而提升产品的整体可靠性。以英伟达的Quantum-X共封装光学交换机为例,这款拥有144个800吉比特端口的设备需要配备18台外置激光器(ELS);而莱特马特公司声称,仅需2台GUIDE激光器,即可满足同等的总带宽需求。

莱特马特公司的发展规划与台积电COUPE技术路线图保持一致:计划于2027至2028年正式推出共封装光学解决方案,随后在2029年及更晚阶段,将研发重心聚焦于其旗舰产品——Passage™M1000三维光子超级芯片。

莱特马特的M1000三维光子超级芯片是一款面积达4000平方毫米的光中介层,它被部署于主计算引擎下方,负责完成电信号至光信号的转换。该芯片已在SC25大会上完成机架级实景演示,且莱特马特公司已将其作为参考设计对外公开。Passage系列产品采用硅通孔(TSV)技术,实现高性能处理器(XPU)与光引擎之间的电信号传输及供电,同时通过串并收发器(SerDes)实现二者的互联。将专用集成电路(ASIC)直接集成于光中介层之上,不仅省去了对体积庞大、功耗高昂的串并收发器的需求,还可通过1024个紧凑低功耗的串并收发器(尺寸约为传统产品的1/8,单器件工作速率达112吉比特/秒),实现总计114太比特/秒的输入输出(I/O)带宽。此外,这种集成方式还突破了芯片沿边接口的物理限制。

来源:Lightmatter

该系统集成了内置光路交换(OCS)功能,可对冗余链路进行管理——一旦某条通信路径发生故障,流量即可通过备用路径重新路由,从而确保这一大型系统的不间断运行。此外,相邻的芯片瓦片之间采用电互连方式整合,使其能够通过通用芯粒互联接口(UCIe)等接口实现电信号通信。

Passage系列产品采用直径约15微米的微环调制器(MRM),每个调制器均集成了电阻式加热器,可实现56吉比特/秒的不归零码(NRZ)调制。该模块包含16条水平总线,每条总线最多可承载16个光波长信道。这些光波长信道由GUIDE激光器提供,该激光器可在200吉赫兹的波长间隔栅格上,为单根光纤提供16个波长。

Passage系列产品共采用256根光纤,每根光纤通过密集波分复用(DWDM)技术单向传输16个波长(或双向传输8个波长),单根光纤的传输带宽可达1太比特/秒至1.6太比特/秒。为提升产品良率,研发团队最大限度地减少了与芯片相连的光纤数量,从而降低了系统复杂度与制造难度。此外,该产品还配备了一套光纤连接系统,可将故障光纤便捷地从面板上断开并更换,进一步提升了系统的可靠性与可维护性

来源:Lightmatter

关于PASSAGE芯片的一项核心争议点,在于其所用微环调制器(MRM)的热稳定性——原因是该光中介层被直接部署在发热量极高的高性能处理器(XPU)下方。相比之下,其他共封装光学(CPO)技术方案并未将调制器置于XPU正下方,因此热管理难度更低。

针对这一质疑,莱特马特公司(Lightmatter)解释称,PASSAGE芯片中微环调制器所搭载的控制环路,可承受每秒2000摄氏度的温度剧变,且工作温度区间覆盖0至105摄氏度。这意味着,即使出现60至80摄氏度的温度波动,该控制环路也能在10毫秒内完成调节,不会造成光链路中断。

SC25大会上播放的演示视频,展示了该芯片在25至105摄氏度区间内的温度变化适应性,印证了其宽泛的工作温度范围。不过在该测试场景中,80摄氏度的温度变化耗时约1分钟,对应的温升速率仅为每秒1.33摄氏度,属于较低水平。而在SC25同期开展的另一项测试中,技术团队通过片上热源模拟出了每秒2000摄氏度的极端温升速率,此时微环调制器的配套温控加热器,可将调制器自身的温度变化速率控制在±2摄氏度/秒的极低范围内。

Xscape光子学

XscapePhotonics是一家创新公司,正在开发ChromX,这是一种可编程激光器,可提供4至16个波长,计划在未来提供多达128个波长。通过达到128种不同的颜色,ChromX将能够实现与仅提供4至8个波长的现有激光器相比,带宽显著更高。ChromX依赖于外部III-V激光器和片上多色发生器,有助于为WDM生成多个波长。

资料来源:XscapePhotonics

激光器是可编程的这一事实使其能够灵活地为不同类型的工作负载提供波长,以满足不同的带宽和距离要求。有趣的是,他们的解决方案只需要一个激光器,而现有的CPO解决方案需要多个激光器,具有极高的功率和功耗。此外,所有波长的光信号均通过单根光纤传输,这一设计规避了困扰大多数共封装光学(CPO)系统的复杂性,同时大幅减少了光纤耦合相关的问题。

拉诺维斯公司Ranovus

拉诺维斯公司(Ranovus)专注于光芯粒技术与激光器的设计和制造两大领域。该公司已通过多条技术路线完成产品流片,其中包括一款在格芯(GlobalFoundries)工艺平台上打造的单片式共封装光学(CPO)产品(此产品最初由先进微流片工厂(AMF)流片,后随格芯对先进微流片工厂的收购完成工艺迁移),以及一款基于台积电COUPE技术的产品——该产品可无缝集成不同几何构型的光子集成电路(PIC)与电子集成电路(EIC)。

该公司的奥丁(Odin)光引擎采用微环谐振器调制器,借助脉冲幅度调制4电平编码(PAM4)技术,可提供多达64个通道,单通道传输速率可达100吉比特/秒。

资料来源:Ranovus

拉诺维斯公司(Ranovus)的市场推广策略,核心是为客户提供满足需求的可互操作解决方案。目前,该策略的落地形式为100吉比特脉冲幅度调制4电平编码(PAM4)直驱光学方案;而其采用微环谐振器作为调制核心的技术路线,使其未来可灵活切换至其他调制方案——例如基于56吉波特不归零码(NRZ)的技术,搭配波分复用(WDM)技术整合4个波长信道,即可实现每对光纤400吉比特的传输速率。

拉诺维斯公司已完成旗下800吉比特芯粒与超威半导体公司(AMD)产品的互操作性验证,并与联发科技(MediaTek)达成合作,计划将奥丁(Odin)直驱共封装光学3.0方案作为芯粒解决方案,赋能超大规模数据中心运营商未来的定制化高性能处理器(XPU)硅基芯片。

森提尔公司Scintil

森提尔公司(Scintil)的主打产品为LEAFLight,这是一款光子片上系统(PSoC)。该产品既可以裸片形态(已知合格芯片,KGD)交付,也可以集成模块的形式供货,其内部集成了8枚或16枚不同波长的激光器,相邻激光器的波长间隔为200吉赫兹或100吉赫兹,可通过密集波分复用(DWDM)技术实现在单根光纤中传输多路波长信号。

森提尔公司研发了专用的电子控制系统,即便在温度发生波动的情况下,该系统也能精准维持各波长之间100吉赫兹或200吉赫兹的间隔。此外,该公司还针对外置激光器小型可插拔(ELSFP)模块提供了封装参考设计——该模块的规格与光互联论坛(OIF)定义的光互联可插拔(OSFP)模块相近,能够帮助客户更便捷地集成这款外置激光器产品。森提尔的解决方案与基于环形调制器的共封装光学(CPO)技术具有良好的兼容性。

来源:Scintil

森提尔公司(Scintil)采用的工艺名为SHIP(即森提尔异构集成光子技术)。该技术的核心是通过晶圆级工艺,将三五族激光器集成到标准硅光子芯片上。具体工艺流程如下:首先,利用成熟的代工厂工艺,制造出包含波导、探测器以及合波/分波器件的标准硅光子晶圆。随后,对该晶圆进行翻转键合,将其贴合到新的承载基底上,再剥离原始衬底,使埋入式氧化层暴露出来。接着,将未进行图形化的三五族材料键合到这一新暴露的表面。最后,通过光刻与蚀刻工艺对三五族材料进行图形化处理,制备出激光器,最终形成一款片上集成激光器的单片式硅光子芯片。这一工艺与传统的磷化铟基激光器制备方式形成鲜明对比。传统磷化铟激光器采用电子束光刻机进行图形化,在密集波分复用(DWDM)技术所需的波长精准控制方面难度更高,难以实现信道的窄间距排布。

来源:Scintil

研发一款密集波分复用(DWDM)分布式反馈(DFB)激光器阵列颇具挑战性,原因在于每个波长的频率都必须实现精准生成。若要达到100吉赫兹的信道间隔,就必须借助硅光子代工厂的先进工艺能力与光刻制程,来对硅基光栅进行高精度、高重复性的图形化制备。此外,由于这类激光器采用晶圆级工艺生产,每片晶圆上均可制造数百个器件,从而能够实现高产量、可扩展的规模化生产。

森提尔方案的一项核心优势是功耗效率。该方案可在单块芯片上完成多路波长(8路或16路)的生成与复用;反观其他采用多枚分立激光器搭配合束/分束器的方案,则需要大功率激光器才能使每路复用波长达到目标功率。相比之下,森提尔的方案不仅功耗效率更优、带宽密度更高,还能将每个传输比特的能耗降低一半。

这一优势是相对现有共封装方案(包括英伟达目前为Q3450型共封装光学交换机所采用的方案)而言的——这些传统方案采用的是单波长、高调制速率的技术路径,而非森提尔这种多波长、低调制速率的路径

第五分:英伟达的CPO供应链

我们已经探讨了核心组件在共封装光学(CPO)系统中所发挥的作用,本节将聚焦英伟达的供应商群体,深入分析供应链中的特定企业及物料清单(BOM)成本,并列举出以下关键领域的核心供应商:激光器光源、外置激光器模块(ELS)、光纤接入单元(FAU)、FAU对准工具、FAU组装环节、交换机机框、多纤推拉式连接器(MPO)、MT光纤插芯、光纤以及电光(E/O)测试环节。

Optical Engines 光学引擎

Nvidia的X800-Q3450 CPO交换机具备115.2T的总体吞吐量,专为scale-out网络而设计。初始版本将采用72个光学引擎,每个的工作速率为1.6Tbit/s;后续版本很可能过渡到36个光学引擎,每个为3.2Tbit/s,单个成本约为1,000美元(包括FAU)。因此,光学引擎的BOM总成本约为3.5–4万美元(以3.2T光学引擎版本计算)。

External Laser Source (ELS) 外置激光器

NvidiaX 800-Q3450 CPO交换机使用了18个ELS模块作为激光光源,每个模块包含8颗连续波(CW)DFB激光芯片。CPO系统需要使用相对更高功率的激光光源,每颗CWDFB芯片可输出约350mW的功率。

能够生产CW激光单元的主要行业厂商包括博通(美国)、古河(日本)、Lumentum(美国)、Coherent(美国)、源杰科技(中国)以及仕佳光子(中国)。Lumentum、Coherent、古河和博通的定价通常高于中国厂商(源杰科技和仕佳光子)。我们预计,在Nvidia CPO交换机的首批出货中,Lumentum将成为唯一的供应商,而Coherent可能在2026年底作为第二供应商进入。随着时间推移,中国厂商可能会看到机会,因为CW激光光源整体被认为是相对标准化和商品化的产品,但在构建CPO应用所需的高功率激光光源方面,仍然存在一定的技术护城河。

光纤耦合单元(FAUs)

FAU(光纤阵列单元)是关键的无源组件,负责将光纤与光引擎连接起来。高质量的FAU及其精确的对准对于确保最佳光学性能至关重要。当前FAU装配流程中的一个挑战在于,用于测量耦合损耗的测试设备尚无法实现完全自动化。因此,测试过程仍高度依赖人工操作,这不仅降低了整体生产速度,也带来了更高的成本。康宁估计,在SpectrumX CPO系统中,每个FAU的测试平均需要10–15分钟。

除了材料和器件成本之外,人工成本也是FAU成本的重要组成部分——熟练的技术人员对于确保FAU单元中光纤的高质量组装和精确对准至关重要。X800-Q3450上的每个1.6T OE都配备一个包含20根光纤的FAU:其中8根用于发送、8根用于接收,另外4根用于外部激光器。按整机系统计算,总计需要1,440根光纤,其中用于发射/接收的为1,152根。

FAU领域的领先公司包括天孚科技TFCOptical(300394.SH)、扇港Senko(9069.JP)以及上诠光纤FOCI(3363.TW)。天孚科技非常有可能为X800-Q3450 CPO交换机供应FAU,而扇港被认为是SpectrumX CPO以及博通Tomahawk6 CPO系统的最有力候选者。与此同时,上诠光纤更可能将重心放在英伟达的大型CPO解决方案上。

天孚科技的核心优势在于其强大的制造能力,以及在中国能够获取大量技术熟练且成本相对低廉的劳动力,这一点正如我们在上文段落中所讨论的,对于保持竞争力至关重要。此外,天孚科技大约在三年前便开始与英伟达在CPO设计方面展开合作,这一早期伙伴关系如今正在开花结果,预计天孚科技将在英伟达持续推进的CPO布局中发挥关键作用。

扇港拥有其标志性的SEAT(Senko Elastic Averaging Technology)平台,在该平台上为CPO系统提供可拆卸式FAU解决方案。该公司正与GFS紧密合作推进边缘耦合技术,将扇港的反射镜直接集成到晶圆沟槽中。这种方式实现了针对边缘耦合的晶圆级测试,而这一直是光栅耦合方案迄今为止的一项关键优势。

该领域的其他知名参与者还包括住友(Sumitomo)等,以及先进光纤资源公司(Advanced Fiber Resources,AFR)。据信,AFR与博通(Broadcom)的供应链关系密切。

硅光子芯片具有微米级尺度的波导通道,每一条都需要与进入系统的光进行精确对准。因此,在生产过程中需要具备极高精度的耦合设备。斐控FiconTEC(德国)目前在提供高精度耦合设备方面处于行业领先地位。其设备单价可超过30万美元,但由于精度卓越,仍然深受客户追捧。与此同时,万润科技股份有限公司(台湾6187. TPEX)也提供自动化光纤贴装设备。该公司已将约10%的员工投入到该领域,并预计其耦合设备收入将从2026年开始获得显著增长。最后,高明铁企业股份有限公司GMT Global(台湾4573.TPEX)设计用于FAU键合、对准和检测的设备,可校正光的波长,以确保通过FAU的精确传输。该公司计划将其设备定价设为同类日本设备的约75%以下,而后者的价格通常在20万至25万美元之间。该公司预计将在2025年第四季度进行部分试产。

Fiber Shuffle Box光纤分纤盒

在英伟达的X800-Q3450 CPO交换机中,有超过1,000根光纤从光引擎(OE)中引出,因此需要一个光纤分纤盒来对这些光纤进行整理并将其引导至各自的目的地。传统上,分纤盒的对齐过程是通过人工完成的,由技术人员手动排列光纤。不过,一些领先的公司已经开发出能够以更高精度和效率完成对齐的自动化设备。

分纤盒的价格通常与其所管理的光纤数量挂钩。例如,太辰光(300570.SH)销售的48芯光纤分纤盒价格约为150美元,300芯版本约为1,000美元,500芯型号约为1,600美元。对于拥有数千根光纤的X800-Q3450而言,光纤分纤盒的采购成本将超过3,000美元。光纤分纤盒的主要BOM组件包括MT插芯和光纤。

太辰光(300570.SH)是分纤盒行业的领先企业。该公司开发了用于在分纤盒中对光纤进行对齐的自动化设备。这些技术已获得专利,竞争对手要绕开这些专利可能需要时间并付出额外成本。太辰光的主要客户是康宁,两家公司经常协同合作以服务客户。例如,康宁会帮助客户(英伟达、博通等)为其CPO解决方案设计光纤网络,并将分纤盒部分分包给太辰光。

莫仕Molex是另一家值得关注的参与者,也很早进入了该市场。然而,由于制造效率较低,其产品价格通常比T&S高约20%。

MPO Connectors MPO连接器

在光纤分纤盒的外围,有MPO连接器,用于将光纤分纤盒内部的光纤连接到外部端口。随后,光纤MPO电缆可以插入该端口,将交换机与其他远端交换机或远端NIC连接起来。MPO连接器的制造工艺主要包括注塑成型、真空注胶填充以及对单元内部MT陶瓷插芯的穿纤。对于X-800Q3450 CPO交换机,共需要144个MPO连接器。

能够生产MPO连接器的厂商有多家,包括US Conec(美国)、太辰光(中国)、扇港(日本)、Broadex(中国)以及爱普迪光通讯科技(深圳)有限公司Optec(中国)。它们还需要与光纤网络的合同制造商(如康宁)合作,将其组件供应到整体网络设计中。

MT陶瓷插芯

MT插芯是用于FAU、shufflebox以及MPO连接器中的关键组件。它们用于以并行方式对齐多根光纤。许多公司都具备生产MT插芯的能力,包括USConec(美国)、太辰光(中国)、Senko(日本)、Fukushima(日本)、FOCI(台湾)、住友(日本)以及天孚通讯(中国)。MT插芯的制造难度并不算特别高,但要达到所需的精度和可靠性,仍然需要大量工程投入。各家公司主要在模具成型能力方面展开竞争,以生产能够在光纤连接中将插入损耗降至最低的插芯。

在这些公司中,US Conec拥有三十多年的相关技术开发经验,预计将成为英伟达Q3450CPO系统的主要供应商之一。Fukushima也具备强大的模具设计和制造能力,能够以具有竞争力的价格生产高质量的MT插芯。与此同时,FOCI、天孚和太辰光主要为自家内部的FAU和shufflebox生产MT插芯,逻辑在于尽可能实现垂直整合,以提升质量控制水平和成本效率。

制造、组装以及测试流程

OE制造:如上所述,台积电将在PIC、EIC的制造以及它们与CPO系统的集成中发挥关键作用。他们的COUPE平台似乎是下一代CPO端点的首选解决方案。格芯和高塔是具备较强硅光子(SiPho)能力的晶圆代工厂,但由于缺乏领先制程的CMOS和先进封装能力,其提供未来更高带宽OE的能力受到限制。

先进封装:外包半导体封装与测试(OSAT)供应商将专注于后段工艺,包括OE封装、OE测试以及系统级封装(激光器和耦合器的集成与测试)。

日月光/矽品(3711.TW)、Amkor($AMKR)以及Shunsin(6451.TW)是此类解决方案的主要供应商。其中,日月光作为英伟达供应链中的关键供应商尤为突出,包括参与未来的Rubin机架CPO系统,而Shunsin则与博通保持着密切合作关系。

其他值得关注的公司包括Fabrinet($FN)、天孚通讯(300394.SH)以及富士康(2354.TW)。Fabrinet长期作为英伟达自研光模块单元的模块组装商,如今正积极建设在OE封装、测试以及整机系统组装方面的能力。Fabrinet同时也被视为博通CPO系统组装工作的潜在候选方之一,其他候选还包括Micas和富士康。天孚过去3–4年一直与英伟达在CPO设计上保持密切合作,并将成为FAU的主要供应商。公司已在中国苏州投资建设先进封装设施,显示出其希望在CPO供应链中获得更大角色的雄心。

电光(E/O)测试设备:在测试过程中,上述服务厂商会使用电光(E/O)测试工具来确保系统可靠性。然而,该行业仍处于发展阶段,尚未在光子引擎的标准化测试方法上完全达成一致。各家厂商都在开发不同的解决方案,以期在这一新兴领域中占据一席之地。

CPO供应链中的其他关键设备供应商包括Keysight是德科技、Ficontec斐控泰克、Teradyne泰瑞达、Advantest爱德万测试、FormFactor福尔姆费克特、Chroma致茂电子、Anritsu安立知和Multilane迈络思。其中,是德科技Keysight是该领域的重要参与者——以提供高端、高速测试设备而闻名(当然价格也同样高端!)。例如,他们最近宣布推出两款用于1.6T光收发器测试的新型示波器。凭借其在市场中的地位,是德科技有望充分受益于CPO趋势。

斐控泰克Ficontec在光子测试领域拥有深厚基础,目前也在积极扩展其电测试能力。其关键优势之一是晶圆级光子测试——这提升了传统上效率较低的光子测试流程。例如,该公司近期推出了一款全新的高吞吐量PIC晶圆级测试设备,兼容现有的半导体ATE架构。该设备被称为业内首款双面晶圆测试机。除了测试设备之外,Ficontec还提供FAU组装与耦合设备,我们将在下一节中对此进行更详细的探讨。

泰瑞达Teradyne也是该领域的重要参与者之一,在电气测试方面拥有深厚的历史积累,但该公司一直“非常认真”地投入光子测试领域。例如,该公司最近还收购了一家专注于封装光学测试的初创企业,这一举措反映了其为构建CPO能力而进行的战略性布局。

Chroma一直在为用于3D传感和光通信的激光二极管提供光子测试设备,并有潜力利用这一专业优势进入CPO领域。然而,该公司目前的创新速度落后于部分竞争对手。