AI工厂的矛盾,看CPO技术的必然性和紧迫性

用户头像
闷得而蜜
 · 广东  

在 AI 浪潮汹涌澎湃的当下,英伟达的战略目标是打造AI 工厂,作为支撑 AI 技术蓬勃发展的关键基础设施,其技术架构的革新显得尤为重要。今天,咱们就从 AI 工厂的视角,来深入剖析 CPO 技术的必然性和紧迫性。

当前AI工厂的架构继承自传统数据中心

在传统的企业数据中心中,一级交换机集成在每个服务器机架内,允许直接通过铜缆连接到服务器,并最大限度地降低电源和组件的复杂性。这种架构足以满足以 CPU 为中心的工作负载,且网络需求适中。

相比之下,NVIDIA 率先打造的现代 AI 工厂拥有超高密度的计算机架和数千个 GPU,这些 GPU 的架构设计使其能够协同完成一项任务。这要求整个数据中心拥有最大的带宽和最小的延迟,因此需要新的拓扑结构,将一级交换机迁移到行尾。这种配置极大地增加了服务器和交换机之间的距离,使得光纤网络至关重要。因此,功耗和光学元件数量显著增加,现在网卡到交换机以及交换机到交换机的连接都需要光学元件。

如下图1所示,这种演变反映了满足大规模AI工作负载的高带宽、低延迟需求所需的拓扑结构和技术的重大转变。它从根本上重塑了数据中心的物理和能源配置。

现在的 AI 算力工厂,用的还是铜缆和光模块搭配的混合架构。成本高、功耗大、延时低、可靠性差等诸多矛盾,尚未解决。全球范围内,还没有那种专门为 AI 工厂打造的创新架构落地,主要原因就是全光互联技术还没实现商用。要是这个技术能突破,那对 AI 算力工厂来说,可就有大变化了 。

基于CPO/OIO全光互联的AI工厂创新架构

现在 AI 数据中心的零件都得往一个机架里使劲塞,挤得满满当当。等 CPO/OIO 技术能用了就不一样了 —— 它靠光通信传数据,10 毫米到 100 米的距离都能搞定,还省电、成本低。到时候不用再硬凑机架,怎么部署经济就怎么来。

不管是行业大佬还是中美政府,都把 CPO 捧成了 “香饽饽”—— 台积电 CEO 说它是后摩尔时代最关键的半导体技术,黄仁勋更直接,称这是要啃二十年的 “硬骨头”(持续投入才能成);政策端更实在,美国把 CPO 放进《芯片法案》给资助,咱们中国也把它列为 “十五五” 要重点突破的十大产业化技术之一。

这些大佬和政策为啥这么看重?答案全在对比里 —— 现在 AI 算力工厂的混合架构毛病一堆,而 CPO/OIO 能解决长距离传输、功耗、成本这些核心痛点。说白了,要让 AI 算力工厂真正跑起来、跑划算,CPO/OIO 就是绕不开的希望。

前面聊了 CPO/OIO 是 AI 算力工厂的未来,但对咱们 A 股投资者来说,这话得补半句 —— 这东西可能是 “双刃剑”。现在 A 股里最火的那些板块,比如光模块、PCB、液冷、HVDC,看着涨得热闹,可一旦 CPO 技术真商用了,麻烦就来了。原来的混合架构里,这些板块是刚需,需求撑得足;但 CPO 要解决的就是老架构的痛点,它一上来,对这些零部件的需求会直接降档,甚至可能萎缩到只剩一小块市场。

架构变革之际,往往也是市场重新洗牌之时。未来的 “新希望”,可能会让现在的 “香饽饽” 变 “烫手山芋”,甚至可能给整个市场造成一定的震荡,这点得提前看清楚。在未来 1 - 2 年内,这种情况发生的确定性相当高。

芯片出光(CPO/OIO)集体照

CPO龙头:罗博特科

MPO配件:太辰光仕佳光子

CPO微透镜:炬光科技

$罗博特科(SZ300757)$ $半导体ETF(SH512480)$ $太辰光(SZ300570)$

免责声明+特别提醒:以上内容仅为个人研究心得和投资思考记录,不构成任何买卖建议。市场瞬息万变,个股走势受多重因素影响,大家务必结合自身风险承受能力独立判断,投资决策请自己做主。赚钱了不用谢我,亏了也别来骂我,毕竟真金白银的操作权在你手里。投资有风险,入市需谨慎。