AI发展的主要矛盾已经从“缺乏算力”转变为“如何高效地组织和利用算力”。 这个瓶颈的转移,打破了由英伟达(NVIDIA)凭借NVLink技术建立的互联垄断壁垒,为中国企业在交换芯片领域实现“换道超车”打开了战略窗口。
第一部分:AI进入“推理即服务”时代,性能瓶颈从算力变成“机柜内互联”
1. “推理即服务”时代
· 训练 vs. 推理:
· 训练:像“学校学习”,需要海量数据和巨大算力让模型学习规律。这是过去几年大家关注的焦点,拼的是GPU数量和算力规模。
· 推理:像“毕业工作”,利用已训练好的模型(如ChatGPT)来回答用户问题、生成图片等。随着大模型普及,每天数十亿次的用户请求带来了天量的推理需求。
· “即服务”模式:企业不再自己购买和维护昂贵的AI集群,而是像使用水电煤一样,通过API调用云端AI模型的推理能力。这意味着推理任务变得常态化、规模化且要求低延迟。
2. 瓶颈转移:从算力到互联
· 过去的瓶颈——算力:在训练时代,大家关心的是GPU(如H100)的绝对算力(TFLOPS)。买不到足够的GPU是主要矛盾。
· 现在的瓶颈——互联:
· 在推理时代,尤其是大规模推理集群中,单个用户请求可能需要多个GPU协同工作来处理。GPU之间需要频繁、高速地交换数据(例如,不同token的生成需要实时通信)。
· 如果GPU之间的通信速度(带宽)慢、延迟高,就会导致大部分GPU处于“等待数据”的闲置状态,整个系统的效率和吞吐量会急剧下降。这就好比一个工厂生产线,即使每个工人(GPU)手艺再高,如果传送带(互联网络)太慢,整体产能也上不去。
· 因此,机柜内GPU与GPU、服务器与服务器之间的互联带宽和延迟,取代了单芯片算力,成为了制约整个AI服务性能和成本的关键瓶颈。
---
第二部分:NVLink不再一家独大,PCIe6/7、UAlink、CXL打开国产交换芯片黄金窗口
1. 英伟达的护城河:NVLink + NVSwitch
· 过去,英伟达能垄断AI训练市场,不仅靠GPU芯片,更靠其NVLink(GPU间高速直连技术)和NVSwitch(基于NVLink的交换芯片)组成的封闭生态。
· 这套系统让它的GPU们能像一个巨大的“超级芯片”一样高效协同工作,其他厂商的GPU无法融入这个体系,形成了极高的生态壁垒。
2. 新技术的崛起:打破垄断的利器
现在,多种开放标准和技术正在合力打破这堵墙:
技术 定位与功能 如何打破垄断
PCIe 6.0/7.0 服务器内部“主干道”:负责CPU与GPU、GPU与网卡等设备的互联。新版PCIe带宽翻倍(PCIe 6.0达256 GT/s),延迟更低。 提供了开放的、标准的高速互联基础。国产GPU和交换芯片只要遵循PCIe标准,就能接入任何基于PCIe的服务器平台,不再被NVLink绑定。
CXL 内存“扩展池”:建立在PCIe之上,允许CPU和GPU等设备高效共享和访问统一的内存池。 解决了“内存墙”问题。允许国产加速卡与CPU深度协同,实现内存资源共享,极大提升效率,是构建异构计算的关键。
UAlink 机柜内“调度网”:由谷歌、微软、Meta、思科、英特尔、AMD、博通等巨头联合推出的开放标准,旨在替代英伟达的NVLink/NVSwitch,用于机柜内多个GPU之间的高速互联。 这是最致命的一击。它旨在创建一个不属于任何一家公司的开放GPU互联标准。任何厂商(包括中国国产GPU厂商)的芯片,只要支持UAlink协议,就能通过支持UAlink的交换机组网。这直接瓦解了英伟达的封闭生态护城河。
3. 为什么是“国产交换芯片的黄金窗口”?
上述技术趋势的结合,创造了一个前所未有的机遇期:
1. 技术路线切换:行业从封闭的NVLink体系转向开放的PCIe/CXL/UAlink体系。大家回到了同一起跑线,比拼的不再是生态绑定,而是谁能在开放标准下做出性能更好、成本更低的交换芯片和解决方案。
2. 需求明确且迫切:中国拥有庞大的AI推理市场和强烈的国产替代需求。国产GPU厂商(如华为昇腾、海光等)急需高性能的开放互联方案来组建自己的AI集群,以对抗英伟达的限制。
3. 供应链安全自主:地缘政治因素使得中国科技产业必须建立自主可控的供应链。交换芯片作为AI集群的“神经网络”,其重要性不亚于GPU本身,是实现自主可控的核心环节。
4. 市场空白待填补:在这个新的开放体系下,谁能率先推出成熟可靠的PCIe/CXL/UAlink交换芯片,谁就能抓住国产AI基础设施的入口,市场空间巨大。
总结与展望
您可以这样理解这个巨大的转变:
· 过去:英伟达建了一个“iOS系统”(NVLink/NVSwitch生态),只有他自己的“App”(GPU)能在这个系统上跑得最好,别人进不来。
· 现在:行业共同推出了“Android系统”(PCIe/CXL/UAlink开放标准)。任何手机厂商(GPU公司)都可以基于这个系统开发手机,而交换芯片公司就是为这个新系统制造“芯片组”和“核心元器件”的角色。
对于中国来说,我们可能暂时还造不出完全媲美英伟达的“手机”(GPU),但我们完全有机会在这个新的“Android时代”,率先造出性能领先的“芯片组”(交换芯片),从而主导国产AI基础设施的构建。
因此,“性能瓶颈从算力变成机柜内互联”是问题的本质,“NVLink不再一家独大”是竞争格局的松动,而“PCIe6/7、UAlink、CXL”则是打开新时代大门的钥匙,共同为中国交换芯片产业提供了一个千载难逢的“黄金窗口”。 数渡科技(专注PCIe/CXL交换)、盛科通信(专注以太网交换,与UAlink相关)等企业正处在这一浪潮之巅。
盛科通信估值推算:
如果只考虑中短线,芯片公司需按远期估值。按机构预测27年营收22亿,25年中国交换芯片总规模约170亿,博通在中国市场预估份额约70%,预计在中国营收约120亿,假设两年内盛通替代率在15%,替代带来的增量营收在18亿左右,替代后总营收为40亿。
按照寒武纪估值体系,目前PS在35,给予盛通30ps,未替代前27年市值预期在660亿,若替代成功27年市值预期在1200亿。