用户头像
挖掘招财喵
 · 浙江  

AEC调研Credo
会议要点
AEC应用场景与优势:AEC主要用于服务器到TOR交换机连接,少量用于TOR到Spine交换机连接。相比光模块,AEC在柜内连接具有成本低、功耗低、可靠性高的优势。
各大客户订单及采购计划:Nvidia尚未直接采购AEC,但设备通过认证,未来200G及800G速率应用可能有变化;AWS将AEC用于自研芯片项目,Trainium3计划升级至800G AEC; Meta在GB200部署中全面采用AEC,明年每季度采购量预计与XAI相近;Microsoft主要在传统数据中心部署100G AEC,未来订单规模待定;Oracle测试进展顺利,有望成为重要客户。
800G AEC产品情况:800G AEC产品根据距离不同价格有差异,短距离售价约450-500美元,长距离接近600美元。与光模块相比,成本上有一定优势,定价策略旨在体现产品价值并保持市场竞争力。
市场竞争格局:800G领域主要竞争者有Amphenol和Molex,但尚未实现批量供货。Credo在Meta项目中竞争优势明显,目前市场未出现价格战迹象。
生产策略和供应链:公司负责PCB设计和芯片开发,铜缆外购,组装环节外包给贸联和Foxlink。引入乐庭作为第二铜缆供应商,Foxlink份额未来计划提升至30%-40%。
DSP产品及技术发展:800G DSP产品市场需求有限,计划推出5纳米制程新一代低功耗DSP;400G DSP年出货量约200万至300万颗,主要供应字节跳动和腾讯,未来看好800G单通道100G 产品发展潜力;LPO产品旨在降低功耗和成本,已送样给阿里巴巴,计划向Meta提供样品;PCle AEC领域,公司完成研发,计划与Astera labs竞争,预计2026年实现规模化应用;1.6T及3.2T AEC技术发展面临挑战,依赖铜缆材料、芯片均衡能力及PCB材质进步。
Q:当前AEC的主要应用场景是什么?在服务器到TOR交换机以及TOR到Spine交换机的连接中,AC与其他技术相比有哪些优势?
A:AEC的主要应用场景集中在服务器到TOR交换机的连接中,而在TOR到Spine交换机的连接中仅有少量使用。早期低速率时,通常采用DAC,随着速率提升,大部分场景转向光模块。但在柜内连接中,AEC相较光模块具有显著优势。首先是成本方面,AEC整体成本低于光模块;其次是功耗,由于AEC不包含光器件及其驱动相关组件,所以功耗更低;最后是可靠性,光模块中的光器件存在一定比例的失效风险,在AI 应用场景下这个问题尤为突出,而AEC采用纯铜设计,失效率显著降低至十万分之一以下,可靠性更高。
Q:TOR交换机通常放置在哪些位置?其与服务器之间的物理布局有哪些常见形式?
A:TOR交换机的放置式主要有两种。第一种是在服务器所在同一机柜内,将TOR放置于服务器之间或靠近中间的位置;第二种是在独立的机柜内,与左右两侧分别存放服务器的两个机柜相邻,中间独立设置一个用于存放TOR及可能附带Leaf交换机的专用机柜。这两种布局形式是当前数据中心部署中的主流方式。
Q:Nvidia是否直接向Credo采购AEC产品?在禾来200G及更高速率应用中,Nvidia是否可能改变其现有采购模式?具体在哪些代际产品上会涉及这些变化?
A:Nvidia目前尚未直接采购AEC产品,不过公司设备已通过了相关认证。在现阶段,其内部scale - up连接采用铜缆,外部scale - out连接允许客户自行选择采购光模块或AEC来实现从GB200到TOR交换机之间的互联,例如Meta和SC均计划自行采购AEC用于此类连接,而非通过Nvidia直接购买。此外,Nvidia自身也销售以太网或IB switch,但并未将中间互联部分打包销售,目前仍以自有产线生产并销售光模块为主。在200G速率应用中,目前尚无明确迹象表明。
Nvidia会改变现有模式,GB300代际预计仍不会采用AEC,而Rubin代际可能会有所接触,不过目前相关讨论仍处于前期阶段。对于800G速率互联,从现阶段来看,大概率将采用AEC,已有800G AEC样品送至客户进行测试,但最终决定尚未完全确定。
Q:AWS当前对AEC产品的需求情况如何?其主要用途是什么?未来架构是否会发生变化?Trainium3的出货计划因延迟有所调整,原定于2025年底推出,目前推迟至2026年第二季度。Trainium3在推出后关于Trainium3相关的出货计划,其时间节点和部署安排是怎样的?目前是否有关于2026年的采购量指引?2025年的采购节奏和数量如何?
A:AWS目前主要将AEC用于自研芯片相关项目,其H100和GB200仍然通光模块实现互联。对单通道50G AEC产品(如8x50Gbps组成400Gbps链路)的需求集中于较早期版本,当前这些产品主要用于训练任务中的网卡到TOR之间
5/23
互联。在2026年计划推出的新一代架构Trainium3中,将从400Gbps升级至800Gbps 即从8x50Gbps升级至8x100Gbps或4x100Gbps,同时GPU间scale - up网络将从PCle 5.0升级至PCle 6.0,但对于具体网络形态,如64个GPU互联还是16个GPU互联,目前AWS尚未透露明确信息。从目前情况看,新一代网卡到TOR之间大概率会采用800G AEC技术。Trainium3原定于2025年底推出,目前推迟至2026年第二季度,推出后还需完成自主芯片的开发以及服务器的生产与部署,预计公司产品的批量部署将在2026年第三季度进行。目前尚未收到明确的2026年采购量指引,根据Trainium2的经验,通常会在当年的第一季度开始准备下订单,并在第三季度左右提供下一年度(即后年)的全年指引,例如Trainium2在部署初期仅提供按季度计算的目标,而到2024年第四季度时则给出了2025年的全年指引,因此预计类似节奏可能适用于Trainium3。2025年的采购节奏基本与往年一致,上半年约为70-80万条,全年的总量预计为150万条。
Q:Amazon当前主要采用哪种技术方案?光模快和AEC之间如何选择?
A:Amazon当前主要采用400G AEC技术,并且其设计中一个ASIC对应一个AEC。从产品角度来看,AEC具有更高稳定性、更低功耗以及更低成本等优势。然而,在实际选择中,商业考量占主导地位。通常情况下,如果现有AEC方案运行良好,不太可能切换回光模块。此外,对于GPU到TOR交换机之间的互联,不太可能采用正交背板设计,因为这种设计复杂且没有必要。
Q:相较于400G产品,800GAEC产品有哪些价格变化及原因?与光模块相比,800G AEC在成本上的竞争力如何?在AEC的定价策略中,如何平衡其与光模块的价格差异,同时确保客户对AEC 价值的认可?
A:相较于400G AEC产品(售价约200美元)800G产品售价翻倍甚至略高一些。这主要由于以
7/23
下原因:一是目前800G需求紧张且供应尚未完全跟上;二是800G所需Retimer芯片制程更先进、成本更高;三是相比400G已大规模出货导致价格下降,800G仍处于早期阶段。800G AEC售价450- 500美元,单模光模块每个售价接近300美元,两端合计约600美元,三模则更贵,每个超过400美元,所以800G AEC与光模块在成本上差距并不显著,但AEC仍具备一定优势。AEC的定价策略旨在避免客户将其视为廉价产品,因此价格设定为略低于光模块,但不会便宜太多,这种定价既体现了产品价值,又保持了市场竞争力。
Q:从CSP的角度看◇选择AEC时成本、功耗和可靠性三者的重要性排序如何?AEC在可靠性方面相较光模块有何具体优势?AEC主要用于连接哪些服务器型号?是否存在混用情况?
A:在传统云计算环境中,成本通常是首要考虑因素。但随着数据中心规模扩大,功耗控制的重要性逐步提升。在AI训练场景中,由于训练过程对数据完整性的高要求,可靠性成为首要关注点。AI训练通常持续约20天,如果因可靠性问题导致中断,将造成重大损失,所以性能及可靠性被优先考虑,而成本和功耗则次之。光模块在前六个月内的失效率约为千分之一,而AEC由于采用纯铜设计,其失效率显著降低至十万分之一以下,相当于提高了100倍。在传统云计算场景中,千分之一的失效率可以通过备份机制接受,但在AI训练场景中,这样的失效率难以容忍,因为一次训练失败会导致整个数据无效。AEC主要用于连接H100和GB200服务器,在GB200服务器上,其短距离连接全部采用AEC,仅长距离连接使用光模块,不存在混用情况。
Q:GB200服务器明年的采购量预期是多少?这将如何影响AEC需求量?GB200服务器为何选择800G速率网卡◇而非400G速率网卡?如果未来速率提升至1.6T,对AEC支持的距离有何影响?是否会限制其应用范围?
A:预计GB200服务器明年每季度采购约1000个机柜,每季度对应70K至75K条AEC需求。如果机柜采购量增加,将直接推动AEC需求增长。B200服务器配备CX8网卡,因此采用800G速率,而此前H100服务器配备CX7网卡,则使用400G速率,所以明年GB200相关部署将全面转向800G速率。当前800G速率下,理论极限传输距离为7米,实际使用极限为5米;而1.6T速率下理论极限缩短至3米,实际使用极限约2.5米。不过,即使是2.5米,对于机柜内连接仍然足够,因为从网卡到TOR交换机通常仅需1.5米左右。
Q: Meta是否也像XAI一样,在GB200部署中全面采用AEC而非光模块?其采购计划如何影响市场预期?
A:Meta在GB200部署项目中同样全面采用AEC,不再考虑光模块。Meta今年小批量订单始于6月,大规模交付预计从第三季度开始。根据目前计划,其明年每季度采购量预计与XAI相近。这一指引较保守,但可能存在上调空间,总本营收贡献预计达一点几亿美元,这将对市场预期产生积极影响。
Q:Microsoft目前主要在哪些场景下使用100G AEC,其未来订单规模如何?Microsoft在GB200这一代产品上的进展为何较慢?是否存在客户反馈关于未采用AC方案的问题?
A: Microsoft主要在传统数据中心部署100G AEC。今年5月底至明年6月期间,其已下单超过80万条100G AEC,这些产品主要用于传统数据中心内部网络连接。Microsoft在GB200上的进展相对缓慢,其原因主要是商务推进速度较慢,以及其业务复杂、项目众多。此外,Microsoft作为一家相对保守的公司,其决策流程也较为谨11/23具。虽然800G样品早已送测,但尚未收到明确反馈,目前没有客户反馈关于未采用AC方案的问题。
Q:AWS为何未在GB200上采用AEC方案,而选择其他解决方案?
A:AWS选择不使用AEC方案可能与商业考量及认证时间有关。一种可能是AWS倾向于直接从英伟达采购成套设备,因为英伟达提供了预先认证过的光模块,这可以缩短部署时间。而对于部分客户而言,更快完成部署比花费时间进行独立认证更具吸引力。不过,也有如Meta这样的客户认为使用AEC不会显著增加时间成本,因此仍愿意选择该方案。
Q:Google为何未采用AEC,并且在光模块选择上表现出不同于其他公司的偏好?
A: Google长期以来并未使用AEC,而是主要依赖DAC和单模光模块。值得注意的是,与多模光模块相比,单模光模块成本更高,但Google似乎并不特别关注成本节约。此外,Google与MarvellInphi等供应商关系密切,这可能对Credo等竞争者造成一定商务障碍。因此,即使送测了样品,也未能取得进一步商务进展。
Q:Oracle目前在GB200上的测试和采购计划如何推进?是否有望成为未来的重要客户?
A:Oracle已经分批接收了几百条样品进行测试,目前测试进展顺利且接近完成阶段。如果Oracle决定下订单,其生产准备不会成为问题。然而,由于Oracle的大规模部署计划通常存在一延迟,例如今年初订单确认被推迟数月,因此即便目前尚无明确订单数量信息,也不能排除未来合作可能性。从内部评估来看,与Oracle达成合作的希望相对较大,有望成为Meta之后的重要发展客户。
Q:当前市场竞争格局中有哪些主要玩家参与800G领域竞争?Amphenol、Molex等厂商是否已实现批量供货?关于微软和AWS在800G产品上的供应商选择情况,是否可以详细说明当前的竞争格局以及未来可能的变化?
A:在800G领域,目前主要竞争者包括Amphenol和Molex。Amphenol曾向亚马逊微软提供800G样品,但最终这些客户选择了Credo作为供应商。目前尚无明确信息表明Amphenol或Molex已实现批量供货,但他们仍然是该领域的重要竞争者之一。微软方面,目前儿家供应商都已经完成了样品测试,测试结果显示没有问题,但尚未收到进一步的订单或明确反馈,因此未来合作的不确定性较大。AWS方面,在上一代400G产品中,AWS曾尝试让Amphenol成为第二供应商,但由于其认证测试失败未能实现。然而,目前AWS仍有意愿引入第二供应商以满足其较大的需求量,这为Amphenol提供了一定机会。此外,Meta在审厂过程中对Credo表现出更高的认可度,其供应链、批量交货能力及质量控制均优于Molex,因此Credo在Meta项目中的竞争优势较为明显。
Q:当前市场是否存在价格战,以及未来价格走势如何?
A:目前市场上并未出现价格战迹象。以AWS为例,其上一代400G产品降价是基于签订超过100万条协议框架的前提条件,而目前800G和Meta 相关产品的需求量相对较小,因此价格保持稳定。预计到2026年6月之前,微软相关产品价格不会发生变化(维持在800美元以上)。唯一可能出现降价的是400G产品,其收入占比预计将在2026年下降10% - 15%,因此存在一定降价空间。
Q:关于公司铜缆及连接器生产和组装环节的产能分布情况如何?铜缆采购策略为何计划引入乐庭作为第二供应商?铜缆连接器设计是否涉及额采购或复杂工艺?Foxlink作为新增代工厂,其当前份额分配情况以及未来规划如何?瑞可达是否参与Credo相关项目合作?
A:公司主要负责PCB设计和芯片开发,而铜缆完全外购。目前铜缆采购主要来自兆龙互联,未来可能增加乐庭作为第二供应商。引入乐庭主要基于两个原因:一是从技术性能来看,兆龙现有铜缆能够满足400G和800G需求,但在1.6T性能上存在不足,而乐庭送样表现更优;二是从客户要求来看,例如Meta提出希望原材料能够实现海外本地化供应,而兆龙在东南亚布局进展缓慢,相比之下乐庭具备更快响应能力。铜缆连接器并不需要额外采购或复杂设计,中间铜线直接焊接到PCB板上的焊盘,两端通过裸露覆铜与设备接口连接,并通过卡口固定。这种设计简化了组装工艺,仅需完成焊接,安装导热材料及外壳即可完成组件制造。组装环节外包给贸联和Foxlink 其中贸联承担80%以上份额,是长期合作伙伴;Foxlink作为新增代工厂,目前占比约10%,目标是逐步提升至30%-40%。选择这两家代工厂主要基于客户对工业安全及信任度要求,同时贸联与AWS有密切联系,在批量交货谈判中发挥了重要作用。瑞可达并未参与Credo任何项目合作,这是因为Credo坚持AEC组件必须由身生产,不会将该业务授权给其他公司,这一政策确保了核心技术与关键组件的自主可控性。
Q:关于Credo在AEC领域的策略,其为何选择不直接销售芯片并支持客户自行制造AEC?马威尔和博通在AEC领域的策略有何不同?
A:Credo选择不直接销售芯片并支持客户自行制造AEC,主要基于以下几点考虑:首先,这种模式可能导致内部竞争,即既销售芯片又生产电缆会形成与自身业务的冲突,从而影响市场推广。其次,AEC的质量控制要求极高,而Credo 为此投入了大量资源建立专门部门以确保产品质量。如果仅销售芯片,客户可能误以为简单焊接即可使用,但实际上需要复杂的技术支持,这可能导致公司的制造工艺秘密被泄露。此外,这种模式也容易对品牌声誉造成损害。马威尔采取了与Credo不同的策略,其更倾向于直接销售芯片,而不建立专门部门来管理质量控制或工厂运营,这种做法延续了其在光模块领域的一贯思路。相比之下,博通虽然也开放出售相关芯片,但由于其整体业务规模庞大,对AEC芯片这一细市场并未投入过多资源,也缺乏显著支持力度。马威尔预计该领域年收入占其总收入比例较高,因此相对重视;而博通则因该业务占比小,对其关注度较低。
Q:目前800G DSP产品的市场表现如何?主要面临哪些挑战?新一代5纳米DSP预计何时进入市场?
A:目前800G DSP产品在国内市场需求有限,仅少量用于自用场景;海外市场表现亦不理想,仅实现数万颗出货量(约几十K)。主要原因包括国内客户如旭创、新易盛等与博通和马威尔绑定紧密,新产品导入速度较慢,此外在商务层面也存在一定阻碍。目前通过立讯进行导入,但出货量仍然较低。尽管测试效果良好,但现有产品因采用成本较低但功耗较大的芯片,与博通和马威尔相比存在劣势,因此计划推出基于5纳米制程的新一代低功耗DSP,以改善竞争力。不过目前尚未明确这款新产品进入市场的具体时间。
Q:当前400G DSP年出货量及主要客户情况如何?400G DSP为何能实现显著价格优势?对未来400G及800G DSP的发展预期如何?A:400G DSP年出货量约为200万至300万颗,主要供应字节跳动和腾讯,其中腾讯部分需求为200G,其余则集中于400G。400G DSP能实现显著价格优势,是因为其采用两颗合封设计,将两颗DSP集成到一个芯片中,从而降低了整体成本。此外,该公司针对国内市场高度重视成本控制,使得其价格显著低于竞争对手。对未来400G 及800GDSP的发展预期方面,400G DSP预计将继续扩大量产规模,并可能逐步进海外市场,例如Oracle或微软等潜在客户。然而,从长期来看,公司更看重800G单通道100G这一代产品的发展潜力,因为这一代技术生命周期更长,有望成为未来主流方向。在海外拓展方面,公司计划凭借价格优势以及与相关企业合作铺设渠道,例如通过与Oracle及其相关生态系统合作推动应用落地。
Q:光模块厂商在产业链中扮演什么样的角色?其对国内外客户的影响有何不同?在选择DSP供应方案时,CSP如何通过竞争机制降低成本?国内外800G光模块价格差异如何?目前市场上的主流价格区间是多少?
A:光模块厂商在产业链中具有较大的影响力,尤其是在国内市场。国内客户通常采用JDM模式,例如字节跳动、阿里巴巴和腾讯等公司会指定某一家的DSP(数字信号处理器),然后由光模块厂商完成产品制造,并最终通过招标流程确定供应商。在这一过程中,光模块厂商通常会与芯片厂商事先谈好价格,以降低成本,从而提高中标概率。由于成本是主要考量因素,这种模式使得光模块厂商在价格谈判中占据重要地位。相比之下,海外市场的情况有所不同。海外客户对光模块的整体价格容忍度更高,一般比国内高出20%至30%。例如,旭创和新易盛的毛利率显著高于光迅,因为它们面向海外市场的产品售价更高。然而,海外客户更关注核心器件(如DSP和数光器)的品牌认可度。一旦核心器件方案被认可,他们对具体使用哪家光模块厂商并不敏感。例如,对于亚马逊而言,只要DSP来自博通、马威尔等知名供应商即可,但如果是小型或不知名品牌,则可能直接被否决。CSP在选择DSP供应方案时,其主要目标是通过引入竞争机制来降低成本,而非单纯替换现有供应商。例如,当现有方案使用的是马威尔的DSP时,CSP可能会引入另一家供应商以促使马威尔降价。这种策略并非一定要更换供应方,而是为了通过竞争压低价格。不过,更换DSP方案需要重新进行测试,例如亚马逊可能需要验证新的核心器件,这一过程耗时且复杂。此外,有些情况下客户可能没有足多时间进行测试,因此仍需沿用原有方案。所以,引入第二家供应方更多是一种商业策略,而非技术需求。国内800G光模块相较于海外市场便宜约20%至30%,目前800G产品在国内市场的主流售价约为40美元,而海外市场则接近50美元,这种差异主要源于两地对成本敏感度及定价策略的不同。
Q:LPO产品设计思路是什么,其当前进展如
A:LPO产品旨在通过减少一半DSP组件来进步降低功耗和成本。目前主流设计要求收发两端均配备DSP,但LPO尝试仅在发端保留DSP,从而实现性能与经济性的平衡。这种设计能够显著降低功耗,同时优化量产和使用体验。目前,该产品已送样给阿里巴巴,并计划向Meta提供样品。然而,目前尚未进入批量生产阶段。尽管阿里巴巴和腾讯对此类产品表现出浓厚兴趣,但由于其保守态度,他们倾向于等待海外客户验证半年后再大规模采用。
Q:PCle AEC领域的发展现状如何,公司有哪些布局?
A:公司已完成PCle AEC相关研发工作,并计划在PCle 6.0时代与Astera labs展开竞争。目前,公司拥有两个相关产品:Retimer和AEC。其中Retimer已被一家台湾AI服务器厂商导入应用,但具体名称未披露。此外,公司已通过PCle SIG 测试,并计划明年向亚马逊送样,同时也正在向微软推广相关Demo。从目前反馈来看,这些产品获得了较好的评价,但预计至少到2026年才能实现规模化应用。
Q:1.6T及3.2T AEC技术的发展前景如何,其生周期受到哪些因素制约?铜缆与芯片技术进步分别对AEC性能提升起到了怎样作用?
A:对于1.6T AEC,目前仅处于Demo阶段,MPW芯片已经回片,但正式AEC芯片预计要到2026年上半年才能推出。从测试结果来看,两米距离内传输无问题。而对于3.2T AEC,其发展面临更多挑战。如果能够将传输距离控制在两米以内,则该技术仍具备5至6年的生命周期,但若超出两米范围,则难以满足性能要求。未来发展还依赖铜缆材料、芯片均衡能力以及PCB材质等方面的进步。目前公司也正在预研存储及交换机领域的新方向,以应对长期技术升级需求。铜缆与芯片技术进步各占一半作用,铜缆方面,通过改良材料特性显著减少了信号损耗;而芯片方面,通过提升均衡能力增强了整体系统性能。例如,在1.6T AEC研发初期,两米传输距离曾被认为难以实现,但随着铜缆改良及芯片优化,如今甚至可以达到三米传输距离,这表明二者协同作用对于推动AEC性能提升至关重要。
$Credo Technology(CRDO)$ $沃尔核材(SZ002130)$ $立讯精密(SZ002475)$