AI数据中心格局与超级计算民主化

用户头像
Tintinji
 · 挪威  
创作声明:本文包含AI生成内容

$Nebius Group(NBIS)$ 近期与 $新聚思(SNX)$ 之间新建立的合作伙伴关系。此举不仅为双方带来了显著的商业价值,更对传统超大规模云服务商(Hyperscalers)以直销为主导的市场格局构成了重大的、基于渠道的挑战。在AI 原生云提供商(Neocloud)与超大规模云服务商(Hyperscalers)的直接竞争中,这是一种经典的非对称竞争策略:用一种完全不同的市场进入方式,来服务一个服务不足的客户群体。通过一种“渠道优先”的商业模式,利用信任关系、赋能合作伙伴并提供可预测的经济模型,来服务一个被现有巨头忽视的、庞大的中间市场。

文章目录:

1. 中小企业的AI转型落地难点(被现有巨头忽视的或者因为相对低价值规模化弱在目前算力稀缺的场景下被战略性弱化、但是庞大的中间市场)

2. Nebius的技术价值(Nebius有能力服务这个市场)

3.超大规模云服务商(Hyperscalers)(他们战略优先考量服务大型客户)

4. 如何建立增长飞轮(与SNX的合作, Nebius有机会快速切入这个市场)

5.“AI超级计算的民主化”(中小企业无缝使用AI是AI技术快速下沉的方向,也是整个社会全面AI转型的下一个阶段)

6. 总结 参考AWS

中小企业的AI转型落地难点

中小企业(SMBs)的AI技术采纳和应用上有巨大的障碍。主要包括财务、人才和组织架构变革的障碍:

1. 财务壁垒:GPU本地数据中心需要高昂的资本支出(Capex),对中小企业不可承受;

2. AI专业人才的稀缺:这也是很多欧洲国家的困境,无法用绝对的薪资吸引顶尖的AI人才;

3. 组织管理能力挑战:成功地将 AI 集成到现有业务流程中是一项复杂的系统工程。它不仅涉及技术层面的挑战,如确保数据质量、建立数据治理框架和管理复杂的基础设施,还包括组织层面的变革管理,这些都对企业的综合能力提出了极高要求 。

在这种情况下,AI 原生云提供商(Neocloud)更好地嵌合了中小企业的核心需求:简单低成本地快速将AI融入到现有业务和工作流,并获得稳定产出。Neocloud厂商从一开始就秉持“AI 优先”的理念进行设计。它们对技术栈的每一层——从硬件设计到软件服务——都进行了深度优化,旨在为 AI 工作负载提供极致的性能和成本效益 。而传统的超大规模云服务商(如 AWS, Azure, GCP)是在其通用云计算平台的基础上“改造”以适应 AI 负载,主要服务于市场顶端的大型企业客户。问题在于,中小企业很多都没有能力或者缺乏必要的专业知识来利用复杂的云平台,而这部分市场,正是将自身定位为“AI 原生”云 ,以“普及 AI 基础设施”为使命的Nebius这样的公司切入的地方。

Nebius的技术价值

市场上很多对于Nebius的批评声音会基于这样的论调:NBIS也没什么技术实力,就是拿到GPU然后组装起来,拿地建数据中心的施工队。这也是对Nebius商业模式和技术实力的一种常见的误解。 这种说法大大简化了 Nebius 的技术能力,并忽略了其在 AI 计算领域真正的差异化优势。虽然获取 GPU 和建设数据中心是其业务的基础,但这仅仅是起点。Nebius 的核心技术实力体现在如何将这些独立的组件垂直整合并深度优化成一个专为 AI 工作负载设计的高性能、高效率的统一平台

以下几点可以系统地反驳“施工队”这一观点:

1. 硬件层的深度定制与创新,而非简单组装。Nebius 并非简单地将购买的 GPU 插入现成的服务器。他们进行自主的硬件设计,以最大化性能和效率:他们将 GPU 安装到“自己设计的服务器和机架”中 。这种设计针对液体冷却和高密度部署进行了优化,这是在超级计算规模下实现能效和性能最大化的关键工程挑战,远非简单的“组装”可比。并构建世界顶级的超级计算机:在其芬兰数据中心,Nebius 建造了 ISEG,名列全球最强超级计算机第19位(Top500 2024年11月,芬兰Mäntsälä,35.26 GFlops/watts的性能,同时为当地2000多户家庭供暖, 参考芬兰中心)。这本身就是一项世界级的工程成就,需要深厚的系统架构和集成能力。

[心心]Nebius冰岛数据中心ISEG2,以及其性能解析:

这种速度与效率的完美结合,正是 Nebius 这类“新形态云”提供商的核心价值所在:将以往遥不可及的超级计算能力,以一种经济高效且对环境友好的方式,“民主化”地提供给每一位创新者。

2. 超级计算机级别的网络架构,而非标准网络。AI 训练的瓶颈往往不在于单个 GPU 的速度,而在于数千个 GPU 之间通信的效率。这正是 Nebius 技术实力的核心体现:高性能网络技术:他们采用 NVIDIA Quantum InfiniBand 网络,每个主机带宽高达 3.2Tbit/s 。这是一种专为高性能计算(HPC)和 AI 集群设计的低延迟、高带宽网络技术,与标准数据中心以太网有天壤之别。 优化的通信协议:Nebius 利用 GPUDirect RDMA 等技术,允许 GPU 直接通过网络进行通信,绕过 CPU,从而最大限度地减少了节点间通信的延迟 。这对于大规模分布式训练至关重要,是实现接近线性扩展效率的关键。

关于通信协议带来效率提升的具体解释:

那么这种传输技术和NVLink有什么关系,其他厂商有类似的技术吗,是否有相关的专利垄断?

3. 完整的软件与服务栈,而非裸金属租赁 :仅仅提供硬件访问权限的公司才是“施工队”。Nebius 提供的是一个从基础设施即服务(IaaS)到平台即服务(PaaS)的完整软件生态系统,旨在简化和加速 AI 开发的全过程 : 多样化的编排工具:同时支持为云原生应用设计的托管式 Kubernetes 和为传统高性能计算(HPC)工作负载设计的 Slurm 。这种灵活性表明他们深刻理解并服务于 AI 开发者多样化的工作流程。 增值平台服务 (AI Studio):提供 AI Studio 这样的 PaaS/SaaS 层服务,支持模型的构建、微调和运行,进一步降低了用户使用 AI 基础设施的门槛 。 全栈优化:Nebius 强调其价值在于“优化技术栈的每一层” 。这意味着从硬件驱动、网络协议到上层的管理软件,都经过了精心的设计和调优,以确保整个系统作为一个整体高效运行。

4. 内部 AI 研发与外部权威验证 一家公司的技术实力不仅体现在其产品上,也体现在其团队和行业地位上:内部 AI 研发团队:Nebius 拥有一支内部 AI 研发团队,该团队作为其平台的首批用户(即“dogfooding”),不断测试和反馈,确保平台功能紧密贴合机器学习从业者的真实需求 。这形成了一个持续优化的正向循环,是纯粹的基础设施提供商所不具备的。据统计,Nebius 拥有约 400 名 AI/ML/云工程师的强大研发核心。NVIDIA 的顶级认证:Nebius 是 NVIDIA 的“参考平台云合作伙伴”(Reference Platform Cloud Partner)。这是一个非常重要的行业背书,意味着其架构是与 NVIDIA 协同设计、经过测试和优化的,达到了 NVIDIA 认可的最高标准。这绝非一个普通的硬件集成商或数据中心运营商能够获得的认证。

超大规模云服务商(Hyperscalers)的战略

当前 AI 云计算市场的一个核心结构性矛盾就是:中小企业(SMBs)的 AI 转型市场之所以被超大规模云服务商(Hyperscalers)在一定程度上忽视或战略性弱化。这主要源于以下几个相互关联的原因:

这正是像 Nebius 这样的“新形态云”与 TD SYNNEX 这样的“解决方案聚合商”合作所瞄准的战略真空 。他们不是试图与超大规模云服务商争夺顶级客户,而是通过一种完全不同的“渠道优先”模式,赋能成千上万的本地 IT 合作伙伴(MSP、VAR 等),由这些合作伙伴去服务他们已经建立了深度信任关系的本地中小企业客户。【关于IT服务这个市场后面会有详细介绍,参见“超级计算的民主化”】

总而言之,中小企业的 AI 转型市场并非价值低,而是单个客户的价值对于超大规模云服务商的高成本直销模式来说显得不经济。在算力稀缺的背景下,他们自然会战略性地将宝贵资源集中在利润最高的大型企业客户上。这就在客观上形成了一个庞大但服务不足的“中间市场”,为以渠道为核心、专注于简化和普及 AI 基础设施的新商业模式创造了历史性的机遇。

如何建立增长飞轮(与SNX的合作)

尽管 Nebius 在技术上取得了巨大成功,并且实现了惊人的增长(一份报告显示其年同比增长率高达 625%),但其面临的主要挑战是如何快速扩大其市场进入(Go-to-Market)的规模。要触及全球范围内数量庞大且分散的企业和中小型企业客户,需要建立一个庞大的销售和支持网络,而这既耗时又耗资巨大。

与传统数据中心业务一样,早期的渠道覆盖和获客是开启增长飞轮的重要起点。这时,就需要一个 TD SYNNEX 这样的公司,一个全球 IT 分销商与解决方案聚合商。

我们可以看出,作为一家综合的基础设施提供商,TD SYNNEX有需求将AI云服务加入到自己的产品线当中,保持自己对于客户的竞争力和全面服务的设定。而Nebius可以绕过通常需要数年时间和数十亿美元才能建立起来的同等规模的直销团队和渠道计划,获得了即时且规模化地进入北美最大、最成熟的 IT 渠道生态系统的通道 。

双方的高层也在合作的 声明中阐述了对未来的愿景和合作的方向。对 TD SYNNEX来说,该合作为其宏大的Destination AI”计划提供了底层的、高性能的“引擎” 。它使 TD SYNNEX 从一个 AI 软件产品的分销商,转变为整个 AI 解决方案生命周期的基础赋能者。此举巩固了其在 AI 时代作为不可或缺的解决方案聚合商的角色,并生动地展示了分销商如何能够成为新兴技术的“力量倍增器” 。

“AI超级计算的民主化”

根据之前的研究,我们了解到了这个中小企业AI转型的IT服务市场,是一个被超大规模云服务商选择性弱化,Nebius有技术和意愿提供服务但是渠道受限,而企业本身IT能力又不强,但是他们却有能力从传统的IT渠道中获得一如既往的非AI服务,那么,最后AI转型流程的障碍就在于IT服务供应链中,中间商的选择。为了理解这一点,我们需要了解IT服务行业的结构。

这是整个合作中最具变革性的方面。它赋能了成千上万的管理服务提供商(MSP)、增值经销商(VAR)和系统集成商,使其能够进入利润丰厚的 AI 解决方案市场 。在过去,这个市场几乎是大型企业和专业咨询公司的专属领域。TD SYNNEX 高级副总裁 Francisco Criado 关于“普及现代 AI 市场”的论述,正是此处的关键所在 。它使得一家本地的 MSP 能够为其所在区域的制造企业客户提供复杂的 AI 模型训练解决方案,这在以前是不可想象的。

这就是“超级计算的民主化”的真正含义 。它将原本只有财力雄厚的大公司和技术精英才能接触到的尖端技术,通过一个成熟、庞大的渠道网络(由成千上万的 MSP、VAR 和 SI 组成),下沉到了广大的中端市场。它让每一个企业都能通过他们身边已经信任的 IT 伙伴,轻松地获得和使用 AI 的强大能力。

商业逻辑上,这个变革的意义在于它改变了市场进入(Go-to-Market)的基本规则。这是两种云服务商的商业模式,以及运营逻辑的冲突:即谁拥有最终客户关系,以及如何服务于广大的中间市场

1. 【它“武器化”了IT渠道的信任关系超大规模云服务商的模式是中心化的,他们希望成为所有客户的“唯一真理来源”。而 Nebius-TD SYNNEX 的模式是分布式的。它认识到一个事实:对于一家本地的中型制造企业来说,他们最信任的不是远在西雅图的云巨头销售代表,而是为他们服务了十年的本地 IT 服务商(MSP 或 VAR)。

这次合作将最顶尖的 AI 计算能力,交到了这些“受信任的本地顾问”手中。这使得最终客户的购买决策从“是否要冒险采用一个复杂的新平台”转变为“是否要从我信任的 IT 伙伴那里购买一项新服务”。这极大地降低了客户的采纳门槛。

2. 【它将合作伙伴从“代理人”提升为“老板”】在超大规模云服务商的生态中,许多合作伙伴的角色更像是“销售代理”或“实施顾问”,他们帮助客户使用 AWS 或 Azure,并从中赚取服务费,但最终客户仍然是云巨头的客户。

Nebius-TD SYNNEX 的模式则完全不同。它让 MSP 和 VAR 能够创建属于自己的、贴牌的 AI 服务。他们可以基于 Nebius 提供的可预测成本,设计自己的服务包(例如,“AI 模型微调服务包,每月 X 美元”),加上自己的利润,然后直接销售给客户。这使得合作伙伴从价值链的下游参与者,一跃成为拥有自己产品和客户的“老板”,这对于渠道生态系统具有巨大的吸引力。

3.【它在经济模式上发起了攻击】AI 基础设施极其昂贵。超大规模云服务商的消费定价模型对于需要持续、大规模计算的 AI 训练任务来说,成本可能失控。

Nebius-TD SYNNEX 提供的“基础设施即服务”(IaaS)模式,结合了 TD SYNNEX 强大的金融服务能力,将巨额的前期资本支出(Capex)转变为可预测的运营支出(Opex)。这对于现金流敏感的中端市场企业极具吸引力。它使得 AI 不再仅仅是财力雄厚的巨头的“专利”,而成为了一项更多企业能够负担得起的、类似水电煤的基础设施服务。

总结 参考AWS

二十一世纪初,亚马逊网络服务(AWS)的崛起,本质上是一场计算能力的“民主化”革命。在此之前,企业需要投入巨额资本(Capex)购买服务器、建设数据中心。AWS通过“按需付费、在线自助”的模式,将昂贵的计算和存储资源变成了像水电一样的公用事业,赋能了无数无法承担传统IT成本的初创公司和中小企业,并最终颠覆了IBM、Oracle等传统IT巨头。(这里就只能说,美国很多公司真的牛,这两家公司现在又焕发第二春了)

今天,Nebius及其“Neocloud”同盟正在推动一场“AI超级计算的民主化”,但其路径与AWS有着根本不同:

AWS的民主化,是面向开发者和终端用户自助服务模式(Self-Service Model)。它降低了技术门槛,但要求用户具备相当的专业知识来驾驭其复杂的产品体系。

Nebius-新聚思的民主化,是面向IT渠道伙伴(MSP/VAR)的深度赋能模式(Enablement Model)。它认识到,广大的中小企业并不直接消费复杂的技术,而是通过他们长期信任的本地IT服务商来获得解决方案。

面对AI浪潮,AWS等超大规模云服务商正努力将其AI能力嫁接到现有庞大复杂的云平台上,其渠道策略也倾向于让合作伙伴成为其服务的“延伸销售臂”或“实施顾问”,最终客户关系和核心价值仍归属于平台本身。而Nebius-SNX的策略则是另辟蹊径:他们不与巨头在顶端市场直接竞争最终客户,而是竞争服务这些最终客户的成千上万的渠道伙伴。 他们通过提供技术上卓越且经济上可预测的基础设施,将渠道伙伴“武器化”,使其能够创建自己的AI服务品牌,掌握客户关系和利润空间。这是一场新时代的非对称竞争:争夺“服务者”而非“被服务者”。

这场合作的真正意义在于,它开启了一场关于如何将AI能力规模化地交付给广大中间市场的模式之战。如果说AWS通过技术和商业模式创新,让“计算”进入了寻常百姓家;那么Nebius-新聚思则试图通过顶尖技术与渠道模式的深度捆绑,让“AI超级计算”也能通过那些最值得信赖的本地IT顾问,流入到每一个需要它的中小企业中。

这不仅是对超大规模云服务商现有市场策略的重大挑战,更是推动整个社会从“部分精英的AI”迈向“全面普惠的AI”这一新阶段的关键催化剂。