转:花旗對 NVIDIA 的看法
昨天,在花旗銀行年度矽谷巴士之旅期間,我們與 NVIDIA 網路業務高級副總裁 Kevin Deierling 進行了一次投資者會議。總的來說,NVIDIA 在 AI 領域構建的「全棧護城河」給我們留下了深刻的印象,它涵蓋了運算、網路和儲存領域。以下是一些關鍵要點:
一切圍繞人工智慧
該公司專注於人工智慧所需的網路功能。 NVIDIA 擁有統一的網路作業系統,專注於優化運算和存儲,核心目標是實現最低的每秒用戶代幣成本(TCO) 。 Dynamo 是針對人工智慧工廠的作業系統。自從 Mellanox 被 NVIDIA 收購後,團隊停止了園區交換器的開發,並將重點轉向人工智慧交換機,因為電信/大規模網路的響應邏輯與人工智慧代理流的響應邏輯不同。
Spectrum-X 銷售
在近期公佈的第一季財報中,網路業務實現了64%的環比強勁成長,達到50億美元。這一增長似乎涵蓋了從“橫向擴展”到“縱向擴展”的產品。在「縱向擴展」方面,該公司憑藉其NVLink解決方案實現了超過10億美元的銷售額;在「橫向擴展」方面,該公司繼續推進其Spectrum-X(乙太網路)產品組合,並新增了兩家客戶。 Spectrum-X的季度營收運作率為20億美元,涵蓋NIC(網路介面卡)和交換器。
Infiniband 與乙太網
乙太網路仍在不斷發展,但 Infiniband 仍然是事實上的標準。超大規模客戶出於熟悉度考慮會選擇乙太網,而 NVIDIA 在 Spectrum-X 方面擁有強大的能力。儘管像 Arista 及其 EOS 系統這樣的通用供應商正試圖從傳統的資料中心交換業務轉型到 AI 應用,但 NVIDIA 的優勢在於其完整的技術堆疊。博通在市場上的主要產品是 Tomahawk,而不是 Jericho 平台,後者提供了可編程性,但會增加延遲。
NVLink
NVLink 是一個專為 AI 量身訂做的機架式「擴充」平台。它透過快取一致性介面連接多個 GPU(最多 72 個)。更大的 LLM 模型受益於大規模 GPU 擴展,有時開發人員會基於硬體 GPU 堆疊來建立模型。客戶無需從 NVIDIA 購買整個技術堆疊;他們可以根據需要購買,例如 SuperNIC、交換器和用於半定制 AI 基礎設施的 NVLink Fusion。
共封裝光學元件 (CPO)
NVLink 使用超過三英里長的銅纜。銅線功耗低且價格低廉。然而,在橫向擴展時使用 CPO 的原因是,PCB 上 10 到 15 英寸長的銅線會產生很大的噪聲,需要額外的 DSP 和重定時器來處理。為了避免這個問題,光學元件可以直接封裝在 ASIC 旁邊,將訊號轉換為光訊號,從而無需 DSP 和重定時器。