回复@大乐融融: 在NVIDIA H100GPU环境下,NetApp AFX (A90)和Infinidat InfiniBox SSA II实验取得了完全不同的性能优势:NetApp 关注于 AI 管道的吞吐能力,而 Infinidat 关注于延迟的极端一致性。
NetApp AFX:AI 吞吐王者
货运优势:在8节点的AFX集群测试中,NetApp达到了457 GiB/s的持续吞吐量,这比上一代提高了 33%。
GPU直接通信:通过NFS over RDMA和NVIDIA GDS技术,数据可以绕过CPU直接从AFX传输到H100的GPU内存中,极大地缩短了训练周期。
Infinidat:延迟与并发专家
低延迟优势:Infinidat 的InfiniBox SSA II在工作中真实负载能够提供低至35微秒的延迟。
高并发稳定性:其三控制器(Active/Active/Active)架构使其在面对H100处理海量小文件或高并发事务时,性能几乎没有达到。
3. 应用建议
训练大规模模型(LLM):建议选择NetApp AFX。其NVIDIA DGX SuperPOD认证架构能够提供PB级的数据吞吐能力,是典型的“AI工厂”配置。
实时与预测关键数据库:建议选择Infinidat。如果您的H100主要用于推理(Inference)或处理金融级实时交易,其无与伦比的低延迟和100%可用性保证是核心保障。//@大乐融融:回复@icefighter:联想需要 infinidat 来稀释对 netapp 的依赖