用户头像
icefighter
 · 美国  

回复@大乐融融: 在NVIDIA H100GPU环境下,NetApp AFX (A90)和Infinidat InfiniBox SSA II实验取得了完全不同的性能优势:NetApp 关注于 AI 管道的吞吐能力,而 Infinidat 关注于延迟的极端一致性。
NetApp AFX:AI 吞吐王者
货运优势:在8节点的AFX集群测试中,NetApp达到了457 GiB/s的持续吞吐量,这比上一代提高了 33%。
GPU直接通信:通过NFS over RDMA和NVIDIA GDS技术,数据可以绕过CPU直接从AFX传输到H100的GPU内存中,极大地缩短了训练周期。
Infinidat:延迟与并发专家
低延迟优势:Infinidat 的InfiniBox SSA II在工作中真实负载能够提供低至35微秒的延迟。
高并发稳定性:其三控制器(Active/Active/Active)架构使其在面对H100处理海量小文件或高并发事务时,性能几乎没有达到。
3. 应用建议
训练大规模模型(LLM):建议选择NetApp AFX。其NVIDIA DGX SuperPOD认证架构能够提供PB级的数据吞吐能力,是典型的“AI工厂”配置。
实时与预测关键数据库:建议选择Infinidat。如果您的H100主要用于推理(Inference)或处理金融级实时交易,其无与伦比的低延迟和100%可用性保证是核心保障。//@大乐融融:回复@icefighter:联想需要 infinidat 来稀释对 netapp 的依赖

企业级AI步入深水区,破解高失败率魔咒到底靠什么?@阿明观察 :  企业级AI步入深水区,破解高失败率魔咒到底靠什么?  【全球存储观察 | 科技热点关注】
当前,中国的人工智能发展正从技术探索迈入行业应用阶段。在“十五五”规划将AI置于“新质生产力”核心位置的战略引领下,借助“政产学研用”的协同优势和超大规模市场的丰厚土壤,AI深度渗透进入科学技术、民生消费、产业发展、社会治理等关键领域,成为推...