> **来源:[研报客](https://pc.yanbaoke.cn)** # 守护 AI 数据: GPU 如何重塑格局 总结 ## 核心内容 本文档探讨了AI工作负载对存储系统的要求,以及SupremeRAID™ 2.0与InnoGrit N3X SLC NVMe SSD硬盘的结合如何显著提升存储性能。重点分析了GPU卸载技术在RAID处理中的应用,特别是在奇偶校验RAID(RAID5/6)场景下的性能表现与CPU效率提升。 ## 主要观点 - AI工作负载具有大规模、高度并行、突发性以及对数据一致性和系统稳定性要求高的特点。 - 传统RAID方案(如Linux MD)在面对高强度的随机写入负载时,存在明显的性能瓶颈和CPU资源消耗问题。 - SupremeRAID™ 2.0通过引入GPU卸载技术,显著提升了RAID5/6在各种负载下的性能表现,特别是在降级模式下依然能保持高吞吐量。 - 该方案有效解决了传统RAID中“写入空洞”问题,避免了CPU在奇偶校验计算和中断处理中的高开销。 - 在4K和1M随机读写场景下,SupremeRAID™ 2.0分别实现了比Linux MD高4.7倍和26倍的读取效率,以及高41倍和107倍的写入效率。 ## 关键信息 ### 硬件配置 - **RAID控制器**:SupremeRAID™ Ultra,搭载NVIDIA RTX 2000E Ada GPU,功耗仅为50W。 - **存储介质**:24块InnoGrit N3X SLC NVMe SSD硬盘,基于KIOXIA XL-flash™技术,具备极低时延与确定性性能。 - **系统环境**: - CPU: AMD EPYC 9755 128核处理器 × 2 - 内存: 32GB DDR5-6400 RDIMM × 24 - 操作系统: Ubuntu 24.04.2 LTS - 内核: 6.8.0-62Generic - 基准工具: fio-3.40 ### 性能对比 #### 4K 随机读取性能 - **RAID5 最佳**:Linux MD 28.6M IOPS,SupremeRAID™ 2.0 36.2M IOPS(+26%) - **RAID5 降级**:Linux MD 0.163M IOPS,SupremeRAID™ 2.0 12.6M IOPS(77x) - **RAID6 最佳**:Linux MD 27.9M IOPS,SupremeRAID™ 2.0 36.2M IOPS(+29%) - **RAID6 降级**:Linux MD 0.186M IOPS,SupremeRAID™ 2.0 12.6M IOPS(67x) #### 4K 随机写入性能 - **RAID5 最佳**:Linux MD 0.223M IOPS,SupremeRAID™ 2.0 6.477M IOPS(29x) - **RAID5 降级**:Linux MD 0.246M IOPS,SupremeRAID™ 2.0 6.466M IOPS(26x) - **RAID6 最佳**:Linux MD 0.149M IOPS,SupremeRAID™ 2.0 5.687M IOPS(38x) - **RAID6 降级**:Linux MD 0.147M IOPS,SupremeRAID™ 2.0 5.499M IOPS(37x) #### 1M 随机读取性能 - **RAID5 最佳**:两者性能相近,均为约323GB/s。 - **RAID5 降级**:Linux MD 12.9GB/s,SupremeRAID™ 2.0 210GB/s(16x) - **RAID6 最佳**:两者性能相近,均为约323GB/s。 - **RAID6 降级**:Linux MD 12.7GB/s,SupremeRAID™ 2.0 208GB/s(16x) #### 1M 随机写入性能 - **RAID5 最佳**:Linux MD 14.8GB/s,SupremeRAID™ 2.0 242GB/s(16x) - **RAID5 降级**:Linux MD 14.2GB/s,SupremeRAID™ 2.0 218GB/s(15x) - **RAID6 最佳**:Linux MD 15.4GB/s,SupremeRAID™ 2.0 233GB/s(15x) - **RAID6 降级**:Linux MD 15.8GB/s,SupremeRAID™ 2.0 212GB/s(13x) ### CPU效率分析 - **4K 随机读取**: - Linux MD: 每IOPS的CPU使用率为3.5% - SupremeRAID™ 2.0: 每IOPS的CPU使用率仅为0.74%,效率提升4.7倍。 - **1M 随机读取**: - Linux MD: 每10GB/s的CPU使用率为2.35% - SupremeRAID™ 2.0: 每10GB/s的CPU使用率仅为0.1%,效率提升26倍。 - **4K 随机写入**: - Linux MD: 每IOPS的CPU使用率为77.26% - SupremeRAID™ 2.0: 每IOPS的CPU使用率仅为1.87%,效率提升41倍。 - **1M 随机写入**: - Linux MD: 每10GB/s的CPU使用率为33.24% - SupremeRAID™ 2.0: 每10GB/s的CPU使用率仅为0.31%,效率提升107倍。 ## 结论 SupremeRAID™ 2.0通过将RAID处理任务卸载至GPU,显著提升了AI工作负载下的存储性能与系统稳定性。其在RAID5和RAID6配置下,即使在降级模式下,也能保持高性能与低CPU开销,从而释放更多计算资源用于AI任务。该方案在高密度、高能效方面表现出色,是下一代AI存储节点的理想选择。 ## 附录(简要) - **测试方法**:使用fio工具对RAID5/6进行基准测试,分别模拟最佳和降级状态。 - **测试步骤**: - 创建物理驱动器 - 创建RAID组 - 创建虚拟驱动器 - 运行fio测试 - 强制单个驱动器故障以测试降级状态 - **免责声明**:性能结果可能因系统配置、工作负载及其他因素而有所不同。 ## 技术亮点 - **GPU卸载**:通过NVIDIA RTX 2000E Ada GPU实现I/O处理任务卸载,显著降低CPU负载。 - **SLC NVMe SSD**:InnoGrit N3X采用SLC架构,提供低时延和高吞吐能力。 - **奇偶校验RAID优化**:SupremeRAID™ 2.0重新设计了I/O卸载引擎,解决了传统RAID性能瓶颈问题。 - **高密度部署**:支持24盘配置,适用于大规模AI训练与推理场景。