技术交流 PPT · 中科存储 vs NVIDIA
面向技术交流的 HTML 幻灯:存算分离全闪存储与 NVIDIA 推理新范式的客观对比,含 NVIDIA 官方技术描述与链接,可全屏演示、可导出 PDF。
这是一份什么样的材料?
这是中科存储面向技术交流的 HTML 幻灯(模仿 PPT),把中科存储的存算分离全闪存储技术栈,与 NVIDIA 的推理新范式(Dynamo 分离式服务、KVBM 分层 KV Cache 卸载、GPUDirect Storage、NIXL)逐项客观对比,并如实引用 NVIDIA 官方对这些相似技术的描述与链接。
定位是公允、不贬损、可查证:中科存储数值取自单一数据源(含第三方实测 S38、项目方口径 S9),NVIDIA 描述均来自其官方公开文档。二者「同一范式、不同层次」,互补互通——存算分离全闪存储底座正是该范式所依赖的一环,中科存储面向国产算力底座(昇腾 / 国产 GPU)提供这一底座。
逐项对标 NVIDIA
存算分离 ↔ Dynamo、KV Cache 卸载 ↔ KVBM、GPU 直通 ↔ GPUDirect Storage、数据通路 ↔ NIXL。
可查证 · 不贬损
中科存储数值带 S9/S38 口径;NVIDIA 描述均附官方链接,以各方最新官方资料为准。
可演示 · 可导出 PDF
16:9 幻灯,方向键 / 点击翻页、按 O 总览;浏览器「打印 → 另存为 PDF」即得横向单页 PPT。
中科存储 vs NVIDIA · 客观对比总表
以下为 PPT 中的对比总表(同源渲染,便于检索与引用);具体以各方最新官方信息为准。
| 维度 | 中科存储 WS5000 | NVIDIA 对应能力(官方) |
|---|---|---|
| 定位层次 | 全闪存储一体机(硬件底座) | 推理编排 / IO 软件框架(Dynamo·NIXL·GDS) |
| 存算分离 | 硬件 EBOF + NVMe-oF/RoCE | Dynamo 分离式服务(prefill/decode 分离) |
| KV Cache 卸载 | KV-Cache 分层调度(显存↔全闪) | KVBM 分层 G1→G4(GPU→CPU→SSD→远端) |
| GPU 直通路径 | GPUDirect 直通 + NVMe-oF | GPUDirect Storage(GPU↔NVMe/NVMe-oF DMA) |
| 主力算力适配 | 国产 GPU / 昇腾 90%+(S9) | 以 NVIDIA GPU 生态为主 |
| 数据不出域 / 信创 | 强(自主可控) | 视部署与合规评估 |
| 第三方实测 | 有(北京信息科技大学·昇腾910B,S38) | 以官方 / 合作方资料为准 |
| 关系 | 互补:可作该范式的国产存储底座 | 开放接入第三方存储(WEKA / Dell 等) |
口径说明
本表仅作客观维度对照,不构成对第三方的贬损。中科存储为全闪存储一体机(硬件底座),NVIDIA 为推理 / IO 软件框架,二者互补;中科存储数值标注项目方口径(S9)/ 第三方实测(S38)。
NVIDIA 官方对相似技术的描述与链接
以下描述均如实引自 NVIDIA 官方文档与开源仓库,可点击核验。
- NVIDIA GPUDirect Storage(Magnum IO GDS)
「GPUDirect Storage 在本地或远端存储(如 NVMe 或 NVMe over Fabrics)与 GPU 显存之间建立直达数据通路,绕过 CPU 内存中的中转缓冲(bounce buffer),由靠近网卡或存储的 DMA 引擎直接把数据搬入 / 搬出 GPU 显存。」
NVIDIA Developer · GPUDirect · GPUDirect Storage Overview Guide - NVIDIA Dynamo · 分离式推理服务(Disaggregated Serving)
「分离式服务把 prefill(预填充)与 decode(解码)放在不同设备上运行,使两者能各自独立扩展与并行;它需要三项能力:调度、用于 KV Cache 卸载与回载的内存管理,以及在节点间与内存层级间搬运 KV Cache 的低时延数据传输。」
NVIDIA Dynamo · Introduction · ai-dynamo/dynamo (GitHub) - NVIDIA Dynamo KVBM · KV Cache 分层卸载
「KV Block Manager(KVBM)提供一套统一内存 API,横跨 GPU 显存、锁页主机内存、远端 RDMA 可访问内存、本地 / 分布式 SSD,以及远端文件 / 对象 / 云存储;把 KV Cache 从 HBM 卸载到更廉价的存储层(G1 GPU → G2 CPU → G3 SSD → G4 远端),可加快 TTFT、降低 TCO 并支持更长上下文。」
NVIDIA Dynamo · KVBM - NVIDIA NIXL · 推理数据传输库
「NIXL(NVIDIA Inference Xfer Library)是一套低时延、与厂商无关的数据传输库,通过非阻塞 API 在 GPU 显存、CPU 内存与存储层(SSD / 远端)之间高吞吐搬运 KV Cache,服务于分离式 KV Cache 迁移、长上下文存储与模型权重传输等场景。」
NVIDIA Technical Blog · NIXL · ai-dynamo/nixl (GitHub)
在线预览
下方为内嵌 PPT,支持方向键 / 点击翻页;建议全屏查看,并可在 PPT 内点击「导出 PDF」。
说明:本页 PPT 提供中英双语版本,随官网语言切换;所有数据可追溯、可复现。
最后更新: