技术交流 PPT · 中科存储 vs NVIDIA

面向技术交流的 HTML 幻灯：存算分离全闪存储与 NVIDIA 推理新范式的客观对比，含 NVIDIA 官方技术描述与链接，可全屏演示、可导出 PDF。

这是一份什么样的材料？

这是中科存储面向技术交流的 HTML 幻灯（模仿 PPT），把中科存储的存算分离全闪存储技术栈，与 NVIDIA 的推理新范式（Dynamo 分离式服务、KVBM 分层 KV Cache 卸载、GPUDirect Storage、NIXL）逐项客观对比，并如实引用 NVIDIA 官方对这些相似技术的描述与链接。

定位是公允、不贬损、可查证：中科存储数值取自单一数据源（含第三方实测 S38、项目方口径 S9），NVIDIA 描述均来自其官方公开文档。二者「同一范式、不同层次」，互补互通——存算分离全闪存储底座正是该范式所依赖的一环，中科存储面向国产算力底座（昇腾 / 国产 GPU）提供这一底座。

全屏打开技术交流 PPT ↗

逐项对标 NVIDIA

存算分离 ↔ Dynamo、KV Cache 卸载 ↔ KVBM、GPU 直通 ↔ GPUDirect Storage、数据通路 ↔ NIXL。

可查证 · 不贬损

中科存储数值带 S9/S38 口径；NVIDIA 描述均附官方链接，以各方最新官方资料为准。

可演示 · 可导出 PDF

16:9 幻灯，方向键 / 点击翻页、按 O 总览；浏览器「打印 → 另存为 PDF」即得横向单页 PPT。

COMPARISON

中科存储 vs NVIDIA · 客观对比总表

以下为 PPT 中的对比总表（同源渲染，便于检索与引用）；具体以各方最新官方信息为准。

维度	中科存储 WS5000	NVIDIA 对应能力（官方）
定位层次	全闪存储一体机（硬件底座）	推理编排 / IO 软件框架（Dynamo·NIXL·GDS）
存算分离	硬件 EBOF + NVMe-oF/RoCE	Dynamo 分离式服务（prefill/decode 分离）
KV Cache 卸载	KV-Cache 分层调度（显存↔全闪）	KVBM 分层 G1→G4（GPU→CPU→SSD→远端）
GPU 直通路径	GPUDirect 直通 + NVMe-oF	GPUDirect Storage（GPU↔NVMe/NVMe-oF DMA）
主力算力适配	国产 GPU / 昇腾 90%+（S9）	以 NVIDIA GPU 生态为主
数据不出域 / 信创	强（自主可控）	视部署与合规评估
第三方实测	有（北京信息科技大学·昇腾910B，S38）	以官方 / 合作方资料为准
关系	互补：可作该范式的国产存储底座	开放接入第三方存储（WEKA / Dell 等）

口径说明

本表仅作客观维度对照，不构成对第三方的贬损。中科存储为全闪存储一体机（硬件底座），NVIDIA 为推理 / IO 软件框架，二者互补；中科存储数值标注项目方口径（S9）/ 第三方实测（S38）。

NVIDIA SOURCES

NVIDIA 官方对相似技术的描述与链接

以下描述均如实引自 NVIDIA 官方文档与开源仓库，可点击核验。

NVIDIA GPUDirect Storage（Magnum IO GDS）
「GPUDirect Storage 在本地或远端存储（如 NVMe 或 NVMe over Fabrics）与 GPU 显存之间建立直达数据通路，绕过 CPU 内存中的中转缓冲（bounce buffer），由靠近网卡或存储的 DMA 引擎直接把数据搬入 / 搬出 GPU 显存。」
NVIDIA Developer · GPUDirect · GPUDirect Storage Overview Guide
NVIDIA Dynamo · 分离式推理服务（Disaggregated Serving）
「分离式服务把 prefill（预填充）与 decode（解码）放在不同设备上运行，使两者能各自独立扩展与并行；它需要三项能力：调度、用于 KV Cache 卸载与回载的内存管理，以及在节点间与内存层级间搬运 KV Cache 的低时延数据传输。」
NVIDIA Dynamo · Introduction · ai-dynamo/dynamo (GitHub)
NVIDIA Dynamo KVBM · KV Cache 分层卸载
「KV Block Manager（KVBM）提供一套统一内存 API，横跨 GPU 显存、锁页主机内存、远端 RDMA 可访问内存、本地 / 分布式 SSD，以及远端文件 / 对象 / 云存储；把 KV Cache 从 HBM 卸载到更廉价的存储层（G1 GPU → G2 CPU → G3 SSD → G4 远端），可加快 TTFT、降低 TCO 并支持更长上下文。」
NVIDIA Dynamo · KVBM
NVIDIA NIXL · 推理数据传输库
「NIXL（NVIDIA Inference Xfer Library）是一套低时延、与厂商无关的数据传输库，通过非阻塞 API 在 GPU 显存、CPU 内存与存储层（SSD / 远端）之间高吞吐搬运 KV Cache，服务于分离式 KV Cache 迁移、长上下文存储与模型权重传输等场景。」
NVIDIA Technical Blog · NIXL · ai-dynamo/nixl (GitHub)

PREVIEW

在线预览

下方为内嵌 PPT，支持方向键 / 点击翻页；建议全屏查看，并可在 PPT 内点击「导出 PDF」。

在新窗口全屏打开 PPT（按 ⎙ 导出 PDF） ↗

说明：本页 PPT 提供中英双语版本，随官网语言切换；所有数据可追溯、可复现。

用您自己的数据，跑出加载与吞吐对比

现有 2 套现货样机可即时送测。让数据说话，是最高效的验证方式。

预约送测 → 联系我们

最后更新：2026-06-28