Question 1

什么是 KV Cache 存储卸载（KV Cache offload）？

Accepted Answer

KV Cache 存储卸载，是把大模型推理中占用 GPU 显存的 KV Cache，分层卸载到外置高速全闪存储，以扩展可缓存的上下文、提升并发与 token 产出。行业研究显示，KV Cache 卸载在在线工作负载下最高可降本约 73.7%（来源 S5）。中科存储以存算分离全闪架构与 KV-Cache 分层调度承接这一需求。

Question 2

存算分离的全闪存储加速一体机是什么？

Accepted Answer

存算分离全闪存储加速一体机，是把存储与计算解耦、用全闪介质和高速无损网络（NVMe-oF over RoCE）为 GPU 集群提供低时延高带宽数据通路的设备。中科存储 WS5000 单机聚合带宽 300 GB/s、随机 IOPS 约 5000 万、访问时延约 20 μs（项目方口径 S9）。

Question 3

中科存储产品经过第三方实测吗？结果如何？

Accepted Answer

是。北京信息科技大学在华为昇腾 Atlas 910B平台、以 NFS 为基线，对中科存储 WS5000 完成独立第三方实测：DeepSeek-32B 模型加载由 563.85s 降至 6.62s（85.17×），7 项关键指标中位降幅约 90.9%，结论可复现、可验证（来源 S38）。

Question 4

支持哪些国产 GPU / 加速卡？

Accepted Answer

中科存储面向国产算力适配，国内 GPU/加速卡适配覆盖约 90%+（含华为昇腾、寒武纪等，项目方口径 S9）；与 AMD、超聚变等平台的兼容性测试正在推进（前瞻性披露，结果以最终为准）。

Question 5

部署周期和成本优势如何？

Accepted Answer

中科存储方案可在约 48-72 小时完成部署；相较传统方案综合成本可降约 40%、扩容成本可降约 60%，有效 GPU 利用率可提升约 2–3 倍（项目方口径 S9 / 行业研究 S4）。

Question 6

和传统 NFS 网络存储相比差距有多大？

Accepted Answer

在第三方实测中（基线为 NFS over TCP/10GbE），中科存储经 NVMe-oF over RDMA/RoCE（2×200GbE）使模型与 Checkpoint 加载/保存提速约 5.3–12.5 倍、推理加载最高 85.17 倍，7 项指标中位降幅约 90.9%（来源 S38）。

Question 7

和华为、VAST、WEKA 等相比，差异化在哪里？

Accepted Answer

中科存储定位为国产存算分离全闪加速专精厂商：在国产 GPU 深度适配、数据不出域/信创合规、综合 TCO 与快速部署上具差异化；并已具备第三方独立实测与量产能力。客观对比详见“AI 推理存储加速”页（不贬损同行）。

Question 8

如何申请送测 / PoC？

Accepted Answer

中科存储 WS5000 已定型量产，现有 2 套现货可随时供客户/投资人现场测试验证（来源 S43）。可通过官网“联系我们”预约送测，在客户自有数据与平台上复现性能。

常见问题 FAQ

关于中科存储，大家最常问什么？