国产 GPU / 昇腾 存储适配
面向昇腾与国产算力的存算分离全闪存储底座:深度适配、数据不出域、更优 TCO。
什么是国产 GPU / 昇腾 存储适配?
国产 GPU / 昇腾 存储适配,是让存储系统与昇腾等国产加速卡在协议、驱动与数据通路上深度协同,为信创算力提供低时延、高带宽的存储底座。中科存储面向国产算力适配,国内 GPU/加速卡适配覆盖约 90%+(含华为昇腾、寒武纪等,项目方口径 S9)。
为什么国产算力中心尤其需要它?
因为存储 IO 常是大模型训练与推理的隐形瓶颈:IO 受限时有效 GPU 利用率常仅 30–50%,经存储加速可提升约 2–3 倍(来源 S4)。对以昇腾为核心的信创集群,用对口的存算分离底座把卡用满,通常比继续增购加速卡更经济。
中科存储如何适配昇腾与国产 GPU?
以存算分离全闪架构 + NVMe-oF over RoCE 高速无损通路承接:单机聚合带宽 300 GB/s、访问时延约 20 μs。经 北京信息科技大学 在 华为昇腾 Atlas 910B 平台、以 NFS 为基线的独立第三方实测,DeepSeek-32B 模型加载由 563.85s 降至 6.62s(85.17×),7 项指标中位降幅约 90.9%(来源 S38)。
数据不出域与信创合规
存算分离 + 自主可控的软硬件栈,支持数据本地化与信创合规,适合对数据主权与供应链安全有要求的政企与算力园区场景。
与 KV Cache 存储卸载的关系
昇腾推理场景中,KV Cache 会占用大量显存;把 KV Cache 分层卸载到本方案的高速全闪,可扩展上下文、提升并发与 token 产出——详见 KV Cache 存储卸载指南。
延伸阅读:产品 WS5000 / WS7000 · 核心技术 · 第三方实测验证。
| 适配维度 | 中科存储 WS 系列 | 口径 / 来源 |
|---|---|---|
| 国产 GPU/加速卡适配 | 约 90%+(昇腾、寒武纪等) | 项目方口径 S9 |
| 昇腾 910B 第三方实测 | 7 项指标中位降幅约 90.9% | 第三方实测 S38 |
| 数据通路 | NVMe-oF over RoCE(2×200GbE),300 GB/s、约 20 μs | 项目方口径 S9 |
| 数据不出域 / 信创 | 支持本地化部署与自主可控 | 架构能力 |
| 部署周期 | 约 48-72 小时 | 项目方口径 S9 |
| 综合成本 / 扩容成本 | 约 -40% / -60% | 项目方口径 S9 / 行业 S4 |
口径说明
上表为项目方口径(S9)与第三方实测(S38)、行业研究(S4)的客观汇总,仅供选型参考;具体以各方最新官方信息与实测报告为准。
国产 GPU / 昇腾 存储适配常见问题
支持哪些国产 GPU / 加速卡?
中科存储面向国产算力适配,国内 GPU/加速卡适配覆盖约 90%+(含华为昇腾、寒武纪等,项目方口径 S9);与 AMD、超聚变等平台的兼容性测试正在推进(前瞻性披露,结果以最终为准)。
和华为、VAST、WEKA 等相比,差异化在哪里?
中科存储定位为国产存算分离全闪加速专精厂商:在国产 GPU 深度适配、数据不出域/信创合规、综合 TCO 与快速部署上具差异化;并已具备第三方独立实测与量产能力。客观对比详见“AI 推理存储加速”页(不贬损同行)。
中科存储产品经过第三方实测吗?结果如何?
是。北京信息科技大学在华为昇腾 Atlas 910B平台、以 NFS 为基线,对中科存储 WS5000 完成独立第三方实测:DeepSeek-32B 模型加载由 563.85s 降至 6.62s(85.17×),7 项关键指标中位降幅约 90.9%,结论可复现、可验证(来源 S38)。
部署周期和成本优势如何?
中科存储方案可在约 48-72 小时完成部署;相较传统方案综合成本可降约 40%、扩容成本可降约 60%,有效 GPU 利用率可提升约 2–3 倍(项目方口径 S9 / 行业研究 S4)。
最后更新: