看存算协同,如何化解AI时代的“存储焦虑”?

张开发
2026/4/13 7:07:22 15 分钟阅读

分享文章

看存算协同,如何化解AI时代的“存储焦虑”?
“存储问题正逐渐成为限制大模型实际应用的关键瓶颈大数据产业创新服务媒体——聚焦数据·改变商业随着AI大模型的竞争步入2026年焦点已从单纯的“比拼参数”转变为“比拼落地”和“比拼效率”。在实际应用中不少企业发现即便已经购置了算力卡但数据读写却难以跟上推理响应速度迟缓成本居高不下。这一现象的核心矛盾之一正是存储架构能否契合AI智能计算的特殊需求尤其是近期备受瞩目的KV Cache存储瓶颈。3月17日一场题为《算力先行存力为王——谁主沉浮AI智算新生态》的直播活动盛大开启。此次活动由数据猿主办特别邀请西部数据资深售前工程师芦浩、极道科技首席技术官张京城以及数据猿联合创始人兼主编张艳飞担任直播主持现场上演了一场精彩绝伦的思想交锋。本次活动聚焦KV Cache优化、模型训练加速以及高性价比存储系统的构建探讨了通过软硬协同如何有效化解AI时代的“存储焦虑”。随着人工智能技术在全球范围内的飞速发展算力固然是核心驱动力但存储问题却日益成为制约大模型实际应用的关键短板。无论是在训练阶段对大规模数据的高效处理还是在推理阶段对KV Cache的频繁访问传统存储架构都面临着前所未有的挑战。针对这一情况数据猿特别邀请两位行业专家展开探讨。西部数据与极道科技分别作为软硬件领域的代表围绕六个核心议题进行了深研讨论这些议题涵盖了AI智算存储所面临的技术瓶颈、协同优化、降本增效、实战落地、未来趋势以及生态共建等方面。此次对话为AI智算新生态的发展提供了实践路径和发展参考。议题一大模型训练“粮草”保卫战软硬件协同破解高带宽瓶颈直播开始主持人张艳飞抛出了核心问题千亿甚至万亿级参数的AI模型训练对存储带宽提出严苛要求硬件与软件层面分别面临哪些“卡脖子”挑战西部数据芦浩表示当前AI发展对存储的实时性、及时性提出全新要求模型训练需存储硬件具备微秒级响应速度与超高带宽而行业正面临性能、容量、成本的三重考验。机械硬盘虽凭借高容量、低成本优势主导AI数据中心但读写速度、延迟等指标与固态硬盘差距明显在高性能场景中竞争力下滑。为破解困境西部数据推出三项创新技术一是高带宽硬盘技术采用三阶执行器技术实现精准磁道定位通过双读写磁头并行访问读写吞吐量达现有硬盘1.7倍顺序读写性能提升至2倍未来有望实现8倍提升该技术计划在50TB级产品中引入未来100TB产品可实现8轨道同时处理以提升I/O速率二是双枢轴技术通过双独立执行器并行操作结合算法优化合并IO带宽可提升2倍未来将实现4倍突破三是HAMR热辅助磁记录技术借助磁头上激光二极管瞬时加热碟片磁道使磁粒位磁性反转从而实现数据稳定写入助力大容量硬盘研发。芦浩透露西部数据预计2027年推出60TB硬盘性能将接近主流固态硬盘水平。极道科技张京城从存储系统视角补充道西部数据的高性能硬盘是基础极道科技则聚焦端到端优化核心是消除应用到硬盘的通信瓶颈充分释放硬件效能。他强调可靠性是存储系统的核心需先保障数据不丢失再通过差异化适配优化性能、控制成本。极道科技通过自主研发的统一调度引擎实现“按需加载、智能预取”与西部数据硬件形成协同缓解存算瓶颈。议题二KV Cache优化软硬件“快上加快”赋能AI推理探讨完训练瓶颈后张艳飞聚焦AI推理场景提问“KV Cache技术对低延迟要求极高西部数据EBOF与极道软件如何实现‘快上加快’”芦浩表示西部数据OpenFlex Data24 EBOF盘框天生适配KV Cache特性为AI推理提供高并发、低延迟、大容量硬件支撑可满足TB级上下文、PB级存储需求解决GPU显存不足、I/O瓶颈等痛点。其采用NVMe SSD搭配100G RoCE网络通过NVMe over Fabric架构实现存算直连属于Diskless架构创新实践双控架构控制内部采用PCIe 4.0标准硬件架构支持多种无损网络协议无性能瓶颈。实测数据显示EBOF配置闪迪SN655 NVMe SSD时12台服务器压测下随机IOPS达2700万顺序读带宽135GB/s、写带宽近90GB/s单盘随机读延迟仅96微秒。该产品支持全局共享、近计算节点、分层三种部署方式可弹性扩展通过RDMA直连与GPU Direct软件实现存算协同为极道软件提供坚实支撑。据悉OpenFlex Data24系列EBOF最大容量可达1474TB顺序读性能最高达129.34GB/s随机读最高可达29.41M IOPS。张京城表示AI 推理核心诉求是低延迟。极道科技采用 “QA Cache 存储 智能网关” 组合方案通过架构级协同优化实现推理性能大幅提升。智能网关可智能调度算力资源、追踪 KV Cache 分布最大化缓存命中效率QA Cache 采用开放架构实现多层次智能缓存通过零拷贝读写进一步提升性能。该方案兼容主流推理引擎与国产算力卡具备企业级高可用性可有效降低 token 生成延迟、优化使用成本。议题三降本增效多模态时代的存储最优解针对AI多模态时代的海量数据存储难题张艳飞问道“面对视频、三维数据等百倍于文字的数据吞吐量如何构建‘既能打又省钱’的存储系统”对此芦浩表示智慧城市、自动驾驶等场景数据已达PB级甚至EB级需软硬件协同构建高效存储架构。西部数据聚焦硬件创新通过分层硬盘产品与高密磁盘扩展柜组合降本增效。其企业级硬盘家族涵盖26TB-32TB SMR硬盘、22TB-26TB CMR硬盘等多规格22TB以上产品搭载OptiNAND技术12TB以上采用氦气封装MTBF达250万小时。针对海量存储场景西部数据推出60盘、102盘两种磁盘扩展柜阿里、字节等大厂均采用JBOD磁盘扩展柜方案。举例规划50PB存储需求下“服务器60盘扩展柜”需40个节点采购成本、机柜数量下降近一半102盘扩展柜仅需26个节点采购成本下降超一半5年运营成本与硬盘故障率大幅降低帮助客户降低整体TCO。西部数据磁盘扩展柜具有振动隔离技术、冷温区技术两项专利技术支持远程集中管理简化运维。张京城表示极道科技通过软件自适应优化实现了性能与成本的精准平衡。具体而言我们先深度拆解各类应用的实际需求精准区分不同场景的性能差异采用“HDDSSD”混合介质架构进行场景化适配让存储资源与业务需求高度匹配同时基于数据热度实现存储介质的智能动态调度让数据流转更高效从底层规避IO拥堵问题更推出“AI Pipeline”解决方案实现存储调度全流程自动化大幅简化操作门槛的同时高效应对多模态数据的爆发式增长从软件层面彻底打通数据读写链路让IO不再成为制约业务发展的存储瓶颈。议题四实战派分享——医学科研领域的AI存储落地实践围绕技术落地张艳飞邀请嘉宾分享医学科研、前沿科创领域的实战案例并询问Agent及“小龙虾”智能体对行业的影响。张京城表示极道科技与西部数据在医学科研领域落地多个AI存储实践案例核心采用自研ALAMO分布式并行存储系统搭配西部数据高性能硬件精准适配各类科研与医疗机构的业务需求。该系统兼具高性能、高可靠与高可扩展性可同时承载AI训练推理、基因测序分析等多元业务兼容英伟达及国产GPU支持X86与ARM架构保障医疗科研核心数据高效流转与高性能存取。针对智能体张京城认为当前其主要应用于个人场景企业级应用仍面临安全可靠性不足、数据增长压力大等挑战未来将推动AI与业务深度耦合增加存储需求多样性。芦浩认同这一观点他表示智能体进入企业场景需提升安全可靠性西部数据通过高稳定硬件与专利技术降低故障概率为企业级AI场景筑牢硬件根基助力智能体落地。议题五存算协同下一个五年AI架构的核心趋势聚焦AI架构未来发展主持人问道“存算分离时代数据搬运成本过高存储系统是否需具备更强‘计算感知’能力”张京城表示下一个五年AI架构核心趋势是AI与业务高度耦合存算协同是关键未来需构建AI专属操作系统。该系统需包含存储、非结构化数据管理、融合计算三大模块通过协同优化降低数据搬运成本、提升算力利用率实现数据价值转化。他认为AI技术迭代极快未来大模型能力将深度融入各类应用重构行业形态。芦浩补充道存算协同核心是最小化IO损耗、减少数据搬运并非物理设备融合而是通过软件实现逻辑一体化。西部数据通过高速以太网与并行NVMe闪存组合提供硬件支撑。其与极道科技合作的存算协同案例显示开启GPU Direct Storage功能后带宽从20多GB/s提升至93GB/s解决三维仿真卡顿问题验证了方案有效性。两位嘉宾一致认为存算协同将成为未来五年核心演进方向需软硬件深度协同。议题六共建生态“存、算、用”闭环助力行业发展作为直播最后一个议题主持人询问两家企业如何打破“黑盒”协同构建“存、算、用”闭环生态。芦浩表示西部数据正从单一硬件供应商向全线解决方案服务商转型在科罗拉多普林斯组建开放兼容性实验室OCCL推动行业互操作性。其已形成完善生态矩阵软件端与极道科技、英伟达等深度合作硬件端联动闪迪、英特尔等厂商未来将加大研发推出AI全生命周期配套解决方案。张京城表示AI将成为生态协同的核心工具借助AI编程可大幅缩短厂商对接周期、降低成本。他强调数据安全与隐私保护是生态协同的前提未来AI将同时作为服务对象与协同工具推动“存、算、用”闭环完善扩大AI智算“朋友圈”。此次直播中西部数据与极道科技从硬件创新、软件优化、案例落地、趋势预判等多维度展现了软硬件协同破解AI存储瓶颈的路径为行业高质量发展提供了宝贵经验。未来随着存算协同趋势深化与生态体系完善AI存储将更好支撑多领域智能化落地。文梦芸 / 数据猿责编一蓑烟雨/数据猿☆往期好文推荐☟卡住具身智能脖子的不是硬件是数据Token经济爆发如何接住这“十年百倍”的市场机会“数据高铁”又一个噱头

更多文章