Kioxia与NVIDIA合作 目标实现比现有顶级固态硬盘快33倍的SSD性能
Kioxia与NVIDIA的最新合作,被视为AI数据中心基础设施又一技术跃进。两家公司正联手研发能提供高达1亿IOPS(每秒输入输出操作次数)的SSD,这一性能远高于目前顶级固态硬盘约300万IOPS的水平,旨在攻克大规模AI模型训练与部署中的数据传输瓶颈。
如果项目成功,不仅能加速生成式AI(GenAI)创新步伐,还将重新定义数据中心架构,改变云计算和企业级存储的竞争格局,并为整个硬件生态树立新标准。
半导体存储器制造商Kioxia正开发新一代SSD技术,以满足AI高强度读写需求。公司宣布,计划在2027年实现商用化,使SSD的随机IOPS达到1亿次,该性能指标约为现有高端产品的30至35倍。Kioxia此次与NVIDIA合作,推动项目落地。
在东京的一次媒体说明会上,Kioxia表示,该新型SSD将直接与NVIDIA GPU相连,而无需通过传统服务器中央处理器。这种“点对点”连接方式极大提升了存储与计算单元之间的数据流动速度,尤其适合依赖频繁、小规模随机数据读取的AI大模型训练,例如调取嵌入表示和模型参数等操作,而传统SSD系统难以高效应对这些需求。
NVIDIA则提出了更具挑战性的目标:在即将到来的PCI Express 7.0标准支持下,通过两块此类SSD实现2亿IOPS。PCIe 7.0带来更高速的点对点GPU通信能力。相比之下,目前高性能SSD在4K区块下约实现300万IOPS,若要跃升至1亿IOPS,将对NAND闪存和接口架构两方面带来重大技术挑战。
Kioxia最有希望采用的技术是其专有的XL-Flash单层单元(SLC)NAND存储,具备高耐用、低延迟和强劲性能等特点。XL-Flash每颗芯片最大支持16个“平面”,而普通消费级3D NAND普遍为3至6平面。
尽管Kioxia尚未公布全部技术规格,但现有测试数据可一窥挑战之大:一块400GB、搭载32颗NAND芯片并采用PCIe 5.0接口的XL-Flash SSD,已展现出约350万随机读取IOPS的表现。理论上,如果性能可以完美线性扩展,那么配备915颗芯片的SSD就有可能实现1亿IOPS。但实际上,受控制器带宽、固件开销和系统架构等因素影响,这一目标往往难以简单堆叠芯片达成,或需采用多控制器或模块化SSD方案。
鉴于传统3D NAND扩展的局限性,Kioxia还在探索名为高带宽闪存(HBF)的新型存储技术,其目标是结合高带宽内存的速度与更大的存储容量。HBF方案通过先进封装,将最多16颗NAND芯片与一个逻辑芯片堆叠于一体,实现极高的并行度和带宽水平。虽然目前尚不确定HBF会否用于该合作项目的最终产品,但这项研发表明Kioxia正布局AI时代的超高性能存储解决方案。