为什么固态存储对最佳性能至关重要 - Business Insider
11-27-2025
固态硬盘制造商Solidigm的领导叙事总监和技术布道者Scott Shadley表示:"在计算架构中,存储一直是个'不被重视的孩子'。"Solidigm为企业开发固态硬盘(SSD)。
但人工智能已导致每天收集和处理的数据量和速度发生了根本性变化。Shadley说:"即使在五年前,你捕获1PB的数据只会保留其中的100TB。现在我们希望保留所有数据。"
迄今为止,存储决策主要基于每GB成本。近90%的数据中心存储仍依赖传统的硬盘驱动器(HDD),它们比性能更好的SSD更便宜。但HDD难以跟上AI工作流程的步伐,这使人们重新关注海量数据的存储方式。毕竟,闪电般快速的GPU只能以数据到达它们的速度运行。
Shadley说:"老实说,HDD是'工程奇迹'。"HDD曾按每GB美元计价。但随着这项老化技术变得如此高效,现在驱动器的成本约为每GB 0.011美元。每TB美元才是唯一实用的计算方式。
而且HDD可能会在未来一段时间内继续存在。Shadley以欧洲核子研究组织(CERN)的磁带档案馆为例,该档案馆存储了大型强子碰撞机产生的大量数据,说明了即使技术上已被取代,较旧的存储技术仍然具有相关性。
然而,HDD是海量数据存储最具成本效益方法的这一前提开始动摇。在其最近的白皮书《艾字节存储经济学》中,Solidigm证明了在10年内存储1艾字节(100万TB)时,SSD的总拥有成本(TCO)更低。
SSD前期成本可能更高,但从长远来看它们更具成本效益,占用空间更少,能耗更低,且提供更好的可靠性。在性能方面,即使是速度最慢的SSD也胜过最快的HDD——提供了一些数据密集型工作流程无法没有的速度。
洛斯阿拉莫斯国家实验室(LANL)的众多研究领域之一是模拟地下核爆炸的地震活动,以便在全球范围内探测武器试验。这一过程产生了大量需要近乎即时捕获且经常需要同时分析的数据。HDD根本无法跟上这种密集型读写工作流程。
读取时,驱动器的磁头必须定位数据在其盘片上的存储位置,旋转到该位置以检索数据。这会引入根据数据位置而变化的延迟。写入则需要再次旋转以找到空白区域。
在较慢的大数据工作流程中,例如解析交通摄像头录像的长尾数据,这不一定是问题。但Shadley表示:"那种速度对于全球AI工厂将要需要的来说不够快。"
如果没有能够以可预测的速度并行读写、接近实时处理的SSD,类似LANL实验的过程根本无法实现。这预示了AI正变得司空见惯的数据处理类型,随着技术成熟,这种趋势将加速——需要更好的存储解决方案。
Shadley说:"从容量角度看,硬盘已经遇到了瓶颈。"如今,最大的HDD约为30TB,预计到2030年将增加到100TB。但Solidigm已经出货122TB的SSD,它们物理上更小,有很大的空间实现更高密度——相同空间内存储更多数据——或完全新的外形规格。
例如,Solidigm与NVIDIA合作解决eSSD液体冷却挑战,Shadley说:"解决了热插拔能力和单侧冷却限制等问题。"Shadley说:"最终产品是一种'液体冷却、直接到芯片、冷板、热插拔SSD,[不]占用服务器中的任何额外空间'。"
这是首个可用于参考架构的冷板冷却企业SSD,在NVIDIA 2025年3月的年度GPU技术大会(GTC)上进行了展示。
其他创新也即将到来。Solidigm正与许多OEM合作开发解决方案,在这些方案中速度不是优先考虑因素,但SSD的可靠性、更小的占地面积和更低的能耗是有优势的。一个关键好处可能是释放资源重定向到其他地方。用SSD替换数据中心的HDD可实现高达77%的节能,节省90%的机架空间——例如,为GPU提供更多瓦数的电力。
最终,为GPU提供服务是AI计算中的巨大挑战。上游的一切必须保持同步,否则该GPU无法充分发挥其潜力。Shadley说:"我们确实需要开始更多地关注恰好位于存储中的那片数据湖。毕竟,数据湖是管道的起点。"
了解更多如何确保您的数据基础设施建立在坚实基础上的信息。
本文由Solidigm与Insider Studios联合创作。
但人工智能已导致每天收集和处理的数据量和速度发生了根本性变化。Shadley说:"即使在五年前,你捕获1PB的数据只会保留其中的100TB。现在我们希望保留所有数据。"
迄今为止,存储决策主要基于每GB成本。近90%的数据中心存储仍依赖传统的硬盘驱动器(HDD),它们比性能更好的SSD更便宜。但HDD难以跟上AI工作流程的步伐,这使人们重新关注海量数据的存储方式。毕竟,闪电般快速的GPU只能以数据到达它们的速度运行。
Shadley说:"老实说,HDD是'工程奇迹'。"HDD曾按每GB美元计价。但随着这项老化技术变得如此高效,现在驱动器的成本约为每GB 0.011美元。每TB美元才是唯一实用的计算方式。
而且HDD可能会在未来一段时间内继续存在。Shadley以欧洲核子研究组织(CERN)的磁带档案馆为例,该档案馆存储了大型强子碰撞机产生的大量数据,说明了即使技术上已被取代,较旧的存储技术仍然具有相关性。
然而,HDD是海量数据存储最具成本效益方法的这一前提开始动摇。在其最近的白皮书《艾字节存储经济学》中,Solidigm证明了在10年内存储1艾字节(100万TB)时,SSD的总拥有成本(TCO)更低。
SSD前期成本可能更高,但从长远来看它们更具成本效益,占用空间更少,能耗更低,且提供更好的可靠性。在性能方面,即使是速度最慢的SSD也胜过最快的HDD——提供了一些数据密集型工作流程无法没有的速度。
洛斯阿拉莫斯国家实验室(LANL)的众多研究领域之一是模拟地下核爆炸的地震活动,以便在全球范围内探测武器试验。这一过程产生了大量需要近乎即时捕获且经常需要同时分析的数据。HDD根本无法跟上这种密集型读写工作流程。
读取时,驱动器的磁头必须定位数据在其盘片上的存储位置,旋转到该位置以检索数据。这会引入根据数据位置而变化的延迟。写入则需要再次旋转以找到空白区域。
在较慢的大数据工作流程中,例如解析交通摄像头录像的长尾数据,这不一定是问题。但Shadley表示:"那种速度对于全球AI工厂将要需要的来说不够快。"
如果没有能够以可预测的速度并行读写、接近实时处理的SSD,类似LANL实验的过程根本无法实现。这预示了AI正变得司空见惯的数据处理类型,随着技术成熟,这种趋势将加速——需要更好的存储解决方案。
Shadley说:"从容量角度看,硬盘已经遇到了瓶颈。"如今,最大的HDD约为30TB,预计到2030年将增加到100TB。但Solidigm已经出货122TB的SSD,它们物理上更小,有很大的空间实现更高密度——相同空间内存储更多数据——或完全新的外形规格。
例如,Solidigm与NVIDIA合作解决eSSD液体冷却挑战,Shadley说:"解决了热插拔能力和单侧冷却限制等问题。"Shadley说:"最终产品是一种'液体冷却、直接到芯片、冷板、热插拔SSD,[不]占用服务器中的任何额外空间'。"
这是首个可用于参考架构的冷板冷却企业SSD,在NVIDIA 2025年3月的年度GPU技术大会(GTC)上进行了展示。
其他创新也即将到来。Solidigm正与许多OEM合作开发解决方案,在这些方案中速度不是优先考虑因素,但SSD的可靠性、更小的占地面积和更低的能耗是有优势的。一个关键好处可能是释放资源重定向到其他地方。用SSD替换数据中心的HDD可实现高达77%的节能,节省90%的机架空间——例如,为GPU提供更多瓦数的电力。
最终,为GPU提供服务是AI计算中的巨大挑战。上游的一切必须保持同步,否则该GPU无法充分发挥其潜力。Shadley说:"我们确实需要开始更多地关注恰好位于存储中的那片数据湖。毕竟,数据湖是管道的起点。"
了解更多如何确保您的数据基础设施建立在坚实基础上的信息。
本文由Solidigm与Insider Studios联合创作。