本文原載微信公眾號"云數(shù)智觀察",作者:郭濤。轉載已獲授權。
北京2026年5月13日 /美通社/ -- AI時代,在算力火了之后,人們又將關注的目光投向了存儲。雖然算力決定了AI的上限,但存儲決定了AI能不能真正落地,并且用得好、用得久、用得起。
存儲漲價的背后
近期,存儲產(chǎn)品漲價潮持續(xù)蔓延,包括DRAM、閃存顆粒、機械硬盤、磁帶等核心組件的供應全面緊張,特別是20TB、24TB大容量硬盤的交付周期普遍延長。IBM大中華區(qū)存儲事業(yè)部總經(jīng)理吳磊提到一現(xiàn)象,當前很多企業(yè)即便有充足的預算,存儲產(chǎn)品也很難快速到貨。這態(tài)勢與GPU"一卡難求"的緊缺局面高度相似,顯示出供需矛盾全面加劇,全球供應鏈與成本壓力倍增。
其實,存儲供應鏈失衡只是浮出海面的冰山一角。創(chuàng)新技術的快速迭代、層出不窮的新型工作負載,以及企業(yè)用戶對安全和自動化運維的高要求等,才是最大的壓力所在。
從業(yè)務需求的轉變可以看出,當AI從模型訓練階段全面進入推理的爆發(fā)期,企業(yè)的存儲需求發(fā)生了根本性改變。AI推理必然依賴企業(yè)內(nèi)部的海量、多類型、實時性存量數(shù)據(jù),而數(shù)據(jù)不可復用、難以盤活成了普遍痛點。另外,隨著大模型的快速迭代,參數(shù)量激增,對存儲的響應速度、并發(fā)能力、數(shù)據(jù)流動性等都提出了更高要求。
再從企業(yè)日常的安全與運維實踐來看,技術架構復雜、攻擊升級、專業(yè)人才不足等短板進一步被放大。在安全層面,黑客利用AI技術,使得索軟件的攻擊速度與破壞力大幅提升。傳統(tǒng)安全響應機制幾乎失效,必須實現(xiàn)秒級甚至毫秒級的威脅發(fā)現(xiàn)、偵測與處置,否則企業(yè)將面臨巨大的數(shù)據(jù)損失。在運維層面,企業(yè)已經(jīng)普遍采用"混合多云+多廠商設備"的異構架構,這抬高了運維團隊的人力成本和技術門檻。
不容忽視的是,企業(yè)的數(shù)據(jù)規(guī)模長期處于加速爆發(fā)的過程中,從數(shù)百TB躍升至數(shù)十EB,而且結構化、半結構化、非結構化數(shù)據(jù)混雜,覆蓋IoT設備、智能汽車、醫(yī)療影像、工業(yè)傳感器等多元數(shù)據(jù)源,同時金融、醫(yī)療、政務、汽車等行業(yè)又有嚴格的合規(guī)要求,長期數(shù)據(jù)保留增加了存儲的難度與成本。
一方面,數(shù)據(jù)必須服務于業(yè)務,將海量數(shù)據(jù)高效轉化為真實業(yè)務價值;另一方面,數(shù)據(jù)又需要長期合規(guī)留存、全程安全可控。雙重壓力疊加,迫使企業(yè)必須尋求新的存儲技術、架構與解決方案。
讓AI走向數(shù)據(jù)
吳磊指出,"讓AI走向數(shù)據(jù)"的核心存儲理念,直指傳統(tǒng)存儲模式的痛點,將成為企業(yè)構建AI競爭力的關鍵。
過去,企業(yè)普遍采用"數(shù)據(jù)搬運、多副本拷貝"的傳統(tǒng)方式,為滿足AI處理的需要,就要將數(shù)據(jù)復制、上傳、集中處理。這種方式在小規(guī)模數(shù)據(jù)時代尚能適用,但進入EB級數(shù)據(jù)與高并發(fā)推理的"詞元(Token)經(jīng)濟"時代,則捉襟見肘。
從"數(shù)據(jù)走向 AI"到"讓AI走向數(shù)據(jù)",這是范式的轉變。吳磊解釋說,讓AI主動走向數(shù)據(jù)、理解數(shù)據(jù)并就近處理數(shù)據(jù),將從根本上解決數(shù)據(jù)搬運的難題。
傳統(tǒng)的多副本不僅會帶來高昂的網(wǎng)絡與存儲成本,還將引發(fā)數(shù)據(jù)一致性失控、安全管控難度劇增、合規(guī)追溯困難等一系列困擾,有些時候企業(yè)甚至無法判斷哪一份副本才是真實、最新的數(shù)據(jù),最終可能導致AI推理結果失真或算力大量空耗。
IBM的破解之道是,以"單副本架構+內(nèi)容感知存儲(CAS)"為技術核心,讓存儲主動感知數(shù)據(jù)變化,在數(shù)據(jù)更新的一瞬間即可同步給AI模型,無需人工重做副本,更無需重復數(shù)據(jù)處理,從而實現(xiàn)數(shù)據(jù)一處更新、全局可用。這一新的架構大幅降低了數(shù)據(jù)傳輸與安全管控成本,可確保數(shù)據(jù)的唯一性、準確性與實時性,很好地消除了數(shù)據(jù)亂、副本多、效率低的瓶頸。
在此基礎上,IBM還進一步提出了"人工智能工廠"(AI Factory)的理念,致力于打造覆蓋數(shù)據(jù)采集、集成、準備、訓練、模型適配、推理、歸檔的端到端AI數(shù)據(jù)平臺,讓數(shù)據(jù)在全生命周期內(nèi)自由流動,并持續(xù)產(chǎn)生價值。
吳磊用餐飲類比詞元經(jīng)濟時代存儲的演進。傳統(tǒng)存儲如同家庭廚房,SAN/NAS好比預制加工廠,應用存儲就像是預制餐;而新的"AI+"要求存儲變成"私人廚師",智能的存儲可以按需調(diào)度、主動服務并實時響應AI負載,并最大化數(shù)據(jù)價值。
總而言之,讓AI走向數(shù)據(jù),就是把存儲從被動的"數(shù)據(jù)容器"升級為主動的"智能數(shù)據(jù)服務層",讓AI可以在數(shù)據(jù)產(chǎn)生的地方就近處理、實時學習、高效推理,實現(xiàn)數(shù)據(jù)不搬家、AI更高效、成本更可控、安全可追溯,將AI從演示項目變成規(guī)模化的生產(chǎn)力,這將為AI的落地筑牢最堅實的數(shù)字底座。
邁向自主存儲,踐行增本增效
在"讓AI走向數(shù)據(jù)"的理念指導下,IBM布局新的存儲產(chǎn)品與技術,為AI落地鋪就數(shù)據(jù)之橋。
1. 持續(xù)更新AI高性能存儲,打造AI工廠的算力底座與數(shù)據(jù)引擎
作為IBM人工智能工廠的核心引擎,IBM Storage Scale System 6000/3500面向大模型訓練、多模態(tài)數(shù)據(jù)處理、萬卡級GPU集群等高算力場景,提供端到端AI數(shù)據(jù)管道支撐。
具體來看,面向大模型訓練的Checkpoint,可以提供極致高吞吐、低延遲架構,保障訓練過程中關鍵斷點數(shù)據(jù)快速落盤、不丟進度、不浪費算力,顯著提升GPU有效利用率;可以統(tǒng)一承載文本、圖片、音頻、視頻、傳感器數(shù)據(jù)等混合負載,適配從數(shù)據(jù)準備、分布式訓練、模型適配到推理的全流程;全局統(tǒng)一命名空間能夠有效打通邊緣、數(shù)據(jù)中心、私有云與公有云,實現(xiàn)數(shù)據(jù)一處更新、全局可用;與NVIDIA實現(xiàn)深度生態(tài)協(xié)同,比如支持GPUDirect等高速協(xié)議,大幅降低數(shù)據(jù)搬運開銷。
IBM Storage Ceph主要面向高IOPS、高并發(fā)、云原生的AI負載場景,可提供統(tǒng)一、彈性、可橫向擴展的分布式存儲能力。它采用統(tǒng)一架構,塊、文件、對象三協(xié)議合一,可以簡化云原生與虛擬化環(huán)境部署,并且兼容S3 API,很好地適配容器、微服務與AI云平臺。特別值得一提的是,它可以從小規(guī)模起步,按需平滑擴容,尤其適合數(shù)據(jù)湖、AI中臺、海量小文件等長期增長型場景。
2. 引入AI智能體,重新定義新一代閃存核心
IBM重新定義企業(yè)級全閃存,將AI智能體與自研硬件芯片深度融合,打造自主、安全、高效的核心業(yè)務存儲。
全新的FlashSystem.ai是AI驅動的自主存儲的智能中樞。它定位為"永不休息的智能存儲管理員",可以把存儲從被動設備升級為自主自治的智能層。IBM中國區(qū)存儲業(yè)務銷售總經(jīng)理金鑫歸納了FlashSystem.ai的特色和優(yōu)勢:第一,支持自然語言交互,降低命令行與專業(yè)門檻,即使普通管理員也可高效操作;第二,實現(xiàn)主動性能優(yōu)化,比如在數(shù)小時內(nèi)自適應業(yè)務負載,實現(xiàn)智能調(diào)優(yōu)資源、智能遷移負載,提升整體效率與穩(wěn)定性;第三,秒級勒索軟件感知,比如可通過I/O特征識別異常,并在60秒內(nèi)發(fā)出告警,同時結合硬件級防護,實現(xiàn)更快的恢復;第四,合規(guī)審計自動化,可自動生成可解釋審計報告,大幅縮短合規(guī)文檔編制時間,降低合規(guī)成本;第五,在安全方面,系統(tǒng)僅支持"增、擴、優(yōu)化"等安全操作,同時嚴格限制刪除等高風險動作,從機制上保障了數(shù)據(jù)安全;第六,管理效率大幅提升,可減少90%的存儲手動管理工作量。
金鑫還特別提到了IBM自研的硬件級黑科技——第五代閃存核心模塊(FlashCore Module 5)。其重要性和特殊性表現(xiàn)在:可實現(xiàn)硬件級壓縮、重刪、加密和異常檢測,完全不占用控制器性能,最高支持1:5的硬件壓縮/重刪,顯著降低單位TB的成本;采用量子安全加密,通過硬件級加密抵御未來量子計算破解風險,有效滿足長期數(shù)據(jù)安全與合規(guī)要求。目前第五代 FCM可支撐IBM FlashSystem 5600/7600/9600全系列產(chǎn)品,實現(xiàn)從邊緣到核心關鍵業(yè)務的全覆蓋。
以AI智能體為驅動,IBM FlashSystem.ai將訓練好的AI模型封裝在本地容器中,用自然語言交互替代命令行與圖形界面,從而實現(xiàn)存儲的自助式管理、自動化運維、主動式優(yōu)化,旨在用極少的人力管理大規(guī)模、跨品牌、跨時代的復雜存儲架構,以實現(xiàn)高效率、高韌性、低成本和強合規(guī),為業(yè)務創(chuàng)新保駕護航。
如果說AI存儲是AI時代存儲必修的"基本功",解決了算力與數(shù)據(jù)的匹配問題,那么IBM提出的"自主存儲"則是AI時代存儲的"進階形態(tài)",解決的是企業(yè)對數(shù)據(jù)、架構與運維的自主掌控問題。兩者一脈相承、層層遞進,共同構成IBM面向"AI+"時代的完整存儲戰(zhàn)略。AI存儲是能力層,自主存儲則是管理層/控制層,在AI存儲之上,用AI智能體實現(xiàn)自治、自愈、自優(yōu)化、自安全。自主存儲可以理解為是IBM"數(shù)字自主"戰(zhàn)略在存儲層的落地,其核心是讓企業(yè)掌握數(shù)據(jù)與架構的絕對掌控權,不被廠商、云所綁定,能夠自主規(guī)劃 IT演進路徑。可以預見,未來的企業(yè)級存儲將是"AI存儲能力+自主存儲架構"融合的形態(tài)。
3. 磁帶是數(shù)據(jù)的終極歸宿
在光盤存儲逐步退出后,磁帶就成了可支撐30年以上長周期、高可靠、低成本存儲的"唯一"選擇,其可靠性遠超硬盤3~4個數(shù)量級。目前最新的LTO10E單盤容量達到40TB,容量、密度、帶寬持續(xù)領先。IBM磁帶設備可在高速運行中實時精準定位,保證數(shù)據(jù)讀寫零偏差、高穩(wěn)定;而且磁帶更薄、韌性更強,可支持高速穩(wěn)定運行,不易拉伸和斷裂;同樣內(nèi)置抗量子加密,并支持WORM一次寫多次讀功能,可滿足金融、醫(yī)療、政務等行業(yè)長期留存的要求;單位容量成本遠低于硬盤、閃存與公有云歸檔。
4. 全場景分層存儲
在技術和產(chǎn)品層面不斷創(chuàng)新之外,IBM還以策略驅動、智能感知、應用無感為核心,構建了覆蓋全數(shù)據(jù)生命周期的分層存儲體系,兼顧性能、成本、安全與合規(guī)。
IBM FlashSystem全閃存用于存儲熱數(shù)據(jù),主要面向ERP、核心數(shù)據(jù)庫、實時交易、AI推理等高并發(fā)、低延遲場景,提供微秒級響應與7×24小時的高可用;溫數(shù)據(jù)可存儲于IBM Storage Scale/Storage Ceph之上,以滿足AI訓練、數(shù)據(jù)湖、數(shù)據(jù)分析、虛擬化、混合云等大容量、高吞吐、彈性擴展場景的需求;磁帶庫用于長期保留冷數(shù)據(jù),主要面向長期歸檔、合規(guī)留存、低頻訪問數(shù)據(jù),實現(xiàn)極致的低成本、高可靠、長壽命。
金鑫表示,全場景分層存儲的核心價值表現(xiàn)在,能夠按訪問頻率、重要性、生命周期自動分層,實現(xiàn)智能自動化遷移,無需人工干預,并且開放兼容市場上主流的公有云,同時很好地利舊,在供應鏈緊張、硬件成本倍增的背景下,切實踐行降本增效。
存儲,做好自己的主角
在詞元經(jīng)濟時代,存儲不是配角,而是AI規(guī)模化落地的底座與命脈。在某種程度上,它決定了AI能不能跑起來,因為只有低延遲、高吞吐、大并發(fā)的存儲,才能讓算力利用率持續(xù)提升;它決定了AI是否經(jīng)濟,因為智能分層存儲可以將成本降到最優(yōu),讓AI擁有更強的盈利能力;它決定了AI的安全與合規(guī),量子安全加密、長期留存等是業(yè)務連續(xù)的基本保證。
面對未來的存儲挑戰(zhàn),"讓AI走向數(shù)據(jù)"與"自主存儲"是IBM存儲戰(zhàn)略的兩大基石,將全面引領企業(yè)存儲邁向智能、自治、高效、安全。存儲將從被動容器升級為主動智能服務層,AI智能體由加分項變?yōu)闃伺洌⑸疃热谌脒\維、優(yōu)化、安全與合規(guī)的全流程。全閃存+分布式存儲+磁帶的全棧分層存儲解決方案,將更好地幫助企業(yè)在多云、異構、AI深度落地的環(huán)境中,掌握數(shù)據(jù)自主。