節(jié)點集群帶寬突破 513GBps 焱融存儲再度登頂MLPerf Storage 全球榜單
2025-08-05 17:49:00AI云資訊2105
2025 年 8 月 4 日,全球權(quán)威的 AI 性能基準(zhǔn)評測組織 MLCommons® 正式發(fā)布最新一輪 MLPerf® Storage v2.0 基準(zhǔn)測試結(jié)果。來自中國的存儲廠商焱融科技在此次測試中表現(xiàn)突出,其全閃存儲一體機 F9000X 不僅在全部模型測試中性能領(lǐng)先,更以三節(jié)點存儲集群 513GB/s 的總帶寬刷新 3D-Unet 模型測試的紀(jì)錄,登頂 MLPerf 全球性能榜單。
MLPerfStorage:AI存儲性能的黃金衡量標(biāo)準(zhǔn)
MLCommons 作為全球人工智能工程聯(lián)盟,始終致力于規(guī)范 AI 技術(shù)的準(zhǔn)確性、安全性、速度與效率評估,推動 AI 系統(tǒng)性能優(yōu)化,其權(quán)威性得到全球業(yè)界廣泛認(rèn)可。而 MLPerf Storage Benchmark 作為該聯(lián)盟專為 AI 場景打造的存儲基準(zhǔn)測試,通過模擬真實 AI 訓(xùn)練中的 I/O 操作,精準(zhǔn)衡量存儲系統(tǒng)向 GPU 輸送訓(xùn)練數(shù)據(jù)的速度與能力。
此次發(fā)布的 MLPerf Storage v2.0,在 v1.0 基礎(chǔ)上進一步升級:除保留 3D-Unet、ResNet50、CosmoFlow 三大訓(xùn)練模型外,新增 Checkpoint 工作負(fù)載,更全面覆蓋訓(xùn)練中斷點恢復(fù)、模型存檔等實際場景。為確保結(jié)果的嚴(yán)謹(jǐn)性與公正性,v2.0 要求每項基準(zhǔn)測試必須多次重復(fù)執(zhí)行(訓(xùn)練任務(wù) 5 次、Checkpoint 任務(wù) 10 次),且全程連續(xù)運行無失敗,同步提交完整測試日志,最終結(jié)果取多次運行的平均值 —— 這一系列嚴(yán)格規(guī)范,使其成為業(yè)界衡量 AI 存儲性能時最具參考價值的權(quán)威標(biāo)準(zhǔn)。
焱融全閃刷新全球紀(jì)錄最小規(guī)模集群性能第一
MLPerf Storage 基準(zhǔn)測試既支持單個計算節(jié)點(客戶端)運行多個 ACC(GPU 加速器)的模型測試,也適配分布式訓(xùn)練集群場景 —— 通過多客戶端模擬真實數(shù)據(jù)并行訪問存儲集群,充分覆蓋從單節(jié)點到分布式集群的全場景 AI 工作負(fù)載。其最關(guān)鍵的衡量標(biāo)準(zhǔn),是在保證高性能 GPU 利用率(3D-Unet 與 ResNet50 模型下為 90%,CosmoFlow 模型下為 70%)的前提下,存儲系統(tǒng)所能實現(xiàn)的聚合帶寬。這項指標(biāo)是衡量存儲系統(tǒng)實際能力的核心,直接體現(xiàn)其在 AI 訓(xùn)練過程中是否能夠充分“喂飽”計算資源,避免造成 GPU 空閑浪費。
最新測試結(jié)果顯示,在 3D-Unet、ResNet50 以及 CosmoFlow 所有模型的測試場景下,于通用硬件環(huán)境中,針對分布式存儲的最小規(guī)模集群,即三節(jié)點存儲集群,焱融全閃 F9000X 在全球知名分布式存儲廠商中脫穎而出,集群總帶寬等關(guān)鍵指標(biāo)位列全球第一。尤其是在 3D-Unet 模型測試中,集群帶寬達(dá)到 513 GB/s ,為迄今已公布結(jié)果中的最高值。
數(shù)據(jù)來源:MLCommns 官方
除分布式場景外,在單客戶端測試中,焱融全閃 F9000X 同樣展現(xiàn)出優(yōu)異性能,進一步驗證了其在不同部署規(guī)模下的強勁數(shù)據(jù)處理能力。
此外,在新增的 Checkpoint 工作負(fù)載測試中,針對 Llama3-70B 模型場景,通過部署 8 個客戶端模擬并發(fā)請求、搭配 64 個模擬 GPU 環(huán)境,實現(xiàn) 221 GB/s 讀取帶寬與 79 GB/s 寫入帶寬的高性能表現(xiàn)。這種穩(wěn)定且高效的帶寬支撐能力,能夠精準(zhǔn)保障 Checkpoint 文件在模型訓(xùn)練全流程中實現(xiàn)秒級極速讀寫,從底層存儲層面為 AI 訓(xùn)練任務(wù)的斷點續(xù)訓(xùn)連續(xù)性與模型訓(xùn)練穩(wěn)定性筑牢技術(shù)根基,助力企業(yè)從容應(yīng)對大規(guī)模模型訓(xùn)練的嚴(yán)苛存儲需求。
焱融存儲MLPerf測試表現(xiàn)背后:技術(shù)積淀與生態(tài)協(xié)同是關(guān)鍵
據(jù)了解,焱融存儲去年便參與了 MLPerf Storage v1.0 基準(zhǔn)測試,并以出色成績從全球知名存儲廠商中強勢突圍。焱融存儲之所以能在 MLPerf 存儲基準(zhǔn)測試中持續(xù)取得優(yōu)異成績,核心在于其長期深耕 AI 大模型訓(xùn)練與推理等核心場景的技術(shù)積累:一方面,通過長期深耕大模型訓(xùn)練與推理等核心場景,深度理解 AI 工作負(fù)載特性;另一方面,從架構(gòu)設(shè)計到軟硬件全技術(shù)棧,持續(xù)推進系統(tǒng)性創(chuàng)新與優(yōu)化,構(gòu)建起應(yīng)對高性能負(fù)載的核心能力。
與此同時,焱融也與 NVIDIA、Intel、新華三(H3C)、憶恒創(chuàng)源(Memblaze)、大普微(DapuStor)等上下游生態(tài)伙伴展開深度協(xié)同,在網(wǎng)絡(luò)、芯片、服務(wù)器、SSD 等關(guān)鍵環(huán)節(jié)緊密合作,實現(xiàn)軟硬件的深度適配與極致優(yōu)化,有效保障系統(tǒng)在 AI 基礎(chǔ)設(shè)施全鏈路中的高效穩(wěn)定運行。
公開資料顯示,焱融全閃存儲基于其自研的高性能分布式文件系統(tǒng) YRCloudFile,通過多項關(guān)鍵技術(shù)實現(xiàn)性能突破:
采用自研 Multi-Channel 網(wǎng)絡(luò)帶寬聚合技術(shù),可整合多張 InfiniBand/RoCE 網(wǎng)卡性能,在大 IO 場景下充分釋放硬件潛力,支撐超高速數(shù)據(jù)傳輸;
系統(tǒng)具備負(fù)載感知能力,可根據(jù)壓力智能切換中斷與輪詢模式,有效提升 IOPS 性能;
在 IO 模型層面,通過異步非阻塞設(shè)計減少上下文切換、增強并行處理能力,并通過處理器核心資源的高效分配,降低線程調(diào)度開銷,支撐高并發(fā)數(shù)據(jù)處理的同時,充分發(fā)揮 NVMe SSD 的性能優(yōu)勢;
針對大規(guī)模 GPU 集群易出現(xiàn)的網(wǎng)絡(luò)擁塞問題,專項優(yōu)化傳輸機制,保障數(shù)據(jù)傳輸?shù)母咝c穩(wěn)定。
隨著大模型向千億、萬億參數(shù)演進,存儲作為底層支撐的性能要求持續(xù)提升。此次焱融科技在 MLPerf Storage v2.0 中的表現(xiàn),不僅印證了中國存儲廠商的技術(shù)實力,也為 AI 基礎(chǔ)設(shè)施的性能優(yōu)化提供了可參考的實踐路徑。業(yè)內(nèi)預(yù)計,未來存儲系統(tǒng)的高帶寬、低延遲能力依然是 AI 大模型廣泛落地的關(guān)鍵競爭力之一。
相關(guān)文章
- CCF存儲系統(tǒng)測評發(fā)榜,浪潮存儲全面領(lǐng)先!
- CCF中國存儲大會 | 浪潮存儲劉希猛:融合存儲加快“人工智能+”行動落地
- 打破傳統(tǒng)AI存儲器性能和容量瓶頸:華為發(fā)布AI SSD系列新品
- 《2025存力發(fā)展報告》:我國存力規(guī)模達(dá)1680EB,國產(chǎn)存儲介質(zhì)、芯片、系統(tǒng)實現(xiàn)三級突破
- 霄云科技銀河存儲:重構(gòu)AI時代的存儲新范式
- 華瑞指數(shù)云發(fā)布AI原生數(shù)據(jù)平臺WADP:統(tǒng)一的通用存儲架構(gòu),重構(gòu)AI時代數(shù)據(jù)基座
- 大模型推理成本居高不下,浪潮存儲幫你來突圍!
- 適配大疆 Osmo 360,雷克沙 SILVER PLUS micro SD 的存儲優(yōu)勢
- 算力之后看存力,英韌科技洞庭-N3X SSD推動AI和邊緣計算存儲升級
- 數(shù)據(jù)重建異常耗時 深信服EDS存儲通過創(chuàng)新技術(shù)提升可靠性
- 中國力量閃耀MLPerf!泛聯(lián)信息強勢包攬7項世界第一,引領(lǐng)AI存儲新時代!
- 華為OceanStor A系列存儲再登MLPerf全球性能之巔
- 單存儲節(jié)點支持700+ GPU訓(xùn)練!華瑞指數(shù)云首秀登頂MLPerf全球存力榜
- 節(jié)點集群帶寬突破 513GBps 焱融存儲再度登頂MLPerf Storage 全球榜單
- aigo存儲與 TEC 無畏契約分部達(dá)成戰(zhàn)略合作
- aigo存儲與TEC無畏契約分部達(dá)成戰(zhàn)略合作
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案