精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

節(jié)點集群帶寬突破 513GBps 焱融存儲再度登頂MLPerf Storage 全球榜單

2025-08-05 17:49:00AI云資訊2105

2025 年 8 月 4 日,全球權(quán)威的 AI 性能基準(zhǔn)評測組織 MLCommons® 正式發(fā)布最新一輪 MLPerf® Storage v2.0 基準(zhǔn)測試結(jié)果。來自中國的存儲廠商焱融科技在此次測試中表現(xiàn)突出,其全閃存儲一體機 F9000X 不僅在全部模型測試中性能領(lǐng)先,更以三節(jié)點存儲集群 513GB/s 的總帶寬刷新 3D-Unet 模型測試的紀(jì)錄,登頂 MLPerf 全球性能榜單。

MLPerfStorageAI存儲性能的黃金衡量標(biāo)準(zhǔn)

MLCommons 作為全球人工智能工程聯(lián)盟,始終致力于規(guī)范 AI 技術(shù)的準(zhǔn)確性、安全性、速度與效率評估,推動 AI 系統(tǒng)性能優(yōu)化,其權(quán)威性得到全球業(yè)界廣泛認(rèn)可。而 MLPerf Storage Benchmark 作為該聯(lián)盟專為 AI 場景打造的存儲基準(zhǔn)測試,通過模擬真實 AI 訓(xùn)練中的 I/O 操作,精準(zhǔn)衡量存儲系統(tǒng)向 GPU 輸送訓(xùn)練數(shù)據(jù)的速度與能力。

此次發(fā)布的 MLPerf Storage v2.0,在 v1.0 基礎(chǔ)上進一步升級:除保留 3D-Unet、ResNet50、CosmoFlow 三大訓(xùn)練模型外,新增 Checkpoint 工作負(fù)載,更全面覆蓋訓(xùn)練中斷點恢復(fù)、模型存檔等實際場景。為確保結(jié)果的嚴(yán)謹(jǐn)性與公正性,v2.0 要求每項基準(zhǔn)測試必須多次重復(fù)執(zhí)行(訓(xùn)練任務(wù) 5 次、Checkpoint 任務(wù) 10 次),且全程連續(xù)運行無失敗,同步提交完整測試日志,最終結(jié)果取多次運行的平均值 —— 這一系列嚴(yán)格規(guī)范,使其成為業(yè)界衡量 AI 存儲性能時最具參考價值的權(quán)威標(biāo)準(zhǔn)。

焱融全閃刷新全球紀(jì)錄最小規(guī)模集群性能第一

MLPerf Storage 基準(zhǔn)測試既支持單個計算節(jié)點(客戶端)運行多個 ACC(GPU 加速器)的模型測試,也適配分布式訓(xùn)練集群場景 —— 通過多客戶端模擬真實數(shù)據(jù)并行訪問存儲集群,充分覆蓋從單節(jié)點到分布式集群的全場景 AI 工作負(fù)載。其最關(guān)鍵的衡量標(biāo)準(zhǔn),是在保證高性能 GPU 利用率(3D-Unet 與 ResNet50 模型下為 90%,CosmoFlow 模型下為 70%)的前提下,存儲系統(tǒng)所能實現(xiàn)的聚合帶寬。這項指標(biāo)是衡量存儲系統(tǒng)實際能力的核心,直接體現(xiàn)其在 AI 訓(xùn)練過程中是否能夠充分“喂飽”計算資源,避免造成 GPU 空閑浪費。

最新測試結(jié)果顯示,在 3D-Unet、ResNet50 以及 CosmoFlow 所有模型的測試場景下,于通用硬件環(huán)境中,針對分布式存儲的最小規(guī)模集群,即三節(jié)點存儲集群,焱融全閃 F9000X 在全球知名分布式存儲廠商中脫穎而出,集群總帶寬等關(guān)鍵指標(biāo)位列全球第一。尤其是在 3D-Unet 模型測試中,集群帶寬達(dá)到 513 GB/s ,為迄今已公布結(jié)果中的最高值。

數(shù)據(jù)來源:MLCommns 官方

除分布式場景外,在單客戶端測試中,焱融全閃 F9000X 同樣展現(xiàn)出優(yōu)異性能,進一步驗證了其在不同部署規(guī)模下的強勁數(shù)據(jù)處理能力。

此外,在新增的 Checkpoint 工作負(fù)載測試中,針對 Llama3-70B 模型場景,通過部署 8 個客戶端模擬并發(fā)請求、搭配 64 個模擬 GPU 環(huán)境,實現(xiàn) 221 GB/s 讀取帶寬與 79 GB/s 寫入帶寬的高性能表現(xiàn)。這種穩(wěn)定且高效的帶寬支撐能力,能夠精準(zhǔn)保障 Checkpoint 文件在模型訓(xùn)練全流程中實現(xiàn)秒級極速讀寫,從底層存儲層面為 AI 訓(xùn)練任務(wù)的斷點續(xù)訓(xùn)連續(xù)性與模型訓(xùn)練穩(wěn)定性筑牢技術(shù)根基,助力企業(yè)從容應(yīng)對大規(guī)模模型訓(xùn)練的嚴(yán)苛存儲需求。

焱融存儲MLPerf測試表現(xiàn)背后:技術(shù)積淀與生態(tài)協(xié)同是關(guān)鍵

據(jù)了解,焱融存儲去年便參與了 MLPerf Storage v1.0 基準(zhǔn)測試,并以出色成績從全球知名存儲廠商中強勢突圍。焱融存儲之所以能在 MLPerf 存儲基準(zhǔn)測試中持續(xù)取得優(yōu)異成績,核心在于其長期深耕 AI 大模型訓(xùn)練與推理等核心場景的技術(shù)積累:一方面,通過長期深耕大模型訓(xùn)練與推理等核心場景,深度理解 AI 工作負(fù)載特性;另一方面,從架構(gòu)設(shè)計到軟硬件全技術(shù)棧,持續(xù)推進系統(tǒng)性創(chuàng)新與優(yōu)化,構(gòu)建起應(yīng)對高性能負(fù)載的核心能力。

與此同時,焱融也與 NVIDIA、Intel、新華三(H3C)、憶恒創(chuàng)源(Memblaze)、大普微(DapuStor)等上下游生態(tài)伙伴展開深度協(xié)同,在網(wǎng)絡(luò)、芯片、服務(wù)器、SSD 等關(guān)鍵環(huán)節(jié)緊密合作,實現(xiàn)軟硬件的深度適配與極致優(yōu)化,有效保障系統(tǒng)在 AI 基礎(chǔ)設(shè)施全鏈路中的高效穩(wěn)定運行。

公開資料顯示,焱融全閃存儲基于其自研的高性能分布式文件系統(tǒng) YRCloudFile,通過多項關(guān)鍵技術(shù)實現(xiàn)性能突破:

采用自研 Multi-Channel 網(wǎng)絡(luò)帶寬聚合技術(shù),可整合多張 InfiniBand/RoCE 網(wǎng)卡性能,在大 IO 場景下充分釋放硬件潛力,支撐超高速數(shù)據(jù)傳輸;

系統(tǒng)具備負(fù)載感知能力,可根據(jù)壓力智能切換中斷與輪詢模式,有效提升 IOPS 性能;

在 IO 模型層面,通過異步非阻塞設(shè)計減少上下文切換、增強并行處理能力,并通過處理器核心資源的高效分配,降低線程調(diào)度開銷,支撐高并發(fā)數(shù)據(jù)處理的同時,充分發(fā)揮 NVMe SSD 的性能優(yōu)勢;

針對大規(guī)模 GPU 集群易出現(xiàn)的網(wǎng)絡(luò)擁塞問題,專項優(yōu)化傳輸機制,保障數(shù)據(jù)傳輸?shù)母咝c穩(wěn)定。

隨著大模型向千億、萬億參數(shù)演進,存儲作為底層支撐的性能要求持續(xù)提升。此次焱融科技在 MLPerf Storage v2.0 中的表現(xiàn),不僅印證了中國存儲廠商的技術(shù)實力,也為 AI 基礎(chǔ)設(shè)施的性能優(yōu)化提供了可參考的實踐路徑。業(yè)內(nèi)預(yù)計,未來存儲系統(tǒng)的高帶寬、低延遲能力依然是 AI 大模型廣泛落地的關(guān)鍵競爭力之一。

相關(guān)文章

人工智能企業(yè)

更多>>

人工智能硬件

更多>>

人工智能產(chǎn)業(yè)

更多>>

人工智能技術(shù)

更多>>
AI云資訊(愛云資訊)立足人工智能科技,打造有深度、有前瞻、有影響力的泛科技媒體平臺。
合作QQ:1211461360微信號:icloudnews