浪潮AI服務(wù)器大幅提升NLP模型Transformer訓(xùn)練性能
2019-09-12 17:05:14AI云資訊648
近日,在北京舉行的2019人工智能計(jì)算大會(huì)(AICC 2019)上,浪潮發(fā)布主流自然語言處理(NLP)模型Transformer的最新性能測試數(shù)據(jù)。Transformer模型參數(shù)規(guī)模可達(dá)數(shù)億,對計(jì)算、通信的要求非常高。性能數(shù)據(jù)顯示,相比同類服務(wù)器,浪潮AI服務(wù)器NF5488M5大幅提升了Transformer的訓(xùn)練性能,GLUE基準(zhǔn)訓(xùn)練至80.4%的時(shí)間相比同類產(chǎn)品大幅減少67%。

浪潮AI服務(wù)器NF5488M5
人工智能正在由“能看、會(huì)聽”的感知智能向“能讀、會(huì)寫”的認(rèn)知智能邁進(jìn)。由于文字是信息、思想的重要載體,如果計(jì)算機(jī)能夠理解文字并能夠用文字表達(dá),那么就具備了讀寫能力,因而NLP被認(rèn)為是認(rèn)知智能的重要突破口。目前主流的NLP模型包括Transformer, Bert, GPT, XLNet等,而Bert和GPT都基于Transformer架構(gòu)。Transformer被視為是NLP的經(jīng)典模型,2017年由谷歌提出,其利用自注意力(self-attention)機(jī)制實(shí)現(xiàn)快速并行,并且可以增加到非常深的深度,充分發(fā)掘DNN模型的特性,提升模型準(zhǔn)確率。
但是Transformer模型訓(xùn)練是一大難題,因?yàn)槠鋮?shù)規(guī)模達(dá)到數(shù)億,對計(jì)算力的需求很大。OpenAI的Transformer模型有12層、768個(gè)隱藏單元,使用8塊P100 GPU在8億詞量的數(shù)據(jù)集上訓(xùn)練40個(gè)Epoch需要一個(gè)月。背后的原因很大程度上在于GPU通信制約。Transformer Attention機(jī)制的全連接層計(jì)算時(shí)會(huì)產(chǎn)生海量參數(shù),而更新參數(shù)梯度需要GPU間高速傳輸。同時(shí),模型規(guī)模很大導(dǎo)致占用大量GPU顯存,而batchsize通常都很小,導(dǎo)致每次計(jì)算的時(shí)間較快,計(jì)算后更新參數(shù)梯度頻繁,這也進(jìn)一步要求更高的GPU間傳輸速度。
浪潮AI服務(wù)器NF5488M5 通過無阻塞的GPU全互連設(shè)計(jì),突破性地實(shí)現(xiàn)了All to All 300GB/s的Peer to Peer帶寬。在當(dāng)前深度學(xué)習(xí)通信模型All Reduce性能表現(xiàn)上,NF5488M5的實(shí)際通信帶寬可以達(dá)到采用常規(guī)NVLink互聯(lián)的GPU服務(wù)器的3倍以上。正是這種特性,大大提升了Transformer模型在NF5488M5上的通信效率,從而加大了計(jì)算通信比,節(jié)約了整體運(yùn)行時(shí)間。測試結(jié)果表明,NF5488M5大幅提升了Transformer訓(xùn)練性能,GLUE基準(zhǔn)訓(xùn)練至80.4%的時(shí)間比采用PCIe互聯(lián)的8GPU服務(wù)器縮短67%,比采用常規(guī)NVLink互聯(lián)的8GPU服務(wù)器縮短31%。

Transformer訓(xùn)練性能測試結(jié)果
浪潮集團(tuán)AI&HPC總經(jīng)理劉軍認(rèn)為,當(dāng)前基于Transformer的Bert, XLNet等模型代表了NLP的發(fā)展方向,而它們的特點(diǎn)就是加速器間通信制約。測試結(jié)果充分表明浪潮AI服務(wù)器NF5488M5在GPU間通信效率上具有顯著領(lǐng)先優(yōu)勢,能夠大幅提升Transformer等大型AI工作負(fù)載的訓(xùn)練性能,降低訓(xùn)練成本,加速認(rèn)知智能研發(fā)和應(yīng)用落地。
浪潮是人工智能計(jì)算的領(lǐng)導(dǎo)品牌,AI服務(wù)器中國市場份額保持50%以上,并與人工智能領(lǐng)先科技公司保持在系統(tǒng)與應(yīng)用方面的深入緊密合作,幫助AI客戶在語音、語義、圖像、視頻、搜索、網(wǎng)絡(luò)等方面取得數(shù)量級(jí)的應(yīng)用性能提升。浪潮與合作伙伴共建元腦生態(tài),共享AI計(jì)算、資源與算法三大核心平臺(tái)能力,助力行業(yè)用戶開發(fā)并部署屬于自己的“行業(yè)大腦”,加速推進(jìn)產(chǎn)業(yè)AI化落地。
相關(guān)文章
- CCF存儲(chǔ)系統(tǒng)測評(píng)發(fā)榜,浪潮存儲(chǔ)全面領(lǐng)先!
- 浪潮云海亮相2025中國算力大會(huì) 重磅發(fā)布InCloud AIOS平臺(tái)
- CCF中國存儲(chǔ)大會(huì) | 浪潮存儲(chǔ)劉希猛:融合存儲(chǔ)加快“人工智能+”行動(dòng)落地
- 專注做好“融合型AI底座”:浪潮云海破解政企AI落地難題
- 浪潮數(shù)據(jù)董事長張東:可演進(jìn)AI基礎(chǔ)設(shè)施激活新質(zhì)生產(chǎn)力
- 飛渡科技再度登頂數(shù)字孿生平臺(tái)市場,空間智能引領(lǐng)產(chǎn)業(yè)變革新浪潮
- 消費(fèi)電子微型化浪潮下,利爾達(dá)RedCap模組的突圍戰(zhàn)
- 數(shù)字浪潮聚北京 創(chuàng)新力量啟新程——2025網(wǎng)易創(chuàng)新創(chuàng)業(yè)大賽濟(jì)南站北京分賽圓滿落幕
- 浪潮通信信息亮相2025 TM Forum Accelerate Asia
- OPPO錢包:數(shù)字科技浪潮中的便捷生活助手
- 全球56.71%份額!2025海信引領(lǐng)百吋電視技術(shù)革新與普及浪潮
- 浪潮信息參加2025開放計(jì)算技術(shù)大會(huì),發(fā)布超節(jié)點(diǎn)與MW整機(jī)柜方案
- 大模型推理成本居高不下,浪潮存儲(chǔ)幫你來突圍!
- 科大訊飛亮相2025世界機(jī)器人大會(huì),智能交互技術(shù)引領(lǐng)具身智能新浪潮
- 電商品牌出海:全球化浪潮下的新機(jī)遇
- 浪潮信息發(fā)布“元腦SD200“超節(jié)點(diǎn),面向萬億參數(shù)大模型創(chuàng)新設(shè)計(jì)
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場景AI,傳音手機(jī)推動(dòng)前沿科技落地新興市場
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機(jī)房參考設(shè)計(jì)白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會(huì)隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動(dòng)AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報(bào)名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會(huì)亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級(jí)!率先適配 “液態(tài)玻璃”,原生體驗(yàn)更極致
- 外灘大會(huì)首發(fā)! 螞蟻密算推出AI密態(tài)升級(jí)卡 實(shí)現(xiàn)零改動(dòng)“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會(huì)
- 2025外灘大會(huì):王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能