阿里云機(jī)器學(xué)習(xí)平臺PAI論文入選 SIGMOD 2023
2023-06-21 16:39:35AI云資訊1019
近日,阿里云機(jī)器學(xué)習(xí)平臺PAI和北京大學(xué)楊智老師團(tuán)隊(duì)合作的論文《GoldMiner: Elastic Scaling of Training Data Pre-Processing Pipelines for Deep Learning》被SIGMOD 2023錄用。論文通過對深度學(xué)習(xí)數(shù)據(jù)預(yù)處理流水線的彈性伸縮,大幅提升了訓(xùn)練性能和集群資源利用效率。
SIGMOD是數(shù)據(jù)庫與數(shù)據(jù)管理系統(tǒng)領(lǐng)域的國際頂級會議,自1975年首次舉辦以來,一直對數(shù)據(jù)管理、存儲和處理的發(fā)展起著深刻的推動作用,在學(xué)術(shù)和工業(yè)界均有巨大影響力。SIGMOD也重視數(shù)據(jù)管理系統(tǒng)與其他方向的交叉,尤其近年來也對機(jī)器學(xué)習(xí)和人工智能領(lǐng)域格外關(guān)注。此次入選意味著阿里云機(jī)器學(xué)習(xí)平臺PAI在深度學(xué)習(xí)數(shù)據(jù)處理方向達(dá)到了全球業(yè)界先進(jìn)水平,獲得了國際學(xué)者的認(rèn)可,展現(xiàn)了中國機(jī)器學(xué)習(xí)系統(tǒng)技術(shù)創(chuàng)新在國際上的競爭力。
近年來,隨著GPU加速器的不斷進(jìn)化,以及各類軟件優(yōu)化技術(shù)的層出不窮,深度學(xué)習(xí)訓(xùn)練的計(jì)算效率正不斷被提升到新的層次。但與此同時(shí),深度學(xué)習(xí)本質(zhì)上仍是一種多階段、多資源的任務(wù)類型:不僅需要在GPU上進(jìn)行大量的訓(xùn)練計(jì)算,同時(shí)往往也需要CPU端的數(shù)據(jù)預(yù)處理流水線(如數(shù)據(jù)增強(qiáng)、特征轉(zhuǎn)換等),這類預(yù)處理計(jì)算是訓(xùn)練出高質(zhì)量模型的必要步驟。因此,GPU端訓(xùn)練性能的提升也帶來了更大的數(shù)據(jù)預(yù)處理壓力,使后者成為新的性能瓶頸。
針對這一問題,在觀察后發(fā)現(xiàn)數(shù)據(jù)預(yù)處理流水線具有無狀態(tài)的特點(diǎn),具有內(nèi)在的資源彈性?;诖耍珿oldMiner將數(shù)據(jù)預(yù)處理流水線和模型訓(xùn)練部分分離執(zhí)行,通過自動計(jì)算圖分析來識別無狀態(tài)的數(shù)據(jù)預(yù)處理計(jì)算,并對其實(shí)現(xiàn)高效的并行加速和彈性伸縮,從而緩解數(shù)據(jù)預(yù)處理瓶頸,提升訓(xùn)練性能。通過與集群調(diào)度器的協(xié)同設(shè)計(jì),GoldMiner進(jìn)一步發(fā)揮了數(shù)據(jù)預(yù)處理計(jì)算的資源彈性,大幅提升集群調(diào)度效率。實(shí)驗(yàn)顯示GoldMiner可提升訓(xùn)練性能最高達(dá)12.1倍,提升GPU集群利用率達(dá)2.5倍。
目前阿里云機(jī)器學(xué)習(xí)平臺 PAI正在將GoldMiner與PAI-DLC集成,以向用戶提供數(shù)據(jù)預(yù)處理加速能力。機(jī)器學(xué)習(xí)平臺PAI面向企業(yè)客戶及開發(fā)者,提供輕量化、高性價(jià)比的云原生機(jī)器學(xué)習(xí),涵蓋PAI-DSW交互式建模、PAI-Designer可視化建模、PAI-DLC分布式訓(xùn)練到PAI-EAS模型在線部署的全流程。其中PAI-DLC提供了云原生一站式的深度學(xué)習(xí)訓(xùn)練平臺,提供靈活、穩(wěn)定、易用和高性能的機(jī)器學(xué)習(xí)訓(xùn)練環(huán)境。支持多種算法框架,超大規(guī)模分布式深度學(xué)習(xí)任務(wù)運(yùn)行及自定義算法框架,為開發(fā)者和企業(yè)降本增效。
論文名字:GoldMiner: Elastic Scaling of Training Data Pre-Processing Pipelines for Deep Learning論文作者:趙漢宇,楊智,程羽,田超,任仕儒,肖文聰,袁滿,陳浪石,劉愷博,張楊,李永,林偉論文pdf鏈接:https://dl.acm.org/doi/pdf/10.1145/3589773
相關(guān)文章
- 讓天下沒有難查的故障:2025 阿里云 AI 原生編程挑戰(zhàn)賽正式啟動
- 阿里云AI火花大會:規(guī)?;耙?,AI務(wù)實(shí)派靠場景破局
- 重塑AI算力底座!阿里云服務(wù)器操作系統(tǒng)V4正式發(fā)布
- 英特爾至強(qiáng)6助力阿里云第九代企業(yè)級ECS實(shí)例100天贏得超萬家客戶青睞
- 繁花有聲|涂鴉智能與阿里云一起,共同推動萬物智能
- 繁花有聲|高德與阿里云一起,開啟智慧出行新范式
- 海外營收增長700%!阿里云助力云鯨智能出海
- 繁花有聲|阿里云與產(chǎn)品伙伴共繪AI生態(tài)新圖景
- 《贏在AI+》迎來收官,阿里云助力企業(yè)乘“AI云全棧技術(shù)”破浪
- 阿里云ESSD同城冗余云盤正式商業(yè)化,同城容災(zāi)成本可降低50%
- 數(shù)字“潮”市點(diǎn)燃AI火花,Yoosee攜手阿里云解鎖未來安防新模樣
- 阿里云領(lǐng)投!BetterYeah AI完成超億元B輪融資,刷新國內(nèi)Agent領(lǐng)域融資紀(jì)錄
- 阿里云瓴羊連續(xù)6年入選 Gartner?ABI 魔力象限報(bào)告,中國唯一!
- 阿里云”618創(chuàng)新加速季“開啟:先進(jìn)、領(lǐng)先的大模型限免 超7000萬 token,加速多場景 AI 應(yīng)用落地
- 奧運(yùn)村街道商會攜重點(diǎn)企業(yè)參訪阿里云,共探AI落地和出海新機(jī)遇
- 阿里云全棧AI技術(shù)引擎驅(qū)動SaaS企業(yè)全球化升級 構(gòu)建出海新范式
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機(jī)器人技能大賽在滬啟動,助推智能建造實(shí)戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機(jī)賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎”,以芯片級創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時(shí)延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報(bào)名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價(jià)值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個(gè)孩子提供專屬學(xué)習(xí)方案