百度ERNIN獲國際權(quán)威數(shù)據(jù)集GLUE最高分 《麻省理工科技評論》點贊
2019-12-30 15:19:31AI云資訊1277
12月26日,全球頂級科技商業(yè)雜志《麻省理工科技評論》(MITTechnologyReview)英文官方網(wǎng)站報道稱,百度預(yù)訓(xùn)練模型ERNIE超越微軟和谷歌獲得自然語言處理領(lǐng)域權(quán)威數(shù)據(jù)集GLUE最高分。《麻省理工科技評論》指出,GLUE測試的滿分為100分,人類的平均得分大概在87分左右,百度ERNIE則是在業(yè)界首次突破了90分。百度的成就能夠表明多樣化的貢獻(xiàn)參與將有助于推動人工智能研究。
通用語言理解評估基準(zhǔn)GLUE是自然語言處理領(lǐng)域最權(quán)威的排行榜之一。此前,自然語言模型擅長預(yù)測即將出現(xiàn)的下一個單詞,自動完成拼寫,但卻無法理解一個小段落的連續(xù)思路。因為這些模型不能理解句子的意思,弄不清楚句子中代詞的指代關(guān)系。2018年底,谷歌推出BERT,使用“掩碼”技術(shù)更精準(zhǔn)預(yù)測文本段落的含義。
但中文語境中,人工智能對自然語言理解更難。相較于英語里的一個單詞代表一個含義,中文詞語由多個漢字組成,單個漢字在不同詞中又具備不同含義。比如靈,可以是機(jī)靈,也可以是靈魂。
2019年3月,百度發(fā)布NLP模型ERNIE破解了這一難題,通過ERNIE持續(xù)學(xué)習(xí)框架進(jìn)一步優(yōu)化了通用詞匯級知識學(xué)習(xí)和面向任務(wù)類型的預(yù)訓(xùn)練,使得ERNIE能夠掌據(jù)中文漢字構(gòu)成詞匯的方法,也更能準(zhǔn)確預(yù)測出缺失的語句內(nèi)容。而且,研究人員發(fā)現(xiàn)ERNIE在英語中也有更好的效果。
《麻省理工科技評論》指出ERNIE的重要意義不止于此,因其采用了連續(xù)培訓(xùn)的方法,在培訓(xùn)新數(shù)據(jù)和新任務(wù)的同時又不會遺忘已經(jīng)積累的知識。如此,在不怎么需要人工干預(yù)的情況下,就能夠越來越好的執(zhí)行更廣泛的任務(wù)。
短短4個月后,ERNIE再度升級。ERNIE 2.0持續(xù)學(xué)習(xí)的語義理解框架發(fā)布, 可支持增量引入不同角度的自定義預(yù)訓(xùn)練任務(wù),通過多任務(wù)學(xué)習(xí)對模型進(jìn)行訓(xùn)練更新,每當(dāng)引入新任務(wù)時,該框架可在學(xué)習(xí)該任務(wù)的同時,還可牢記以前學(xué)到過的信息。此外,ERNIE 2.0在16項中英文任務(wù)上超越了 BERT 和 XLNet,取得SOTA效果。據(jù)悉,百度ERNIE 2.0的論文已被國際人工智能頂級學(xué)術(shù)會議AAAI-2020收錄,將于2020年2月面向行業(yè)公開展示。
(百度ERNIE 2.0原理示意圖)
從研發(fā)到落地應(yīng)用,從實現(xiàn)中文場景的突破到2.0版本的驚人表現(xiàn),ERNIE屢創(chuàng)佳績背后離不開百度飛槳的長期產(chǎn)業(yè)實踐積累的高效率GPU分布式訓(xùn)練能力。飛槳的分布式訓(xùn)練能夠在相同硬件設(shè)備的情況下,大大縮短產(chǎn)品迭代周期,滿足深度學(xué)習(xí)模型對訓(xùn)練速度的高要求。目前,ERNIE預(yù)訓(xùn)練技術(shù)已廣泛地應(yīng)用于百度內(nèi)外多個產(chǎn)品和技術(shù)場景,在百度搜索、小度音箱、信息流推薦等一系列產(chǎn)品應(yīng)用中發(fā)揮了重要作用。
ERNIE世界性成果引發(fā)的國際媒體關(guān)注,也是中國自研技術(shù)領(lǐng)先業(yè)界的一個縮影。未來,將有越來越多ERNIE這樣的中國科技、百度這樣的中國企業(yè),持續(xù)輸出中國AI的“戰(zhàn)斗值”
相關(guān)文章
- 「百度智能云學(xué)堂」重磅發(fā)布,加速“云智一體”時代AI原生人才培養(yǎng)
- 百度首批簽署聯(lián)合國“創(chuàng)建可持續(xù)品牌”愿景倡議
- 百度商家智能體全新升級,以技術(shù)革新賦能商家轉(zhuǎn)化經(jīng)營新突破
- 新達(dá)內(nèi)與百度智能云達(dá)成戰(zhàn)略合作 聯(lián)合培養(yǎng)人工智能大模型人才
- 未來已來,百度APP與創(chuàng)作者攜手打造全新AIGC內(nèi)容生態(tài)
- 百度:中國自動駕駛的黃埔軍校
- DPVR 全新 AI 眼鏡即將登場,百度云智大會揭秘三大核心亮點
- 煥新出發(fā)!鴻蒙版百度地圖上新小度語音、美食推薦等實用功能
- 鴻蒙版百度地圖新增小度語音、美食推薦,導(dǎo)航更智能,體驗更完善
- 飛槳入選中國人工智能產(chǎn)業(yè)創(chuàng)新成果展,百度打造AI產(chǎn)業(yè)基礎(chǔ)設(shè)施“國家隊”樣板
- DPVR AI眼鏡亮相百度云大會
- 領(lǐng)先OpenAI三個月,百度文庫GenFlow支持自主調(diào)用數(shù)百Agent、多模內(nèi)容并行生成,2.0版本8月上線
- 鴻蒙版百度地圖導(dǎo)航視野升級!界面煥新,體驗再進(jìn)階
- 百度商業(yè)視頻生成模型MuseSteamer來了:音畫一步到位,出廠自帶bgm!
- 百度文心大模型4.5系列模型開源,國內(nèi)首發(fā)平臺GitCode現(xiàn)已開放下載!
- 百度文庫智能PPT月訪問量超3400萬、位列全球第一,市場份額斷崖式領(lǐng)先
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進(jìn)化,技嘉2025線下產(chǎn)品發(fā)布會強(qiáng)勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案