全球最大的超大規(guī)模智能模型“悟道2.0”發(fā)布,助力打造我國人工智能戰(zhàn)略基礎(chǔ)設(shè)施
2021-06-03 23:45:40AI云資訊1349
6月1日,在2021北京智源大會開幕式上,北京智源人工智能研究院理事長張宏江、學(xué)術(shù)副院長唐杰介紹和發(fā)布了“悟道”模型。這是全球迄今最大的超大規(guī)模智能模型。
目前,“大模型+大算力”是邁向通用人工智能的一條可行路徑。大模型對于人工智能發(fā)展具有重大意義,未來將基于大模型形成類似電網(wǎng)的變革性AI產(chǎn)業(yè)基礎(chǔ)設(shè)施。AI大模型相當(dāng)于“發(fā)電廠”,將數(shù)據(jù),也就是“燃料”,轉(zhuǎn)換為智能能力,驅(qū)動各種AI應(yīng)用。如果將大模型和所有的AI應(yīng)用相連接,為用戶提供統(tǒng)一的智能能力,全社會將形成一個智能能力生產(chǎn)和使用的網(wǎng)絡(luò),即“智網(wǎng)”。大模型就是下一個AI的基礎(chǔ)平臺,是未來AI發(fā)展的戰(zhàn)略基礎(chǔ)設(shè)施。
張宏江表示,國際主流的大模型主要基于英文語料研發(fā),智源研究院作為AI基礎(chǔ)建設(shè)的先行者,成立了由智源研究院學(xué)術(shù)副院長唐杰教授領(lǐng)銜,100多位科研骨干共同參與的“悟道”團隊,啟動面向中文的大規(guī)模智能模型研發(fā)工作?!拔虻馈蹦P拖到y(tǒng)將構(gòu)建“大模型、大平臺、大生態(tài)”,持續(xù)研發(fā)超大規(guī)模智能模型,圍繞大模型研發(fā),構(gòu)建大規(guī)模算力平臺,同時對外開放模型能力,“賦智”各行業(yè)發(fā)展,構(gòu)建大模型生態(tài)。
張宏江介紹“悟道”模型研發(fā)的背景
今年3月20日,智源研究院發(fā)布了中國首個超大規(guī)模智能模型“悟道1.0”,訓(xùn)練出中文、多模態(tài)、認(rèn)知、蛋白質(zhì)預(yù)測等系列模型。經(jīng)過不到3個月的持續(xù)更新迭代,“悟道2.0”實現(xiàn)了更高層面的跨越。
唐杰介紹,“悟道”超大模型智能模型旨在打造數(shù)據(jù)和知識雙輪驅(qū)動的認(rèn)知智能,讓機器能夠像人一樣思考,實現(xiàn)超越圖靈測試的機器認(rèn)知能力?!拔虻馈眻F隊在大規(guī)模預(yù)訓(xùn)練模型研發(fā)上做了很多基礎(chǔ)性工作,形成了自主的超大規(guī)模智能模型技術(shù)創(chuàng)新體系,擁有從預(yù)訓(xùn)練理論技術(shù)到預(yù)訓(xùn)練工具,再到預(yù)訓(xùn)練模型構(gòu)建和最終模型測評的完整鏈條,從技術(shù)上是完整成熟的。通過一系列原始創(chuàng)新和技術(shù)突破,本次發(fā)布的“悟道2.0”實現(xiàn)了“大而聰明”,具備大規(guī)模、高精度、高效率的特點。
唐杰介紹“悟道2.0”模型的具體情況
“悟道2.0”模型的參數(shù)規(guī)模達(dá)到1.75萬億,是GPT-3的10倍,打破了之前由國外預(yù)訓(xùn)練模型創(chuàng)造的1.6萬億參數(shù)記錄,是目前中國首個、全球最大的萬億級模型。
“悟道2.0”模型在中英雙語共4.9T的高質(zhì)量大規(guī)模清洗數(shù)據(jù)上進(jìn)行的訓(xùn)練。訓(xùn)練數(shù)據(jù)包含WuDaoCorpora中的1.2TB中文文本數(shù)據(jù)、2.5TB中文圖文數(shù)據(jù),以及Pile數(shù)據(jù)集的1.2TB英文文本數(shù)據(jù)。“悟道2.0”模型一統(tǒng)文本與視覺兩大陣地,支撐更多任務(wù),更加通用化。
大規(guī)模預(yù)訓(xùn)練模型的參數(shù)規(guī)模通常遠(yuǎn)超傳統(tǒng)的專用人工智能模型,在算力資源、訓(xùn)練時間等方面消耗巨大。為了提升大規(guī)模預(yù)訓(xùn)練模型的產(chǎn)業(yè)普適性和易用性,悟道團隊搭建高效預(yù)訓(xùn)練框架,在高效編碼、高效模型、高效訓(xùn)練、高效微調(diào)和高效推理等方面進(jìn)行全鏈路的原創(chuàng)突破或迭代優(yōu)化,實現(xiàn)效率的大幅提升。
同時,“悟道”模型研發(fā)過程中,智源研究院建設(shè)了全球最大的語料數(shù)據(jù)庫WuDaoCorpora2.0,包含全球最大的中文文本數(shù)據(jù)集、全球最大的多模態(tài)數(shù)據(jù)集、全球最大的對話數(shù)據(jù)集,為行業(yè)內(nèi)大規(guī)模智能模型的研發(fā)提供了豐富的數(shù)據(jù)支撐。
此外,智源研究院還推動開展“悟道”超大規(guī)模智能模型產(chǎn)業(yè)生態(tài)建設(shè),將面向個人開發(fā)者、中小創(chuàng)新企業(yè)、行業(yè)應(yīng)用企業(yè)、IT領(lǐng)軍企業(yè)等不同主體,分別提供模型開源、API調(diào)用、“專業(yè)版”大模型開發(fā)、大模型開發(fā)許可授權(quán)等多種形態(tài)的模型能力服務(wù),賦能AI技術(shù)研發(fā)。
本次大會上,智源研究院與新華社、美團、小米、快手、搜狗、360、寒武紀(jì)、第四范式、好未來、智譜華章等22家“悟道”大模型產(chǎn)業(yè)生態(tài)戰(zhàn)略合作單位進(jìn)行了簽約,并發(fā)出組建“悟道”大模型技術(shù)創(chuàng)新生態(tài)聯(lián)盟的倡議,吸引更多企業(yè)加入,將以聯(lián)盟為樞紐,以企業(yè)需求為導(dǎo)向推動模型研發(fā),共同開發(fā)基于“悟道”大模型的智能應(yīng)用,以模型研發(fā)和應(yīng)用促進(jìn)產(chǎn)業(yè)集聚。
相關(guān)文章
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 僅售999元!唯卓仕AF 9mm F2.8 Air超廣角自動鏡頭來了!
- 僅售999元!唯卓仕AF 14mm F4.0 Air 發(fā)布:輕便全畫幅超廣角自動鏡頭來了
- 華迅科技推出武迅WX-P3固態(tài)硬盤,自有工廠+國資背景助力國產(chǎn)存儲
- 三星Galaxy S25系列:為你的校園生活注入高能科技基因
- 技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀(jì)元
- 未來生活 觸手可得 三星Galaxy智能新品現(xiàn)已開售
- 音質(zhì)升級 煥新登場 三星Galaxy Buds3 FE正式上市
- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能