騰訊混元大模型亮相:全鏈路自主研發(fā)
2023-09-11 14:43:50AI云資訊946
9月7日,在2023騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊首次公開了完全自主研發(fā)的通用大語言模型——騰訊混元大模型。得益于全鏈路自研技術(shù),騰訊混元大模型能夠理解上下文的含義,并且有長文記憶能力,可以流暢地進(jìn)行專業(yè)領(lǐng)域的多輪對(duì)話。
騰訊從2021年開始,曾先后推出了千億、萬億級(jí)參數(shù)模型。經(jīng)過多年時(shí)間的持續(xù)研發(fā)投入和積累,以及在實(shí)際應(yīng)用中不斷地自主研發(fā)創(chuàng)新,騰訊目前已經(jīng)完全掌握了從模型算法到機(jī)器學(xué)習(xí)框架,再到AI基礎(chǔ)設(shè)施的全鏈路自研技術(shù)。騰訊混元大模型的誕生,也是騰訊在大模型領(lǐng)域多年的積累和探索的成果。
據(jù)了解,混元大模型是從第一個(gè)token開始從零訓(xùn)練的。通過采用預(yù)訓(xùn)練“探真”技術(shù)、動(dòng)態(tài)鋸齒狀注意力機(jī)制、位置編碼優(yōu)化、原創(chuàng)思維鏈策略等創(chuàng)新的大模型算法,使得大模型事實(shí)幻覺率相比主流開源大模型減少30%—50%,并讓大模型能夠真正像人一樣識(shí)別問題陷阱,并結(jié)合實(shí)際的應(yīng)用場景進(jìn)行推理和決策。
此外,混元大模型還使用了自研的機(jī)器學(xué)習(xí)框架Angel,使得訓(xùn)練速度相比業(yè)界主流框架提升1倍,推理速度比業(yè)界主流框架提升1.3倍。
得益于在算法、學(xué)習(xí)框架等各個(gè)層面進(jìn)行的一系列自研創(chuàng)新,混元大模型已經(jīng)具備良好的可靠性和成熟度,其上下文理解、長文記憶能力和邏輯推理能力表現(xiàn)優(yōu)秀。
在中國信通院《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用的評(píng)估方法》的標(biāo)準(zhǔn)符合性測試中,混元大模型共測評(píng)66個(gè)能力項(xiàng),在“模型開發(fā)”和“模型能力”兩個(gè)重要領(lǐng)域的綜合評(píng)價(jià)均獲得了當(dāng)前的最高分。在主流的評(píng)測集MMLU、CEval和AGI-eval上,混元大模型均有優(yōu)異的表現(xiàn),特別是在中文的理科、高考題和數(shù)學(xué)等子項(xiàng)上表現(xiàn)突出。
騰訊混元大模型是一個(gè)從實(shí)踐中來,到實(shí)踐中去的實(shí)用級(jí)大模型。它不僅展示了騰訊在大模型領(lǐng)域的技術(shù)實(shí)力和創(chuàng)新能力,更體現(xiàn)了騰訊在將人工智能技術(shù)應(yīng)用到實(shí)際場景中的探索和實(shí)踐。通過與產(chǎn)業(yè)數(shù)據(jù)和場景相結(jié)合,混元大模型為解決產(chǎn)業(yè)痛點(diǎn)帶來了全新的思路和方案。
相關(guān)文章
- 騰訊湯道生:打造智能化、全球化雙引擎,助力企業(yè)穩(wěn)增長
- 2025騰訊全球數(shù)字生態(tài)大會(huì)定檔9月16日 萬興科技擬出席騰訊云國際出海峰會(huì)
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會(huì)
- 騰訊音樂TMEA 盛典:以音樂共鳴鏈接生活,讓中國聲音走向世界
- 騰訊地圖即將發(fā)布AI新品,解鎖“AI+時(shí)空智能”產(chǎn)業(yè)新路徑
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 云原生應(yīng)用保護(hù)能力獲認(rèn)可!騰訊云再次入選權(quán)威研報(bào)代表廠商
- 騰訊云論文入選數(shù)據(jù)庫頂會(huì)VLDB 2025,REDSQL技術(shù)攻克NL2SQL難點(diǎn)
- 騰訊跨端開發(fā)框架Kuikly全面適配鴻蒙5并開源,助力應(yīng)用開發(fā)降本增效
- IDC MarketScape:騰訊云位居國內(nèi)生成式AI數(shù)據(jù)基礎(chǔ)設(shè)施“領(lǐng)導(dǎo)者”象限
- 騰訊Youtu-Agent開源!像聊天一樣生成Agent
- AI時(shí)代,架構(gòu)師如何破局成長?騰訊云架構(gòu)師技術(shù)沙龍圓滿收官
- 騰訊會(huì)議打通騰訊元寶,“AI紀(jì)要”實(shí)現(xiàn)開會(huì)邊開邊總結(jié)
- 連續(xù)三年參展!騰訊游戲安全亮相Gamescom 2025并與韓國知名游戲廠商達(dá)成合作
- 海亮科技x騰訊教育 聯(lián)合亮相全球盛會(huì)!
- 騰訊云與全球手游巨頭Voodoo達(dá)成合作,共助小游戲品質(zhì)升級(jí)
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機(jī)器人技能大賽在滬啟動(dòng),助推智能建造實(shí)戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機(jī)賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎(jiǎng)”,以芯片級(jí)創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時(shí)延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動(dòng)AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報(bào)名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會(huì)亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價(jià)值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會(huì)首發(fā)! 螞蟻密算推出AI密態(tài)升級(jí)卡 實(shí)現(xiàn)零改動(dòng)“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會(huì)
- 2025外灘大會(huì):王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個(gè)孩子提供專屬學(xué)習(xí)方案