讓大模型“看得懂”,騰訊混元多模態(tài)圖文理解模型居全球第一梯隊
2025-01-01 20:05:37AI云資訊168814
圖:智源FlagEval大模型角斗場多模態(tài)模型測評界面
在最新公布的FlagEval大模型角斗場榜單上,騰訊混元多模態(tài)圖文理解大模型憑借出色的表現(xiàn),位列國內大模型第一,并且在兩個榜單上均與GPT4o 以及 claude 等模型同列第一梯隊。
智源研究院發(fā)布的FlagEval大模型角斗場榜單
FlagEval大模型角斗場由北京智源研究院推出,接入了全球主流的大模型,并對這些模型進行長期的觀察和測評。
騰訊混元是國內首個基于MoE架構的多模態(tài)大模型。在架構、訓練方法和數(shù)據(jù)處理方面進行了創(chuàng)新和深度優(yōu)化,支持任意長寬比及最高 7K 分辨率圖片的理解。與大部分多模態(tài)模型主要在開源基準測試中進行調優(yōu)不同,騰訊混元多模態(tài)模型更加注重模型的通用性、實用性和可靠性,具備豐富的多模態(tài)場景理解能力。
應用方面,騰訊混元多模態(tài)理解模型面向通用場景和海量應用進行了優(yōu)化,積累了數(shù)千萬相關問答語料,涵蓋圖片基礎理解、內容創(chuàng)作、推理分析、知識問答、OCR 文檔解析、學科答題等眾多場景,可以完成描述圖片內容、將圖片轉換成文本表格、解釋一段代碼、分析賬單、做數(shù)學題等任務。這些能力已經(jīng)在騰訊元寶APP 上線,并可以通過騰訊云的API調用,除了這次納入評測的Hunyuan-vision模型,還包括上個月新發(fā)布的旗艦多模態(tài)理解模型Hunyuan-turbo-vision,具有更強大的能力。
作為實用級大模型,騰訊混元多模態(tài)理解模型目前已經(jīng)在騰訊的業(yè)務場景中取得廣泛應用,其中包括QQ、QQ瀏覽器、騰訊文檔、騰訊游戲、騰訊廣告、微信讀書、微信小程序等。例如,在QQ說說里,可以實現(xiàn)自動為照片配文,在QQ瀏覽器里,可以通過輸入照片,讓AI自動識別圖片并答題,在小程序教育平臺中,可以通過根據(jù)圖片自動寫程序,提升開發(fā)效率。
此外,在騰訊廣告場景中,騰訊混元大模型強大的內容理解能力,為廣告?zhèn)€性化推薦、廣告定位及效果預測提供了有力的支持,提升廣告精準度和用戶瀏覽體驗。
QQ說說AI配文
QQ瀏覽器AI解題答疑
小程序教育平臺-看圖寫小程序
多模態(tài)理解模型能夠同時處理和理解多種模態(tài)信息,實現(xiàn)更全面、更深入的語義理解,它通過整合不同模態(tài)的信息,提高了AI在復雜任務中的表現(xiàn),也為人工智能領域帶來了新的機遇。未來,隨著模型能力的不斷升級,騰訊混元多模態(tài)理解模型也將推出更多大模型圖片搜索、圖片審核以及視頻理解等多個領域的深度應用。
相關文章
- 騰訊湯道生:打造智能化、全球化雙引擎,助力企業(yè)穩(wěn)增長
- 2025騰訊全球數(shù)字生態(tài)大會定檔9月16日 萬興科技擬出席騰訊云國際出海峰會
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 騰訊音樂TMEA 盛典:以音樂共鳴鏈接生活,讓中國聲音走向世界
- 騰訊地圖即將發(fā)布AI新品,解鎖“AI+時空智能”產(chǎn)業(yè)新路徑
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 云原生應用保護能力獲認可!騰訊云再次入選權威研報代表廠商
- 騰訊云論文入選數(shù)據(jù)庫頂會VLDB 2025,REDSQL技術攻克NL2SQL難點
- 騰訊跨端開發(fā)框架Kuikly全面適配鴻蒙5并開源,助力應用開發(fā)降本增效
- IDC MarketScape:騰訊云位居國內生成式AI數(shù)據(jù)基礎設施“領導者”象限
- 騰訊Youtu-Agent開源!像聊天一樣生成Agent
- AI時代,架構師如何破局成長?騰訊云架構師技術沙龍圓滿收官
- 騰訊會議打通騰訊元寶,“AI紀要”實現(xiàn)開會邊開邊總結
- 連續(xù)三年參展!騰訊游戲安全亮相Gamescom 2025并與韓國知名游戲廠商達成合作
- 海亮科技x騰訊教育 聯(lián)合亮相全球盛會!
- 騰訊云與全球手游巨頭Voodoo達成合作,共助小游戲品質升級
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球對話
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案