明略科技研究成果被ACM MM 2025接收,攻克個性化注視點預(yù)測難題
2025-07-09 10:53:45AI云資訊1665
近日,明略科技與北京大學(xué)、吉林大學(xué)合作的最新研究成果《PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction》被ACM MM 2025正式接收。該研究為解決現(xiàn)有視覺注意力模型在個性化注視點預(yù)測中的局限性,提出了一種新的方法(PRE-MAP)和一個大規(guī)模多模態(tài)數(shù)據(jù)集(SPA-ADV),以更好地捕捉個體差異并提高高分辨率視頻中的多屬性注視點預(yù)測精度。
ACM MM 2025(ACM International Conference on Multimedia)計劃將于2025年10月27—31日在愛爾蘭都柏林舉辦。該會議由國際計算機學(xué)會(ACM)主辦,是全球多媒體技術(shù)領(lǐng)域的旗艦會議,同時也是中國計算機學(xué)會(CCF)推薦的A類國際學(xué)術(shù)會議。
論文標(biāo)題:PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction
(中文標(biāo)題:PRE-MAP:用于高分辨率多屬性注視點預(yù)測的個性化眼動追蹤多模態(tài)大語言模型)
論文作者:吳寒冰*、姜平*、蘇安煬*、趙晨旭、傅天宇、吳明輝、譚北平、李慧盈(*為共同第一作者)
研究成果簡述:
1. 直擊行業(yè)核心痛點
在當(dāng)今的數(shù)字廣告領(lǐng)域,理解消費者的目光焦點至關(guān)重要。然而,不同背景的觀眾(如年齡、性別各異)在觀看同一視頻廣告時,其注意力分布也大相徑庭,傳統(tǒng)技術(shù)卻無法捕捉這種個性化差異。傳統(tǒng)的顯著性預(yù)測模型通常采用分割方法,依賴于降采樣的低分辨率圖像來生成顯著性熱圖,隨后將其放大到原生分辨率,這限制了它們捕捉個性化注意力模式的能力。
2. 構(gòu)建高質(zhì)量數(shù)據(jù)底座
為攻克這一難題,研究團隊開創(chuàng)性地建立了業(yè)界領(lǐng)先的大規(guī)模個性化注視行為數(shù)據(jù)集(SPA-ADV),首次記錄了超過4500名不同年齡與性別背景用戶的真實視覺行為。該數(shù)據(jù)集提供精確的個體級注視點坐標(biāo),為個性化顯著性建模提供了高質(zhì)量的基準(zhǔn)數(shù)據(jù)支持。
3. 研發(fā)高精度預(yù)測模型
基于此數(shù)據(jù)集,團隊研發(fā)了PRE-MAP創(chuàng)新AI預(yù)測模型。該模型能結(jié)合用戶的個人特征,利用最前沿的多模態(tài)大模型技術(shù),增強模型的泛化能力和個性化預(yù)測效果,精準(zhǔn)預(yù)測出“某一類人會看哪里”。有效解決現(xiàn)有AI模型預(yù)測不準(zhǔn)、難以聚焦個性化熱點的問題,幫助品牌方和廣告商更科學(xué)地優(yōu)化廣告創(chuàng)意、評估投放效果,實現(xiàn)真正的“精準(zhǔn)觸達”。
明略的多模態(tài)實踐:從腦電到眼動,補齊廣告預(yù)測模型的關(guān)鍵拼圖
此次成果并非孤立的突破,而是明略科技在多模態(tài)領(lǐng)域長期且深度耕耘的必然結(jié)果,彰顯了公司在前沿AI技術(shù)探索與大模型應(yīng)用落地上的前瞻性布局:
早在2023年,明略科技率先成為國內(nèi)首家基于多模態(tài)大語言模型(MLLM)實現(xiàn)智能社交媒體內(nèi)容分析和策略生成的企業(yè),首度將多模態(tài)大語言模型(MLLM)應(yīng)用于識別并預(yù)測能帶來最佳營銷效果的多樣化內(nèi)容類型,開辟了廣告領(lǐng)域全新的多模態(tài)技術(shù)應(yīng)用賽道。
2024年,明略科技推出超圖多模態(tài)大型語言模型(HMLLM),進一步整合了腦電等非標(biāo)模態(tài)數(shù)據(jù),支持企業(yè)對廣告素材中的實體、情緒、效果、場景及受眾等多樣化元素進行深度分析,從而提升營銷效果,生成預(yù)測效果良好的有效營銷內(nèi)容,并為企業(yè)視頻廣告提供多維度優(yōu)化建議。超圖多模態(tài)大型語言模型(HMLLM)的相關(guān)成果曾榮獲ACM MM 2024最佳論文提名。
今年6月,基于自研的超圖多模態(tài)大型語言模型(HMLLM),協(xié)同混合專家(MoE)模型,明略科技再推創(chuàng)新成果——AI驅(qū)動的全球化廣告測試及優(yōu)化平臺AdEff。該平臺專為全球廣告創(chuàng)意測量打造,可快速、準(zhǔn)確預(yù)測消費者對廣告的主觀反應(yīng)和廣告效果,并給出優(yōu)化建議。在測試效率大幅提升的同時,顯著降低廣告測試成本,讓企業(yè)有機會對每一支廣告進行測試,在 “創(chuàng)意感性” 與 “商業(yè)理性” 之間找到平衡。
直至7月本次研究成果被接收,標(biāo)志著明略科技在多模態(tài)學(xué)習(xí)這一人工智能前沿方向取得了又一突破性進展,補齊了廣告預(yù)測模型中“用戶個性化視點追蹤”這一關(guān)鍵拼圖。它既是推動廣告預(yù)測模型高質(zhì)量發(fā)展的重要一環(huán),也昭示著機器理解人類感知的精度即將邁上新的臺階。
在數(shù)字化內(nèi)容日益碎片化的今天,AI驅(qū)動的科學(xué)預(yù)測已成為提升內(nèi)容觸達效率的關(guān)鍵引擎。明略科技在多模態(tài)學(xué)習(xí)領(lǐng)域的系統(tǒng)性實踐,將在品效提升、成本優(yōu)化和內(nèi)容創(chuàng)新層面展現(xiàn)出廣闊的應(yīng)用價值。
立足于此,明略科技的視野不止于多模態(tài)領(lǐng)域的深耕。未來,公司將會面向更廣闊的AI大模型及Agent技術(shù)領(lǐng)域持續(xù)探索,致力于把前沿科研成果轉(zhuǎn)化為強大的產(chǎn)業(yè)動能,驅(qū)動廣告營銷乃至更多行業(yè)的智能化升級,為構(gòu)建高效、智能的技術(shù)生態(tài)貢獻力量。
相關(guān)文章
- 明略科技研究成果被ACM MM 2025接收,攻克個性化注視點預(yù)測難題
- 明略科技吳明輝:從“影響人”到“影響Agent”,Agent員工將在未來成為企業(yè)標(biāo)配
- 明略科技Agent Show上線,DeepMiner引領(lǐng)AGI時代企業(yè)級智能應(yīng)用新范式
- 明略科技發(fā)布DOMO多謀引擎:數(shù)據(jù)洞察+AI智策,釋放真實聲音長效增長力
- 明略科技CDP+MA:突破流量瓶頸,打造全域增長新引擎
- 明略科技入選IDC中國生成式AI市場圖譜代表廠商 | 技術(shù)認可
- 明略科技接入DeepSeek,賦能企業(yè)級應(yīng)用場景
- 明略科技AI Agent賦能企業(yè)打造學(xué)習(xí)型組織與人才隊伍
- 明略科技向港交所遞交上市申請,多模態(tài)數(shù)據(jù)智能應(yīng)用釋放成長潛力
- 明略科技入選“2024全球AIGC先鋒50強”,InsightFlow CMS引領(lǐng)洞察驅(qū)動的營銷新浪潮
- 明略科技集團強勢入選“2024年中國人工智能行業(yè)大模型企業(yè)競爭力100強”
- 明略科技吳明輝:企業(yè)提早布局大模型,未來將更有機會
- 明略科技集團旗下明略智通推出O2O精準(zhǔn)派樣解決方案
- 明略科技集團位列全球生成式AI領(lǐng)軍者TOP60榜單
- 明略科技入選《2023中國數(shù)據(jù)智能產(chǎn)業(yè)圖譜3.0版》,大模型應(yīng)用效果獲多方認可
- 明略科技位列全球生成式AI領(lǐng)軍者TOP60榜單,AI Agent重塑生產(chǎn)工作流
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案