傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍,推動視頻畫質(zhì)升級
2025-06-24 15:26:23AI云資訊2525
近日,在計算機視覺領域最具影響力的國際競賽 CVPR NTIRE 2025中,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲高效超分辨率挑戰(zhàn)賽(NTIRE 2025 Efficient Super-Resolution Challenge)第一名,短視頻UGC圖像超分辨率挑戰(zhàn)賽(NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第二名,展現(xiàn)了傳音在視頻畫質(zhì)領域的深厚積累與領先實力。
CVPR NTIRE(New Trends in Image Restoration and Enhancement)是計算機視覺頂會CVPR(Conference on Computer Vision and Pattern Recognition)旗下極具影響力的國際學術(shù)競賽,素有“影像算法奧林匹克”之稱。該賽事聚焦視頻復原、圖像增強、生成技術(shù)及質(zhì)量評估等底層視覺任務,旨在推動技術(shù)突破并解決實際應用難題。今年的賽事設置了多項挑戰(zhàn)賽,吸引了全球頂尖科研與產(chǎn)業(yè)隊伍參與。
傳音深耕非洲、南亞等新興市場多年,始終圍繞用戶需求進行本地化創(chuàng)新。近年來數(shù)字媒體飛速發(fā)展,傳音洞察到用戶對智能手機圖像和視頻素質(zhì)提出了更高的要求。據(jù)Dataspark的數(shù)據(jù)顯示,2024年非洲用戶月均在社交、視頻類App上花費約52小時,然而非洲用戶觀看視頻在線播放網(wǎng)速平均不到10M/S,觀看體驗較差。面對非洲等目標市場存在的網(wǎng)速慢、流量貴等現(xiàn)實問題,傳音持續(xù)投入資源,與上海交通大學圖像所MediaLab深入合作,研發(fā)輕量化、低功耗、高性能的畫質(zhì)增強技術(shù),讓更多用戶在有限條件下也能享受高清視覺體驗。
技術(shù)成果一:高效圖像超分辨率中的蒸餾監(jiān)督下的卷積低秩適應
在高效超分辨率挑戰(zhàn)賽中,傳音多媒體團隊和上海交通大學圖像所MediaLab提交的論文“高效圖像超分辨率中的蒸餾監(jiān)督下的卷積低秩適應(Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution)”提出DSCLoRA技術(shù),其借鑒大語言模型中的低秩適應并結(jié)合知識蒸餾策略,在不增加計算成本的前提下顯著提升了高效超分辨率模型的性能。
多個基準數(shù)據(jù)集上的實驗結(jié)果表明DSCLoRA在模型復雜度和性能表現(xiàn)之間實現(xiàn)了出色的均衡。在不增加模型體積和計算開銷的前提下,DSCLoRA能夠大幅提升圖像超分辨率效果,提升弱網(wǎng)環(huán)境下視頻通話與流媒體播放清晰度,同時具備推理速度快、功耗低等優(yōu)點。通過將該算法集成至手機影像引擎,用戶在在線視頻播放、視頻通話、圖像放大、數(shù)碼變焦拍攝等場景中,均可體驗更高分辨率、更銳利自然的畫面。
模型架構(gòu)總覽
技術(shù)成果二:用于短視頻UGC圖像超分辨率的增強語義提取與引導
在短視頻UGC圖像超分辨率挑戰(zhàn)賽中,傳音多媒體團隊和上海交通大學圖像所MediaLab提交的論文“用于UGC圖像超分辨率的增強語義提取與引導(Enhanced Semantic Extraction and Guidance for UGC Image Super Resolution)”,提出一種基于 Diffusion 的新型模型以處理短視頻平臺 UGC 場景下低分辨率退化圖片,有助于實現(xiàn)更穩(wěn)健、感知可信和實際適用的圖像修復。
該模型通過制作特定數(shù)據(jù)集,消除現(xiàn)實 UGC 場景下圖片退化類型和合成退化之間存在的差異。其次,通過引入語義提取模塊,利用 SAM2 預訓練模型提取高層次的上下文信息,協(xié)助模型進行圖像重建任務。最后,針對不同的數(shù)據(jù)集進行參數(shù)微調(diào),使模型在不同數(shù)據(jù)集上表現(xiàn)達到最優(yōu)。
該項技術(shù)突破,將有效處理模糊、壓縮、結(jié)構(gòu)變形等常見失真問題,生成更自然、真實、語義一致的修復圖像,極大提升用戶在短視頻截圖、社交圖片增強等場景中的視覺體驗。
模型架構(gòu)總覽
此次聯(lián)合高校團隊參加國際頂級競賽體現(xiàn)傳音對核心技術(shù)創(chuàng)新的重視與投入,也為后續(xù)畫質(zhì)增強功能的產(chǎn)品化奠定堅實基礎。未來,傳音將加速將畫質(zhì)增強技術(shù)部署到旗下手機產(chǎn)品中,構(gòu)建起一套適應新興市場特色、兼顧性能與體驗的視頻增強解決方案,為更多新興市場用戶帶來更為高清、流暢的視覺體驗。
相關文章
- 華為視頻HDC2025升級:全庫超高清+AI搜索重構(gòu)影音娛樂新范式
- 智象未來兩篇論文入選 CVPR 2025!視頻生成與虛擬換裝齊破局,開源賦能產(chǎn)業(yè)革新
- 字節(jié)豆包視頻模型Seedance 1.0首次登頂全球視頻生成競技榜
- 理大開發(fā)嶄新長視頻推理多模態(tài)框架 加速生成式人工智能應用于視頻分析
- 物聯(lián)網(wǎng)視頻云平臺AIRTC上線阿里云!除了兼容90%以上接口,還有三大技術(shù)優(yōu)勢
- 小魚易連賦能數(shù)字氣象:以超融合視頻底座筑基氣象防災和應急協(xié)同
- Soul成果亮眼:實時人像視頻生成研究成果被CVPR2025錄用
- AI營響力:DeepSeek和智能體寫短視頻腳本,有什么不同?
- 深度測評|2025年短視頻運營推薦榜單:五大實力服務商TOP5
- 鈦動科技解析:如何利用科技力量打造跨境電商爆款吸量短視頻?
- 科技助力非遺煥新,抖音過去一年AI類非遺視頻增長超16倍
- 2025年短視頻運營品牌推薦:五大優(yōu)質(zhì)品牌助力企業(yè)高效運營
- 2025年短視頻培訓推薦:五家機構(gòu)助力你在短視頻領域騰飛
- 特斯拉人形機器人擎天柱解鎖家政新技能,通過看視頻學習,使用吸塵器、扔垃圾,還學會了炒菜
- 火山引擎引領“AI+視頻云”融合創(chuàng)新,開啟智能視頻新時代
- 實力上榜 螢石視頻通話攝像機S10入選2025杭州十大“科技新特產(chǎn)”
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案