昇騰算力賦能視頻生成革命 浙江大學(xué)團(tuán)隊攻克長時一致性難題
2025-07-31 15:40:36AI云資訊1597
隨著以 Sora 為代表的視頻生成模型技術(shù)的演進(jìn),長視頻生成領(lǐng)域在維持長時序內(nèi)容一致性以及平衡生成質(zhì)量與計算資源效率方面面臨挑戰(zhàn)。浙江大學(xué) 鯤鵬昇騰科教創(chuàng)新卓越中心計算機學(xué)院研究員朱霖潮團(tuán)隊基于此課題持續(xù)深耕并取得重要進(jìn)展。依托昇騰AI基礎(chǔ)軟硬件平臺,該團(tuán)隊提出的技術(shù)方案有效提升了長視頻內(nèi)容一致性,同時顯著優(yōu)化了視頻生成過程中的計算效率。
針對長序列視覺指令生成的核心技術(shù)難題,項目團(tuán)隊成功研發(fā)首個無需訓(xùn)練的長序列視覺指令生成框架LIGER,實現(xiàn)了歷史提示和視覺記憶機制,以及基于DDIM反演的記憶校準(zhǔn)技術(shù)。依托昇騰的編碼加速能力,通過對每個步驟的圖像特征進(jìn)行采樣和存儲,捕捉前序步驟中的關(guān)鍵視覺信息,并將其注入到自注意力機制中,確保步驟間的視覺連貫性。同時,通過自反思機制糾正圖像中的屬性錯誤、邏輯錯誤、對象冗余和身份不一致等問題,使用多種圖像編輯工具進(jìn)行精確修正。該系統(tǒng)在長序列任務(wù)中展現(xiàn)出優(yōu)異的邏輯連貫性和對象屬性準(zhǔn)確性,顯著提升了視覺指令的理解性和實用性。
在計算效率方面,項目團(tuán)隊提出了基于昇騰平臺優(yōu)化的引導(dǎo)式漸進(jìn)蒸餾方法,通過在線教師引導(dǎo)、漸進(jìn)式蒸餾和高頻細(xì)節(jié)保護(hù)三項關(guān)鍵技術(shù),成功加速了視頻擴散模型的生成過程。該方法讓教師模型實時優(yōu)化學(xué)生模型的中間預(yù)測以創(chuàng)建自適應(yīng)訓(xùn)練目標(biāo),通過多階段訓(xùn)練逐步增加步長將復(fù)雜軌跡學(xué)習(xí)分解為可管理的任務(wù),并引入頻域損失函數(shù)保持視頻精細(xì)細(xì)節(jié)。在保持視頻高質(zhì)量輸出基礎(chǔ)上,該方法實現(xiàn)8倍加速。
該項目創(chuàng)新性地將大語言模型推理能力與視頻生成技術(shù)相結(jié)合,為多模態(tài)交互研究開辟了新方向。目前,研究成果已成功入選人工智能頂級會議ICLR 2025,獲得國際學(xué)術(shù)界的高度認(rèn)可。項目構(gòu)建的包含569個任務(wù)的評估數(shù)據(jù)集,為后續(xù)研究提供了重要基準(zhǔn)。
未來,浙江大學(xué) 鯤鵬昇騰科教創(chuàng)新卓越中心將依托昇騰AI基礎(chǔ)軟硬件平臺,持續(xù)深化產(chǎn)學(xué)研協(xié)同創(chuàng)新,著力突破多模態(tài)生成技術(shù)的核心瓶頸,構(gòu)建自主創(chuàng)新、技術(shù)領(lǐng)先的多模態(tài)生成技術(shù)生態(tài)體系,并為國家人工智能戰(zhàn)略與數(shù)字經(jīng)濟發(fā)展儲備核心創(chuàng)新力量。
相關(guān)文章
- 科大訊飛聯(lián)合華為聯(lián)合推出iFlyCode編程一體機昇騰版,筑牢AI編程安全防線
- 與時代共昇騰 華為攜手全愛科技上海AI分享會圓滿舉辦 探智能轉(zhuǎn)型新路徑
- 哈爾濱工業(yè)大學(xué)鯤鵬昇騰科教創(chuàng)新孵化中心成立
- 伙伴協(xié)同創(chuàng)新×行業(yè)場景深耕:先進(jìn)算力加速“下沉”的昇騰路徑
- 昇騰助力中科大團(tuán)隊實現(xiàn)MoE 稀疏大模型并行推理提速超30%
- 聚焦制造業(yè)智能化轉(zhuǎn)型 中國科學(xué)技術(shù)大學(xué)依托昇騰突破知識增強大模型關(guān)鍵技術(shù)
- 昇騰賦能三維生成新突破!浙大團(tuán)隊實現(xiàn)跨模態(tài)可控3D CAD建模
- 聚焦大模型訓(xùn)練效率提升 北大依托昇騰突破細(xì)粒度混合并行技術(shù)
- 昇騰算力賦能視頻生成革命 浙江大學(xué)團(tuán)隊攻克長時一致性難題
- 突破風(fēng)電運維瓶頸!上交大聯(lián)合昇騰實現(xiàn)聯(lián)邦學(xué)習(xí)訓(xùn)練性能飛躍
- 華為攜昇騰384超節(jié)點亮相WAIC 2025
- 昇騰384超節(jié)點亮相2025世界人工智能大會
- 北京大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心突破:自主創(chuàng)新軟件SPONGE性能超越國際主流GPU方案
- 昇騰助力浙江移動內(nèi)部自用業(yè)務(wù)跑出AI加速度
- 云知聲獸牙智能體平臺通過華為昇騰技術(shù)認(rèn)證,AI實力再獲認(rèn)可
- 華為云北方首批超節(jié)點AI智算中心開服,新一代CloudMatrix 384昇騰AI云服務(wù)點亮“綠色引擎”
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案