快手可靈AI面向全球發(fā)布1.5模型 新增“運(yùn)動(dòng)筆刷”效果業(yè)內(nèi)領(lǐng)先
2024-09-20 13:20:42AI云資訊848
9月19日,可靈AI迎來重磅升級(jí),視頻生成新增可靈1.5模型,在畫質(zhì)質(zhì)量、動(dòng)態(tài)質(zhì)量、美學(xué)表現(xiàn)、運(yùn)動(dòng)合理性以及語義理解等方面均有顯著提升。與此同時(shí),可靈AI還引入了全新的“運(yùn)動(dòng)筆刷”功能,進(jìn)一步提升視頻生成的精準(zhǔn)控制能力。
首先是基座模型再次升級(jí),新增可靈1.5模型,支持在高品質(zhì)模式下,直出1080p高清視頻,挑戰(zhàn)大屏清晰度與質(zhì)感。與可靈 1.0 模型相比,1.5模型在畫面質(zhì)量、動(dòng)態(tài)質(zhì)量、文本響應(yīng)度等方面有顯著效果提升,其內(nèi)部評(píng)測(cè)整體效果提升95%。
此前,可靈1.0模型在高品質(zhì)模式可生成720p視頻,本次升級(jí)后,1.5模型高品質(zhì)模式可直接生成1080p高清視頻。通過輸入提示詞“女孩看著車窗”,對(duì)比左右兩個(gè)版本視頻生成的效果,可以發(fā)現(xiàn),可靈1.5新模型的畫面質(zhì)量提升顯著:畫面清晰度有直觀可感,畫面右側(cè)的女孩面部細(xì)節(jié)更清晰豐富,車窗的水霧、整體光影表現(xiàn)等也都更加出色。同時(shí),新模型下畫面整體構(gòu)圖也進(jìn)一步優(yōu)化,畫面更具美感。
在動(dòng)態(tài)質(zhì)量方面,新模型也有顯著提升。例如,對(duì)比可靈AI此前火爆出圈的吃面案例,輸入提示詞“小男孩吃面”,右側(cè)1.5模型生成的視頻中,面條從被夾起到入口這一過程中,在彈性、垂墜感等方面有非常真實(shí)的物理表現(xiàn),同時(shí)小男孩右手握住筷子和吃面時(shí)的咀嚼動(dòng)作,也都較左側(cè)1.0模型更加自然流暢,整體運(yùn)動(dòng)合理性大大增強(qiáng)。
在圖生視頻方面,可靈全新的1.5模型可以響應(yīng)更復(fù)雜的文本描述要求。例如通過一張沒有人物的食物照片和提示詞“鏡頭拉遠(yuǎn),一個(gè)小男孩走到桌前拿起勺子開始吃飯”。在生成的視頻中,隨著鏡頭的微微晃動(dòng),一個(gè)勺子“入場(chǎng)”,然后畫面聚焦到握著勺子的小男孩,看他將一勺飯菜送到嘴里,勺子在碗里撥開飯粒的細(xì)節(jié)也都被細(xì)致地呈現(xiàn)了出來,顯示出強(qiáng)大的圖生視頻理解能力。
本次升級(jí),可靈AI還帶來了強(qiáng)大的“運(yùn)動(dòng)筆刷”功能,大幅提升了圖生視頻時(shí)創(chuàng)作者對(duì)運(yùn)動(dòng)效果的控制能力?!斑\(yùn)動(dòng)筆刷”功能支持為圖片中的元素(人或物體等)指定運(yùn)動(dòng)軌跡,用戶只需將圖片中需要控制運(yùn)動(dòng)方向的部分勾勒出來,然后畫一個(gè)示意運(yùn)動(dòng)方向箭頭,就可實(shí)現(xiàn)精準(zhǔn)運(yùn)動(dòng)控制。該功能支持上傳圖片后最多為圖中的 6 個(gè)元素(人或物體等)指定運(yùn)動(dòng)軌跡。此外,還可以為某些元素額外指定靜止區(qū)域,讓視頻內(nèi)容有更好的運(yùn)動(dòng)控制及運(yùn)動(dòng)表現(xiàn)。
目前,橫屏(16:9、4:3)、豎屏(9:16、3:4)、方屏(1:1)等多種尺寸格式的圖片,都支持使用「運(yùn)動(dòng)筆刷」生成視頻,生成視頻時(shí)長為5秒。大量用戶和媒體的評(píng)測(cè)顯示,可靈AI的運(yùn)動(dòng)筆刷功能,在易用性、效果表現(xiàn)等方面均為業(yè)內(nèi)領(lǐng)先。
實(shí)際上,可靈AI近期還進(jìn)行了一系列其他功能升級(jí),諸如支持一次性生成最多 4 條視頻,方便創(chuàng)作者快速選取到最優(yōu)生成結(jié)果;“圖生視頻”功能新增支持 10 秒時(shí)長并在標(biāo)準(zhǔn)模式下支持增加尾幀;“AI圖片”功能支持“畫質(zhì)增強(qiáng)”。此外,官方還上線了使用指南,幫助用戶更好地掌控可靈AI。
自今年6月發(fā)布以來,這已經(jīng)是可靈AI累計(jì)第9次迭代升級(jí)。本次升級(jí)也將同步面向全球展開,今年7月,可靈AI宣布國際版1.0正式上線,正式面向全球用戶開放,隨后又推出了全球會(huì)員體系。目前,可靈AI目前已經(jīng)累積了大量的國內(nèi)外用戶,快手高級(jí)副總裁、主站業(yè)務(wù)與社區(qū)科學(xué)線負(fù)責(zé)人蓋坤此前在快手投資者日上披露,已有累計(jì)超260萬人使用過可靈AI,并累計(jì)生成超2700萬個(gè)視頻、5300萬張圖片。
相關(guān)文章
- 累計(jì)生成超2億視頻,快手可靈AI引領(lǐng)“生成式AI應(yīng)用元年”
- CVPR2025:快手可靈四大技術(shù)方向布局視頻生成及世界模型
- 快手上線鴻蒙應(yīng)用高性能解決方案 高效提升數(shù)據(jù)反序列化性能
- 快手與杜比實(shí)驗(yàn)室達(dá)成深度合作 短視頻領(lǐng)域首家全鏈路支持“杜比視界”
- 快手與清華大學(xué)聯(lián)合項(xiàng)目榮獲錢偉長中文信息處理科學(xué)技術(shù)獎(jiǎng)
- 人工智能智庫網(wǎng)絡(luò)在京啟動(dòng),百度、快手、華為、螞蟻、騰訊、阿里等發(fā)起
- 快手可靈AI面向全球發(fā)布1.5模型 新增“運(yùn)動(dòng)筆刷”效果業(yè)內(nèi)領(lǐng)先
- 藍(lán)色光標(biāo)Blue AI攜手快手可靈AI,共同引領(lǐng)AI視頻生成新時(shí)代
- 快手出席2024中國多媒體大會(huì):AI驅(qū)動(dòng)多媒體創(chuàng)新 構(gòu)建AI產(chǎn)學(xué)研生態(tài)
- 快手大模型首次集體亮相WAIC 2024,用AI重塑內(nèi)容與商業(yè)生態(tài)
- CCF-快手大模型探索者基金正式啟動(dòng),賦能全球科研創(chuàng)新
- 快手“快意大模型”獲信通院5級(jí)評(píng)估
- 快手“可靈”大模型燃爆AI賽道 萬興科技金山辦公等受關(guān)注
- 快手發(fā)布對(duì)標(biāo)Sora的視頻生成大模型「可靈」 已開放邀測(cè)體驗(yàn)
- InfoQ發(fā)布中國技術(shù)力量之AIGC先鋒榜 快手“AI小快”等入選最佳實(shí)踐案例
- 快手啟動(dòng)鴻蒙原生應(yīng)用開發(fā),構(gòu)建全場(chǎng)景短視頻社交新體驗(yàn)
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場(chǎng)景AI,傳音手機(jī)推動(dòng)前沿科技落地新興市場(chǎng)
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機(jī)房參考設(shè)計(jì)白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會(huì)隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動(dòng)AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報(bào)名企業(yè)超300家
- 首都機(jī)場(chǎng)“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會(huì)亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級(jí)!率先適配 “液態(tài)玻璃”,原生體驗(yàn)更極致
- 外灘大會(huì)首發(fā)! 螞蟻密算推出AI密態(tài)升級(jí)卡 實(shí)現(xiàn)零改動(dòng)“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會(huì)
- 2025外灘大會(huì):王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢(shì)科技,提升科研數(shù)據(jù)處理效能