智譜新清影:模型全面升級、4K、任意比例、自帶音效
2024-11-11 14:37:50AI云資訊11826
11月8日,智譜推出新清影:10s時長、4k、60幀超高清畫質(zhì)、任意尺寸,自帶音效,以及更好人體動作和物理世界模擬。
3個月前,作為國內(nèi)首個面向公眾開放的視頻生成產(chǎn)品,清影上線清言App,只需一段指令或圖片,30秒就能生成AI視頻。為人類影視創(chuàng)作帶來了更多創(chuàng)新玩法,如廣告制作、短視頻、表情包梗圖等。
清影發(fā)布后不久,GLM技術團隊先后開源了CogVideoX 2B和5B版本兩個模型,可在消費級顯卡上流暢運行,性能領先的CogVideoX-5B模型自開源以來受到廣泛的關注,并衍生出如CogVideoX-factory等大量的二次開發(fā)項目。
基于CogVideoX模型的最新技術進展和智譜最新推出的音效模型CogSound,新清影在以下5個方面實現(xiàn)了提升。
· 模型能力全面提升:在圖生視頻的質(zhì)量、美學表現(xiàn)、運動合理性以及復雜提示詞語義理解方面能力明顯增強。
· 4K超高清分辨率:支持生成 10s、4K、60幀超高清視頻,視覺體驗拉到極致,動態(tài)畫面更加流暢。
· 可變比例:支持任意比例的圖像生成視頻,超寬畫幅也能輕松Hold住,從而適應不同的播放需求。
· 多通道生成能力:同一指令/圖片可以一次性生成4個視頻。
· 帶聲效的AI視頻:新清影可以生成與畫面匹配的音效了。音效功能將很快在本月上線公測。
即日起,新清影在智譜清言App上線,為了支持廣大開發(fā)者,智譜同時將CogVideoX v1.5-5B、CogVideoX v1.5-5B-I2V進行了開源。
生成視頻將為影視工作者、短視頻創(chuàng)作者提升產(chǎn)量、產(chǎn)能,在其生產(chǎn)流程中發(fā)揮重要作用。不到一年時間,生成視頻技術在視頻時長、生成速度、分辨率、一致性等方面已經(jīng)顯示出長足進步。新清影往前又邁進了一步,未來,智譜也將攜手視覺中國等合作伙伴,基于更豐富的視覺內(nèi)容,產(chǎn)出更好的AI生成視頻工具。
“默片 Sora”進入“有聲電影時代”
智譜認為真正的智能一定是多模態(tài)的,聽覺、視覺、觸覺等共同參與了人腦認知能力的形成,因此,智譜希望包括文字、圖像、語音和視覺等模態(tài)在內(nèi)的智譜多模態(tài)大模型矩陣,能夠進一步提高大模型的應用和工具能力。
因此,GLM模型家族逐步從文字拓展至圖片、視頻、聲音,以及音效。今天,GLM家族加入了新成員——音效模型CogSound和音樂模型CogMusic。即將上線與大家見面的音效模型CogSound能根據(jù)視頻自動生成音效、節(jié)奏等音樂元素,它是基于GLM-4V的視頻理解能力,能夠準確識別并理解視頻背后的語義和情感,在此基礎上生成與之相匹配的音頻內(nèi)容,甚至生成復雜音效,如爆炸、水流、樂器、動物叫聲、交通工具聲等。
音效模型的出現(xiàn)能夠?qū)崿F(xiàn)視頻與聲音的同步創(chuàng)作。同時該模型在電影行業(yè)也具有廣泛的應用前景,比如可以生成電影中的大規(guī)模戰(zhàn)斗場景和災難場景的聲音,大大縮短了制作周期,降低了制作成本。
「CogVideoX + CogSound」由清影生成畫面,音效模型配音
兩周前,智譜剛剛發(fā)布最新的GLM-4-Voice情感語音模型。今天,隨著音效模型的加入,GLM大模型在聲音模態(tài)領域?qū)崿F(xiàn)了人聲、音效、音樂的多鏈路布局,基于圖像、視頻和聲音的多模態(tài)模型矩陣由此更加完整,意味著智譜在多模態(tài)和工具兩個維度上都朝著AGI的目標邁出了一小步。
音效模型將于本月上線清言App,與新清影一起生成有聲AI影片。智譜的理想狀態(tài)是,只需一個好的創(chuàng)意,剩下的事AI都能輔助搞定,輕松將一個idea、一張圖,變成一段自帶bgm的影片。相信這個組合能給創(chuàng)作者和用戶帶來AI生視頻的全新體驗。
當前,AI生成視頻用于影視創(chuàng)作仍需要多種不同的創(chuàng)作工具串聯(lián)使用。但基于智譜多模態(tài)的最新成果,實現(xiàn)這種一站式AI原生多模態(tài)工作流,這樣的前景無疑是激動人心的。
相關文章
- 值得買科技CTO王云峰出席WAIC 2025智譜大模型論壇:讓模型能力在場景中兌現(xiàn)價值
- MiniMax、星野、智譜清言,這些 AI 應用都在用聲網(wǎng)打造對話式 AI 體驗
- 聲網(wǎng)對話式 AI 引擎接入智譜GLM模型,支持獲取智能體短期記憶
- 首發(fā)即支持!昇思MindSpore 0day 支持智譜開源GLM-4-0414全部6個模型
- 智譜AI宣布完成30億融資,三大潛力概念股引領行情
- 云礪(票易通)與智譜AI、無問芯穹達成合作,打造企業(yè)協(xié)同行業(yè)大模型!
- 智譜新清影:模型全面升級、4K、任意比例、自帶音效
- 思邁特x智譜達成戰(zhàn)略合作,攜手探索大模型+BI發(fā)展新范式
- 共建行業(yè)生態(tài),智譜大模型生態(tài)合作伙伴聯(lián)盟成立
- 攜手并進,智馭教育!和鯨科技與智譜AI簽署“101數(shù)智領航計劃”戰(zhàn)略合作協(xié)議
- RTE2024 AI 專場開啟 通義千問、MiniMax、智譜、Soul來了
- “智匯云端,首創(chuàng)未來” 首都在線&智譜戰(zhàn)略合作發(fā)布會在京召開
- 智譜AI與和鯨科技簽署戰(zhàn)略合作協(xié)議,共拓大模型產(chǎn)業(yè)應用與人才培養(yǎng)新未來
- 攜手智譜共建大模型技術聯(lián)合實驗室,榮耀平臺級AI邁向新階段
- 智譜受邀參加2024數(shù)博會,董事長劉德兵分享千億大模型訓練的思考與實踐
- 加速原生創(chuàng)新,智譜攜手昇騰、昇思打造自主創(chuàng)新原生模型
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案