騰訊多媒體實(shí)驗(yàn)室自研AI作曲框架XMusic,亮相2023中國新媒體大會
2023-07-14 06:35:16AI云資訊999
7月11日,2023中國新媒體技術(shù)展在湖南國際會展中心舉行。本屆技術(shù)展以“智慧促深融”為主題,重點(diǎn)聚焦人工智能新技術(shù)新應(yīng)用、智慧媒體服務(wù)社會治理新場景等,呈現(xiàn)新技術(shù)賦能融合發(fā)展新生態(tài)。
會上,騰訊多媒體實(shí)驗(yàn)室展出了自研AI通用作曲框架XMusic,基于AIGC技術(shù),用戶只需上傳視頻、圖片、文字、標(biāo)簽、哼唱等任意內(nèi)容,即可生成情緒、曲風(fēng)、節(jié)奏可控的高質(zhì)量音樂,能夠大幅降低音樂創(chuàng)作的門檻。該產(chǎn)品前幾日首度亮相2023年世界人工智能大會,并被評為“鎮(zhèn)館之寶”,引發(fā)廣泛關(guān)注。
隨時隨地實(shí)現(xiàn)AI輔助創(chuàng)作,打造專屬“行走的音樂庫”
在日常生活中,用戶對使用音樂有著多種多樣的需求。比如在視頻剪輯時,需要應(yīng)用多樣的配樂來讓畫面更加生動,但音樂搜索一般只能用歌曲名字、歌手名字等指向性強(qiáng)的信息來搜索,需要耗費(fèi)大量的時間精力;亦或在商超、會場等場所布置時,傳統(tǒng)的環(huán)境音樂選擇容易受到版權(quán)限制,很難獲得多樣且合法的音樂素材。
面對這些難題,騰訊多媒體實(shí)驗(yàn)室自研AI通用作曲框架XMusic可以隨時隨地利用AI輔助實(shí)現(xiàn)音樂創(chuàng)作,打造個人專屬的“行走的音樂庫”。一張圖片、一段文字、一個視頻,甚至是一段哼唱,XMusic都能夠?qū)?yīng)生成出樂曲優(yōu)美連貫、旋律起伏明顯、節(jié)奏強(qiáng)弱交替的高質(zhì)量音樂。比如輸入“逗趣橫生,讓人捧腹大笑”的描述,XMusic就會生成一段節(jié)奏俏皮、旋律歡快的音樂。
對于視頻創(chuàng)作者而言,XMusic無疑是解決配樂難題的一大利器。除此之外,針對互動娛樂、輔助創(chuàng)作、音樂教育、互動娛樂、音樂治療等諸多場景,XMusic也有著很高的實(shí)用價值。
以場景音樂生成為例,XMusic的商用級音樂生成能力可以有效解決線下展廳、體驗(yàn)展、餐廳商超等場景中的環(huán)境音樂版權(quán)問題,為展廳提供多樣化的公播音樂,并在體驗(yàn)展中融入多種智能音樂方案,提升展廳的科技感和體驗(yàn)感。
此外,XMusic也可以發(fā)揮重要的教學(xué)輔助能力,推進(jìn)線上音樂教育的發(fā)展。比如在智慧音樂課堂中,教師可以用XMusic生成多樣的節(jié)拍、節(jié)奏、音高練習(xí)曲目,結(jié)合實(shí)際教學(xué)場景,發(fā)揮AI生成音樂的教學(xué)輔助能力,為學(xué)生在演奏、練耳等多種場景中提供個性化的指導(dǎo)和訓(xùn)練,幫助學(xué)生更快地提升音樂技能。
全面AIGC能力矩陣支撐,實(shí)現(xiàn)音樂高效精準(zhǔn)創(chuàng)作
作為本次技術(shù)展中的亮點(diǎn)之一,XMusic背后的騰訊多媒體實(shí)驗(yàn)室也受到了廣泛關(guān)注,一位熱愛音樂的科學(xué)家,帶領(lǐng)一群同樣熱愛音樂的工程師們從零到一落地了XMusic項(xiàng)目。2019年,騰訊多媒體實(shí)驗(yàn)室負(fù)責(zé)人、騰訊杰出科學(xué)家、IEEE Fellow 劉杉博士帶領(lǐng)實(shí)驗(yàn)室開展“基于多模態(tài)融合的智能內(nèi)容生產(chǎn)”相關(guān)技術(shù)能力研發(fā)并逐步完善AIGC能力矩陣。
騰訊多媒體實(shí)驗(yàn)室自研AI通用作曲框架XMusic,是基于自研的多模態(tài)和序列建模技術(shù),可以將提示詞內(nèi)容解析至符號音樂要素空間,并以此為控制條件引導(dǎo)模型生成豐富、精準(zhǔn)、動聽的音樂,達(dá)到商用級的音樂生成能力要求。
劉杉博士表示,人工智能技術(shù)的飛速發(fā)展對多媒體和相關(guān)領(lǐng)域產(chǎn)生深遠(yuǎn)影響?!膀v訊(多媒體實(shí)驗(yàn)室)將繼續(xù)推動人工智能和多媒體及相關(guān)領(lǐng)域的國際和國家標(biāo)準(zhǔn)制定,打造音視頻、互動沉浸和智能媒體核心能力矩陣,通過騰訊云、騰訊視頻、騰訊游戲等業(yè)務(wù)平臺服務(wù)全球用戶、助力各行業(yè)發(fā)展并踐行科技向善?!?
騰訊多媒體實(shí)驗(yàn)室還在展區(qū)展出前沿技術(shù)方面的三個項(xiàng)目:“全景'云'游東北虎豹國家公園”通過自研技術(shù)智能影像處理和自研VR360解決方案供所有人在“云端”走進(jìn)這片山林秘境;“虛實(shí)融合技術(shù)”產(chǎn)品,可將傳統(tǒng)虛擬制片的成本與難度大幅降低,無需傳感器,只通過一臺相機(jī)或手機(jī),就可將自己植入到虛擬世界中;“騰訊水墨畫”產(chǎn)品融合了視覺、音樂、文字等多種模態(tài),結(jié)合山水畫創(chuàng)作、智能作詩、音樂生成等多種技術(shù)能力,形成了多模態(tài)融合且能互動娛樂的完整技術(shù)方案。
騰訊多媒體實(shí)驗(yàn)室專注于多媒體和相關(guān)領(lǐng)域的前沿技術(shù)探索、產(chǎn)品研發(fā)和應(yīng)用落地,其行業(yè)領(lǐng)先的視頻圖片壓縮和處理引擎、沉浸式VR系統(tǒng)和智能媒體能力矩陣,通過騰訊云、騰訊視頻、騰訊游戲等業(yè)務(wù)平臺服務(wù)全球海量用戶并助力傳媒、文化、旅游等行業(yè)的發(fā)展。同時代表騰訊參與多個國際及國家標(biāo)準(zhǔn)制定,數(shù)十人次擔(dān)任聯(lián)合主席、主編等核心職務(wù),數(shù)百項(xiàng)技術(shù)提案被國際標(biāo)準(zhǔn)采納,榮獲工程艾美獎、技術(shù)盧米埃獎、ISO/IEC杰出貢獻(xiàn)獎等,享有國際盛譽(yù)。
未來,騰訊多媒體實(shí)驗(yàn)室將以創(chuàng)新的視角和前瞻的思維,不斷探索多媒體技術(shù)與AIGC能力的融合,拓展多領(lǐng)域的應(yīng)用場景,為用戶提供更加智能、便捷和豐富的多媒體體驗(yàn)。
相關(guān)文章
- 騰訊湯道生:打造智能化、全球化雙引擎,助力企業(yè)穩(wěn)增長
- 2025騰訊全球數(shù)字生態(tài)大會定檔9月16日 萬興科技擬出席騰訊云國際出海峰會
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 騰訊音樂TMEA 盛典:以音樂共鳴鏈接生活,讓中國聲音走向世界
- 騰訊地圖即將發(fā)布AI新品,解鎖“AI+時空智能”產(chǎn)業(yè)新路徑
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 云原生應(yīng)用保護(hù)能力獲認(rèn)可!騰訊云再次入選權(quán)威研報代表廠商
- 騰訊云論文入選數(shù)據(jù)庫頂會VLDB 2025,REDSQL技術(shù)攻克NL2SQL難點(diǎn)
- 騰訊跨端開發(fā)框架Kuikly全面適配鴻蒙5并開源,助力應(yīng)用開發(fā)降本增效
- IDC MarketScape:騰訊云位居國內(nèi)生成式AI數(shù)據(jù)基礎(chǔ)設(shè)施“領(lǐng)導(dǎo)者”象限
- 騰訊Youtu-Agent開源!像聊天一樣生成Agent
- AI時代,架構(gòu)師如何破局成長?騰訊云架構(gòu)師技術(shù)沙龍圓滿收官
- 騰訊會議打通騰訊元寶,“AI紀(jì)要”實(shí)現(xiàn)開會邊開邊總結(jié)
- 連續(xù)三年參展!騰訊游戲安全亮相Gamescom 2025并與韓國知名游戲廠商達(dá)成合作
- 海亮科技x騰訊教育 聯(lián)合亮相全球盛會!
- 騰訊云與全球手游巨頭Voodoo達(dá)成合作,共助小游戲品質(zhì)升級
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機(jī)器人技能大賽在滬啟動,助推智能建造實(shí)戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機(jī)賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎”,以芯片級創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案