科學(xué)家設(shè)計AI系統(tǒng)從無聲鋼琴演奏視頻中再現(xiàn)演奏聲音
2021-02-13 07:44:35AI云資訊1156
這項技術(shù)被稱為Audeo,由華盛頓大學(xué) 的一個團隊設(shè)計。研究人員使用鋼琴家保羅·巴頓的YouTube視頻對系統(tǒng)進(jìn)行了培訓(xùn)和測試。培訓(xùn)包括約17.2萬巴頓演奏巴赫和莫扎特等著名古典作曲家音樂的視頻幀。
在分析一段無聲視頻時,所產(chǎn)生的系統(tǒng)首先會觀察哪些鍵被按下的順序,確定各個音符及其排列方式。也就是說,它還能感知到每個鍵被擊打的力度和被按住的時間--這讓它能計算出每個音符的強度,以及它在隨后彈奏的音符下面持續(xù)的時間長度。它還考慮到了鋼琴獨特的聲學(xué)特性。然后,這些數(shù)據(jù)被轉(zhuǎn)換為一種可以被現(xiàn)有的數(shù)字合成器理解的格式。據(jù)報道,當(dāng)該合成器回放音樂文件時,它聽起來非常像原始的鋼琴音樂。
在對Audeo的測試中,它的任務(wù)是根據(jù)巴頓演奏的靜音視頻重現(xiàn)鋼琴音樂,而不是系統(tǒng)所訓(xùn)練的音樂作品。當(dāng)SoundHound等音樂識別應(yīng)用分析這些再現(xiàn)時,它們能夠以大約86%的準(zhǔn)確率識別出樂曲。相比之下,當(dāng)這些應(yīng)用分析相同視頻中的原始鋼琴音頻時,其識別準(zhǔn)確率攀升至93%。隨著技術(shù)的進(jìn)一步發(fā)展,這種差距應(yīng)該會縮小。
“我們希望我們的研究能夠?qū)崿F(xiàn)與音樂互動的新方法,”該研究的高級作者Eli Shlizerman副教授說?!袄?,未來的一個應(yīng)用是,Audeo可以擴展到虛擬鋼琴,攝像頭只記錄一個人的手。此外,通過將攝像頭放在真實的鋼琴之上,Audeo有可能協(xié)助教學(xué)生如何演奏的新方法?!?
相關(guān)文章
- 億道數(shù)碼攜驍龍AI PC矩陣亮相高通科技日,定義移動辦公輕時代
- 直擊WAIC 2025 | 浩鯨科技聯(lián)合螞蟻數(shù)科發(fā)起“金融智能體應(yīng)用聯(lián)創(chuàng)聯(lián)盟”
- 多模態(tài)AI融入日常交互 用三星Galaxy手機搭建效率工作流
- 引領(lǐng)智能運維!全新FortiAIOps 3.0重新定義IT運營
- 得瑞領(lǐng)新閃耀2025全球閃存峰會:D8000系列斬獲創(chuàng)新大獎,強勢賦能AI時代數(shù)據(jù)基石
- WAIC 2025 | SHIXP將與PPIO共建分布式智算樞紐平臺
- 2025 WAIC落幕,深謀科技以技術(shù)與落地破局具身智能賽道
- AI賦能基層“智治” 湖北移動打造數(shù)字鄉(xiāng)村治理新樣本
- AI重磅獎項揭曉!用友大易榮膺人力資源服務(wù)業(yè)AI25強及思旗獎
- 中國最大黑客松AdventureX 2025杭州啟幕,涂鴉賦能青年開發(fā)者引爆Physical AI變革
- WAIC2025:澳鵬發(fā)布新一代技術(shù)平臺矩陣 助力大模型垂直應(yīng)用落地
- 共建AI PC企業(yè)服務(wù)生態(tài),京東政企業(yè)務(wù)攜手高通打造驍龍AI PC生態(tài)科技日
- 2025 WAIC“智算技術(shù)創(chuàng)新與行業(yè)實踐” 論壇圓滿落幕 共繪智算生態(tài)新藍(lán)圖
- 四維圖新亮相2025世界智能汽車大會:以AI新基建與數(shù)據(jù)閉環(huán)賦能智駕新范式
- 星辰聚智·才啟未來:2025世界人工智能大會中國電信發(fā)布系列前沿能力及AI產(chǎn)品
- 神州云動CRM亮相2025浪潮AI向新 數(shù)字企業(yè)創(chuàng)新大會
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進(jìn)化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案