騰訊云小微首次技術(shù)開放日,揭秘AI語音背后的奧秘
2020-07-20 15:17:32AI云資訊1682
隨著科學(xué)技術(shù)的發(fā)展,自動化技術(shù)將機(jī)械控制進(jìn)化為信號控制,幫助工業(yè)生產(chǎn)和日常生活更加便利高效。
同時(shí)人工智能開始替代人類的雙手進(jìn)行部分工作,比如AI語音助手接收聲音信號通過數(shù)據(jù)分析和識別,響應(yīng)人類指令完成指定操作。
AI技術(shù)的每一次革新,都會對社會生活進(jìn)行一次深度改變。從智能音箱走進(jìn)千家萬戶,到智能車聯(lián)陪伴日常行程,在數(shù)字化升級、消費(fèi)轉(zhuǎn)型的風(fēng)口面前,我們可以期待怎樣的AI技術(shù)打開未來的智能生活?
在剛剛結(jié)束的騰訊技術(shù)開放日·騰訊云小微AI語音專場,來自騰訊智能平臺產(chǎn)品部AI語音專家?guī)黻P(guān)于語音識別、自然語言理解、智能對話機(jī)器人等行業(yè)應(yīng)用探索等領(lǐng)域的精彩分享,從騰訊云小微AI語音助手的角度,揭開AI語音助手在技術(shù)和應(yīng)用領(lǐng)域的探索和最新成果。
云+端協(xié)調(diào)、軟硬件一體,打造魯棒的車載語音識別系統(tǒng)
在直播中提到,就構(gòu)建魯棒的車載語音識別系統(tǒng)而言,人工智能首先要解決的難題就是數(shù)據(jù)分析與識別,只有將各個(gè)行業(yè)的寶貴經(jīng)驗(yàn)搜集并形成數(shù)據(jù)庫,再通過電腦自動識別知識并進(jìn)行分析,才能從億萬條數(shù)據(jù)中剝絲抽繭,找到匹配用戶使用場景的正確反饋。
但是在實(shí)際應(yīng)用環(huán)境如汽車使用過程中,車載語音識別面臨著重重挑戰(zhàn)。在語音識別將人類的聲音信號轉(zhuǎn)化為文字或者指令的過程中,用戶口音、環(huán)境噪聲、海量POI以及場景化語音均構(gòu)成影響識別系統(tǒng)決策的變量,尤其考驗(yàn)語音識別系統(tǒng)的基礎(chǔ)穩(wěn)定性。
為此騰訊云小微AI語音助手在接收信號后,通過聲學(xué)前端處理,對豐富的聲音信息進(jìn)行甄別,分流至本地語音識別、云語音識別以及云+端協(xié)調(diào)機(jī)制進(jìn)行精準(zhǔn)識別,提供更為精準(zhǔn)的技術(shù)解決方案。
以常見的環(huán)境噪聲處理為例,當(dāng)用戶聲音信號發(fā)出,在路噪、風(fēng)噪、空調(diào)、音響等不同噪聲類型的干擾下,很容易讓車載語音識別發(fā)生理解偏差。騰訊云小微AI語音助手從車內(nèi)語音交互場景出發(fā),通過騰訊自有技術(shù)和硬件設(shè)備完成回聲消除、噪聲抑制以及定位和拾音,確保得到干凈的語音信號,同時(shí)在聲學(xué)模型層面從訓(xùn)練數(shù)據(jù)、特征提取、網(wǎng)絡(luò)結(jié)構(gòu)等方面進(jìn)行針對性優(yōu)化以提升識別系統(tǒng)對噪聲的魯棒性。
在基礎(chǔ)能力方面,因?yàn)橛序v訊云加持,再根據(jù)自主研發(fā)的全棧AI技術(shù),整合前端降噪、語音識別、語義理解、人聲合成、圖像識別能力,能夠提供云到端的完整的AI解決方案。
在直播中,我們還看到了騰訊云小微AI語音助手在不同用戶口音輸入語音情況下如何做出精準(zhǔn)反饋。騰訊云小微AI語音助手的魯棒性源自容錯(cuò)性極小的兩套處理方案,一是基于遷移學(xué)習(xí)的分地域模型方案,二是引入地域向量的單模型方案。在這樣的智能車載語音識別系統(tǒng)下,騰訊云小微AI語音助手聯(lián)合騰訊車聯(lián)TAI已合作多家國內(nèi)頭部車企和熱銷車型,通過騰訊云小微車載語音識別系統(tǒng)的助力,無懼用戶口音,精準(zhǔn)識別語音指令,滿足車內(nèi)交互場景的語音需求。
實(shí)現(xiàn)深度學(xué)習(xí)的自然語義理解,打造基于理解的人機(jī)交互
自然語義理解是人機(jī)自然對話的核心技術(shù)基礎(chǔ)。如何讓語音助手實(shí)現(xiàn)家庭、汽車和辦公室的無縫連接,甚至可以預(yù)測并解決用戶的需求,只有懂“深度學(xué)習(xí)”并可以進(jìn)行“理解”的語音技術(shù)才能勝任這樣的要求。
在技術(shù)開放日上,深入探討了這項(xiàng)AI技術(shù)如何實(shí)現(xiàn)深度學(xué)習(xí)。人工智能技術(shù)基于數(shù)據(jù)的邏輯分析,在一定程度上的確可以實(shí)現(xiàn)自我學(xué)習(xí),但是相較于人類的情感需求、精神狀態(tài),再智能的AI語音助手也難以讀懂主人的“心”,因此具備理解能力的人機(jī)交互成為技術(shù)攻關(guān)的重點(diǎn)所在。
根據(jù)騰訊技術(shù)開放日·騰訊云小微專場直播所演示,騰訊云小微AI語音助手以高質(zhì)量低延時(shí)語音合成、智能語音交互系統(tǒng),進(jìn)化成為真正以用戶需求為導(dǎo)向的個(gè)性化服務(wù)。
物聯(lián)網(wǎng)時(shí)代,語義理解成為語音交互的核心所在。通過聲學(xué)前端處理,降低干擾信號、抑制回聲,提升語音識別效果、語音喚醒效果,隨即將文字轉(zhuǎn)換為命令字,通過語料模型匹配,做領(lǐng)域分發(fā)。在這個(gè)過程中騰訊云小微AI語音助手支持自然語音識別,語義理解、語音指令隨意說,系統(tǒng)均可很好的理解并執(zhí)行,同時(shí)將文本轉(zhuǎn)化為語言流,在終端設(shè)備上進(jìn)行語音播報(bào)。
僅以智能語音交互系統(tǒng)為例,騰訊云小微AI語音助手向我們展示了在智能車聯(lián)模式中,人車之間愉悅的交互體驗(yàn)。高效自然的語音輸入方式,輸入速度遠(yuǎn)高于手動輸入;安全行車釋放雙手,切換導(dǎo)航、調(diào)換歌曲不分散注意力;更重要的是騰訊云小微AI語音助手能夠讀懂車主語音中所包含的語氣、情緒等豐富信息,以做出正確的判斷,讓行車過程省心省力。
高質(zhì)量低延時(shí)語音合成則為我們展示了智能語音系統(tǒng)的深度學(xué)習(xí)能力?;凇盎ヂ?lián)網(wǎng)+”自然語言理解發(fā)展成自然的人-機(jī)器交互方式是指基于自然語言理解技術(shù)重塑人與機(jī)器之間的交互方式,使自然語言成為人-機(jī)器之間進(jìn)行交互的自然接口。通過騰訊云小微AI語音助手的語音合成能力,支持純中文、純英文以及中英混搭的合成場景,提供50+種不同男女聲音色,個(gè)性化音色定制能力,王者榮耀妲己、李白定制語音包;采用業(yè)內(nèi)領(lǐng)先的算法,優(yōu)化不同場景中的語音音色,讓AI語音助手發(fā)聲更為自然。
這是因?yàn)轵v訊云小微AI語音助手采用專門為機(jī)器設(shè)計(jì)的語言編寫程序來“告知”機(jī)器,當(dāng)用戶發(fā)出某項(xiàng)聲音指令時(shí),機(jī)器通過深度學(xué)習(xí)掌握指令的真實(shí)意圖并執(zhí)行,達(dá)成機(jī)器說脫口秀的效果。怎么讓機(jī)器的音質(zhì)高保真、韻律更加自然連貫?騰訊云小微AI語音助手給出的答案是神經(jīng)網(wǎng)絡(luò)語音合成系統(tǒng),整體架構(gòu)上使用序列建模的聲學(xué)模型與神經(jīng)網(wǎng)絡(luò)聲碼器。通過GAN優(yōu)化Parallel WaveNet、WaveRNN、FeatherWave等技術(shù)升級,達(dá)到高質(zhì)量、高穩(wěn)定性的自然人聲。
客服機(jī)器人的功能設(shè)計(jì)與實(shí)現(xiàn),開放能力降低企業(yè)智能化成本
如何通過AI語音助手幫助企業(yè)級用戶進(jìn)行商業(yè)變現(xiàn)?以客服機(jī)器人的接入與實(shí)現(xiàn)角度,指出能力獲取的方式之一正是在技能開放平臺通過標(biāo)準(zhǔn)協(xié)議、賬號打通、商業(yè)轉(zhuǎn)化、推薦運(yùn)營全面由開發(fā)者定制方案,構(gòu)建由開發(fā)者到用戶的語音服務(wù)路徑,讓開發(fā)者以成本最小化接入客服機(jī)器人,實(shí)現(xiàn)個(gè)性化和精準(zhǔn)服務(wù)效果最大化,在服務(wù)咨詢階段引入客服機(jī)器人功能,對節(jié)約前端客服人力,提升服務(wù)運(yùn)營效率。
在騰訊云小微AI語音專場我們了解到,騰訊云小微技能開放平臺是唯一支持小程序接入的AI行業(yè)解決方案,目前已經(jīng)開放與京東和大眾點(diǎn)評的合作,用戶語音指令即可操作在京東和大眾點(diǎn)評的購物和服務(wù),幫助小程序?qū)崿F(xiàn)更智能化的用戶體驗(yàn)。
騰訊云小微AI語音助手以自身技術(shù)為突破點(diǎn),在客服機(jī)器人的實(shí)現(xiàn)與接入上,構(gòu)建起完整的工程閉環(huán)。面對未知狀態(tài)(動態(tài))、非結(jié)構(gòu)化環(huán)境下客服機(jī)器人的環(huán)境感知、環(huán)境交互、環(huán)境功能等三個(gè)方面的需求,在功能設(shè)計(jì)與實(shí)現(xiàn)層,按智能環(huán)境系統(tǒng)設(shè)計(jì)提供客服配置、客服使用、發(fā)現(xiàn)問題、解決問題的手段完成任務(wù)需求。
在客服配置上,騰訊云小微AI語音助手將文本模式分類拆分為知識庫檢索、服務(wù)售前、服務(wù)售后等模式,檢索為功能性檢索,售前、售后可根據(jù)問題回答策略轉(zhuǎn)向人工模式。其中分層模塊的搭建上注重知識庫的基礎(chǔ)搭建,模塊分工明確,流程簡單。
在客服使用中,采用多線程方式、人機(jī)協(xié)同,區(qū)別普通的聊天機(jī)器人,依靠系統(tǒng)功能事件&指令的智能交互,形成更為精準(zhǔn)、人性化的索引推薦。
當(dāng)然,客服機(jī)器人還需要加強(qiáng)訓(xùn)練,挖掘算法、索引堆砌并不能解決問題,更多需要明確的系統(tǒng)規(guī)則和流程。想要發(fā)現(xiàn)問題、解決問題,重要的是實(shí)現(xiàn)人工、機(jī)器人的交互,在線客服、模型算法、統(tǒng)計(jì)監(jiān)控、配置平臺,缺一不可。例如從人工服務(wù)界面引用客服機(jī)器人的索引,進(jìn)而給出服務(wù)明確的答案。只有快速迭代優(yōu)化的深度學(xué)習(xí),才能適應(yīng)數(shù)字化時(shí)代的商業(yè)發(fā)展需求。
在客服機(jī)器人的接入上,應(yīng)用入口有電商平臺網(wǎng)站、WAP平臺、微信小程序入口、內(nèi)部客服助手、語音交互方式等,實(shí)現(xiàn)形式基本都是在線模式,webchat方式通過IM、微信小程序、APP入口等實(shí)現(xiàn)。
在自然語言處理技術(shù)方面,我們主要分享了騰訊云小微的兩項(xiàng)前沿技術(shù),1)在2019法研杯閱讀理解賽道中獲得冠軍采用的方案;2)一篇關(guān)于信息抽取的發(fā)表在人工智能國際會議IJCAI-2020上的最新論文。通過直播,我們看到了騰訊云小微在知識抽取與問答領(lǐng)域的技術(shù)積累,并以豐富的案例形象生動的展示了相關(guān)技術(shù)在實(shí)際應(yīng)用中的作用。
不僅如此,我們還能從騰訊云小微AI語音助手強(qiáng)大的開放能力中發(fā)現(xiàn)更多領(lǐng)域的應(yīng)用探索,比如為企業(yè)定制品牌IP形象。這在以往不敢想象,在5G、直播風(fēng)口,虛擬人以安全、可控、高效成為眾多企業(yè)熱衷的對象,而通過騰訊云小微語音助手提供智能語音交互,根據(jù)不同硬件終端和應(yīng)用場景,可以觸發(fā)豐富的表情動作,快速換形象。因?yàn)轵v訊云小微AI語音助手的全雙工交互功能,高度智能化免喚醒、主動引導(dǎo)對話,再加上騰訊系正版IP授權(quán)服務(wù),AI語音助手的商業(yè)變現(xiàn)價(jià)值擁有廣闊的市場機(jī)會。
相關(guān)文章
- 2025騰訊云國際出海峰會:國際業(yè)務(wù)高雙位數(shù)增長,海外客戶規(guī)模同比增長翻倍
- “云+AI”深度融合,蘑菇車聯(lián)攜手騰訊云共拓MogoMind技術(shù)邊界
- 赤子城科技與騰訊云達(dá)成戰(zhàn)略合作,以AI驅(qū)動全球用戶體驗(yàn)升級
- 騰訊云 TVP 走進(jìn)太古可口可樂,共探數(shù)智融合下的企業(yè)增長新路徑
- 2025騰訊全球數(shù)字生態(tài)大會定檔9月16日 萬興科技擬出席騰訊云國際出海峰會
- 云原生應(yīng)用保護(hù)能力獲認(rèn)可!騰訊云再次入選權(quán)威研報(bào)代表廠商
- 騰訊云論文入選數(shù)據(jù)庫頂會VLDB 2025,REDSQL技術(shù)攻克NL2SQL難點(diǎn)
- IDC MarketScape:騰訊云位居國內(nèi)生成式AI數(shù)據(jù)基礎(chǔ)設(shè)施“領(lǐng)導(dǎo)者”象限
- AI時(shí)代,架構(gòu)師如何破局成長?騰訊云架構(gòu)師技術(shù)沙龍圓滿收官
- 騰訊云與全球手游巨頭Voodoo達(dá)成合作,共助小游戲品質(zhì)升級
- 騰訊云上線DeepSeek-V3.1 API,智能體開發(fā)平臺和TI平臺同步上線
- 騰訊云助力秘塔AI降低近數(shù)據(jù)采集及訓(xùn)練成本,實(shí)現(xiàn)全球數(shù)據(jù)高效采集
- 1600萬玩家預(yù)約!騰訊云助力國產(chǎn)英雄射擊游戲《遠(yuǎn)光84》全球公測上線
- 智涌云端,與 AI 共生,騰訊云架構(gòu)師峰會圓滿落幕!
- AI智能加速,騰訊云天御構(gòu)建全流程、多場景金融風(fēng)控安全防線
- “金融智能體創(chuàng)造營”啟航,贊同科技攜手騰訊云共繪金融AI生態(tài)新圖景
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機(jī)器人技能大賽在滬啟動,助推智能建造實(shí)戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機(jī)賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎”,以芯片級創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時(shí)延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報(bào)名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價(jià)值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個(gè)孩子提供專屬學(xué)習(xí)方案