精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

小米官方揭秘小米AI技術(shù) 一文看懂小愛(ài)同學(xué)進(jìn)化的奧秘

2021-02-03 22:05:27AI云資訊773

2020年,小米AI技術(shù)持續(xù)發(fā)展背后,藏著無(wú)數(shù)位工程師們的付出和堅(jiān)持

在2020年小米開(kāi)發(fā)者大會(huì)(MIDC)上,小米集團(tuán)副總裁、集團(tuán)技術(shù)委員會(huì)主席崔寶秋宣布小愛(ài)同學(xué)5.0正式上線。小愛(ài)同學(xué)由語(yǔ)音助手正式升級(jí)為智能生活助手。

在小愛(ài)同學(xué)持續(xù)進(jìn)化的背后,是小米AI技術(shù)的強(qiáng)大支撐和不斷深耕,也離不開(kāi)小米AI實(shí)驗(yàn)室工程師們的努力。

2020年,小米AI實(shí)驗(yàn)室克服多項(xiàng)技術(shù)難點(diǎn),在計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)語(yǔ)音、計(jì)算機(jī)聲學(xué)、自然語(yǔ)言處理、知識(shí)圖譜、機(jī)器學(xué)習(xí)、論文與競(jìng)賽等方面均卓有成效。小米自研AI技術(shù)已經(jīng)全面賦能了小米各項(xiàng)業(yè)務(wù)——手機(jī)、AIoT、互聯(lián)網(wǎng)等,HDR技術(shù)助力小米10 Pro/至尊紀(jì)念版奪得DXOMARK評(píng)測(cè)第一。

小米公司2020,小米AI努力前行,突破邊界,在自研創(chuàng)新的路上越來(lái)越堅(jiān)定。2021,我們希望用人工智能的技術(shù)和產(chǎn)品,為你帶來(lái)更美好和更智能的生活。

一、計(jì)算機(jī)語(yǔ)音

計(jì)算機(jī)語(yǔ)音,就是對(duì)人說(shuō)的話進(jìn)行處理,這是一個(gè)很常用的技術(shù),在小愛(ài)同學(xué)里面的語(yǔ)音交互、語(yǔ)音生成等都用到了計(jì)算機(jī)語(yǔ)音技術(shù)。

2020年,小米AI實(shí)驗(yàn)室做了大量的工作,在語(yǔ)音的喚醒、識(shí)別、生成等方面取得了重大的突破。

1、語(yǔ)音喚醒

2020年,小米自研兩麥語(yǔ)音喚醒、低功耗語(yǔ)音喚醒方案分別上線了小愛(ài)音箱Art、小愛(ài)音箱Art電池版和Redmi小愛(ài)觸屏音箱Pro 8英寸電池版,技術(shù)上取得了重大突破。

我們通過(guò)技術(shù)升級(jí),讓誤喚醒率降低了25%、喚醒延遲優(yōu)化了33%,Redmi小愛(ài)觸屏音箱Pro 8英寸電池版在喚醒性能沒(méi)有降低的情況下,待機(jī)時(shí)長(zhǎng)增加了30%。

在喚醒方面,小米語(yǔ)音喚醒技術(shù)為了兼顧低功耗與高性能,采用了雙級(jí)喚醒策略。低功耗待機(jī)喚醒詞檢測(cè)模型,利用子采樣與共享隱含層等技術(shù),減少模型資源消耗的同時(shí)保證召回率在一個(gè)較高的水平。

高性能誤喚醒檢測(cè)模型,采用粗粒度建模單元,結(jié)合局部信息與長(zhǎng)時(shí)上下文信息,高效抑制誤喚醒。通過(guò)從海量數(shù)據(jù)中自動(dòng)挖掘高區(qū)分度訓(xùn)練樣本,再經(jīng)過(guò)數(shù)據(jù)擴(kuò)充技術(shù),提高喚醒模型在低信噪比與小音量場(chǎng)景下的魯棒性。

2、語(yǔ)音識(shí)別

2020年,小米語(yǔ)音識(shí)別在技術(shù)創(chuàng)新和業(yè)務(wù)應(yīng)用上均取得了明顯的進(jìn)步,主要包括4個(gè)方面:

第一,多通道端到端語(yǔ)音識(shí)別算法的研究取得一系列重要進(jìn)展。論文《MULTI-CHANNEL AUTOMATIC SPEECH RECOGNITION USING DEEP COMPLEX UNET》作為研究成果之一已入選IEEE信號(hào)處理協(xié)會(huì)的旗艦活動(dòng) SLT 2021會(huì)議。

文章實(shí)驗(yàn)結(jié)論表明,提出的算法與亞馬遜AI團(tuán)隊(duì)最近提出的神經(jīng)波束形成方法相比具有約10%的性能提升。論文發(fā)布后,此研究繼續(xù)取得突破,相比于經(jīng)過(guò)工業(yè)界長(zhǎng)期驗(yàn)證的遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別傳統(tǒng)解決方案,自研多通道端到端方案取得20%的相對(duì)提高,并入選小米集團(tuán)年度技術(shù)大獎(jiǎng)前20位。

第二,包括手機(jī)、音箱、電視等線上主要業(yè)務(wù)業(yè)務(wù)識(shí)別準(zhǔn)確率大幅提高,相比去年同期識(shí)別錯(cuò)誤率下降50%+。為小愛(ài)同學(xué)提供了更加精準(zhǔn)的環(huán)境感知能力,進(jìn)一步提升了小愛(ài)同學(xué)用戶(hù)語(yǔ)音交互體驗(yàn)。

第三,在細(xì)分人群和細(xì)分場(chǎng)景等方面取得了明顯的改進(jìn)。2020年,小米語(yǔ)音對(duì)音樂(lè)點(diǎn)播、翻譯查詞等頭部場(chǎng)景的中英文混合識(shí)別能力進(jìn)行了專(zhuān)項(xiàng)優(yōu)化,英文歌曲識(shí)別準(zhǔn)確率較改善前提升100%,翻譯查詞識(shí)別準(zhǔn)確率提升50%。另外,針對(duì)兒童等細(xì)分人群識(shí)別準(zhǔn)確率低的問(wèn)題也進(jìn)行了專(zhuān)門(mén)的聲學(xué)調(diào)教,童音識(shí)別準(zhǔn)確率提升近10個(gè)百分點(diǎn)。第四,動(dòng)態(tài)識(shí)別、并行推理等新技術(shù)應(yīng)用改善了線上服務(wù)能力。動(dòng)態(tài)識(shí)別技術(shù)極大地提高了對(duì)突發(fā)或新增內(nèi)容的支持力度,對(duì)新熱資源、網(wǎng)絡(luò)新梗、突發(fā)名詞等已實(shí)現(xiàn)分鐘級(jí)動(dòng)態(tài)增強(qiáng)。在語(yǔ)音識(shí)別業(yè)務(wù) batch 推理優(yōu)化方面,小米的在線語(yǔ)音識(shí)別業(yè)務(wù)通過(guò)深度優(yōu)化 Kaldi 中模型推理模式,將原來(lái)的單序列模式改為 batch 模式,幫助業(yè)務(wù)的吞吐量提升3倍。

3、語(yǔ)音合成

2020年,小愛(ài)同學(xué)在聲音體驗(yàn)上做了很多創(chuàng)新,如奶萌泡芙童聲、多情感語(yǔ)音、粵語(yǔ)合成、定制聲音等,不僅滿(mǎn)足了用戶(hù)對(duì)聲音情感化以及多樣化的需求,還通過(guò)黑科技帶給用戶(hù)更個(gè)性化的聲音體驗(yàn)。小愛(ài)同學(xué)聲音體驗(yàn)升級(jí)的背后,其實(shí)正是小米自研語(yǔ)音合成技術(shù)的迭代創(chuàng)新。

語(yǔ)音合成的工程師們付出了很大的努力,對(duì)端到端語(yǔ)音合成技術(shù)的框架做了重大升級(jí),也就是“第二代端到端語(yǔ)音合成技術(shù)”,只需目標(biāo)發(fā)音人少量的錄音數(shù)據(jù),便可實(shí)現(xiàn)在音色和情感自然度等層面的合成效果高保真還原。

此外,工程師們進(jìn)行了創(chuàng)新性探索,首先通過(guò)在模型中加入聲紋編碼和風(fēng)格編碼,使得目標(biāo)音色在利用其他數(shù)據(jù)完善自己對(duì)各類(lèi)型文本駕馭能力的同時(shí),保存了本真聲音特點(diǎn),如童聲的奶萌,青蔥和茉莉的開(kāi)心、關(guān)心;其次,我們上線了基于深度神經(jīng)網(wǎng)絡(luò)的聲碼器,使得生成的聲音在音質(zhì)上和對(duì)細(xì)節(jié)的刻畫(huà)上更趨于自然飽滿(mǎn)。



用心打磨粵語(yǔ)整體鏈路體驗(yàn),我們對(duì)超過(guò)兩萬(wàn)句回復(fù)做了符合粵語(yǔ)表述的優(yōu)化,只為讓粵語(yǔ)功能更地道、更好用?;浾Z(yǔ)功能將跟隨小愛(ài)同學(xué)5.0在手機(jī)端上線,小米小愛(ài)音箱、小愛(ài)音箱Pro、小愛(ài)音箱Art、小愛(ài)音箱Art 電池版四款音箱已全量上線。

2020年2月,在小米10發(fā)布會(huì)上亮相了黑科技“定制聲音”,用戶(hù)只需要20句話就能夠復(fù)刻自己、戀人、親人的聲音。作為目前行業(yè)內(nèi)唯一一家大規(guī)模落地語(yǔ)音助手場(chǎng)景的公司,我們?cè)诓粩嘟o用戶(hù)帶來(lái)溫情和爽點(diǎn)功能的背后,也曾面臨各種挑戰(zhàn),例如如何基于少量低音質(zhì)數(shù)據(jù)、如何實(shí)現(xiàn)海量聲音模型云端智能調(diào)度、如何降低服務(wù)成本等,是這個(gè)功能落地背后工程師們一直致力解決的“難題”。

但在小米投資企業(yè)深聲科技的幫助下,小愛(ài)同學(xué)的工程師們花了大量時(shí)間精力打磨優(yōu)化,在短短幾個(gè)月時(shí)間攻克了難題,最終帶給用戶(hù)更流暢更逼真的效果體驗(yàn)。

4、聲紋識(shí)別

2020年,聲紋識(shí)別技術(shù)持續(xù)擴(kuò)充新能力,優(yōu)化提升關(guān)鍵指標(biāo),以覆蓋更多應(yīng)用場(chǎng)景。擴(kuò)充新能力層面,我們新增了兒童細(xì)粒度識(shí)別,進(jìn)一步保護(hù)兒童內(nèi)容健康。此外,我們將聲紋的注冊(cè)成本由原先的5句降低到3句,大幅降低了用戶(hù)的注冊(cè)成本。

近期,小米聲紋的工程師更進(jìn)一步,通過(guò)前沿的深度學(xué)習(xí)技術(shù),直接將3句降成0句,用戶(hù)幾乎零注冊(cè)成本就可以使用聲紋能力。目前該技術(shù)已在小米電視5上線,大大提高了聲紋用戶(hù)覆蓋率。

在識(shí)別準(zhǔn)確率與誤識(shí)率層面,經(jīng)過(guò)一年的迭代優(yōu)化,我們達(dá)到了業(yè)界領(lǐng)先水平。

目前小米自研的聲紋能力,已落地在手機(jī)、音箱、電視等多種設(shè)備上,誕生了聲紋鎖、個(gè)性化聊天響應(yīng)、聲紋追劇、聲紋支付等很多用戶(hù)非常喜愛(ài)的場(chǎng)景功能。

二、計(jì)算機(jī)聲學(xué)

小米聲學(xué)技術(shù)致力于研發(fā)業(yè)界領(lǐng)先的智能聲學(xué)技術(shù),以物理聲學(xué)、心理聽(tīng)覺(jué)、信號(hào)處理、深度學(xué)習(xí)為理論基礎(chǔ),開(kāi)展陣列增強(qiáng)、通話降噪、智能感知、音頻聲場(chǎng)、聲學(xué)測(cè)量等技術(shù)領(lǐng)域的研究工作,全面支持小米集團(tuán)各個(gè)業(yè)務(wù)線的聲學(xué)算法需求,其中通話降噪、麥克風(fēng)陣列、協(xié)同喚醒、組合立體聲、全屋播放、揚(yáng)聲器均衡等算法達(dá)到行業(yè)領(lǐng)先水平,已在多款小愛(ài)同學(xué)產(chǎn)品上線。

1、協(xié)同喚醒

大家都知道,當(dāng)我們只有一個(gè)智能設(shè)備時(shí),下達(dá)指令非常簡(jiǎn)單且直接。但隨著用戶(hù)家里的智能設(shè)備越來(lái)越多,在使用和操作方面也變得更加復(fù)雜,小米一直在思考如何讓智能生活變得足夠簡(jiǎn)單輕松、沒(méi)有負(fù)擔(dān)和門(mén)檻——小愛(ài)同學(xué)5.0,就是那個(gè)能幫你決策最佳執(zhí)行設(shè)備的“智能生活助手”。

小米希望通過(guò)全場(chǎng)景智能協(xié)同,為用戶(hù)提供多設(shè)備跨場(chǎng)景的靈活應(yīng)答和執(zhí)行能力,能夠智能地選出最符合預(yù)期的設(shè)備喚醒應(yīng)答、調(diào)起能力最匹配的設(shè)備執(zhí)行指令、通過(guò)最適合的設(shè)備觸達(dá)提醒。

首先在協(xié)同喚醒方面,當(dāng)你用語(yǔ)音喚醒小愛(ài)同學(xué)時(shí),小愛(ài)同學(xué)將會(huì)從設(shè)備距離、活躍狀態(tài)、形態(tài)等綜合條件判斷,選擇最優(yōu)的設(shè)備應(yīng)答并傾聽(tīng),避免一呼百應(yīng)。在控制功耗、不增加時(shí)延的同時(shí),實(shí)現(xiàn)與其他設(shè)備的高效協(xié)同,突破原本“就近喚醒原則”的限制,實(shí)現(xiàn)根據(jù)場(chǎng)景不同喚醒不同設(shè)備的協(xié)同喚醒。

其次是協(xié)同響應(yīng)方面,小愛(ài)同學(xué)解決了空間位置關(guān)系感知、設(shè)備能力統(tǒng)一建模、用戶(hù)上下文狀態(tài)管理等方面的技術(shù)難題,讓小愛(ài)同學(xué)在接收并理解你指令后,自主選擇出設(shè)備能力最能滿(mǎn)足當(dāng)前語(yǔ)義需求的設(shè)備,更好的滿(mǎn)足你的需求。

最后是協(xié)同提醒方面,借助小米IoT生態(tài)的優(yōu)勢(shì),小愛(ài)同學(xué)會(huì)即時(shí)通過(guò)海量小米智能設(shè)備獲知環(huán)境狀態(tài),加上對(duì)用戶(hù)家居控制習(xí)慣的學(xué)習(xí)記憶,預(yù)測(cè)你潛在的設(shè)備控制需求,適時(shí)主動(dòng)為你作出提醒和建議,例如說(shuō)晚安提醒你關(guān)燈,溫度高時(shí)提醒你開(kāi)空調(diào)或風(fēng)扇。

2、陣列增強(qiáng)

在日常生活場(chǎng)景中,如果說(shuō)話的人距離智能設(shè)備的麥克風(fēng)較遠(yuǎn),加上周?chē)嬖诘脑肼?、多徑反射和混響,?huì)導(dǎo)致麥克風(fēng)收取信號(hào)的質(zhì)量下降,嚴(yán)重影響語(yǔ)音識(shí)別率。

針對(duì)這一問(wèn)題,2019年,小米聲學(xué)與語(yǔ)音團(tuán)隊(duì)聯(lián)合推出了自主研發(fā)的陣列喚醒算法,并于2月20日上線小米AI音箱,有效提升噪聲場(chǎng)景平均喚醒率及回聲場(chǎng)景平均喚醒率。

9月20日發(fā)布的小愛(ài)音箱Pro及小愛(ài)音箱全量采用六麥自主研發(fā)的陣列喚醒算法,成為小米首款落地的全自主研發(fā)的智能音箱。

2020年,小愛(ài)音箱Art、小愛(ài)音箱Art電池版、Redmi小愛(ài)觸屏音箱Pro 8英寸電池版陸續(xù)發(fā)布,均搭載了小米自研兩麥陣列增強(qiáng)技術(shù),采用兩麥盲源分離降噪前端,通過(guò)盲源分離、降噪、回聲消除等技術(shù),在多聲源的嘈雜環(huán)境、音箱自身播放音樂(lè)時(shí),都能結(jié)合語(yǔ)音增強(qiáng)技術(shù),消除噪音的強(qiáng)干擾,獲得干凈、準(zhǔn)確的人聲音頻。

未來(lái),這項(xiàng)技術(shù)將應(yīng)用到更多的小米設(shè)備中。

3、組合立體聲/全屋播放

小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì),依托自研分布式技術(shù),持續(xù)研發(fā)出了基于Wi-Fi組網(wǎng)的分布式放音技術(shù),并實(shí)現(xiàn)了國(guó)內(nèi)智能音箱首次落地組合立體聲的放音能力。

2020年,聲學(xué)團(tuán)隊(duì)分布式放音技術(shù)全面升級(jí),跟隨小愛(ài)音箱Art發(fā)布立體聲2.0,持續(xù)在全屋播放場(chǎng)景深挖技術(shù),打通了設(shè)備端與云端的復(fù)雜信息同步,創(chuàng)新性地實(shí)現(xiàn)了語(yǔ)音支持全屋播放,用戶(hù)只需說(shuō)一句“全屋播放XXX的音樂(lè)”,即可實(shí)現(xiàn)同賬號(hào)同Wi-Fi下的所有設(shè)備自動(dòng)組網(wǎng)、并自動(dòng)同步播放相同音頻。在實(shí)現(xiàn)語(yǔ)音自動(dòng)組網(wǎng)的同時(shí),也仍然支持APP內(nèi)操作組建播放組,滿(mǎn)足用戶(hù)不同場(chǎng)景的不同播放需求。

除此以外,組合立體聲功能在2020年還實(shí)現(xiàn)了支持藍(lán)牙、Auxin場(chǎng)景,用戶(hù)可以通過(guò)藍(lán)牙或Auxin模式,自由地在組合立體聲上播放自己喜愛(ài)的音樂(lè)。

4、聲學(xué)標(biāo)準(zhǔn)

結(jié)合小米在硬件產(chǎn)品上的交互經(jīng)驗(yàn)和數(shù)據(jù)累積,2020年,聲學(xué)實(shí)驗(yàn)室完成了《智能語(yǔ)音設(shè)備聲學(xué)硬件準(zhǔn)入標(biāo)準(zhǔn)和設(shè)計(jì)建議》企業(yè)標(biāo)準(zhǔn)報(bào)批,并且作為起草單位參與了《信息技術(shù)智能語(yǔ)音交互測(cè)試》國(guó)家標(biāo)準(zhǔn)和《智能家居終端技術(shù)要求及等級(jí)評(píng)估方法》IEEE標(biāo)準(zhǔn)的制定。

建立適用于智能語(yǔ)音交互產(chǎn)品的遠(yuǎn)場(chǎng)語(yǔ)音前端系統(tǒng)測(cè)評(píng)規(guī)范,旨在從用戶(hù)體驗(yàn)角度建立一套科學(xué)完善的系統(tǒng)性能測(cè)評(píng)標(biāo)準(zhǔn),為技術(shù)改進(jìn)和方案選型提供有力支撐,促進(jìn)語(yǔ)音技術(shù)產(chǎn)業(yè)良性發(fā)展。

三、自然語(yǔ)言處理

1、MiNLP平臺(tái)

經(jīng)過(guò)兩年多的打造,小米AI實(shí)驗(yàn)室從0到1,推出了一個(gè)技術(shù)領(lǐng)先、應(yīng)用廣泛、有小米特色的自然語(yǔ)言處理平臺(tái)(下稱(chēng)MiNLP平臺(tái))。目前MiNLP平臺(tái)已經(jīng)升級(jí)到了3.0版本,包含數(shù)十項(xiàng)NLP功能,已有30多個(gè)業(yè)務(wù)使用該平臺(tái),每天調(diào)用量達(dá)到80億次。2020年11月,我們開(kāi)源了MiNLP平臺(tái)中文分詞工具,后續(xù)還將陸續(xù)開(kāi)源詞性標(biāo)注、命名實(shí)體識(shí)別、句法分析、語(yǔ)義分析工具。

分詞是自然語(yǔ)言處理的基礎(chǔ),對(duì)小愛(ài)同學(xué)理解用戶(hù)意圖起著重要的作用。小愛(ài)同學(xué)之前采用開(kāi)源分詞,準(zhǔn)確性不高且未針對(duì)業(yè)務(wù)場(chǎng)景進(jìn)行優(yōu)化。MiNLP平臺(tái)通過(guò)對(duì)分詞功能進(jìn)行升級(jí),在語(yǔ)料自動(dòng)標(biāo)注、領(lǐng)域數(shù)據(jù)增強(qiáng)、深度學(xué)習(xí)模型、人工干預(yù)機(jī)制、多端支持等方面有了很大的創(chuàng)新,先進(jìn)的MiNLP平臺(tái)為小愛(ài)同學(xué)提供強(qiáng)大基礎(chǔ)技術(shù)支撐。

2、機(jī)器翻譯

我們經(jīng)常遇到的翻譯是語(yǔ)音輸入——大家說(shuō)話然后把它翻譯成其他語(yǔ)言。在機(jī)器翻譯過(guò)程中,第一步是通過(guò)語(yǔ)音識(shí)別系統(tǒng)將語(yǔ)音識(shí)別成文字,然后通過(guò)文字翻譯系統(tǒng),將文字翻譯成另外一種文字。在這個(gè)過(guò)程當(dāng)中,語(yǔ)音識(shí)別系統(tǒng)可能會(huì)發(fā)生錯(cuò)誤,且錯(cuò)誤率一直較高。

針對(duì)這個(gè)問(wèn)題,小米AI實(shí)驗(yàn)室給出了一些解決方法,其中,提出了基于對(duì)抗訓(xùn)練的抗噪語(yǔ)音翻譯技術(shù),簡(jiǎn)單來(lái)說(shuō),就是訓(xùn)練時(shí)盡量構(gòu)造一些可能出錯(cuò)的句子一起加入訓(xùn)練。

同時(shí),小米通過(guò)技術(shù)探索,對(duì)現(xiàn)有主流的神經(jīng)機(jī)器翻譯模型進(jìn)行了優(yōu)化,在移動(dòng)端設(shè)備上實(shí)現(xiàn)了基于低計(jì)算能力CPU的高質(zhì)量低延時(shí)的離線翻譯。

3、多模態(tài)內(nèi)容理解

“多模態(tài)”,簡(jiǎn)單來(lái)說(shuō)就是:擁有各種傳感器的智能設(shè)備,除了能聽(tīng)(耳)會(huì)說(shuō)(嘴)外,同時(shí)還能利用攝像頭(眼)觀察、利用底盤(pán)云臺(tái)(腳)移動(dòng)等,從而全面的理解用戶(hù)意圖,和用戶(hù)進(jìn)行溝通,滿(mǎn)足用戶(hù)的需求。

作為多模態(tài)融合的應(yīng)用場(chǎng)景之一,小米在視覺(jué)模塊上投入了較多精力,全面擴(kuò)充了小愛(ài)同學(xué)的視覺(jué)能力,包括集成鍵盤(pán)輸入、語(yǔ)言輸入、圖像輸入的多模態(tài)輸入能力,自動(dòng)截屏進(jìn)行翻譯、識(shí)物的語(yǔ)音與屏幕融合能力,還有新版掃一掃集成的六大核心功能:掃文檔、翻譯、掃碼、識(shí)物、掃題、名片,全新的小愛(ài)同學(xué)5.0實(shí)現(xiàn)了多場(chǎng)景視覺(jué)能力提升,小愛(ài)同學(xué)的“眼睛”更好用了。

從語(yǔ)音輸入走向視覺(jué)輸入,未來(lái)的人工智能不僅會(huì)是生活的工具,也將會(huì)朝著人機(jī)交互、情感交互的的趨勢(shì)發(fā)展,而如你我所見(jiàn),小米的人工智能,一直在追求更自然地交互、更懂用戶(hù)的需求的方向上努力,從未停下腳步。

4、人機(jī)對(duì)話

語(yǔ)音交互中的全雙工連續(xù)對(duì)話能力,是目前業(yè)界比較關(guān)注的熱點(diǎn)。全雙工語(yǔ)音交互的特點(diǎn)是具備“邊說(shuō)邊聽(tīng),可隨時(shí)打斷”的能力。小愛(ài)同學(xué)是首個(gè)在手機(jī)上實(shí)現(xiàn)自然連續(xù)對(duì)話的智能語(yǔ)音助理。作為小米人工智能應(yīng)用前沿探索的先鋒,小愛(ài)同學(xué)經(jīng)歷了幾代的技術(shù)積累與成長(zhǎng),也正朝著人文化、智能化的方向邁進(jìn)。

小愛(ài)同學(xué)5.0的對(duì)話式主動(dòng)智能,改變過(guò)去語(yǔ)音助手有問(wèn)才有答的產(chǎn)品形態(tài),小愛(ài)同學(xué)將會(huì)自己和你溝通,像人一樣發(fā)起問(wèn)題來(lái)增進(jìn)對(duì)你的了解,擁有了關(guān)于你的記憶,背后強(qiáng)大的全場(chǎng)景主動(dòng)服務(wù)能力也得以更好的施展。

為了讓小愛(ài)同學(xué)能像人一樣,擁有“記憶”,小米克服了很多難點(diǎn),首先,有賴(lài)于小米NLP技術(shù)支持的30多個(gè)業(yè)務(wù)場(chǎng)景、日調(diào)用次數(shù)達(dá)80億的深厚積累,用戶(hù)對(duì)小愛(ài)同學(xué)說(shuō)過(guò)的話會(huì)經(jīng)過(guò)NLP分析處理,并主動(dòng)學(xué)習(xí)其中關(guān)于用戶(hù)的知識(shí),另外,小愛(ài)同學(xué)還能計(jì)算哪些問(wèn)題可以主動(dòng)向用戶(hù)提問(wèn),并在合適的時(shí)機(jī)加入到對(duì)話式主動(dòng)智能的溝通隊(duì)列中。

然后是記憶的存儲(chǔ),用戶(hù)專(zhuān)屬的小愛(ài)同學(xué)云端大腦會(huì)為用戶(hù)建立多維度的個(gè)人畫(huà)像,實(shí)現(xiàn)了全設(shè)備個(gè)人信息互聯(lián)互通,每次交互都可以結(jié)合個(gè)人畫(huà)像進(jìn)行計(jì)算,產(chǎn)生出面向用戶(hù)的個(gè)性化結(jié)果。

四、知識(shí)圖譜

知識(shí)圖譜,簡(jiǎn)單理解就是知識(shí)庫(kù),包括小愛(ài)同學(xué)的問(wèn)答、搜索、推薦等能力都有涉及。知識(shí)圖譜對(duì)小愛(ài)應(yīng)用場(chǎng)景支持更廣泛,除了知識(shí)問(wèn)答場(chǎng)景外,支持音樂(lè)、視頻、古詩(shī)、菜譜、復(fù)雜推理、閑聊等場(chǎng)景。我們還在小愛(ài)同學(xué)中增加了字、詞、篇章、古詩(shī)的教育類(lèi)能力,強(qiáng)化了“世界之最”以及“十萬(wàn)個(gè)為什么”知識(shí)專(zhuān)項(xiàng)。

小愛(ài)同學(xué)背后的知識(shí)圖譜技術(shù)的提升主要體現(xiàn)在以下幾個(gè)方面:

知識(shí)融合:多源異構(gòu)知識(shí)融合技術(shù)不僅支持了文本知識(shí)融合還支持了多模態(tài)知識(shí)的融合;

知識(shí)構(gòu)建:知識(shí)自動(dòng)構(gòu)建技術(shù)已經(jīng)可以支持用戶(hù)定制及敏捷擴(kuò)展,可以更高效的支撐更多的業(yè)務(wù);

知識(shí)關(guān)聯(lián):目前已經(jīng)可以支持復(fù)雜的關(guān)系推理和知識(shí)推薦場(chǎng)景;

概念圖譜:概念圖譜體系持續(xù)擴(kuò)展,目前概念體系擴(kuò)展到了97%的實(shí)體;

實(shí)體鏈接:實(shí)體鏈接技術(shù)更加成熟,效果在小愛(ài)場(chǎng)景上準(zhǔn)召都到98%以上。

2021年,小米將打造更自動(dòng)化的知識(shí)圖譜構(gòu)建技術(shù)、更智能化的知識(shí)表示和知識(shí)推理應(yīng)用、更開(kāi)放化的知識(shí)圖譜社區(qū)、更特色化的知識(shí)內(nèi)容。

2020年,小米AI技術(shù)持續(xù)發(fā)展背后,藏著無(wú)數(shù)位工程師們的付出和堅(jiān)持,也融合著小米期望將AI科技融入智能生活的美好愿景。

未來(lái),小米AI實(shí)驗(yàn)室將繼續(xù)攻克一個(gè)又一個(gè)難題,探索科技新高度,用人工智能的技術(shù)和產(chǎn)品,為每一個(gè)人帶來(lái)更美好和更智能的生活。

相關(guān)文章

人工智能企業(yè)

更多>>

人工智能硬件

更多>>

人工智能產(chǎn)業(yè)

更多>>

人工智能技術(shù)

更多>>
AI云資訊(愛(ài)云資訊)立足人工智能科技,打造有深度、有前瞻、有影響力的泛科技媒體平臺(tái)。
合作QQ:1211461360微信號(hào):icloudnews