精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

思必馳:語音交互邁入“擬人化”階段

2023-06-29 09:49:35AI云資訊983

消費(fèi)者在交互過程中并非孤立地依據(jù)聲音、表情及動作中的單項進(jìn)行溝通與交流,而是綜合視覺、聽覺、觸覺甚至嗅覺來進(jìn)行有效的溝通。同理,要使機(jī)器做到更加逼真的“擬人化”,就需要通過語音、視覺、文本等信息結(jié)合的方式來推動人機(jī)交互的優(yōu)化與升級。

例如,在復(fù)雜聲學(xué)環(huán)境尤其是多人同時說話的時候,語音識別性能會顯著下降,此時若引入視覺信息對講話者進(jìn)行唇語識別,綜合語音和視頻信息則可以大幅提升說話人跟蹤和語音識別準(zhǔn)確率;又例如,在人機(jī)交互過程中,機(jī)器通過采集用戶的表情、說話語氣,甚至腳步的頻率和急緩程度,可以分析用戶的情緒狀態(tài),以采用不同的方式推進(jìn)交互,提高人機(jī)交互的交互效率與質(zhì)量。

不難看出,應(yīng)對人機(jī)交互場景化應(yīng)用不斷拓展的市場需求,多模態(tài)、智能化的完整解決方案可以更好地應(yīng)對不同場景的復(fù)雜變化,多模態(tài)交互成為行業(yè)發(fā)展的必然趨勢。

深耕行業(yè)多年,思必馳早年便對多模態(tài)交互領(lǐng)域進(jìn)行布局,已經(jīng)成功自主研發(fā)出多模態(tài)對話交互技術(shù)。

具體來看,思必馳多模態(tài)對話交互技術(shù)聯(lián)合語音、語言、視覺等多個模態(tài)的信息,能夠在高噪聲環(huán)境(比如地鐵、家居、車載環(huán)境),大幅提升語音識別率和對話交互成功率。此外,思必馳研發(fā)打造出多模態(tài)對話交互軟硬件一體的解決方案,包括高噪聲環(huán)境下的多模態(tài)喚醒、說話人跟蹤、語音活動檢測等技術(shù),增加了語音交互對噪聲的魯棒性,顯著提升了用戶體驗(yàn)。

目前,思必馳上述方案已應(yīng)用政務(wù)民生場景中的軌道交通、智能自助設(shè)備等需要近場語音交互且環(huán)境嘈雜的場景和產(chǎn)品。

隨著技術(shù)的不斷進(jìn)步,多模態(tài)交互的應(yīng)用場景將會越來越廣泛??梢灶A(yù)見的是,AI語音的發(fā)展在思必馳等技術(shù)領(lǐng)先企業(yè)的持續(xù)推動下,將會為人們帶來更加自然、智能的交互體驗(yàn)。

相關(guān)文章

人工智能企業(yè)

更多>>

人工智能硬件

更多>>

人工智能產(chǎn)業(yè)

更多>>

人工智能技術(shù)

更多>>
AI云資訊(愛云資訊)立足人工智能科技,打造有深度、有前瞻、有影響力的泛科技媒體平臺。
合作QQ:1211461360微信號:icloudnews