靈云語音合成:追求極致真實(shí),高度自然的語音合成效果
2020-02-28 19:06:06AI云資訊1257
近日,捷通華聲推出搭載最新引擎的靈云語音合成技術(shù),聲線細(xì)膩、情感豐富、語速真實(shí)。得益于核心引擎的深度學(xué)習(xí)化與高音質(zhì)聲碼器,最新靈云語音合成技術(shù)的合成效果得到全面提升。
新版靈云語音合成技術(shù)采用一體化智能文本分析算法,結(jié)合統(tǒng)計(jì)和規(guī)則等處理手段,讓文本處理前端擁有強(qiáng)大的分詞、多音字、韻律環(huán)境預(yù)測(cè)能力,使合成的語音聽起來更加符合人類發(fā)音習(xí)慣和說話節(jié)奏。它還具備自動(dòng)識(shí)別和處理日期時(shí)間、數(shù)值金額、電話號(hào)碼等文本的能力,使得數(shù)字發(fā)音更自然,“年月日元”、“百分之”、“點(diǎn)”等分詞朗讀時(shí)的發(fā)音也更加順暢。
升級(jí)后的語音合成技術(shù)在各項(xiàng)指標(biāo)上都達(dá)到了歷史新高。測(cè)評(píng)人員給出的MOS值達(dá)4.5分,屬行業(yè)領(lǐng)先。
注:MOS(Mean Opinion Score),平均主觀意見分。在國(guó)際標(biāo)準(zhǔn)中,統(tǒng)一使用MOS值來評(píng)價(jià)系統(tǒng)接收到的話音質(zhì)量。(滿分5分)合成速度方面,靈云語音合成技術(shù)同樣毫不遜色。從實(shí)際體驗(yàn)來說,用戶幾乎感受不到任何等待時(shí)間,語音合成從點(diǎn)擊“播放”開始即刻完成。為了在各個(gè)專業(yè)領(lǐng)域都能夠有良好穩(wěn)定的語音合成表現(xiàn),滿足不同行業(yè)的特殊需求,靈云語音合成針對(duì)特定詞匯和語句進(jìn)行個(gè)性化定制,通過用戶詞表、定制錄音以及調(diào)整判斷規(guī)則等方法,提高讀音、讀法和韻律的準(zhǔn)確性。經(jīng)過十多年不同行業(yè)的實(shí)踐經(jīng)驗(yàn),捷通華聲積累了大量的專業(yè)領(lǐng)域詞庫(kù)、預(yù)選音庫(kù),可為金融證券、天氣預(yù)報(bào)、體育賽事、公交汽運(yùn)、航空、稅務(wù)、POI、排隊(duì)叫號(hào)等眾多領(lǐng)域提供更專業(yè)的語音合成播報(bào),客戶能夠快速、輕松定制與自己產(chǎn)品屬性、形象相匹配的聲音,為產(chǎn)品賦能。
為滿足各種應(yīng)用場(chǎng)景對(duì)語音合成的需求,捷通華聲推出了完善的語音合成產(chǎn)品體系:
a.由靈云公有云平臺(tái)提供靈云語音合成能力
針對(duì)手機(jī)app、智能手表、智能機(jī)器人等產(chǎn)品,開發(fā)者可通過從云端調(diào)用能力的方式,搭建輕量化終端。
b.基于windows系統(tǒng)的靈云語音合成軟件
車站、醫(yī)院、廣播站的語音播報(bào),可以直接使用安裝在電腦上的靈云語音合成軟件,一鍵播放。
c.私有化部署的靈云語音合成能力平臺(tái)
在客服中心、呼叫中心等場(chǎng)景,用電話機(jī)器人來服務(wù)海量用戶,需要高并發(fā)的語音合成能力。捷通華聲提供可私有云部署的語音合成能力平臺(tái),與客戶IVR系統(tǒng)對(duì)接,提供穩(wěn)定高效的語音合成服務(wù)。
靈云語音合成技術(shù)擁有包含多國(guó)語種的音庫(kù),持普通話、英語、維語、粵語等20多個(gè)語種的語言合成,配合捷通華聲的語音識(shí)別和機(jī)器翻譯技術(shù),能夠?qū)崿F(xiàn)多國(guó)語音面對(duì)面翻譯。
音色方面,除了提供男聲、女聲、童聲等基礎(chǔ)音色庫(kù)外,還有更多個(gè)性化、飽含情感的音色,包括柔美動(dòng)聽、干凈利落、甜美可愛、純真自然、成熟穩(wěn)重、熱情洋溢、措辭嚴(yán)厲等等,可為各種應(yīng)用場(chǎng)景提供合適的聲音,全面滿足企業(yè)個(gè)性化需求。例如,銀行的智能客服需要溫柔動(dòng)聽的聲音,從而給客戶良好的服務(wù)體驗(yàn),而金融行業(yè)的欠款催收?qǐng)鼍?,則需要選擇相對(duì)嚴(yán)厲的聲音,起到警示和催促的作用。
自從2001年在國(guó)內(nèi)率先推出面向市場(chǎng)的語音合成技術(shù)以來,捷通華聲已廣泛服務(wù)金融、電信、能源、交通、教育、司法、公安、醫(yī)療、互聯(lián)網(wǎng)等各領(lǐng)域,并出口美國(guó)、法國(guó)、西班牙、日本、韓國(guó)、新加坡等國(guó)家。捷通華聲愿攜手更多產(chǎn)業(yè)伙伴,為軟件開發(fā)商、系統(tǒng)集成商、解決方案供應(yīng)商等合作伙伴提供優(yōu)質(zhì)的產(chǎn)品和全面的技術(shù)支持,讓更多的企業(yè)及個(gè)人享受到智能語音合成為生活帶來的便利體驗(yàn)。
相關(guān)文章
- 靈云智能客服“懂你”式人機(jī)交互,推動(dòng)金融服務(wù)再升級(jí)
- 靈云AI:全面推動(dòng)智慧城市建設(shè)
- 傳統(tǒng)IVR真的過時(shí)了嗎?靈云智能語音導(dǎo)航給你答案
- 靈云語義理解:不斷學(xué)習(xí)成長(zhǎng)的人工智能
- 靈云語音合成:追求極致真實(shí),高度自然的語音合成效果
- 以AI賦能政企,靈云智會(huì)開啟高效會(huì)議模式
- 靈云語音識(shí)別:給你便捷生活、高效工作新體驗(yàn)
- AI戰(zhàn)“疫“,筑安全防線——靈云疫情防控智能機(jī)器人在行動(dòng)
- 靈云語音分析系統(tǒng):幫助企業(yè)提升市場(chǎng)洞察力
- 全新靈云語音分析系統(tǒng):構(gòu)建自動(dòng)化、智能化、數(shù)據(jù)驅(qū)動(dòng)的客服中心
- 靈云語音識(shí)別:為智能終端插上“雙耳”
- 靈云智能輸入法重磅升級(jí):新增語音速記+快捷翻譯+跨屏輸入
- 靈云語音識(shí)別:用AI賦予產(chǎn)品智能“雙耳”
- 靈云AI服務(wù)器:為小型辦公場(chǎng)景提供AI能力
- 刷臉時(shí)代:靈云人臉識(shí)別能力平臺(tái)為企業(yè)提供安全、高效的身份認(rèn)證服務(wù)
- 靈云四川話語音識(shí)別,這個(gè)技術(shù)很“要得”
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場(chǎng)景AI,傳音手機(jī)推動(dòng)前沿科技落地新興市場(chǎng)
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機(jī)房參考設(shè)計(jì)白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國(guó)
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會(huì)隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動(dòng)AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營(yíng)報(bào)名企業(yè)超300家
- 首都機(jī)場(chǎng)“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國(guó)首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會(huì)亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級(jí)!率先適配 “液態(tài)玻璃”,原生體驗(yàn)更極致
- 外灘大會(huì)首發(fā)! 螞蟻密算推出AI密態(tài)升級(jí)卡 實(shí)現(xiàn)零改動(dòng)“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會(huì)
- 2025外灘大會(huì):王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢(shì)科技,提升科研數(shù)據(jù)處理效能