浪潮AI加速中國頂尖語言聲學(xué)研究
2020-09-03 13:54:57AI云資訊1014
語音是人類進(jìn)行信息交互的一種重要方式,但對計算機(jī)或者機(jī)器人來說,理解語音并不是一件容易的事情。讓機(jī)器“能聽會說”是人工智能科學(xué)家期望實現(xiàn)的一大重要目標(biāo)。如今很多語音技術(shù)已經(jīng)走出實驗室,在現(xiàn)實中應(yīng)用落地,如智能音箱、迎賓機(jī)器人、智能語音導(dǎo)航、語音輸入……讓人們的生產(chǎn)生活更加便利。這些成果離不開眾多科研機(jī)構(gòu)的努力,其中就包括中國科學(xué)院語言聲學(xué)與內(nèi)容理解重點(diǎn)實驗室(以下簡稱實驗室)。
該實驗室是我國語言聲學(xué)領(lǐng)域最大的國立研究機(jī)構(gòu)。經(jīng)過近20年發(fā)展,實驗室從最初的6人發(fā)展成為包含51名固定人員、總?cè)藬?shù)200余人的科研力量,被譽(yù)為“中國智能語音人才的搖籃”。
語言聲學(xué)研究改變中國
實驗室布局于音頻聽感知、語音識別和面向聲學(xué)應(yīng)用的大數(shù)據(jù)分析等研究方向,全方位覆蓋了以音頻為核心的媒體內(nèi)容理解研究內(nèi)容。目前,實驗室承擔(dān)著多項國家級和國際合作研究項目,如中科院戰(zhàn)略性先導(dǎo)專項“面向感知中國的新一代信息技術(shù)”媒體內(nèi)容項目、中日韓前瞻計劃A3項目“面向下一代互聯(lián)網(wǎng)的超臨場感聲通信應(yīng)用研究”、自然科學(xué)基金杰青項目“面向語音處理的言語聲學(xué)數(shù)字化建?!薄⒒鹬卮笱芯坑媱澲攸c(diǎn)支持項目“多人多方對話中的語音分離、內(nèi)容分析與理解”、聲學(xué)所率先行動計劃項目“以音頻驅(qū)動的媒體深度理解關(guān)鍵技術(shù)研究“等等,科研任務(wù)十分繁重。
實驗室的研究項目對于社會生產(chǎn)、生活的發(fā)展有著十分重要的價值和意義。以語音聽覺感知研究方向為例,通過深入研究多種復(fù)雜因素對語音聽覺感知的影響機(jī)理,探索復(fù)雜聲學(xué)環(huán)境下的語音感知機(jī)制及其建模方法,可能會使聽力障礙患者過上正常人的生活。據(jù)2016年3月公布的《全國聽力障礙與耳病調(diào)查結(jié)果》,我國有15.84%的人患有聽力障礙,其中中度以上聽力障礙的人占到總?cè)丝跀?shù)的5.17%。伴隨著我國老齡化趨勢加劇,聽力障礙總現(xiàn)患率仍在進(jìn)一步升高,以語音技術(shù)為核心的助聽器具能夠直接為聽障患者帶來福音。此外,該研究方向所包含的三維音頻技術(shù),通過研究人對真實三維聲學(xué)環(huán)境的感知機(jī)理,能夠?qū)⑻摂M現(xiàn)實技術(shù)的用戶體驗提高約50%,進(jìn)一步促進(jìn)真正的”沉浸式”用戶體驗實現(xiàn)。
目前,實驗室的部分研究成果已在多個領(lǐng)域得到應(yīng)用:在智能終端領(lǐng)域,推出了智能電視交互系統(tǒng);在互聯(lián)網(wǎng)領(lǐng)域,先后跟百度、騰訊和阿里巴巴進(jìn)行了卓有成效的合作,推出了語音輸入、語音和音樂檢索、語音客服等應(yīng)用;在廣電領(lǐng)域,實驗室的連續(xù)語音識別引擎成為該行業(yè)主流企業(yè)的標(biāo)配,被索貝、大洋集成到各自的媒資管理系統(tǒng)和多媒體信息檢索系統(tǒng),同時也被天脈聚源在其為電視臺提供新聞素材整理服務(wù)的云平臺中采用。
AGX-5助力語言聲學(xué)研究突破AI算力瓶頸
為了支撐重大項目的科研工作,實驗室在音頻內(nèi)容分析核心技術(shù)方面建立了全面的、具有國際水平的開發(fā)工具和處理平臺,主要包括非特定人大詞表連續(xù)語音識別系統(tǒng)、語種識別系統(tǒng)、說話人識別/確認(rèn)系統(tǒng)、識別置信度評價關(guān)鍵詞檢測系統(tǒng)、發(fā)音評估系統(tǒng)、固定音頻檢測系統(tǒng)、口語理解和對話系統(tǒng)、噪聲消除系統(tǒng)、音頻水印編解碼系統(tǒng)、基于Hadoop的信息安全大數(shù)據(jù)分析系統(tǒng)等。同時,在基礎(chǔ)資源數(shù)據(jù)庫方面,實驗室建立了大規(guī)模的漢語、英語、朝鮮語、維語、日語等語種的語音基礎(chǔ)資源數(shù)據(jù)庫和音樂數(shù)據(jù)庫。
隨著研究項目的增多以及數(shù)據(jù)量的快速增加,實驗室的人工智能相關(guān)研究出現(xiàn)了AI計算資源緊張的局面,很多研究項目不得不“排隊”等待,科研進(jìn)度與成果產(chǎn)出均受到重大影響。如自動語音識別的部分研究項目,每次需要訓(xùn)練的語音數(shù)據(jù)樣本規(guī)模高達(dá)數(shù)萬小時,使用原有的分布式集群進(jìn)行訓(xùn)練,單次耗時就長達(dá)2周左右,AI算力已成為科研的“瓶頸”之一。
浪潮AI服務(wù)器AGX-5
實驗室希望在短時間內(nèi)完成海量非結(jié)構(gòu)數(shù)據(jù)的高速吞吐與并行訓(xùn)練,需要計算平臺具備強(qiáng)大的模型優(yōu)化處理能力和高可擴(kuò)展性,能夠支持更大規(guī)模設(shè)備間的分布式組網(wǎng)聯(lián)合訓(xùn)練。為此,浪潮為實驗室設(shè)計并構(gòu)建了一套以AGX-5為核心的AI計算平臺,其單機(jī)訓(xùn)練效率相比以往訓(xùn)練集群實現(xiàn)了2-3倍的提升。
AGX-5是浪潮自研的新一代AI服務(wù)器,專為解決現(xiàn)代AI和深度學(xué)習(xí)需求的擴(kuò)展難題而設(shè)計,單機(jī)計算性能高達(dá)2 PetaFLOPS。AGX-5采用業(yè)界最先進(jìn)的AI計算芯片高速互聯(lián)架構(gòu),可提供近乎線性的AI計算性能加速比。
實驗室主任顏永紅表示:“在以前,我們的研究人員經(jīng)常需要花費(fèi)很多時間去等待計算資源,嚴(yán)重影響項目進(jìn)度。使用浪潮AGX-5計算平臺后,模型訓(xùn)練效率得到了很大的提升,開發(fā)周期大幅縮短。科研人員可以將更多精力放在項目本身,推動了語言聲學(xué)研究和應(yīng)用落地的進(jìn)程?!?
相關(guān)文章
- CCF存儲系統(tǒng)測評發(fā)榜,浪潮存儲全面領(lǐng)先!
- 浪潮云海亮相2025中國算力大會 重磅發(fā)布InCloud AIOS平臺
- CCF中國存儲大會 | 浪潮存儲劉希猛:融合存儲加快“人工智能+”行動落地
- 專注做好“融合型AI底座”:浪潮云海破解政企AI落地難題
- 浪潮數(shù)據(jù)董事長張東:可演進(jìn)AI基礎(chǔ)設(shè)施激活新質(zhì)生產(chǎn)力
- 飛渡科技再度登頂數(shù)字孿生平臺市場,空間智能引領(lǐng)產(chǎn)業(yè)變革新浪潮
- 消費(fèi)電子微型化浪潮下,利爾達(dá)RedCap模組的突圍戰(zhàn)
- 數(shù)字浪潮聚北京 創(chuàng)新力量啟新程——2025網(wǎng)易創(chuàng)新創(chuàng)業(yè)大賽濟(jì)南站北京分賽圓滿落幕
- 浪潮通信信息亮相2025 TM Forum Accelerate Asia
- OPPO錢包:數(shù)字科技浪潮中的便捷生活助手
- 全球56.71%份額!2025海信引領(lǐng)百吋電視技術(shù)革新與普及浪潮
- 浪潮信息參加2025開放計算技術(shù)大會,發(fā)布超節(jié)點(diǎn)與MW整機(jī)柜方案
- 大模型推理成本居高不下,浪潮存儲幫你來突圍!
- 科大訊飛亮相2025世界機(jī)器人大會,智能交互技術(shù)引領(lǐng)具身智能新浪潮
- 電商品牌出海:全球化浪潮下的新機(jī)遇
- 浪潮信息發(fā)布“元腦SD200“超節(jié)點(diǎn),面向萬億參數(shù)大模型創(chuàng)新設(shè)計
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場景AI,傳音手機(jī)推動前沿科技落地新興市場
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機(jī)房參考設(shè)計白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計算”論壇圓滿召開——攜產(chǎn)界實踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能