打破語言壁壘,百度翻譯同傳為智源大會構(gòu)建跨國溝通橋梁
2020-06-23 11:38:15AI云資訊768
6月21日至24日,2020北京智源大會盛大開幕,五位圖靈獎得主、十多位院士、一百多位專家學(xué)者齊聚一堂,共同探討人工智能的下一個十年。受疫情影響,本屆大會以在線直播的形式舉行,吸引了全球?qū)W術(shù)界、產(chǎn)業(yè)界超過2.5萬人報名參會。為了更好的幫助國內(nèi)外觀眾理解報告內(nèi)容,百度翻譯為本次大會提供了機(jī)器同傳服務(wù)。
百度翻譯同傳現(xiàn)場效果展示
人工同傳專業(yè)性強,難度極高
同傳是一項專業(yè)性極強、難度極大、耗腦又耗嗓的工作。除了深厚的語言能力外,還需要極強的反應(yīng)能力,邊說邊聽,精力高度集中,對譯員的腦力和體力都是極高的挑戰(zhàn)。因此往往一場會需要兩個甚至多個譯員共同完成同傳。
國際會議口譯員協(xié)會(International Association of Conference Interpreters,簡稱AIIC)作為會議口譯職業(yè)全球唯一專業(yè)協(xié)會,全球會員僅有約3000人,其中漢語普通話會員僅50人。而據(jù)不完全統(tǒng)計,僅中國每年需要同傳的國際會議就有上萬場。巨大的市場需求與譯員的稀缺形成強烈反差。
機(jī)器同傳成研究熱點,百度翻譯提出多項創(chuàng)新
近年來,得益于人工智能技術(shù)的綜合進(jìn)步,結(jié)合語音技術(shù)和機(jī)器翻譯技術(shù)的機(jī)器同聲傳譯成為國際前沿研究的熱點。機(jī)器同傳面臨一系列國際公認(rèn)的難題,如語音識別錯誤傳遞、翻譯質(zhì)量與時間延遲難以平衡等。
針對這些難題,百度翻譯團(tuán)隊展開攻關(guān),先后提出了集成預(yù)測與可控時延的翻譯模型、語義單元驅(qū)動的上下文感知翻譯模型、融合音節(jié)與文本的聯(lián)合編碼模型、基于知識蒸餾的端到端同傳模型、語音識別與翻譯交互解碼等一系列創(chuàng)新技術(shù),在語音容錯、平衡質(zhì)量與時延、語篇翻譯連貫性和端到端同傳模型等方面取得突破,研發(fā)了高質(zhì)量、低時延的機(jī)器同傳系統(tǒng)。在2018《麻省理工科技評論》十大技術(shù)突破中,百度被列為語音翻譯領(lǐng)域“Key Player”,成為國內(nèi)唯一上榜單位。
遠(yuǎn)程直播會議新形式,百度同傳研發(fā)新方案
全球疫情使得大量會議改為了線上進(jìn)行。此次智源大會采取演講人遠(yuǎn)程接入,觀眾通過直播平臺觀看的形式舉行。這種形式進(jìn)一步加重了同傳的難度:
一是語音識別難度增大。為了適應(yīng)網(wǎng)絡(luò)帶寬,在線會議軟件對聲音信號進(jìn)行壓縮編碼處理,同時傳輸過程中易受多種信號干擾,原始聲音信號不穩(wěn)定,對語音識別挑戰(zhàn)極大。
二是多場會議并行,對系統(tǒng)穩(wěn)定性要求高。以往的會議往往都是一場會議發(fā)言人順序進(jìn)行,而本次會議共有19個分論壇,最多的時候同時并行6場,系統(tǒng)部署難度超過以往。
三是領(lǐng)域龐雜,專業(yè)性強。本次大會涵蓋智能體系架構(gòu)、智能芯片、認(rèn)知神經(jīng)、機(jī)器感知、人工智能倫理、AI醫(yī)療、AI交通等多個領(lǐng)域,每一個領(lǐng)域都極具專業(yè)性,專業(yè)術(shù)語和領(lǐng)域知識翻譯難度大。
針對以上難題,百度研發(fā)了創(chuàng)新的機(jī)器同傳解決方案。搭載百度語音自研的SMLTA聲學(xué)建模技術(shù),并通過對音頻信號的加強處理,提升了識別的魯棒性;采用云端在線部署,極大降低了部署難度和成本,可根據(jù)需求迅速擴(kuò)容,高效滿足不同形式的同傳需求;通過遷移學(xué)習(xí)、預(yù)訓(xùn)練加精細(xì)化訓(xùn)練等技術(shù),可以迅速提升領(lǐng)域模型的翻譯效果,滿足多領(lǐng)域翻譯需求。
新機(jī)遇新挑戰(zhàn)促發(fā)展
目前,機(jī)器同傳已在許多國際會議上嶄露頭角,它的優(yōu)勢在于可以借助強大的AI技術(shù)和數(shù)據(jù)庫作為后盾,掌握并調(diào)取更多資料和專業(yè)領(lǐng)域的知識,持續(xù)工作,不知疲倦。
同時,也需要清醒的認(rèn)識到,機(jī)器同傳仍面臨多項國際公認(rèn)難題,如語音容錯、數(shù)據(jù)稀缺、評價困難等,需要多學(xué)科、多技術(shù)深入交叉融合,共同進(jìn)步?;诖耍诮衲昙磳⒄匍_的領(lǐng)域頂級會議ACL上,百度聯(lián)合谷歌、臉書、賓夕法尼亞大學(xué)、清華大學(xué)等國內(nèi)外著名公司和高校,舉辦首屆機(jī)器同傳研討會,邀請了多名人類同傳專家、機(jī)器翻譯專家共同探討機(jī)器同傳技術(shù)進(jìn)展、面臨挑戰(zhàn)及未來發(fā)展。
未來,百度將持續(xù)進(jìn)行技術(shù)創(chuàng)新,推動機(jī)器同傳技術(shù)邁向新的階段,構(gòu)筑跨語言溝通橋梁,促進(jìn)全球協(xié)作。
相關(guān)文章
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 僅售999元!唯卓仕AF 9mm F2.8 Air超廣角自動鏡頭來了!
- 僅售999元!唯卓仕AF 14mm F4.0 Air 發(fā)布:輕便全畫幅超廣角自動鏡頭來了
- 華迅科技推出武迅WX-P3固態(tài)硬盤,自有工廠+國資背景助力國產(chǎn)存儲
- 三星Galaxy S25系列:為你的校園生活注入高能科技基因
- 技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀(jì)元
- 未來生活 觸手可得 三星Galaxy智能新品現(xiàn)已開售
- 音質(zhì)升級 煥新登場 三星Galaxy Buds3 FE正式上市
- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能