打破語言壁壘,百度翻譯同傳為智源大會構(gòu)建跨國溝通橋梁
2020-06-23 11:38:15AI云資訊765
6月21日至24日,2020北京智源大會盛大開幕,五位圖靈獎得主、十多位院士、一百多位專家學(xué)者齊聚一堂,共同探討人工智能的下一個十年。受疫情影響,本屆大會以在線直播的形式舉行,吸引了全球?qū)W術(shù)界、產(chǎn)業(yè)界超過2.5萬人報名參會。為了更好的幫助國內(nèi)外觀眾理解報告內(nèi)容,百度翻譯為本次大會提供了機(jī)器同傳服務(wù)。
百度翻譯同傳現(xiàn)場效果展示
人工同傳專業(yè)性強(qiáng),難度極高
同傳是一項專業(yè)性極強(qiáng)、難度極大、耗腦又耗嗓的工作。除了深厚的語言能力外,還需要極強(qiáng)的反應(yīng)能力,邊說邊聽,精力高度集中,對譯員的腦力和體力都是極高的挑戰(zhàn)。因此往往一場會需要兩個甚至多個譯員共同完成同傳。
國際會議口譯員協(xié)會(International Association of Conference Interpreters,簡稱AIIC)作為會議口譯職業(yè)全球唯一專業(yè)協(xié)會,全球會員僅有約3000人,其中漢語普通話會員僅50人。而據(jù)不完全統(tǒng)計,僅中國每年需要同傳的國際會議就有上萬場。巨大的市場需求與譯員的稀缺形成強(qiáng)烈反差。
機(jī)器同傳成研究熱點,百度翻譯提出多項創(chuàng)新
近年來,得益于人工智能技術(shù)的綜合進(jìn)步,結(jié)合語音技術(shù)和機(jī)器翻譯技術(shù)的機(jī)器同聲傳譯成為國際前沿研究的熱點。機(jī)器同傳面臨一系列國際公認(rèn)的難題,如語音識別錯誤傳遞、翻譯質(zhì)量與時間延遲難以平衡等。
針對這些難題,百度翻譯團(tuán)隊展開攻關(guān),先后提出了集成預(yù)測與可控時延的翻譯模型、語義單元驅(qū)動的上下文感知翻譯模型、融合音節(jié)與文本的聯(lián)合編碼模型、基于知識蒸餾的端到端同傳模型、語音識別與翻譯交互解碼等一系列創(chuàng)新技術(shù),在語音容錯、平衡質(zhì)量與時延、語篇翻譯連貫性和端到端同傳模型等方面取得突破,研發(fā)了高質(zhì)量、低時延的機(jī)器同傳系統(tǒng)。在2018《麻省理工科技評論》十大技術(shù)突破中,百度被列為語音翻譯領(lǐng)域“Key Player”,成為國內(nèi)唯一上榜單位。
遠(yuǎn)程直播會議新形式,百度同傳研發(fā)新方案
全球疫情使得大量會議改為了線上進(jìn)行。此次智源大會采取演講人遠(yuǎn)程接入,觀眾通過直播平臺觀看的形式舉行。這種形式進(jìn)一步加重了同傳的難度:
一是語音識別難度增大。為了適應(yīng)網(wǎng)絡(luò)帶寬,在線會議軟件對聲音信號進(jìn)行壓縮編碼處理,同時傳輸過程中易受多種信號干擾,原始聲音信號不穩(wěn)定,對語音識別挑戰(zhàn)極大。
二是多場會議并行,對系統(tǒng)穩(wěn)定性要求高。以往的會議往往都是一場會議發(fā)言人順序進(jìn)行,而本次會議共有19個分論壇,最多的時候同時并行6場,系統(tǒng)部署難度超過以往。
三是領(lǐng)域龐雜,專業(yè)性強(qiáng)。本次大會涵蓋智能體系架構(gòu)、智能芯片、認(rèn)知神經(jīng)、機(jī)器感知、人工智能倫理、AI醫(yī)療、AI交通等多個領(lǐng)域,每一個領(lǐng)域都極具專業(yè)性,專業(yè)術(shù)語和領(lǐng)域知識翻譯難度大。
針對以上難題,百度研發(fā)了創(chuàng)新的機(jī)器同傳解決方案。搭載百度語音自研的SMLTA聲學(xué)建模技術(shù),并通過對音頻信號的加強(qiáng)處理,提升了識別的魯棒性;采用云端在線部署,極大降低了部署難度和成本,可根據(jù)需求迅速擴(kuò)容,高效滿足不同形式的同傳需求;通過遷移學(xué)習(xí)、預(yù)訓(xùn)練加精細(xì)化訓(xùn)練等技術(shù),可以迅速提升領(lǐng)域模型的翻譯效果,滿足多領(lǐng)域翻譯需求。
新機(jī)遇新挑戰(zhàn)促發(fā)展
目前,機(jī)器同傳已在許多國際會議上嶄露頭角,它的優(yōu)勢在于可以借助強(qiáng)大的AI技術(shù)和數(shù)據(jù)庫作為后盾,掌握并調(diào)取更多資料和專業(yè)領(lǐng)域的知識,持續(xù)工作,不知疲倦。
同時,也需要清醒的認(rèn)識到,機(jī)器同傳仍面臨多項國際公認(rèn)難題,如語音容錯、數(shù)據(jù)稀缺、評價困難等,需要多學(xué)科、多技術(shù)深入交叉融合,共同進(jìn)步?;诖?,在今年即將召開的領(lǐng)域頂級會議ACL上,百度聯(lián)合谷歌、臉書、賓夕法尼亞大學(xué)、清華大學(xué)等國內(nèi)外著名公司和高校,舉辦首屆機(jī)器同傳研討會,邀請了多名人類同傳專家、機(jī)器翻譯專家共同探討機(jī)器同傳技術(shù)進(jìn)展、面臨挑戰(zhàn)及未來發(fā)展。
未來,百度將持續(xù)進(jìn)行技術(shù)創(chuàng)新,推動機(jī)器同傳技術(shù)邁向新的階段,構(gòu)筑跨語言溝通橋梁,促進(jìn)全球協(xié)作。
相關(guān)文章
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進(jìn)化,技嘉2025線下產(chǎn)品發(fā)布會強(qiáng)勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案