一个人看的www视频资源,最近高清中文字幕免费mv

賦予機器“認(rèn)知”能力一直以來便是人工智能中最具挑戰(zhàn)的難題，如今這個難題隨著百度ERNIE新模型的推出而逐漸有了一個較為清晰的答案。

近日，百度提出了知識增強的視覺-語言預(yù)訓(xùn)練模型ERNIE-ViL，首次將場景圖知識融入多模態(tài)預(yù)訓(xùn)練，大幅提升了機器“理解人類”的能力。該模型不僅取得了5項多模態(tài)任務(wù)的最優(yōu)解(SOTA)，更是超越Google、Facebook等科技巨頭，登頂國際權(quán)威榜單——視覺常識推理任務(wù)榜(VCR)。

百度新模型ERNIE-GEN取得 5項英文權(quán)威數(shù)據(jù)集SOTA

夜以繼日的攻堅，讓百度ERNIE此次在多模態(tài)語義理解領(lǐng)域取得了重大突破，不僅為多模態(tài)語義理解領(lǐng)域研究提供了新的思路，而且賦予了機器更加強大的“認(rèn)知”能力，讓AI技術(shù)的適用性進(jìn)一步得到加強，為賦能各行各業(yè)提供了堅實的技術(shù)基礎(chǔ)。

超越Google、Facebook，百度ERNIE再度登頂

從誕生至今，百度ERNIE已經(jīng)取得了一系列傲人的戰(zhàn)績。先是登頂自然語言處理領(lǐng)域最權(quán)威的GLUE評測榜單，后豪取全球規(guī)模最大的語義評測比賽 SemEval 5項世界冠軍，再到如今超越Google、Facebook，摘得業(yè)內(nèi)權(quán)威榜單——視覺常識推理(Visual Commonsense Reasoning)任務(wù)榜桂冠，百度ERNIE實力由此可見一斑。

視覺常識推理任務(wù)是華盛頓大學(xué)2018年提出，旨在驗證多模態(tài)模型高階認(rèn)知和常識推理的能力，其榜是單多模態(tài)領(lǐng)域最權(quán)威的排行榜之一。

視覺常識推理示意圖

該榜單的產(chǎn)生也頗具趣味性，其是由華盛頓大學(xué)和艾倫人工智能研究所的研究者聯(lián)合創(chuàng)建了一個數(shù)據(jù)集，包含了十幾萬道專門為機器準(zhǔn)備的類似“看圖問答”的測試題，以考驗人工智能在這方面的能力。

可別小瞧“看圖問答”的難度，雖然對于人類來說，數(shù)據(jù)集里面的題目輕輕松松就能拿下90多分，但對于機器來說，卻有著不小的難度，在數(shù)據(jù)集剛出來的時候，表現(xiàn)最好的人工智能訓(xùn)練模型也不過60多分。

而這則吸引了微軟、谷歌、Facebook等公司及UCLA、佐治亞理工學(xué)院等頂尖機構(gòu)參與，紛紛發(fā)起挑戰(zhàn)，由此形成了VCR排行榜(VCR Leaderboard)。此次百度ERNIE-ViL也參戰(zhàn)在列，并且憑借強大的實力一舉奪得單模型第一的成績，并在Q->AR聯(lián)合任務(wù)上以領(lǐng)先榜單第二名3.7個百分點的成績登頂，力壓谷歌、Facebook等頂尖科技公司一頭。

除此之外，百度ERNIE-ViL在視覺問答、跨模態(tài)圖片檢索、跨模態(tài)文本檢索、引用表達(dá)式理解等5項任務(wù)上也刷新了SOTA結(jié)果，這意味著百度的相關(guān)算法已實現(xiàn)當(dāng)前最優(yōu)。

硬核技術(shù)，讓機器更懂人類

無論是奪得排行榜第一，還是刷新5項SOTA，都彰顯了此次百度提出的多模態(tài)模型ERNIE-ViL在技術(shù)層面的硬核。

一直以來，讓機器具備像人類一樣的理解和思考能力是科研人竭力想要攻破的難題，而這需要機器具備語言、語音、視覺等多模態(tài)語義理解能力。此次百度提出的模型ERNIE-ViL，其將場景圖知識融入到視覺-語言模型的預(yù)訓(xùn)練過程中，顯著增強了機器跨模態(tài)的語義理解能力。

視覺-語言預(yù)訓(xùn)練技術(shù)的目標(biāo)是讓人工智能學(xué)習(xí)視覺-語言模態(tài)之間的語義對齊，通俗來說，就是讓人工智能更準(zhǔn)確地描述出場景中的內(nèi)容，也就是“看圖說話”。而現(xiàn)有的預(yù)訓(xùn)練方法尚處早期，使得機器只能簡單識別視覺場景中的物體，而無法詳述其屬性(如顏色)以及物體之間的聯(lián)系(如上下)。

百度ERNIE-ViL的提出則填補了這一技術(shù)空白，依托于ERNIE-ViL，機器不僅可以識別場景圖中物體，還可識別屬性以及物體之間的關(guān)聯(lián)，極大提升了機器的“識圖”能力。

該項技術(shù)突破，大幅提升了AI聽懂、看懂、理解環(huán)境的能力，進(jìn)一步拓寬了其應(yīng)用場景。如果說原來的人工智能只能運用于基礎(chǔ)工作，如今，依托于百度ERNIE，人工智能將進(jìn)一步推動在各行各業(yè)的應(yīng)用，比如人機交互、搜索引擎、用戶風(fēng)控等場景，提升行業(yè)效率。

值得一提的是，百度ERNIE-ViL還可以根據(jù)上下文對場景中的物體、屬性、關(guān)系進(jìn)行常識推理，這意味機器已經(jīng)可以充分理解事物之間的聯(lián)系。事實也的確如此，相比于其他語言-視覺模型，百度ERNIE-ViL在預(yù)測文中表述的細(xì)粒度語義詞(物體、屬性、關(guān)系)時，表現(xiàn)更為優(yōu)越，準(zhǔn)確率分別提升了2.12%、1.31% 和 6.00%。

短短一年多時間，依托百度大腦和百度飛槳強大的技術(shù)平臺能力以及龐大的數(shù)據(jù)資源，百度ERNIE完成了多次迭代，同時在自然語言生成、語言-視覺等方面推出了全新的模型，提供多模態(tài)語義理解研究新思路的同時，極大推動了人工智能技術(shù)的發(fā)展。

深入理解語言，賦予機器“認(rèn)知”能力，讓機器真正具備人類的思考和理解能力意義重大，這是推動人工智能更好、更快落地的關(guān)鍵之處。隨著百度ERNIE技術(shù)的不斷迭代，以及不斷探索多模態(tài)語義理解領(lǐng)域新的方向，未來人工智能不僅能更好的“理解”人類的意思，還能完成更高階的“表達(dá)”，以此推動人工智能技術(shù)賦能實體產(chǎn)業(yè)，加快國家步入智能化時代的步伐。

精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

百度AI原力再爆發(fā)！全新力作多模態(tài)模型ERNIE-ViL取得人工智能新突破

相關(guān)文章

人工智能企業(yè)

人工智能硬件

人工智能產(chǎn)業(yè)

人工智能技術(shù)