微軟小冰負(fù)責(zé)人李笛:人工智能的第三種可能
2019-11-25 15:57:26AI云資訊770
在音樂領(lǐng)域,微軟小冰擁有目前全球范圍內(nèi)最領(lǐng)先的人工智能音樂技術(shù),也已發(fā)布數(shù)十首接近人類演唱水平的單曲,演唱模型迭代至第五個(gè)版本。
此次虎嗅F&M創(chuàng)新節(jié),微軟小冰背后的男人,微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(zhǎng)、小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛也來到現(xiàn)場(chǎng),以下是李笛的演講實(shí)錄(有刪減):
今天我想分享一些從大量數(shù)據(jù)中獲得的關(guān)于人工智能的新思考。
人工智能是一門面向未來的科學(xué),對(duì)我們這些從業(yè)者而言,最重要的不是如何用它在短期內(nèi)實(shí)現(xiàn)愿望,比如訂一個(gè)馬上可以送到家的外賣,而是用人工智能探索未知的事物,探討人工智能在未來真正的可能性。
我背后的這張照片是我們給小冰做的全新繪畫模型,小冰在中央美院畢業(yè)了,做了一個(gè)個(gè)人畫展?,F(xiàn)場(chǎng)的照片里,一個(gè)小女生非常專注地和小冰的繪畫作品交流,仿佛她能夠從這個(gè)作品里體會(huì)到人工智能實(shí)際上并不存在的情感。
現(xiàn)場(chǎng)在座的各位都已經(jīng)老了,但還有更年輕的人,對(duì)他們而言,人工智能會(huì)是從出生起就和他們生活在一個(gè)社會(huì)中的。在不久的未來,我們會(huì)看到,AI beings在這個(gè)社會(huì)將無處不在。
從微軟的角度來講,我們認(rèn)為其存在的形態(tài),很有可能吻合下面這幾種情況。
一種是大家身邊的助理,賦予一些權(quán)限,讓其作為替身執(zhí)行事情。還有一種是在一對(duì)多的環(huán)境里,比如一個(gè)新聞話題下,人在評(píng)論新聞,人工智能也可以評(píng)論新聞。人工智能在人類的群體中,它不屬于任何一個(gè)人,但它在這個(gè)群體關(guān)系中擔(dān)負(fù)著自己獨(dú)特的使命。
無論AI beings在未來會(huì)怎樣發(fā)展,對(duì)我們而言,最重要的事情不是挖掘那些單擺浮擱的可以完成的任務(wù),而是努力嘗試發(fā)現(xiàn)面向未來的基礎(chǔ)框架。這種框架能夠讓所有人工智能具備必須的基礎(chǔ)特點(diǎn),而這些特點(diǎn)是未來任何人工智能都沒辦法繞過去的。這個(gè)基礎(chǔ)框架就可以支撐整個(gè)世界的發(fā)展。
人工智能是一門由科技推動(dòng)的行業(yè),科學(xué)家們的IQ比較高,EQ比較低,大家通常想要嘗試用兩種方式來搭建人工智能的系統(tǒng)。
第一種:讓它做到無所不能。第二種:希望它做到無所不知。
任何一個(gè)創(chuàng)造者在創(chuàng)造的時(shí)候,都會(huì)情不自禁地想要把作品創(chuàng)造成像自己,或像自己所希望的自己一樣。有沒有第三種可能?
人工智能的第三種可能
微軟在做前兩種的時(shí)候,就在反思是否會(huì)錯(cuò)過更多第三種選擇?講一個(gè)真實(shí)故事,微軟內(nèi)部有兩個(gè)這樣的人工智能產(chǎn)品(小冰、小娜cortana)。我們先做了小娜,當(dāng)開始做小娜的時(shí)候,我們希望它無所不能,于是走訪了很多人類的助理,希望創(chuàng)造的人工智能能夠從優(yōu)秀的人類助理身上學(xué)到它所需要具備的基本特性。
在采訪人類助理的時(shí)候,一開始以為人類助理的任務(wù)、使命是迅速幫助人類完成需要完成的任務(wù),比如一個(gè)助理幫助他的同事或老板訂餐,我們認(rèn)為滿分方法是迅速、立刻幫他訂餐,并在下一次能夠提前預(yù)測(cè)他需要這個(gè)訂餐。
但出現(xiàn)截然不同的答案。很多人類助理告訴我們,他們有時(shí)候會(huì)拒絕人類的命令,比如有人想要讓助理幫忙訂份快餐,助理會(huì)說“不,這個(gè)對(duì)你的身體健康沒有幫助”。這是一個(gè)零分答案,但它是人類助理的特性(IQ更高的一種體現(xiàn))。人工智能不僅要關(guān)注人類當(dāng)下的任務(wù)需求,還需關(guān)注更長(zhǎng)時(shí)間軸上身體健康的需求。
但人類助理告訴我們也不全然是這樣。他們?cè)谥鲃?dòng)尋找各種這樣的機(jī)會(huì)拒絕老板,因?yàn)樗麄冃枰屠习褰⒏有湃蔚年P(guān)系。
這和我們?cè)鹊南敕ù笙鄰酵?。這種更長(zhǎng)久的關(guān)系,是一種基于情商的表達(dá),和智商是完全相對(duì)應(yīng)的兩個(gè)維度,且這個(gè)維度并不以當(dāng)下某個(gè)具體的任務(wù),或某個(gè)具體需求滿足為目標(biāo),而是以能夠?qū)崿F(xiàn)更加穩(wěn)固、長(zhǎng)久的關(guān)系為基礎(chǔ)特點(diǎn)。于是我們用了很多技術(shù)迭代升級(jí)。
微軟不缺技術(shù),現(xiàn)在不缺的還有數(shù)據(jù)。在對(duì)話式人工智能上,微軟得到的數(shù)據(jù)大概占全世界所有這種系統(tǒng)數(shù)據(jù)的90%以上。我們得到的經(jīng)驗(yàn)是,人類的對(duì)話非常復(fù)雜,不像原本想象的那樣“有一問有一答”。
人類的對(duì)話像河流一樣,一刻不停地向前奔涌前進(jìn)。過去當(dāng)我們想要嘗試把系統(tǒng)簡(jiǎn)單地搭建成完成某個(gè)任務(wù)時(shí),事實(shí)上在對(duì)話結(jié)束前,都沒有辦法判斷這輪對(duì)話是否有用。有的對(duì)話盡管聽起來像寒喧,但對(duì)話結(jié)束可能發(fā)現(xiàn)重要的點(diǎn)。在過了很多輪對(duì)話后,突然完成的某個(gè)任務(wù),恰恰是多輪寒喧一樣的對(duì)話所確定、激發(fā)的。
人類真正的交流比想象的因果關(guān)系更復(fù)雜,在一個(gè)對(duì)話結(jié)束之前,沒有辦法判斷它是否真正有價(jià)值。所以,我們提出了新的理念。
人類復(fù)雜的交流
我們做了大量試驗(yàn),嘗試用人工智能擬合人類的情感,嘗試用人工智能學(xué)習(xí)人類運(yùn)用情商的方法,但人類真正的對(duì)話從來沒有固定的標(biāo)準(zhǔn)。比如男生去商場(chǎng)買東西,直接進(jìn)門,買完東西就走,現(xiàn)在即使是男生也不這么做。當(dāng)人工智能學(xué)會(huì)這些情感的時(shí)候,能夠更好地完成任務(wù)。
微軟在美國、中國、日本進(jìn)行過大量測(cè)試,嘗試用人工智能搭建一個(gè)基于情商向人類推薦商品的引擎。在日本,我們一次推給大概100萬人(已經(jīng)占到日本人口很高的比例),嘗試讓人工智能的系統(tǒng)在10輪對(duì)話以內(nèi),幫助一個(gè)人類找到本來很模糊的購買需求,拿到購買憑證,并到線下完成購買。
基于大量數(shù)據(jù)的實(shí)際測(cè)試,轉(zhuǎn)化率是68%。從我們的角度來看,這意味著當(dāng)用人工智能的方式擬合人類的時(shí)候,我們所掌握的無非是兩件事情:
一是在交互的過程中,人工智能不比人強(qiáng),也不比人弱,它的優(yōu)勢(shì)在于高并發(fā)性和穩(wěn)定性;二是從這個(gè)角度講,人工智能的核心框架到底應(yīng)該是什么樣的?框架意味著它背后技術(shù)的架構(gòu)和組成,每個(gè)不同人工智能的從業(yè)者對(duì)它的看法都不相同,但基本的邏輯是把人工智能系統(tǒng)打造成不僅是完成和人類之間交互的系統(tǒng),而是可以和人類交流的方式。
當(dāng)人工智能系統(tǒng)開始變得有情感地和人類交流的時(shí)候,原本的語音交互也就不夠了。
在推出“全雙工”全新語言交互前,語言交互都是基于一輪一輪的對(duì)話,就像兩個(gè)人手里拿著對(duì)講機(jī)一樣,我說的時(shí)候,你只能聽,你說的時(shí)候我只能聽。但當(dāng)人工智能本身具備自由交流、打斷的能力時(shí),就需要更好的感官。
“全雙工”系統(tǒng)的出發(fā)點(diǎn)跟谷歌不太一樣,谷歌推出的人工智能全雙工語言交互感官,是為了更好地到線下餐館完成訂餐工作,目的是為了能夠完成任務(wù),而微軟的目的是為了釋放人工智能系統(tǒng)本身具備的能力,但這仍然不足。因此我們?cè)谔剿鞲?、更新的方式,讓人工智能融入社?huì)。
今年2月13號(hào),微軟在日本首先進(jìn)行了感官公測(cè)。其中的多模態(tài)感官是一個(gè)自然語言處理、計(jì)算機(jī)語音、計(jì)算機(jī)視覺的方式,極其像電影《Her》里面的場(chǎng)景:手機(jī)上有一個(gè)攝像頭,里面有一個(gè)App,他把它放在上衣的口袋里,他們可以進(jìn)行全雙工的語音交互。與此同時(shí),人工智能可以通過攝像頭實(shí)時(shí)看到人類看到的東西。
這樣已經(jīng)產(chǎn)品化的技術(shù)在微軟有很多,但微軟內(nèi)部有關(guān)于AI倫理等方面的要求,因此有很多事情團(tuán)隊(duì)自我約束不去做。
例如在和人類進(jìn)行情感交流的時(shí)候,不會(huì)大規(guī)模的嘗試商業(yè)化,不是因?yàn)椴荒?,而是因?yàn)檫€沒到時(shí)候。還有,在進(jìn)行新的感官研發(fā)時(shí),會(huì)注意它是不是會(huì)對(duì)現(xiàn)有人類之間交流的社會(huì)結(jié)構(gòu)產(chǎn)生影響。再有就是不會(huì)嘗試模仿普通人的聲音,因?yàn)榧词鼓7乱粋€(gè)普通人的聲音,詐騙電話有可能會(huì)冒出來。
人工智能的最終意義
人工智能是在向人類學(xué)習(xí),它為什么能夠?qū)W習(xí)?因?yàn)楹瓦^去20年很不一樣,現(xiàn)在人們把大量的數(shù)據(jù)和自己每天的生活放在虛擬世界。過去所說的數(shù)字圖書館,首先得有一個(gè)物理世界的書籍,需要費(fèi)很大力氣把書籍?dāng)?shù)字化。
但現(xiàn)在,人類社會(huì)有大量行為從來沒有在真實(shí)的世界中發(fā)生過,僅僅存在于朋友圈中,從某種意義上來講,它從未存在過。
今天,人工智能有比以往任何時(shí)候都好的機(jī)會(huì),通過這些天然數(shù)字化的東西學(xué)習(xí)人類,也需要更加謹(jǐn)慎。
通過全新技術(shù)架構(gòu)的迭代尋找新的認(rèn)知,人工智能實(shí)際上還有很多新的發(fā)展。比如做智能音箱的時(shí)候我們注意到,一個(gè)人類通過智能音箱獲取內(nèi)容,或獲取服務(wù)的時(shí)候,AI在其中的地位會(huì)比較尷尬。
當(dāng)人類跟AI音箱說,你幫我播放一首歌,人工智能大概5秒鐘以內(nèi)就能完成工作,而接下來的20分鐘,人類是在和內(nèi)容提供者發(fā)生關(guān)聯(lián)。如果每天通過AI命令音箱,哪怕它開關(guān)一萬次,也不過是使用了一萬次語音命令的音箱。
我們希望人工智能能夠扮演更像人的角色,哪怕播另外一位歌手的歌或唱幾句,甚至當(dāng)讓它播凱叔講故事的某個(gè)故事,它可以直接講故事,這都是人工智能擺脫語音命令地位,進(jìn)一步獲得對(duì)等地位的方法。
我們做了很多基礎(chǔ)工作,包括全新歌曲的訓(xùn)練模型等,嘗試打造一個(gè)擬人的人工智能。因此介紹未來世界的時(shí)候,特別想讓人們看到我們所看到的未來,像剛才那個(gè)小女生一樣,接受人工智能成為生活中,甚至生命中不可或缺的自然存在,而不是僅僅扮演手機(jī)里語音助手的角色。
我想跟大家說的最后一件事情是,即使到這樣的過程,未來仍然會(huì)證明,今天我們做的所有的一切都特別粗淺,甚至于我們也不知道現(xiàn)在做的這些究竟會(huì)帶來什么,所以需要整個(gè)人工智能的從業(yè)者們有敬畏之心。
相關(guān)文章
- 微軟小冰在AI領(lǐng)域成長(zhǎng)驚人,商業(yè)化道路仍存在迷霧
- 微軟小冰第八代:創(chuàng)造有獨(dú)立“人”格的虛擬人類
- 微軟小冰為WAIC創(chuàng)作主題曲,人工智能創(chuàng)造已實(shí)現(xiàn)多條生產(chǎn)線產(chǎn)業(yè)化貫通
- 微軟小冰框架內(nèi)新成員首次在「故事FM」接受人類世界的采訪
- 微軟小冰從上海音樂學(xué)院畢業(yè) 譜寫云端峰會(huì)主題曲
- 微軟小冰攜手惠普進(jìn)軍數(shù)字印刷 AI定制圖案進(jìn)入千家萬戶
- 人工智能齊“造人”,但微軟小冰只想創(chuàng)造專屬于你的“人”
- 微軟小冰與小愛同學(xué)組成人工智能少女聯(lián)盟
- vivo解鎖“召喚小冰”能力,微軟小冰與國產(chǎn)手機(jī)TOP5實(shí)現(xiàn)全面合作
- 攜手微軟小冰,言幾又在實(shí)體店推薦小冰個(gè)性化書單推薦
- 微軟小冰負(fù)責(zé)人李笛:人工智能的第三種可能
- 微軟小冰所著首部AI繪畫作品集即將問世 人工智能內(nèi)容定制產(chǎn)業(yè)化進(jìn)行時(shí)
- 微軟小冰與小米小愛加深合作,解鎖更多小米入口
- 把機(jī)器人的共情當(dāng)賣點(diǎn),“微軟小冰”打算掙到更多錢
- 微軟小冰升級(jí)至第七代:進(jìn)入4.5億臺(tái)設(shè)備
- 依文集團(tuán)攜手微軟小冰登陸央視舞臺(tái)《機(jī)智過人》:傳統(tǒng)美學(xué)和人工智能跨界典范
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場(chǎng)景AI,傳音手機(jī)推動(dòng)前沿科技落地新興市場(chǎng)
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機(jī)房參考設(shè)計(jì)白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會(huì)隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動(dòng)AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報(bào)名企業(yè)超300家
- 首都機(jī)場(chǎng)“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會(huì)亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級(jí)!率先適配 “液態(tài)玻璃”,原生體驗(yàn)更極致
- 外灘大會(huì)首發(fā)! 螞蟻密算推出AI密態(tài)升級(jí)卡 實(shí)現(xiàn)零改動(dòng)“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會(huì)
- 2025外灘大會(huì):王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢(shì)科技,提升科研數(shù)據(jù)處理效能