對話騰訊優(yōu)圖實驗室聯(lián)合負(fù)責(zé)人:做技術(shù)的人不能躲在后端
2019-06-06 15:22:29AI云資訊792

“面對我們不熟悉產(chǎn)業(yè)時,數(shù)據(jù)是沒有辦法逃脫的夢魘。”
賈佳亞,從事計算機(jī)視覺的人都不會覺得這個名字陌生,香港中文大學(xué)計算機(jī)科學(xué)工程系終身教授,電機(jī)及電子工程師學(xué)會(IEEE)院士,商湯科技聯(lián)合創(chuàng)始人劉樞及 CEO 徐立的老師。
2017 年 5 月 15 日,賈佳亞博士加盟騰訊的四大支柱 AI 實驗室之一——優(yōu)圖實驗室。至此,他的學(xué)術(shù)路徑中開始結(jié)合產(chǎn)業(yè)的新基因。其在優(yōu)圖實驗室負(fù)責(zé)計算機(jī)視覺、圖像處理、模式識別、機(jī)器學(xué)習(xí)等人工智能領(lǐng)域的研究,以及人工智能與各應(yīng)用場景結(jié)合的深度探索。
從消費互聯(lián)網(wǎng)開始,賈佳亞逐漸嘗試將 AI 與零售、金融、醫(yī)療等各個領(lǐng)域相結(jié)合,而到去年騰訊組織架構(gòu)調(diào)整后,他又帶領(lǐng)著優(yōu)圖實驗室攻克更加「硬核」的領(lǐng)域——工業(yè)互聯(lián)網(wǎng)。
不久前,在騰訊數(shù)字生態(tài)大會上賈佳亞與極客公園聊了聊他眼中轉(zhuǎn)型后的優(yōu)圖實驗室,不僅提及實驗室中的團(tuán)隊管理、KPI 評定等管理問題,還分享了學(xué)術(shù)如何落地、騰訊要做減法、技術(shù)不能躲到后端等觀點。
或許,科學(xué)家投身業(yè)界又多了一個新范本。

GEEKPARK:去年騰訊進(jìn)行第三次組織架構(gòu)調(diào)整后,優(yōu)圖實驗室的工作有什么樣的變化?
賈佳亞:在公司組織架構(gòu)變革之前,優(yōu)圖實驗室的重心絕大部分是擺在消費互聯(lián)網(wǎng)上。此時,優(yōu)圖相當(dāng)于服務(wù)于內(nèi)部團(tuán)隊的秘密組織。我們的技術(shù)研發(fā)出來后,內(nèi)部團(tuán)隊會進(jìn)行試用。遇到了組織變革后,我們留在了 CSIG,更專注于產(chǎn)業(yè)互聯(lián)網(wǎng)。現(xiàn)在,我們能直接了解客戶需求,研發(fā)出有針對性的產(chǎn)品,然后把產(chǎn)品推給我們合作的企業(yè)。
GEEKPARK:轉(zhuǎn)變之后有壓力嗎?
賈佳亞:我覺得這種轉(zhuǎn)變是好事情,但也是一件不容易的事情。如果一個團(tuán)隊完全沒有收入的壓力,它就不會關(guān)心收入,只會純粹做研究。但現(xiàn)在我們同事更加側(cè)重的出發(fā)點是怎么能把技術(shù)用得好來,我們會去考慮更加偏業(yè)務(wù)型的問題。從長遠(yuǎn)來看,這種想法會加速把技術(shù)轉(zhuǎn)化成平臺或者是產(chǎn)品的進(jìn)程。
GEEKPARK:現(xiàn)在團(tuán)隊怎么定 KPI?
賈佳亞:我們沒有具體的 KPI,在 Dowson(湯道生)層面和 Martin(劉熾平)層面都沒有要求我們完成多少收入,只是我們自己愿意承擔(dān)多少收入,所以氛圍上也相對比較好。在整個業(yè)績考評的時候,我不會以 KPI 或者完成度考評每個人,我會在他自己的主次領(lǐng)域中找到他得主要方面,如果他能做到業(yè)內(nèi)最強(qiáng)或者在團(tuán)隊里比較突出,他的業(yè)績就會比較好一點,這樣就會激發(fā)大家的動力。
GEEKPARK:那你如何管理團(tuán)隊,讓大家在完成 KPI 的同時不斷有技術(shù)創(chuàng)新性?
賈佳亞:關(guān)鍵在于作為一個部門的負(fù)責(zé)人能不能適當(dāng)?shù)厝ロ斪碜陨蠈拥膲毫?/strong>。如果什么東西都順從的話,會導(dǎo)致很多事情失去長遠(yuǎn)的目標(biāo),大家都在為三個月目標(biāo)而奮斗。但如果我把所有問題都擋掉,團(tuán)隊變成一個對業(yè)務(wù)不關(guān)心的實驗室,一旦遇到任何經(jīng)濟(jì)狀況,團(tuán)隊的生存就會有受壓力。所以這兩者需要有一個平衡。優(yōu)圖實驗室的團(tuán)隊構(gòu)建中有一部分的人是做一些前沿探索,還有一部分人更聚焦于業(yè)務(wù)層面。當(dāng)業(yè)務(wù)層面的人需要高精尖技術(shù)時就能直接從科研的團(tuán)隊中獲得,并把這些技術(shù)部署到產(chǎn)品中。
GEEKPARK:從學(xué)術(shù)界投入工業(yè)一直是一件即有吸引力又有爭議的事,您怎么看?
賈佳亞:我一直說一句話,做技術(shù)的人不能躲在后端。這現(xiàn)在很多 AI 技術(shù)的獨角獸公司做得比較好的地方,他們把 AI 推到前端去了,這能促進(jìn)整個產(chǎn)業(yè)的升級進(jìn)步。同樣的道理,在騰訊里面技術(shù)也不能躲到后端,我們不能永遠(yuǎn)是靠別人傳遞業(yè)務(wù)需求給我們,中間可能還要經(jīng)過三四道工序,然后我們再經(jīng)過同樣多的工序再提供給用戶數(shù)據(jù)或者平臺。我們一定要直接了解客戶需求并且直接提供給用戶需要的,這樣的做事方式蠻像一個創(chuàng)業(yè)公司。

GEEKPARK:優(yōu)圖實驗室對于騰訊來說像什么?
賈佳亞:現(xiàn)在我理解優(yōu)圖更像一個亞馬遜的云部門一樣,是其中的一部分。這樣的實驗室可以做非常有創(chuàng)新性、前瞻性的事情,同時還有一部分事情極其貼地氣。
GEEKPARK:優(yōu)圖最近推出了一套手語識別優(yōu)圖最近推出了一款手語識別,這是為了契合騰訊所提出的「科技向善」嗎?
賈佳亞:我們不是刻意設(shè)計這些概念的。我們是很質(zhì)樸的科研人員??萍及l(fā)展到今天,就會給普通人每天的生活、每天的溝通產(chǎn)生了便利,而這恰恰也是公益的。只不過,公司升華了我們的概念。
GEEKPARK:還會繼續(xù)做一些相關(guān)的相關(guān)的公益嗎?
賈佳亞:在醫(yī)療或者社會公益這一塊,我們已經(jīng)開始在籌劃一些新的方向。這些方向既有非常前沿的探索,同時也會能夠幫到人。但在沒做成之前我也不想說太多,因為現(xiàn)在還是偏探索性。萬一 flag 倒了呢。(笑)
GEEKPARK:優(yōu)圖作為騰訊的一部分也參與到了企業(yè)級服務(wù)當(dāng)中,您覺得你們和創(chuàng)業(yè)公司的打法或者說差異點在哪里?
賈佳亞:對小公司而言,一個理念就是哪些東西我們要做,我們要去拼,要沖進(jìn)去,搶占市場。這個大公司的理念是完全截然相反的。騰訊既想做 To B 業(yè)務(wù),又想做 To C 業(yè)務(wù),既想做零售,也想做工業(yè)相關(guān),什么都想做。所以我覺得騰訊現(xiàn)在要做減法,明確哪些東西我們不要做,因為這些東西是做不完的事情,不可能完成。
GEEKPARK:哪些事情不做?
賈佳亞:現(xiàn)在要專注做的是提供云端服務(wù)。只要把云端服務(wù)做好了,這就是一個壁壘,是其它公司很難追趕的東西。
GEEKPARK:優(yōu)圖和云部門怎么展開具體合作?
賈佳亞:云現(xiàn)在是我們一起打拼的伙伴。云需要我們提供技術(shù)支持,也需要我們走到前端。與此同時,我們也依賴云的很多的能力,例如幫我們找到新的落地點、AI 新的應(yīng)用方式等等。

GEEKPARK:為什么感覺最近計算機(jī)視覺技術(shù)的進(jìn)展有些緩慢,是否意味著研究上沒有一些突破了?
賈佳亞:我的認(rèn)知反而是比較相反的?,F(xiàn)在語音或者說 NLP(自然語言處理)有一些新的進(jìn)展,是因為它們以前的底子太差了。但視覺方面,研究其實已經(jīng)遠(yuǎn)遠(yuǎn)超越人的水平,并且開始做一些人做不到的事情。在視覺這一塊,這兩年雖然感覺技術(shù)變化不是很大,但是我在這個領(lǐng)域每年都受到很大的震撼,因為它很多地方遠(yuǎn)遠(yuǎn)超越了人類。當(dāng)然我不是說語音這件事做起來容易,正是因為本身這件事情很難做,所以它以前跟人的差距有點大。
GEEKPARK:說到視覺,隱私也是人們很關(guān)注的一個話題。怎么防止人臉識別技術(shù)的濫用?
賈佳亞:在中國很多人關(guān)注能不能用人臉數(shù)據(jù),怎么能通過人臉對比去查找一些罪犯。這個事情是不太合理的。在 AI 行業(yè),絕大部分的信息都是脫敏的。做人臉識別的時候,實際上只是要做一個對比,并不關(guān)心這個人到底是誰。這個人所有的身份信息,實際上是存在另外一個隔絕的庫里,科研人員是看不到的,只能看到人臉和比對結(jié)果。
GEEKPARK:優(yōu)圖現(xiàn)在在面向更多的行業(yè),您覺得這其中的行業(yè)壁壘是不是會不會越來越高?
賈佳亞:行業(yè)之所以有壁壘,是因為模型不夠泛化。解決面板行業(yè)的算法放到半導(dǎo)體行業(yè),這套方案可能不能用了,必須用另外一個方案,這是一個泛化問題。泛化問題并不是那么好解決,可能會有提升,但是并不能夠期待能像定任務(wù)一樣去解決這個問題。我們不去追求這些,但是我們內(nèi)部會不斷地研究這些。
GEEKPARK:優(yōu)圖如何能夠快速地提供支持不同的落地方向?
賈佳亞:面對我們不熟悉產(chǎn)業(yè)時,數(shù)據(jù)是沒有辦法逃脫的夢魘。中國的產(chǎn)業(yè)互聯(lián)網(wǎng)分幾步走。第一步在叫做電子化,把傳統(tǒng)的紙質(zhì)文件變成電子化,有有些領(lǐng)域里這一步還沒有實現(xiàn),所以也沒有其它更高級別的處理。第二步是結(jié)構(gòu)化,單純電子化是不夠的,數(shù)據(jù)需要結(jié)構(gòu)化。第三步 AI 化,通過這一步來提煉出最有用的信息。通過這三步,優(yōu)圖也能更好的服務(wù)于各個行業(yè)。
相關(guān)文章
- 拿下SOTA!騰訊優(yōu)圖聯(lián)合廈門大學(xué)提出AIGI生成圖像檢測新方法
- Interspeech 2025 | 騰訊優(yōu)圖實驗室4篇論文入選,涵蓋超聲波活體檢測、神經(jīng)語音編解碼、語音合成等方向
- ICCV 2025 | 騰訊優(yōu)圖實驗室大模型8篇論文入選,涵蓋風(fēng)格化人臉識別、AI生成圖像檢測、多模態(tài)大語言模型等方向
- 最高10倍加速!北京大學(xué)聯(lián)合騰訊優(yōu)圖實驗室將 GQA 改造成 MLA形式
- ACL 2025 | 騰訊優(yōu)圖實驗室大模型4篇論文入選,涵蓋智能體、角色扮演、自動推理等方向
- 超越ControlNet!騰訊優(yōu)圖實驗室聯(lián)合復(fù)旦大學(xué)提出AI生圖新框架,解決多條件生成難題
- 喜報!騰訊優(yōu)圖聯(lián)合項目獲CSIG科技進(jìn)步獎一等獎
- PRCV 2021 | 視覺AI飛速發(fā)展,騰訊優(yōu)圖分享內(nèi)容理解新實踐
- AAAI2022騰訊優(yōu)圖14篇論文入選,含語義分割、圖像著色、人臉安全、弱監(jiān)督目標(biāo)定位、場景文本識別等前沿領(lǐng)域
- AICon2021 | 騰訊優(yōu)圖鄢科:以AI技術(shù)助力內(nèi)容安全 促進(jìn)互聯(lián)網(wǎng)環(huán)境健康發(fā)展
- 騰訊優(yōu)圖人臉安全能力再獲認(rèn)可!優(yōu)圖專家入選“護(hù)臉計劃”專家委員會
- 騰訊優(yōu)圖斬獲ICCV2021 LVIS Challenge Workshop冠軍及最佳創(chuàng)新獎
- CCAI 2021 | 騰訊優(yōu)圖汪鋮杰:用AI生成更優(yōu)更新的內(nèi)容
- 用AI技術(shù)開啟穿越時空的視覺盛宴 騰訊優(yōu)圖亮相第八屆世界互聯(lián)網(wǎng)大會
- 騰訊優(yōu)圖“AI畫廊”首次亮相2021重慶智博會展示智能技術(shù)前沿探索成果
- 騰訊優(yōu)圖17篇論文入選ICCV2021,含跨模態(tài)檢索與分割、車輛識別等領(lǐng)域
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進(jìn)化,技嘉2025線下產(chǎn)品發(fā)布會強(qiáng)勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機(jī)的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機(jī)新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機(jī)器人將超2000臺,眾擎機(jī)器人與多倫科技達(dá)成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案