騰訊優(yōu)圖實驗室專家寫給2029的信:計算機視覺AI技術(shù)的爆點在哪里?
2018-12-17 11:17:22AI云資訊1346
在迷霧重重、混沌不明的當(dāng)下,市場中的每一個理性人都需要放長眼量,將錨拋在時間之河中較遠的地方,以未來丈量現(xiàn)在,才能站立得更堅實安穩(wěn)。《中國企業(yè)家》組織9位企業(yè)家、科學(xué)家、經(jīng)濟學(xué)家及藝術(shù)家,請他們每人寫下一封給2029年的信,預(yù)測他們眼中10年后的世界,希望能對讀者有所裨益。

(圖片來源:中企圖庫)
近年來,計算機視覺AI技術(shù)發(fā)展迅速,尤其是人工智能的引入大大提升了算法的能力和實用性。在數(shù)不清的視覺AI應(yīng)用中,我們認為未來技術(shù)的爆發(fā)點可能來自三個方面:信息的整合和提取、醫(yī)療和自動駕駛。騰訊優(yōu)圖實驗室的AI技術(shù)布局也可大致分為上述的三個模塊。
信息的整合和提取,主要指內(nèi)容分析,包括人物識別、行為分析、場景識別、物體檢測、語義分割等能夠從豐富的圖像或視頻中提取有意義和結(jié)構(gòu)化的信息,結(jié)合落地場景的應(yīng)用,產(chǎn)生有價值的數(shù)據(jù),給予用戶或消費者精準的建議。這個領(lǐng)域在近幾年進展迅速。舉例來說,通過分析用戶的點擊或搜索行為,建立用戶畫像,讓內(nèi)容服務(wù)平臺能夠更精準地推薦用戶感興趣的內(nèi)容。這是Google、Facebook等大公司正在做的事情。在視覺AI技術(shù)成熟前,他們的用戶畫像主要以文字搜索記錄的分析為主。但隨著視覺AI技術(shù)的發(fā)展,往后將會有更多的用戶行為是從多媒體內(nèi)容直接提取。并且,信息的整合和提取不會只局限于線上的行為。在大數(shù)據(jù)和5G普及的未來,將會產(chǎn)生大量的線下數(shù)據(jù)。通過提煉線下的數(shù)據(jù),能夠更有效地分析人們的行為,小至商品推薦,大至城市規(guī)劃,均會使用視覺AI技術(shù),讓人們的生活更方便、舒適和安全。
醫(yī)療AI的宗旨在于輔助診斷,在人口眾多、醫(yī)師資源分配不均的時代,減少醫(yī)生的重復(fù)性勞動,幫助基層疾病篩查的覆蓋。臨床上,疾病治療秉持的觀點是:早診斷、早治療、疾病篩查、及時就醫(yī)以及精準微創(chuàng)型治療對整個社會以及人類醫(yī)療水平的提高有著前所未有的重大意義。未來十年,智能問診、智能掛號指引、醫(yī)療影像上的自動篩查,如X光肺炎自動檢測、心臟影像結(jié)構(gòu)自動分析等將會大量減少醫(yī)生的工作,讓醫(yī)生更專注解決和處理危疾病人的需求。并且,醫(yī)療AI有望實現(xiàn)大部分疾病初篩普及,大數(shù)據(jù)化以及智能分析有望改變傳統(tǒng)就醫(yī)繁雜的過程,虛擬手術(shù)的發(fā)展增加醫(yī)師手術(shù)經(jīng)驗,智能手術(shù)機器人實現(xiàn)更多疾病的精準微創(chuàng)手術(shù)治療。
自動駕駛是在未來十年必定會到來的技術(shù)。當(dāng)中核心需要解決的問題在于環(huán)境識別。目前,在自動駕駛的落地測試中,因為環(huán)境識別的錯誤產(chǎn)生的交通意外,占了90%以上。簡單地解釋一下,如果自動駕駛是發(fā)生在游戲世界,所有環(huán)境的數(shù)據(jù)都能夠精準地反饋到負責(zé)車控的AI,而AI只需要做決策,那么在這個問題之上,AI的決策能力絕對在人類之上。這個從AlphaGo戰(zhàn)勝人類的案例中可以看出,在完全的封閉環(huán)境之下,AI的決策能力已經(jīng)超越人類。而自動駕駛目前還處于測試階段的原因,是因為對環(huán)境信息的不完全理解,因而做成決策錯誤。而解決這個環(huán)境識別的問題,是會隨著在路上行車測試數(shù)據(jù)的不斷增加而趨于完美的。這樣考慮下來,自動駕駛就是一個必定會到來的技術(shù)。同時,基于自動駕駛所產(chǎn)生的應(yīng)用,為人們帶來生活的便利,將會越來越多。
未來十年,首先確定無疑的是,AI算法的各項指標會越來越高,計算機視覺的算法也會在實用的道路上越走越深入:更貼近使用場景、效果更精準。軟硬件的進步讓基于AI的視覺算法不再受限于特定的計算硬件,而且將成為計算設(shè)備看懂世界的常用工具。如今的“多媒體計算機”能夠記錄并播放多種媒體,未來的計算機將能夠讀懂多種媒體信息的含義。
計算機視覺AI技術(shù)的發(fā)展也勢必會直接影響我們衣食住行的方方面面。
暢想一下,2029年,商店自動推斷出顧客的體型、膚色、年齡,進而推薦合適的穿衣搭配;吃東西之前,自動幫你判斷新鮮程度、營養(yǎng)成分、推薦健康的膳食搭配;智能家居進入千家萬戶,語音、手勢可以自由地控制家電,智能安防攝像頭幫你照料家中小孩的活動;在醫(yī)療方面,疾病檢查過程簡便化,基層醫(yī)療設(shè)備更加完善,少數(shù)醫(yī)護人員就可建立疾病篩查點;對某些疾病,便攜式的成像設(shè)備涌現(xiàn),傻瓜式的操作、篩查過程進入尋常百姓家,讓患者實現(xiàn)自我篩查。十年后的就醫(yī),我們不用再為“肚子疼”應(yīng)該掛哪個科室而煩惱,智能對話分析助手可以通過簡單的對話幫患者確定疾病范圍、選擇科室、做出最佳的檢查時間、就醫(yī)時間安排,簡化就醫(yī)流程。智能手術(shù)機器人變得更加智能化、微細化,術(shù)后愈合快,減少手術(shù)帶來的痛苦。
無人駕駛汽車的普及,將會大量釋放物流業(yè)的人力成本,讓BtoC的生意更容易和快捷,物價將會因為人力成本的減少變得更合理。泊車時將不再需要忙于尋找車位,長途汽車旅游將會有更多的休息時間,無人計程車讓人們能夠即叫即走,女士晚上叫車將會更安全,城市交通也會因為更好的路線規(guī)劃而減少阻塞。
AI將賦予計算機理解世界的能力,計算機能更好地幫助人類分析規(guī)劃,作出決策。當(dāng)然,計算機視覺AI技術(shù)的想象空間無限大。但是從技術(shù)研究到實際落地應(yīng)用還有很長的路要走,這也是所有相關(guān)研究人員努力的方向和愿景。
相關(guān)文章
- 拿下SOTA!騰訊優(yōu)圖聯(lián)合廈門大學(xué)提出AIGI生成圖像檢測新方法
- Interspeech 2025 | 騰訊優(yōu)圖實驗室4篇論文入選,涵蓋超聲波活體檢測、神經(jīng)語音編解碼、語音合成等方向
- ICCV 2025 | 騰訊優(yōu)圖實驗室大模型8篇論文入選,涵蓋風(fēng)格化人臉識別、AI生成圖像檢測、多模態(tài)大語言模型等方向
- 最高10倍加速!北京大學(xué)聯(lián)合騰訊優(yōu)圖實驗室將 GQA 改造成 MLA形式
- ACL 2025 | 騰訊優(yōu)圖實驗室大模型4篇論文入選,涵蓋智能體、角色扮演、自動推理等方向
- 超越ControlNet!騰訊優(yōu)圖實驗室聯(lián)合復(fù)旦大學(xué)提出AI生圖新框架,解決多條件生成難題
- 喜報!騰訊優(yōu)圖聯(lián)合項目獲CSIG科技進步獎一等獎
- PRCV 2021 | 視覺AI飛速發(fā)展,騰訊優(yōu)圖分享內(nèi)容理解新實踐
- AAAI2022騰訊優(yōu)圖14篇論文入選,含語義分割、圖像著色、人臉安全、弱監(jiān)督目標定位、場景文本識別等前沿領(lǐng)域
- AICon2021 | 騰訊優(yōu)圖鄢科:以AI技術(shù)助力內(nèi)容安全 促進互聯(lián)網(wǎng)環(huán)境健康發(fā)展
- 騰訊優(yōu)圖人臉安全能力再獲認可!優(yōu)圖專家入選“護臉計劃”專家委員會
- 騰訊優(yōu)圖斬獲ICCV2021 LVIS Challenge Workshop冠軍及最佳創(chuàng)新獎
- CCAI 2021 | 騰訊優(yōu)圖汪鋮杰:用AI生成更優(yōu)更新的內(nèi)容
- 用AI技術(shù)開啟穿越時空的視覺盛宴 騰訊優(yōu)圖亮相第八屆世界互聯(lián)網(wǎng)大會
- 騰訊優(yōu)圖“AI畫廊”首次亮相2021重慶智博會展示智能技術(shù)前沿探索成果
- 騰訊優(yōu)圖17篇論文入選ICCV2021,含跨模態(tài)檢索與分割、車輛識別等領(lǐng)域
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案