人工智能:解鎖手機(jī)人臉識別新進(jìn)展
2018-05-07 15:06:09AI云資訊1384
從工業(yè)革命、電氣革命、數(shù)字革命到智能時代,我們已經(jīng)步入了人類賦予機(jī)器智慧的新時代。過去一年,全面屏、人臉解鎖和屏下指紋已然成為手機(jī)圈中最熱的三大技術(shù),然而當(dāng)差異化越來越小之時,又驅(qū)動著新的創(chuàng)新技術(shù)誕生,而AI正成為各大手機(jī)廠商新的競爭點(diǎn),人工智能一躍而起成為手機(jī)圈中的“香餑餑”。
縱觀當(dāng)下,人工智能被廣泛應(yīng)用于機(jī)器人、語音識別、圖像識別等領(lǐng)域,移動互聯(lián)網(wǎng)時代信息傳播效率的飛速提升讓人們真正看到了AI技術(shù)改變?nèi)祟愇磥砩罘绞降目赡苄浴?
在人工智能大賽道中,人臉識別是其中發(fā)展較為成熟的應(yīng)用領(lǐng)域。同時,人臉識別是符合國家政策趨勢、惠及民生的領(lǐng)域,國家863計劃、國家科技支撐計劃、自然科學(xué)基金都會拔出了??钯Y助人臉識別的相關(guān)研究。在國家政策的支持和完善下,人臉識別技術(shù)將會被推向更廣闊的日常領(lǐng)域。
如今,“刷臉”已經(jīng)成了人們生活中的日常事務(wù),從移動支付、解鎖手機(jī)到學(xué)校、公司、小區(qū)門禁等,都運(yùn)用到了人臉識別技術(shù)。人臉識別技術(shù)產(chǎn)品已廣泛應(yīng)用于金融、司法、軍隊(duì)、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療及眾多企事業(yè)單位等領(lǐng)域。
人臉識別在手機(jī)端行業(yè)中,掀起了人臉識別解鎖技術(shù)熱潮,各大手機(jī)廠商也蜂擁擠入,其中最有影響力的便是iPhone X的Face ID。面對日益激烈的行業(yè)競爭,如何在強(qiáng)敵林立之下找到自身的立足之地,創(chuàng)新、突破技術(shù)顯得尤為重要,在這一點(diǎn)上,曠視科技Face++憑借其核心的人臉識別技術(shù) ,成為行業(yè)中的“佼佼者”。
峰會現(xiàn)場
日前,由手機(jī)報在線舉辦的AI手機(jī)產(chǎn)業(yè)峰會在深圳圓滿落幕。據(jù)了解,曠視科技Face++副總裁敖翔蒞臨本次峰會,并以“手機(jī)人臉識別的新進(jìn)展”為主題,深入講述了公司的跨模態(tài)人臉識別和人像光效兩大技術(shù)。
跨模態(tài)人臉識別技術(shù)
跨模態(tài)人臉識別技術(shù)在生活中已得到真實(shí)應(yīng)用,在最近的 vivo X21的發(fā)布會上,vivo X21為提升人臉解鎖的性能和場景寬度選擇,再度與曠視科技Face++合作,并在原有的人臉識別解鎖方案上增加了景深技術(shù)和近紅外技術(shù),實(shí)現(xiàn)了2PD全像素雙核單攝紅外人臉解鎖。
vivo X21在攝像頭方面,其前置攝像頭類似紅外發(fā)射器,可做到全天候刷臉,晚上一點(diǎn)光線都沒有的情況下也可以刷臉。此外,在紅外方面,傳統(tǒng)的紅外方案是一個紅外發(fā)射器、一個紅外接收器,還有一個主攝像頭。據(jù)敖翔介紹,曠視為vivo提供了一個更大膽、更厲害的方案,即一個發(fā)射器和一個主攝像頭,主攝像頭可以感受紅外,基本上是全通的攝像頭。敖翔表示,相比傳統(tǒng)的紅外方案,這項(xiàng)方案具有三個明顯優(yōu)勢:
1、方案易用,只有一個發(fā)射器和一個主攝像頭,模組結(jié)構(gòu)簡單、利于集成。
2、用戶體驗(yàn)非常好,不受光線影響,任何光線環(huán)境下都可以解鎖,良好的用戶體驗(yàn)也將使vivo X21具有更大的市場優(yōu)勢。
3、硬件成本優(yōu)勢,體現(xiàn)在傳感器較少,本身有前置攝像頭。但這一點(diǎn)既是優(yōu)勢,然而也存在很大的風(fēng)險。
而事實(shí)上,這個方案的實(shí)現(xiàn)非常困難,如何將紅外的人臉識別和RGB人臉識別相融合,并且做到無縫轉(zhuǎn)換和融合,這是難點(diǎn)所在。
曠視科技副總裁敖翔(現(xiàn)場圖)
風(fēng)險點(diǎn)在于IR數(shù)據(jù)存量少。對Face++來說,RGB識別不是問題,其RGB的圖像數(shù)據(jù)很多,里面有幾千萬張臉,就算是現(xiàn)場采集人臉也可以采集到幾萬、幾十萬張。但就IR識別而言,對整個行業(yè)來說存量的IR數(shù)據(jù)很少,且IR每個鏡頭不一樣,所以用特定模組采,采的IR數(shù)據(jù)就很少。在IR數(shù)據(jù)特別少的情形下,同時做RGB識別,又做IR識別,這是一個挑戰(zhàn),尤其對做人臉識別這種非常精密的識別來說是非常大的挑戰(zhàn)。
Face++成功地將跨模態(tài)人臉識別技術(shù)運(yùn)用到vivo X21上,這是在手機(jī)產(chǎn)業(yè)界上非常完美的一次運(yùn)用,曠視科技采用神經(jīng)網(wǎng)絡(luò)里面一種流行的辦法——Domain Transfer Learning域遷移學(xué)習(xí),從而解決了該項(xiàng)技術(shù)上的難題,可以說是學(xué)術(shù)界的重大技術(shù)突破。
如何實(shí)現(xiàn)跨模態(tài)人臉識別技術(shù)
對于如何實(shí)現(xiàn)跨模態(tài)人臉識別技術(shù),敖翔做出了深入闡述:“首先需要做的是RGB訓(xùn)練。根據(jù)現(xiàn)有的模型和高精度人臉識別網(wǎng)絡(luò)結(jié)構(gòu),從中獲取參數(shù);接下來,將網(wǎng)絡(luò)直接平移過去做新的網(wǎng)絡(luò),所有的參數(shù)保留,這相當(dāng)于給RGB信號做預(yù)訓(xùn)練,從而得到大量數(shù)值化參數(shù),再用少量紅外數(shù)據(jù)去微調(diào)網(wǎng)絡(luò),經(jīng)過巧妙的網(wǎng)絡(luò)設(shè)計和訓(xùn)練技巧,進(jìn)而得到高精度紅外和紅外相對比的算法?!?
據(jù)了解,曠視在手機(jī)解鎖上應(yīng)用的算法有兩種,一個是RGB識別算法,一個是紅外的識別算法。最重要的是做兩個融合,由于攝像頭在白天識別的時候,光線很好,但是晚上光線比較弱,IR和RGB信號比重是平滑改變的,這就決定了二者必須揉在一起做。上述兩個步驟完成之后,通過將RGB和IR的數(shù)據(jù)進(jìn)行混合訓(xùn)練,對RGB和IR的信息進(jìn)行融合。所有步驟的完成就叫跨模態(tài)識別。
跨模態(tài)人臉識別技不但可以忽略環(huán)境的影響,達(dá)成全天候的人臉識別,其抗攻擊性能也比傳統(tǒng)紅外方案更好,在RGB識別算法和紅外識別算法相結(jié)合的基礎(chǔ)上,最后結(jié)合曠視自研的ShuffleNet模型,進(jìn)一步優(yōu)化了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。據(jù)敖翔透露,在今年的論文中將會就跨模態(tài)人臉識別技術(shù)作出更全面、系統(tǒng)的闡釋。
人像光效技術(shù)
在去年的iPhone發(fā)布會上,蘋果推出了一個新的攝像功能——人像光效。
簡單來說,人像光效技術(shù)就是通過一系列軟硬件配合的技術(shù),讓我們能夠在拍攝人像或者后期編輯時利用算法,為照片添加上逼真的光影效果,比如自然光、攝影室燈光、輪廓光等。用蘋果的廣告語是這么說的:人像光效,隨身攜帶的燈光師。
據(jù)了解,iPhone X的人像光效技術(shù)主要是用于它自己高端的iPhone上,用在iPhoneX或者雙攝鏡頭上。
曠視Face++讓安卓機(jī)實(shí)現(xiàn)人像光效技術(shù)
任何一項(xiàng)技術(shù)的實(shí)現(xiàn)都不會是一蹴而就的,人像光效技術(shù)也是如此。曠視為客戶定制的光效技術(shù)由人臉關(guān)鍵點(diǎn)檢測、面部三維光效渲染、T區(qū)高光提亮、背景保護(hù)等20多項(xiàng)技術(shù)組合而成,“因?yàn)槿四樣刑嗟男畔⑿枰プR別,識別越多的信息就約有利于人的面部美化”。敖翔同樣也道出人像光效技術(shù)研發(fā)關(guān)鍵所在:“人像光效的關(guān)鍵在于三維面部重建。”
據(jù)了解,曠視在人像光效技術(shù)的運(yùn)用上,不強(qiáng)求一定采用3D Camera。對此,敖翔作出了解釋:“因?yàn)槿说拿娌坑泻軓?qiáng)的鮮艷知識被識別的人臉可以在電腦里重構(gòu)出來,并且可以做到一模一樣。雖然3D Camera可以做到更加準(zhǔn)確,但人的知識自主性決定了整個3D重建并不一定完全依賴3D Camera。曠視的人像光效技術(shù)可以對二維的圖像做出3D重建,且重建并不需要花太多時間,在人臉的程度上,利用結(jié)構(gòu)光捕捉、神經(jīng)網(wǎng)絡(luò)的深度威力去猜人臉部的凹凸系統(tǒng),進(jìn)而生成深度圖?!?
對比之下,蘋果的人像光效技術(shù)主要是雙攝鏡頭,因此其對雙攝硬件有更強(qiáng)的依賴,而曠視的人像光效技術(shù)更具有廣泛性,對攝像頭依賴程度較低能夠支持不同平臺和機(jī)型,并可同時滿足前置或后置的單攝/雙攝應(yīng)用需求,更加適合多元化的市場需求。
通過曠視科技副總裁敖翔的解說,加深了我們對跨模態(tài)人臉識別技術(shù)和人像光效的了解,這兩項(xiàng)技術(shù)也是人工智能領(lǐng)域的歷史性突破,曠視科技用AI為行業(yè)增加了新的動力,也賦予了行業(yè)未來更多可能。而對于曠視科技Face++來說,做到這些只是基礎(chǔ),在未來,他們將會做得更好、更細(xì)致,會有更好的成績,我們拭目以待!
相關(guān)文章
- 優(yōu)刻得參加聯(lián)合國工發(fā)組織全球工業(yè)與制造業(yè)人工智能聯(lián)盟大會
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 中國移動董事長楊杰:聚力“人工智能+”行動,賦能新型工業(yè)化發(fā)展
- 2025年人工智能技術(shù)賦能網(wǎng)絡(luò)安全應(yīng)用測試 深信服成唯一包攬三項(xiàng)第一廠商
- 踐行國家“人工智能+”戰(zhàn)略,容聯(lián)云助力某消金“客服智能體”落地
- 相聚上海,共赴智能之約!昇騰AI人工智能產(chǎn)業(yè)峰會三大亮點(diǎn)搶先看
- 2025青島海洋人工智能創(chuàng)新應(yīng)用大賽 高校行活動圓滿收官!
- 老板電器入選首批浙江省人工智能賦能制造業(yè)典型案例,樹立AI轉(zhuǎn)型可復(fù)制標(biāo)桿
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 工業(yè)富聯(lián)AI低代碼平臺入選浙江省人工智能賦能制造業(yè)典型案例
- Canva可畫入選 2025年服貿(mào)會“人工智能+” 示范案例, 展現(xiàn) AI 賦能服務(wù)貿(mào)易新實(shí)踐
- 甲骨文與OpenAI達(dá)成3000億美元“星際之門”項(xiàng)目協(xié)議 或?qū)⒅厮茉朴嬎闩c人工智能未來
- 重磅發(fā)布 | “人工智能數(shù)據(jù)沙盒伙伴計劃”亮相2025服貿(mào)會
- 中國聯(lián)通全面承接國家人工智能應(yīng)用中試基地(醫(yī)療領(lǐng)域)
- GTI發(fā)布全球“人工智能+”產(chǎn)學(xué)研生態(tài)合作倡議:深化融合創(chuàng)新,共促AI普惠
- 深度契合人工智能+與智能網(wǎng)聯(lián)汽車主題,懂車帝智博會系列活動收官
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機(jī)器人技能大賽在滬啟動,助推智能建造實(shí)戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機(jī)賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎”,以芯片級創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案