從奧巴馬假視頻到ZAO,換臉和人臉檢測技術發(fā)生了什么?
2020-01-21 16:59:46AI云資訊1089
近期,通過數(shù)字操縱(尤其是 DeepFake 方法)生成包含人臉信息的假圖像和假視頻,已成為公眾關注焦點。
「DeepFake」是一項基于深度學習的技術,通過把圖像或視頻中的人臉換成另一個人的臉,來創(chuàng)建假圖像/視頻。
該詞最早出現(xiàn)于 2017 年底,一位名為「deepfakes」的 Reddit 用戶開發(fā)了一種機器學習算法,該算法可將名人的人臉換到色情視頻中。除了偽造的色情作品以外,還有一些殺傷力更強的假內(nèi)容應用方式,比如假新聞、金融詐騙等。
因此,原本專注于通用假圖像和假視頻檢測的研究領域重新煥發(fā)了生機,轉(zhuǎn)而將更多的精力放在如何檢測圖像和視頻中的人臉操縱上。研究者對人臉操縱檢測領域的諸多努力是基于有關生物特征識別反欺騙的先前研究和數(shù)據(jù)驅(qū)動的現(xiàn)代深度學習技術展開的。學術頂會上相關研討會的數(shù)量越來越多,NIST 和 Facebook 又分別主辦了 MFC2018 和 DFDC 等競賽,這些都表明社區(qū)對假人臉檢測的興趣不斷增長。
之前,因缺乏復雜編輯工具和領域?qū)I(yè)知識、操作過程復雜且耗時,人臉操縱的數(shù)量和逼真度受到了局限。例如,該領域的早期研究《Video Rewrite: Driving Visual Speech with Audio》利用不同的音軌修改說話人的嘴唇運動(具體是通過將音軌的聲音和說話人的人臉形狀連接起來實現(xiàn)的)。
而現(xiàn)在,自動合成并不存在的人臉或者操縱圖像或視頻中的真實人臉變得更加容易,這取決于以下幾個因素:1)大型公共數(shù)據(jù)的可獲?。?)深度學習技術的進化(這免除了人工編輯步驟)。
《Synthesizing Obama: Learning Lip Sync From Audio》展示了之前技術的進化版,該研究生成了高質(zhì)量的奧巴馬演講視頻,目標視頻中奧巴馬原本的發(fā)言已被改變。
現(xiàn)在,最逼真的人臉操縱技術已經(jīng)取代了上述研究所使用的方法,它們將 CNN 與 GAN 結合起來。因此,ZAO和 FaceApp 等開源移動應用的發(fā)布,使得任何人都可以創(chuàng)建假圖像和假視頻。研究社區(qū)對這些日益復雜和逼真的操縱內(nèi)容作出了回應,目前他們正付出巨大努力來改進人臉操縱檢測方法。
本文對人臉操縱及檢測技術進行了綜述,首先我們來看人臉操縱的類型。
人臉操縱的類型
根據(jù)操縱的級別,人臉操縱技術可分為四類:人臉合成、換臉、人臉屬性操縱和人臉表情操縱,參見下圖 1:
圖 1:每個人臉操縱類別的真假圖像示例。
接下來我們按照從高級到低級的順序,介紹這四種人臉操縱類型:
人臉合成:通常利用強大的 GAN(如近期的 StyleGAN 方法)創(chuàng)建完全不存在的人臉。這些技術獲得了驚人的結果,其生成的高質(zhì)量人臉圖像栩栩如生。圖 1 展示的人臉合成樣本即通過 StyleGAN 生成;
換臉:即將一個人的臉換成另一個人的臉。該領域通常采用兩種不同的方法:1)經(jīng)典的計算機圖形學技術,如 FaceSwap;2)新型深度學習技術 DeepFake,如近期的移動應用 ZAO;
人臉屬性操縱:即修改人臉的某些屬性,如發(fā)色、膚色、性別、年齡、是否戴眼鏡等。該操縱過程通常使用 GAN 完成,如 StarGAN。該類型的典型示例是流行的移動應用 FaceApp;
人臉表情操縱:即修改人臉表情,如將一個人的面部表情遷移到另一個臉上。最流行的技術之一是 Face2Face,該技術可實時進行。近期方法展現(xiàn)出巨大潛力,可以生成高質(zhì)量的視頻,上述視頻中人物(如奧巴馬)的發(fā)言已被改變。
人臉合成
相關的操縱技術和公共數(shù)據(jù)庫
下表 1 總結了人臉合成研究中主要使用的公共數(shù)據(jù)庫。必須強調(diào)的是這些數(shù)據(jù)庫中不包含真實人臉圖像樣本。該領域研究者通常使用常見公共數(shù)據(jù)庫中的真實人臉圖像來訓練系統(tǒng),如 CelebA [23]、FFHQ [19]、CASIA-WebFace [24] 和 VGGFace2 [25]。
表 1:人臉合成領域的公共可用數(shù)據(jù)庫。
相關文章
- 從人臉識別到AIGC文旅,深牧科技榮膺科大訊飛“AI領航者年度金榜”
- 鴻蒙版釘釘上線“考勤”功能,支持人臉識別,效率已達Next Level!
- 硬蛋科技攜手英特爾?至強?可擴展處理器 助力百度云推廣離線人臉識別
- 華為智能門鎖 Plus上市,會自主學習的AI人臉識別鎖
- 皓睛發(fā)布BRITEYE F10人臉識別門禁一體機,打造高效安全智慧化門禁管理
- 直擊人臉識別防沉迷的AB面,厘清合法性邊界是關鍵
- 人臉識別+全景雙攝+AI算法 螢石推動智能鎖行業(yè)革新
- 人臉識別智能鎖迅速興起 歐菲光發(fā)力智能門鎖打開發(fā)展新局面
- 護航未成年人網(wǎng)絡之旅,網(wǎng)易游戲持續(xù)探索人臉識別技術
- 網(wǎng)易游戲積極探索人臉識別技術,筑牢未成年人網(wǎng)絡保護屏障
- 網(wǎng)易游戲探索人臉識別功能,規(guī)范未成年人上網(wǎng)行為
- 網(wǎng)易游戲構建未成年人網(wǎng)絡安全保護網(wǎng),不斷探索人臉識別技術
- 網(wǎng)易游戲探索人臉識別功能,不斷加固未成年人守護屏障
- 2022年3D人臉識別智能鎖銷售增速297% 京東年貨節(jié)攜德施曼等大牌首發(fā)趨勢新品
- 網(wǎng)易探索人臉識別技術,進一步筑牢未成年人防護網(wǎng)
- 保障未成年人安全上網(wǎng),網(wǎng)易游戲人臉識別技術加強防沉迷監(jiān)管
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 僅售999元!唯卓仕AF 9mm F2.8 Air超廣角自動鏡頭來了!
- 僅售999元!唯卓仕AF 14mm F4.0 Air 發(fā)布:輕便全畫幅超廣角自動鏡頭來了
- 華迅科技推出武迅WX-P3固態(tài)硬盤,自有工廠+國資背景助力國產(chǎn)存儲
- 三星Galaxy S25系列:為你的校園生活注入高能科技基因
- 技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀元
- 未來生活 觸手可得 三星Galaxy智能新品現(xiàn)已開售
- 音質(zhì)升級 煥新登場 三星Galaxy Buds3 FE正式上市
- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀元
- 絢星破局AI落地困境,四大業(yè)務重構企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能