騰訊優(yōu)圖榮獲CVPR2021 Image Matching Workshop雙賽道冠亞軍
2021-07-15 19:05:55AI云資訊948
近日,騰訊優(yōu)圖實(shí)驗(yàn)室在CVPR2021舉辦的Image Matching Workshop(IMW2021)比賽中,提出的圖像匹配技術(shù) (SS-Fusing)榮獲雙賽道冠亞軍。IMW2021是Google和University of British Columbia(UBC)聯(lián)合舉辦的Workshop比賽,吸引了包括曠視,商湯,EPFL,KORNIA,華中科大和OPPO等公司、學(xué)校和機(jī)構(gòu)參加。
作為計(jì)算機(jī)視覺領(lǐng)域的基礎(chǔ)技術(shù)之一,Image Matching是指尋找一張圖片中拍攝的子區(qū)域在另一張圖片中的對應(yīng)位置,廣泛應(yīng)用于包括SFM、SLAM、三維重建、大規(guī)模圖像檢索,缺陷檢測與配準(zhǔn)等領(lǐng)域。
圖1、圖像匹配技術(shù)示例
本次比賽的評測機(jī)制如圖2所示,參賽者根據(jù)自己提出的方法提取每張圖的關(guān)鍵點(diǎn)和對應(yīng)描述子,并提交每兩張圖之間的匹配結(jié)果,賽方會根據(jù)提交的結(jié)果統(tǒng)計(jì)兩種評估方案:1.通過對比兩張圖之間匹配結(jié)果對應(yīng)的相機(jī)位姿和真實(shí)位姿之間的差異(Stereo)。2.根據(jù)多張圖之間的關(guān)鍵點(diǎn)匹配結(jié)果,統(tǒng)計(jì)重建后預(yù)測全圖的相機(jī)位姿和真實(shí)位姿之間的差異(Multi-view)。因此對于任意兩張圖之間,關(guān)鍵點(diǎn)的分布越分散,匹配的點(diǎn)越準(zhǔn),則位姿估計(jì)的效果越好。
圖2、比賽流程圖
此外,本屆比賽分為限制性賽道(Restricted category)和非限制性賽道(Unlimited category),其中限制性賽道要求參賽者提交有限的關(guān)鍵點(diǎn)和對應(yīng)描述子,非限制性賽道可提交不限數(shù)量的關(guān)鍵點(diǎn)對和對應(yīng)描述子。相較于前兩屆比賽,本屆比賽增加了街景和公園等場景,圖片之間的角度和尺度變換更大,對算法挑戰(zhàn)非常大,因此我們同時(shí)針對關(guān)鍵點(diǎn)的提取部分和匹配準(zhǔn)確度部分都做了相應(yīng)的改善,具體思路如下:
我們使用SuperPoint+Autoencoder+SuperGlue作為我們的關(guān)鍵點(diǎn)匹配pipeline。其中SuperPoint用于提取關(guān)鍵點(diǎn)和對應(yīng)描述子,Autoencoder用于特征壓縮,SuperGlue用于關(guān)鍵點(diǎn)匹配,最后通過DEGENSAC進(jìn)行離群點(diǎn)過濾。同時(shí)我們優(yōu)化了SuperGlue的訓(xùn)練過程和損失函數(shù),提升了模型在比賽數(shù)據(jù)集下的匹配精度。
圖3、SS-Fusing算法流程圖
我們針對輸入圖片進(jìn)行隨機(jī)變換增加了提取到的關(guān)鍵點(diǎn)對尺度變換的魯棒性,同時(shí)提出了針對描述子的特征融合模塊,以提升描述子的表達(dá)能力和尺度魯棒性。同時(shí)我們還對比了我們的特征融合和平均特征融合的效果,其中橫坐標(biāo)為描述子的cos相似度,縱坐標(biāo)為二者的分布差異,可見我們的方法在高相似度區(qū)域下的占比明顯高于平均特征,而在低相似度區(qū)域下的占比明顯低于平均特征,驗(yàn)證了我們方法的有效性。
圖4、特征融合模塊
圖5、加權(quán)特征和平均特征相似度分布差異圖
我們提出了前背景分割和coarse-to-fine的匹配結(jié)構(gòu),進(jìn)一步提升關(guān)鍵點(diǎn)匹配的有效性。其中前背景分割可以有效過濾掉與匹配無關(guān)的背景部分。Coarse-to-fine的匹配結(jié)構(gòu)可以提升拍攝尺度差異過大導(dǎo)致的匹配率過低的問題。
圖6、前背景分離示意圖
圖7、coarse-to-fine匹配前后示意圖
視覺圖像匹配作為基礎(chǔ)的計(jì)算機(jī)視覺能力,在其基礎(chǔ)上可拓展眾多的下游任務(wù)。如在圖像檢索中,可以通過image matching來檢索到和Database中相似的圖片,如圖8所示。在SFM(Structure from motion)中,可以通過關(guān)鍵點(diǎn)匹配來獲取攝像頭外參并結(jié)合內(nèi)參進(jìn)行深度估計(jì)并重建出拍攝物體(如圖9所示)。在圖像跟蹤與配準(zhǔn)中,通過前后幀的匹配可以捕捉視頻的運(yùn)動軌跡,并針對目標(biāo)物體進(jìn)行視頻跟蹤與圖像配準(zhǔn)。
圖8、圖像檢索
圖9、三維重建
作為騰訊旗下頂尖的人工智能實(shí)驗(yàn)室,優(yōu)圖實(shí)驗(yàn)室聚焦計(jì)算機(jī)視覺,專注人臉識別、圖像識別、OCR等領(lǐng)域開展技術(shù)研發(fā)和行業(yè)落地,在推動產(chǎn)業(yè)數(shù)字化升級過程中,始終堅(jiān)持基礎(chǔ)研究、產(chǎn)業(yè)落地兩條腿走路的發(fā)展戰(zhàn)略,與騰訊云與智慧產(chǎn)業(yè)深度融合,挖掘客戶痛點(diǎn),切實(shí)為行業(yè)降本增效。
未來,騰訊優(yōu)圖實(shí)驗(yàn)室也將繼續(xù)深耕CV技術(shù),并將持續(xù)探索更多的應(yīng)用場景和應(yīng)用空間,讓更多的用戶享受到科技帶來的紅利。
相關(guān)文章
- 拿下SOTA!騰訊優(yōu)圖聯(lián)合廈門大學(xué)提出AIGI生成圖像檢測新方法
- Interspeech 2025 | 騰訊優(yōu)圖實(shí)驗(yàn)室4篇論文入選,涵蓋超聲波活體檢測、神經(jīng)語音編解碼、語音合成等方向
- ICCV 2025 | 騰訊優(yōu)圖實(shí)驗(yàn)室大模型8篇論文入選,涵蓋風(fēng)格化人臉識別、AI生成圖像檢測、多模態(tài)大語言模型等方向
- 最高10倍加速!北京大學(xué)聯(lián)合騰訊優(yōu)圖實(shí)驗(yàn)室將 GQA 改造成 MLA形式
- ACL 2025 | 騰訊優(yōu)圖實(shí)驗(yàn)室大模型4篇論文入選,涵蓋智能體、角色扮演、自動推理等方向
- 超越ControlNet!騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合復(fù)旦大學(xué)提出AI生圖新框架,解決多條件生成難題
- 喜報(bào)!騰訊優(yōu)圖聯(lián)合項(xiàng)目獲CSIG科技進(jìn)步獎(jiǎng)一等獎(jiǎng)
- PRCV 2021 | 視覺AI飛速發(fā)展,騰訊優(yōu)圖分享內(nèi)容理解新實(shí)踐
- AAAI2022騰訊優(yōu)圖14篇論文入選,含語義分割、圖像著色、人臉安全、弱監(jiān)督目標(biāo)定位、場景文本識別等前沿領(lǐng)域
- AICon2021 | 騰訊優(yōu)圖鄢科:以AI技術(shù)助力內(nèi)容安全 促進(jìn)互聯(lián)網(wǎng)環(huán)境健康發(fā)展
- 騰訊優(yōu)圖人臉安全能力再獲認(rèn)可!優(yōu)圖專家入選“護(hù)臉計(jì)劃”專家委員會
- 騰訊優(yōu)圖斬獲ICCV2021 LVIS Challenge Workshop冠軍及最佳創(chuàng)新獎(jiǎng)
- CCAI 2021 | 騰訊優(yōu)圖汪鋮杰:用AI生成更優(yōu)更新的內(nèi)容
- 用AI技術(shù)開啟穿越時(shí)空的視覺盛宴 騰訊優(yōu)圖亮相第八屆世界互聯(lián)網(wǎng)大會
- 騰訊優(yōu)圖“AI畫廊”首次亮相2021重慶智博會展示智能技術(shù)前沿探索成果
- 騰訊優(yōu)圖17篇論文入選ICCV2021,含跨模態(tài)檢索與分割、車輛識別等領(lǐng)域
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場景AI,傳音手機(jī)推動前沿科技落地新興市場
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機(jī)房參考設(shè)計(jì)白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計(jì)算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時(shí)代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀(jì)元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計(jì)劃,新一期AI共創(chuàng)營報(bào)名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個(gè)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時(shí)達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗(yàn)更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅(jiān)暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時(shí)交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能