依圖在全球AI技術(shù)賽道,又攻下一個第一
2020-08-05 12:31:14AI云資訊1339
解鎖行為識別難題,依圖科技再奪一冠
依圖在全球AI技術(shù)賽道再下一城,又攻下一個第一。
繼蟬聯(lián)全球權(quán)威人臉識別競賽冠軍、先后刷新國際聲紋識別權(quán)威競賽(VoxSRC)紀錄、行人重識別(ReID)三大權(quán)威數(shù)據(jù)集之后,在權(quán)威機構(gòu)ACM MM’20 Grand Challenge主辦的大規(guī)模復雜場景人體視頻解析挑戰(zhàn)賽中,依圖科技以大幅領(lǐng)先的成績拿下了“Track-4:行為識別”的第一名。
ACM是全球最大的計算機領(lǐng)域?qū)I(yè)性學術(shù)組織,其評選的圖靈獎(A.M.Turing Award)被公認為世界計算機領(lǐng)域的諾貝爾獎。而ACM MM是全球多媒體領(lǐng)域的頂級會議,屬中國計算機學會(CCF)指定的A類國際會議。
在此次挑戰(zhàn)賽中,包括 Amazon、騰訊、大華科技、中山大學等上百支參賽隊伍參與了超過56000個復雜事件下的人體行為(包括排隊、打架、俯身、同行、跑動、滯留等)解析。
視頻中行為識別是本屆比賽中的重點項目,目的是考察算法在復雜場景下對行為(包含多人追蹤、人體姿態(tài)、行為識別)的解析能力。
該賽事是該方向最接近真實場景的大規(guī)模挑戰(zhàn)賽,依圖科技奪冠的同時,其背后的技術(shù)創(chuàng)新和對行為識別難題的攻克一時間備受關(guān)注。
深度優(yōu)化算法框架,算法性能極致提升
比賽中,依圖算法的指標達到了wf-mAP@avg 0.26,將以往學術(shù)界中的基準算法提升了近3倍。
與舉辦了多次的國際競賽不同,這次競賽是首屆,參賽隊伍在賽前也無法了解識別的類別、數(shù)據(jù)集的大小和識別的具體需求,要在短短一個多月的時間內(nèi),設(shè)計出最優(yōu)的算法, 并在眾多實力強勁的隊伍中達到世界第一,難度極高。
首先,視頻相較于圖像的行為識別更加復雜,且如何建模、視頻幀之間的相關(guān)性仍是學術(shù)界一直存在的難題。
依圖認為,當應(yīng)用場景明確后,在已知分析的對象是人體且明確知道要識別的類別后,就可以針對性的進行算法優(yōu)化,通過算法定制化來提升算法性能,解決以往不能很好解決的問題。
依圖此次創(chuàng)新性地將算法與場景進行了深度結(jié)合。一方面創(chuàng)新性的從視頻中自動提取到了準確豐富的場景信息,結(jié)合先進的行人檢測、行人重識別算法,全面構(gòu)建了人與人、人與場景、人與物之間在視頻中的關(guān)系;
另一方面,借助多年來的算法積淀和對行業(yè)場景的理解,依圖對比賽中要求的特定的14類任務(wù)進行了深度算法優(yōu)化。
依圖在相關(guān)行為上持續(xù)迭代,不斷積累,行為識別算法的性能已遠超比賽當時的算法性能。同時,運用該技術(shù)落地實戰(zhàn)的項目難度也遠超比賽的數(shù)據(jù)集。
行為識別究竟有多難?
如果把人臉識別比作醫(yī)院的“普外門診”的話,行為識別尤其是人類的行為識別,其復雜度和識別難度不亞于“心血管內(nèi)科+神經(jīng)內(nèi)科”。
場景復雜多變、動作差異化大、需要捕捉連續(xù)動作和長時間動作,這些對行為識別和分析都有著巨大的挑戰(zhàn),也就需要算法對行為本身有更精準的分析推理能力,甚至還能通過既定的場景推算未曾見過的場景。
結(jié)合此次比賽,行為識別是指以人為基礎(chǔ)單位,只分析人的行為,關(guān)注單人的動作以及多人的動作(例如:一起走路、奔跑、打架等)。
學術(shù)界通常用frame mAP (f-mAP@avg)來作為行為識別的評價指標,f-mAP@avg代表的含義是以關(guān)鍵幀為單位,評判行為的位置與分類是否準確;
與學術(shù)界對行為識別的考察指標不同,此次競賽的評價標準是wf-mAP@avg,這意味著更注重對難度較大的擁擠場景的考察,以及比較少見的動作的識別,同時對于人體框的定位的精確性要求也更高。
不同于其他參賽隊伍,依圖此次沒有使用復雜的多模型融合策略,僅用單模型,借助強大的背景提取和分割算法,將行為的解析與場景結(jié)合,就大大降低了問題難度,這也意味著依圖仍可以進一步通過融合多個模型提升算法性能。
芯片+算法,加速AI技術(shù)落地
想象一下,未來運用該技術(shù)如何判斷一個都市夜歸人路遇劫匪而自動報警?如何在家中老人倒地時讓及時預警并第一時間告知監(jiān)護人?如何判斷一個生產(chǎn)線上的工人施工順序出錯并即刻發(fā)出告警?如何在一個視頻中對內(nèi)容進行精準理解,并為其貼上更合適的標簽使得能夠被更精準和更容易檢索到?
在依圖不斷開拓AI新領(lǐng)域的版圖上,相信這些問號背后的答案已逐漸清晰。此前,依圖科技自主研發(fā)的全球首款云端視覺智能芯片求索(questcore),開啟了算法設(shè)計與芯片設(shè)計相結(jié)合的時代。集合了高性能AI算法和芯片耦合設(shè)計優(yōu)化的芯片平臺,結(jié)合世界領(lǐng)先的行為識別算法的依圖,將更有利于賦能智能城市、安全生產(chǎn)、智能商業(yè)等領(lǐng)域,打造新一代AI基礎(chǔ)設(shè)施。
目前,依圖已在貴陽、福州等地實現(xiàn)了千萬量級的城市級大規(guī)模AI應(yīng)用,用實際行動詮釋了AI技術(shù)如何實戰(zhàn)落地。
近日,依圖獲得由英國標準協(xié)會(即“BSI”)頒發(fā)的ISO/IEC 27701:2019隱私信息管理體系國際認證,成為國內(nèi)首家通過認證的AI公司。認證由國際標準化組織(ISO)和國際電工委員會(IEC)聯(lián)合發(fā)布,是全球首個針對隱私信息管理的國際標準,也被公認為是最嚴格、權(quán)威的隱私信息管理標準。獲得該認證充分體現(xiàn)了依圖對數(shù)據(jù)隱私保護的堅持和持續(xù)踐行。
新基建趨勢下,各行各業(yè)加快數(shù)字化,提升各類工作的智能水平成為剛需。作為目前國內(nèi)唯一具有提供超大規(guī)模、復雜環(huán)境下億級規(guī)模城市的智能化運營管理技術(shù)能力的人工智能公司,在硬核的技術(shù)實力和隱私保障上的不斷努力已形成一套“組合拳”,也即將加速解鎖更多的智能應(yīng)用。
相關(guān)文章
- 依圖CTO顏水成被曝離職,已加入東南亞電商獨角獸Shopee
- 依圖當選全國信標委人工智能分委會副組長,為AI標準化體系建設(shè)提速
- 依圖科技在人工智能市場的發(fā)展前景如何?
- 人工智能企業(yè)云知聲、依圖科技科創(chuàng)板上市申請獲受理
- 癌癥早篩與科研兩手抓,「依圖醫(yī)療」醫(yī)療AI商業(yè)化探索現(xiàn)成果
- 依圖在全球AI技術(shù)賽道,又攻下一個第一
- 依圖AI助力一線復工復產(chǎn)
- 依圖新冠肺炎小依醫(yī)生落地全國多家醫(yī)療機構(gòu)助力疫情防控
- 依圖承建上海市醫(yī)療圖像與醫(yī)學知識圖譜人工智能重點實驗室
- 2020年5G大風口,WiMi微美全息/曠視/商湯/依圖等AI視覺搶占智能場景市場
- 依圖的2019:眼中有光 芯中有夢
- 重構(gòu)依圖,「不合群」的AI獨角獸
- 依圖科技CTO顏水成:讓“AI”成為“Affordable Intelligence”
- 智·聚變 享·未來 2019依圖科技分銷合作伙伴大會正式召開
- 依圖科技AI防癌地圖獲獎?WiMi微美全息AI視覺模組是5G核心應(yīng)用
- RSNA2019再出發(fā)!依圖醫(yī)療秀出中國醫(yī)療AI新風潮
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 遠程星智F3E上市首發(fā)!玄武11合1超配搭載,實現(xiàn)效能、可靠、安全性全維躍升
- 人體工學鼠標怎么選?細品SANWA新款,自帶腕托的溫柔
- 小水智能受邀AI創(chuàng)新者大會:AI發(fā)展落地為王,引領(lǐng) AI兒童腕表細分領(lǐng)域
- 僅售999元!唯卓仕AF 9mm F2.8 Air超廣角自動鏡頭來了!
- 僅售999元!唯卓仕AF 14mm F4.0 Air 發(fā)布:輕便全畫幅超廣角自動鏡頭來了
- 華迅科技推出武迅WX-P3固態(tài)硬盤,自有工廠+國資背景助力國產(chǎn)存儲
- 三星Galaxy S25系列:為你的校園生活注入高能科技基因
- 技嘉2025發(fā)布會:“從心出發(fā) 我們的主張”,邁向AI新紀元
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能