解密AI算法賦能平臺核心技術 ——特斯聯(lián)半監(jiān)督CV自訓練學習算法
2021-08-29 11:33:20AI云資訊800
7月,特斯聯(lián)“九章人工智能算法賦能平臺”計算機視覺基礎模型核心算法,在國際頂級會議——2021國際計算機視覺大會(ICCV 2021)賽事中,擊敗眾多強敵,躋身賽事排名前10%。競逐者包括:字節(jié)跳動人工智能實驗室、中國移動研究院、日本最大移動通信運營商NNT DOCOMO,以及清華大學、武漢大學、中國科技大學、墨爾本大學等69家國際大型企業(yè)、頂尖高校及研究機構。
堅持深耕、不斷開拓人工智能最前沿算法,是特斯聯(lián)斬落豪強,載譽而歸的秘笈。本期“先鋒科技場”將首次揭秘該行業(yè)領先算法。
大勢所趨
隨著全球人工智能產(chǎn)業(yè)高速發(fā)展, 人工智能(AI)近年被抽象成多種算法應用于不同領域。AI已全面進入機器學習時代。AI未來發(fā)展將是關鍵技術與產(chǎn)業(yè)的深入結合——單純算法已無法滿足更細分領域及行業(yè)對AI的需求,尤其在萬物互聯(lián)的AIoT(人工智能+物聯(lián)網(wǎng))時代,越來越多的訂制化AI需求亟需解決。
原有開發(fā)模式實際已成為新形勢下AI發(fā)展的瓶頸。當前,用戶AI訂制通常遵循“找公司-對需求-交付研究-算法產(chǎn)品化編碼-上線使用”流程。這往往導致研發(fā)周期長、研發(fā)成本高,難以滿足AIoT時代各行業(yè)用戶AI產(chǎn)品開發(fā)需求。
對此,AI開放平臺應運而生。其能集成AI算法、算力與開發(fā)工具,通過接口調用,使企業(yè)、個人或開發(fā)者高效使用平臺AI能力,實現(xiàn)AI產(chǎn)品開發(fā)及賦能。隨著大量AI廠商高速崛起,中國在技術平臺領域已逐漸擺脫對海外廠商的依賴,涌現(xiàn)出多家AI開放平臺。
雖然我國目前AI開放平臺發(fā)展勢頭良好,但現(xiàn)有平臺在用戶規(guī)模、使用場景、用戶技術基礎等多個方面,仍然受限。這些平臺均主要針對專業(yè)AI開發(fā)者設計,對AI零基礎用戶開發(fā)人工智能產(chǎn)品“不甚友好”。
此背景下,特斯聯(lián)核心算法研究團隊開發(fā)出普適性AI算法開放平臺——“九章AI算法賦能平臺”。它力克半監(jiān)督、標簽內容以及“聯(lián)邦學習”(Federated Learning)等方面的核心技術難點,實現(xiàn)了CV(計算機視覺)、NLP(自然語言處理)、推薦預測、知識圖譜算法的自訓練。
九章平臺可針對多場景及各規(guī)模用戶(尤其可針對AI零基礎用戶),進行零代碼、低代碼自有算法孵化,顛覆已有AI研發(fā)人員開發(fā)模式,顯著降低AI研發(fā)成本及周期。
在業(yè)界備受矚目的校企合作方面,近年來各方努力已獲成效,但仍有較大提升空間。目前,企業(yè)對高校研究成果頗感興趣,需求較大;高校亦希望其研究能夠解決實際行業(yè)問題,故十分渴望行業(yè)課題導入。但是,高校研究成果進行行業(yè)落地時,往往水土不服;高校產(chǎn)學研課題亦往往隨著學生畢業(yè)被迫中斷,持續(xù)性堪憂。
特斯聯(lián)“九章AI算法賦能平臺“可在弱監(jiān)督體系下,能夠實現(xiàn)平臺和訓練模型算法有效對接。使基于訓練算法模式的校企需求對接,取代“向企業(yè)提供推理算法代碼”這一傳統(tǒng)模式。不僅如此,該平臺可實現(xiàn)算法積累與深化。
本期“先鋒科技場”就將揭秘九章AI算法賦能平臺的核心技術之一——基于半監(jiān)督的CV自訓練學習算法。
甄選模型
監(jiān)督學習技術通過學習大量訓練樣本,構建預測模型。其中每一訓練樣本均被貼上明確標簽,顯示其真值輸出。盡管當前技術已取得巨大成功,高數(shù)據(jù)標注成本常導致諸多任務無法獲得強監(jiān)督信息(如“全部真值標簽”等)。因此,采用半監(jiān)督學習,通常是執(zhí)行實際任務的更佳方案。
半監(jiān)督分為三類——不完全監(jiān)督、不確切監(jiān)督、不準確監(jiān)督。特斯聯(lián)九章AI賦能平臺致力于讓AI能力偏弱或“貧乏”用戶,也能擁有AI算法孵化服務能力。因此,弱化人工參與算法訓練尤為重要。
但不同半監(jiān)督類型亦存在自身短板。不完全監(jiān)督若只擁有少量被標注數(shù)據(jù),不足以訓練出優(yōu)秀模型。不確切監(jiān)督僅能滿足已給定監(jiān)督信息、但信息不夠精確的場景。不準確監(jiān)督在監(jiān)督過程中,會出現(xiàn)被標注數(shù)據(jù)存在錯誤監(jiān)督信息的情形。三類半監(jiān)督模式人工干預較大,無法形成自訓練學習算法體系,無法達到普適性AI算法開放平臺需求。
為構建基于半監(jiān)督的自訓練學習算法,特斯聯(lián)核心算法研究團隊主要采用基于Transformer模型的Swin Transformer作為骨干模型,以此搭建特征學習基礎算法,進而構建自訓練體系。此外,團隊通過參加國際計算機視覺大會(ICCV)等國際頂級會議,有效驗證了基于半監(jiān)督的CV自訓練學習算法在實際產(chǎn)業(yè)應用中的貼合度,并載譽而歸。
深耕算法
特斯聯(lián)核心算法團隊針對上述三大半監(jiān)督類型難題,將主動學習、半監(jiān)督學習、多示例學習、帶噪學習等技術引入自訓練體系,最大限度從已知標簽樣本特征中,挖掘潛在內嵌信息,反哺至未知標簽數(shù)據(jù),從而減少人工干預。
特斯聯(lián)以Swin Transformer為骨干模型,針對半監(jiān)督,設計可學習樣本全局及局部“特征學習模塊”。
而選用Transformer為骨干網(wǎng)絡,則可使輸出的全局特征信息更為豐富,使“全局特征相似度學習模塊”從樣本特征中挖掘出更多信息。此外,“局部特征細粒度學習模塊”聚焦樣本局部特征,可與Transformer形成互補,統(tǒng)一對外提供基準骨干網(wǎng)絡。
特征學習模塊方面,特斯聯(lián)基于BNNeck,采用“全局+局部”模式展開研究。全局層面,通過度量學習(Circle Loss + Center Loss)提取全局特征。局部細粒度特征學習層面,則首先計算每一局部模型間相關性,隨后交叉融合局部模塊相關性較高的特征,輸入至各局部細粒度分類器,學習相應局部細粒度特征。如圖所示,交叉融合可分為如下四種:
接下來的重點,為構建自訓練體系。其主要分為兩個階段。第一階段——強監(jiān)督訓練:利用少部分數(shù)據(jù),對以上特征學習算法作初步強監(jiān)督訓練,降低后期自訓練難度,提高自訓練性能。第二階段——標簽內容生成:通過主動學習、半監(jiān)督學習、帶噪學習等技術,充分利用余下的大部分數(shù)據(jù)。
在此,將不再贅述強監(jiān)督訓練。標簽內容生成工作,則會從主動學習/無監(jiān)督學習、半監(jiān)督學習兩個方面展開。
主動學習/無監(jiān)督學習分為四個步驟。旨在通過“挖掘小部分數(shù)據(jù),帶動大部分數(shù)據(jù)”,解決半監(jiān)督下不完全監(jiān)督短板。在有限的平臺資源上,令大部分未標注數(shù)據(jù)高效得到相應標簽。
半監(jiān)督學習方面,通過以上無監(jiān)督學習能夠獲得可靠性強,且具有標簽的Query子集和Gallery子集G*。但兩者均僅有缺少局部細粒度標簽的弱標簽信息。通過半監(jiān)督學習實現(xiàn)L、G*,以及帶有局部細粒度標簽的訓練集數(shù)據(jù)T,可對特征學習模型作全量調優(yōu)。隨后,在S=[L,G*,T]上尋找更優(yōu)局部細粒度學習器;并利用訓練集數(shù)據(jù)分布上的局部細粒度子模型,建立多個局部細粒度學習器,對未標簽樣例加注標簽。局部細粒度學習器可基于其未更新前對L、G*所生成的局部細粒度標簽,以及更新后所預測的結果,計算損失值進行學習。這一方面使L、G*在某種層面上,補充了T可能缺失的潛在信息;另一方面可通過學習器,幫助模型在L、G*上挖掘局部特征。
多輪、細致的實驗結果證明:主動學習、半監(jiān)督學習在解決半監(jiān)督下的不完全監(jiān)督問題中,表現(xiàn)穩(wěn)定;多示例學習方法在不確切監(jiān)督問題中表現(xiàn)穩(wěn)定;帶噪學習方法在不精確監(jiān)督問題中表現(xiàn)穩(wěn)定。
相關文章
- 2025最大擬上市AI企業(yè)特斯聯(lián)加速出海,展現(xiàn)中國空間智能的全球之路
- 特斯聯(lián)攜生態(tài)伙伴共同助力余姚人工智能產(chǎn)業(yè)發(fā)展
- 特斯聯(lián)助力蔡甸謀劃智能產(chǎn)業(yè)發(fā)展新格局
- 特斯聯(lián)機器人:園區(qū)是機器人無法逾越的大山嗎
- 阿聯(lián)酋航空引入特斯聯(lián)機器人,簡化機場登機手續(xù)辦理
- 特斯聯(lián)攜手科知中心:打造數(shù)智轉型“德陽新模式”
- 特斯聯(lián)參與國家重點研發(fā)計劃重點專項獲批立項
- 特斯聯(lián)智慧照明控制系統(tǒng)賦能鄂州港智慧升級
- 特斯聯(lián)入選專精特新高質量發(fā)展項目名單
- 特斯聯(lián)機器人與通州法院達成首期合作,共同打造智慧法院
- 特斯聯(lián)楊旸受邀出席O-RAN nGRG研究組會議
- 特斯聯(lián)楊旸:前沿技術與既有體系有效融合是技術轉化的關鍵
- 對話首席 | 特斯聯(lián)邵嶺:ChatGPT的現(xiàn)狀和商業(yè)化前景
- 特斯聯(lián)泰坦機器人成功入選“低速無人駕駛場景落地案例TOP50”
- 特斯聯(lián)機器人布局社區(qū)場景,打通消費界限
- 中國低速無人駕駛行業(yè)團標發(fā)布 特斯聯(lián)任參編單位
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球對話
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應用先導區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案