精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

解密AI算法賦能平臺核心技術 ——特斯聯(lián)半監(jiān)督CV自訓練學習算法

2021-08-29 11:33:20AI云資訊800

7月,特斯聯(lián)“九章人工智能算法賦能平臺”計算機視覺基礎模型核心算法,在國際頂級會議——2021國際計算機視覺大會(ICCV 2021)賽事中,擊敗眾多強敵,躋身賽事排名前10%。競逐者包括:字節(jié)跳動人工智能實驗室、中國移動研究院、日本最大移動通信運營商NNT DOCOMO,以及清華大學、武漢大學、中國科技大學、墨爾本大學等69家國際大型企業(yè)、頂尖高校及研究機構。

堅持深耕、不斷開拓人工智能最前沿算法,是特斯聯(lián)斬落豪強,載譽而歸的秘笈。本期“先鋒科技場”將首次揭秘該行業(yè)領先算法。

大勢所趨

隨著全球人工智能產(chǎn)業(yè)高速發(fā)展, 人工智能(AI)近年被抽象成多種算法應用于不同領域。AI已全面進入機器學習時代。AI未來發(fā)展將是關鍵技術與產(chǎn)業(yè)的深入結合——單純算法已無法滿足更細分領域及行業(yè)對AI的需求,尤其在萬物互聯(lián)的AIoT(人工智能+物聯(lián)網(wǎng))時代,越來越多的訂制化AI需求亟需解決。

原有開發(fā)模式實際已成為新形勢下AI發(fā)展的瓶頸。當前,用戶AI訂制通常遵循“找公司-對需求-交付研究-算法產(chǎn)品化編碼-上線使用”流程。這往往導致研發(fā)周期長、研發(fā)成本高,難以滿足AIoT時代各行業(yè)用戶AI產(chǎn)品開發(fā)需求。

對此,AI開放平臺應運而生。其能集成AI算法、算力與開發(fā)工具,通過接口調用,使企業(yè)、個人或開發(fā)者高效使用平臺AI能力,實現(xiàn)AI產(chǎn)品開發(fā)及賦能。隨著大量AI廠商高速崛起,中國在技術平臺領域已逐漸擺脫對海外廠商的依賴,涌現(xiàn)出多家AI開放平臺。

雖然我國目前AI開放平臺發(fā)展勢頭良好,但現(xiàn)有平臺在用戶規(guī)模、使用場景、用戶技術基礎等多個方面,仍然受限。這些平臺均主要針對專業(yè)AI開發(fā)者設計,對AI零基礎用戶開發(fā)人工智能產(chǎn)品“不甚友好”。

此背景下,特斯聯(lián)核心算法研究團隊開發(fā)出普適性AI算法開放平臺——“九章AI算法賦能平臺”。它力克半監(jiān)督、標簽內容以及“聯(lián)邦學習”(Federated Learning)等方面的核心技術難點,實現(xiàn)了CV(計算機視覺)、NLP(自然語言處理)、推薦預測、知識圖譜算法的自訓練。

九章平臺可針對多場景及各規(guī)模用戶(尤其可針對AI零基礎用戶),進行零代碼、低代碼自有算法孵化,顛覆已有AI研發(fā)人員開發(fā)模式,顯著降低AI研發(fā)成本及周期。

在業(yè)界備受矚目的校企合作方面,近年來各方努力已獲成效,但仍有較大提升空間。目前,企業(yè)對高校研究成果頗感興趣,需求較大;高校亦希望其研究能夠解決實際行業(yè)問題,故十分渴望行業(yè)課題導入。但是,高校研究成果進行行業(yè)落地時,往往水土不服;高校產(chǎn)學研課題亦往往隨著學生畢業(yè)被迫中斷,持續(xù)性堪憂。

特斯聯(lián)“九章AI算法賦能平臺“可在弱監(jiān)督體系下,能夠實現(xiàn)平臺和訓練模型算法有效對接。使基于訓練算法模式的校企需求對接,取代“向企業(yè)提供推理算法代碼”這一傳統(tǒng)模式。不僅如此,該平臺可實現(xiàn)算法積累與深化。

本期“先鋒科技場”就將揭秘九章AI算法賦能平臺的核心技術之一——基于半監(jiān)督的CV自訓練學習算法。

甄選模型

監(jiān)督學習技術通過學習大量訓練樣本,構建預測模型。其中每一訓練樣本均被貼上明確標簽,顯示其真值輸出。盡管當前技術已取得巨大成功,高數(shù)據(jù)標注成本常導致諸多任務無法獲得強監(jiān)督信息(如“全部真值標簽”等)。因此,采用半監(jiān)督學習,通常是執(zhí)行實際任務的更佳方案。

半監(jiān)督分為三類——不完全監(jiān)督、不確切監(jiān)督、不準確監(jiān)督。特斯聯(lián)九章AI賦能平臺致力于讓AI能力偏弱或“貧乏”用戶,也能擁有AI算法孵化服務能力。因此,弱化人工參與算法訓練尤為重要。

但不同半監(jiān)督類型亦存在自身短板。不完全監(jiān)督若只擁有少量被標注數(shù)據(jù),不足以訓練出優(yōu)秀模型。不確切監(jiān)督僅能滿足已給定監(jiān)督信息、但信息不夠精確的場景。不準確監(jiān)督在監(jiān)督過程中,會出現(xiàn)被標注數(shù)據(jù)存在錯誤監(jiān)督信息的情形。三類半監(jiān)督模式人工干預較大,無法形成自訓練學習算法體系,無法達到普適性AI算法開放平臺需求。

為構建基于半監(jiān)督的自訓練學習算法,特斯聯(lián)核心算法研究團隊主要采用基于Transformer模型的Swin Transformer作為骨干模型,以此搭建特征學習基礎算法,進而構建自訓練體系。此外,團隊通過參加國際計算機視覺大會(ICCV)等國際頂級會議,有效驗證了基于半監(jiān)督的CV自訓練學習算法在實際產(chǎn)業(yè)應用中的貼合度,并載譽而歸。

深耕算法

特斯聯(lián)核心算法團隊針對上述三大半監(jiān)督類型難題,將主動學習、半監(jiān)督學習、多示例學習、帶噪學習等技術引入自訓練體系,最大限度從已知標簽樣本特征中,挖掘潛在內嵌信息,反哺至未知標簽數(shù)據(jù),從而減少人工干預。

特斯聯(lián)以Swin Transformer為骨干模型,針對半監(jiān)督,設計可學習樣本全局及局部“特征學習模塊”。

而選用Transformer為骨干網(wǎng)絡,則可使輸出的全局特征信息更為豐富,使“全局特征相似度學習模塊”從樣本特征中挖掘出更多信息。此外,“局部特征細粒度學習模塊”聚焦樣本局部特征,可與Transformer形成互補,統(tǒng)一對外提供基準骨干網(wǎng)絡。

特征學習模塊方面,特斯聯(lián)基于BNNeck,采用“全局+局部”模式展開研究。全局層面,通過度量學習(Circle Loss + Center Loss)提取全局特征。局部細粒度特征學習層面,則首先計算每一局部模型間相關性,隨后交叉融合局部模塊相關性較高的特征,輸入至各局部細粒度分類器,學習相應局部細粒度特征。如圖所示,交叉融合可分為如下四種:

接下來的重點,為構建自訓練體系。其主要分為兩個階段。第一階段——強監(jiān)督訓練:利用少部分數(shù)據(jù),對以上特征學習算法作初步強監(jiān)督訓練,降低后期自訓練難度,提高自訓練性能。第二階段——標簽內容生成:通過主動學習、半監(jiān)督學習、帶噪學習等技術,充分利用余下的大部分數(shù)據(jù)。

在此,將不再贅述強監(jiān)督訓練。標簽內容生成工作,則會從主動學習/無監(jiān)督學習、半監(jiān)督學習兩個方面展開。

主動學習/無監(jiān)督學習分為四個步驟。旨在通過“挖掘小部分數(shù)據(jù),帶動大部分數(shù)據(jù)”,解決半監(jiān)督下不完全監(jiān)督短板。在有限的平臺資源上,令大部分未標注數(shù)據(jù)高效得到相應標簽。

半監(jiān)督學習方面,通過以上無監(jiān)督學習能夠獲得可靠性強,且具有標簽的Query子集和Gallery子集G*。但兩者均僅有缺少局部細粒度標簽的弱標簽信息。通過半監(jiān)督學習實現(xiàn)L、G*,以及帶有局部細粒度標簽的訓練集數(shù)據(jù)T,可對特征學習模型作全量調優(yōu)。隨后,在S=[L,G*,T]上尋找更優(yōu)局部細粒度學習器;并利用訓練集數(shù)據(jù)分布上的局部細粒度子模型,建立多個局部細粒度學習器,對未標簽樣例加注標簽。局部細粒度學習器可基于其未更新前對L、G*所生成的局部細粒度標簽,以及更新后所預測的結果,計算損失值進行學習。這一方面使L、G*在某種層面上,補充了T可能缺失的潛在信息;另一方面可通過學習器,幫助模型在L、G*上挖掘局部特征。

多輪、細致的實驗結果證明:主動學習、半監(jiān)督學習在解決半監(jiān)督下的不完全監(jiān)督問題中,表現(xiàn)穩(wěn)定;多示例學習方法在不確切監(jiān)督問題中表現(xiàn)穩(wěn)定;帶噪學習方法在不精確監(jiān)督問題中表現(xiàn)穩(wěn)定。

相關文章

人工智能企業(yè)

更多>>

人工智能硬件

更多>>

人工智能產(chǎn)業(yè)

更多>>

人工智能技術

更多>>
AI云資訊(愛云資訊)立足人工智能科技,打造有深度、有前瞻、有影響力的泛科技媒體平臺。
合作QQ:1211461360微信號:icloudnews