毫末智行成立中國自動駕駛行業(yè)最大智算中心 一文讀懂MANA五大模型全新升級
2023-01-07 18:00:12AI云資訊1395
經(jīng)過多年的發(fā)展,自動駕駛已經(jīng)經(jīng)歷了以硬件驅(qū)動為主的 1.0 時代、以軟件驅(qū)動的 2.0 時代,并正在進入將持續(xù)發(fā)展的由數(shù)據(jù)驅(qū)動的自動駕駛3.0時代。隨之而來的是,自動駕駛已經(jīng)成為了汽車產(chǎn)業(yè)中最熱門的賽道之一,而在量產(chǎn)自動駕駛領(lǐng)域的競爭更是進入到了白熱化的階段。
在以數(shù)據(jù)驅(qū)動為主的自動駕駛3.0時代,最重要的是如何快速處理自動駕駛車輛在日常的運行和測試過程中產(chǎn)生的還量數(shù)據(jù)。尤其是城市輔助導(dǎo)航駕駛,某種意義上說,城市道路輔助駕駛系統(tǒng)要解決的問題難度,并不低于L4級自動駕駛,這就要求自動駕駛企業(yè)需要具備很強的數(shù)據(jù)處理能力。
為此特斯拉直接建設(shè)了一個智算中心來處理海量的數(shù)據(jù),而近日,國內(nèi)自動駕駛公司毫末智行也宣布成立智算中心——雪湖 · 綠洲(MANA OASIS),該智算中心由毫末智行和火山引擎聯(lián)合打造,是國內(nèi)自動駕駛行業(yè)最大的智算中心。
在MANA OASIS的加持下,毫末智行推出的中國首個自動駕駛數(shù)據(jù)智能體系MANA五大模型迎來全新亮相升級。
首先,視頻自監(jiān)督大模型,讓毫末4D Clip標注實現(xiàn)100%自動化,人工標注成本降低98%。為了更低成本、更高效獲取更多高價值數(shù)據(jù),需要解決從離散幀自動化擴充到Clips形態(tài)的問題。毫末首先利用海量videoClip,通過視頻自監(jiān)督方式,預(yù)訓(xùn)練出一個大模型,用少量人工標注好的Clip數(shù)據(jù)進行Finetune(微調(diào)),訓(xùn)練檢測跟蹤模型,使得模型具備自動標注的能力;然后,將已經(jīng)標注好的千萬級單幀數(shù)據(jù)所對應(yīng)的原始視頻提取出來組織成Clip,其中10%是標注幀,90%是未標注幀,再將這些Clip輸入到模型,完成對90%未標注幀的自動標注,進而實現(xiàn)所有單幀標注向Clip標注的100%的自動轉(zhuǎn)化,同時降低98%的Clip標注成本。毫末視頻自監(jiān)督大模型的泛化性效果極佳,即使是在一些非常困難的場景,例如嚴重遮擋的騎行者,遠處的小目標,惡劣的天氣和光照,都能準確地完成自動標注。
其次,3D重建大模型,讓毫末實現(xiàn)了數(shù)據(jù)“無中生有”,獲得海量corner case(長尾場景)不再是難事。面對“完全從真實數(shù)據(jù)中積累的corner case困難且昂貴”的行業(yè)難題,毫末將爆火的三維重建NeRF技術(shù)應(yīng)用在自動駕駛場景重建和數(shù)據(jù)生成中,它通過改變視角、光照、紋理材質(zhì)的方法,生成高真實感數(shù)據(jù),實現(xiàn)以低成本獲取normal case,生成各種高成本corner case。3D重建大模型生成的數(shù)據(jù),不僅比傳統(tǒng)的人工顯式建模再渲染紋理的方法效果更好、成本更低,增加NeRF生成的數(shù)據(jù)后,還可將感知的錯誤率降低30%以上。
第三,多模態(tài)互監(jiān)督大模型,能夠精準識別異形障礙物,讓車輛“火眼金睛”。在成功實現(xiàn)車道線和常見障礙物的精準檢測后,針對城市多種異形障礙物的穩(wěn)定檢測問題,毫末正在思考和探索更加通用的解決方案。多模態(tài)互監(jiān)督大模型引入了激光雷達作為視覺監(jiān)督信號,直接使用視頻數(shù)據(jù)來推理場景的通用結(jié)構(gòu)表達。通用結(jié)構(gòu)的檢測,可以很好地補充已有的語義障礙物檢測,有效提升自動駕駛系統(tǒng)在城市復(fù)雜工況下的通過率。
第四,動態(tài)環(huán)境大模型,可以精準預(yù)測道路的拓撲關(guān)系,讓車輛始終行駛在正確的車道中。在重感知技術(shù)路線下,毫末為了將對高精地圖的依賴度降到最低,面臨著“道路拓撲結(jié)構(gòu)實時推斷”的挑戰(zhàn)。為此,毫末在BEV(鳥瞰圖)的feature map(特征圖)基礎(chǔ)上,以標精地圖作為引導(dǎo)信息,使用自回歸編解碼網(wǎng)絡(luò),將BEV特征,解碼為結(jié)構(gòu)化的拓撲點序列,實現(xiàn)車道拓撲預(yù)測,讓毫末的感知能力,能像人類一樣在標準地圖的導(dǎo)航提示下就可以實現(xiàn)對道路拓撲結(jié)構(gòu)的實時推斷。毫末認為,解決了路口問題實際就解決了大部分城市NOH問題,目前在保定、北京,毫末對于85%的路口拓撲推斷準確率高達95%。即便是非常復(fù)雜、非常不規(guī)則的路口,毫末也能準確預(yù)測。
第五,人駕自監(jiān)督認知大模型,掌握高水平司機的開車技法,讓駕駛決策更聰明。在探索“使用大量人駕數(shù)據(jù),直接訓(xùn)練模型做出擬人化決策”方面,毫末為了讓模型能夠?qū)W習(xí)到高水平司機的優(yōu)秀開車方法,全新引入了用戶真實的接管數(shù)據(jù),同時用RLHF(從人類反饋中強化學(xué)習(xí))思路先訓(xùn)練一個reward model(獎勵模型)來挑選出更好的駕駛決策。通過這種方式,使毫末在掉頭、環(huán)島等公認的困難場景中,通過率提升30%以上。這與AGI領(lǐng)域爆火的ChatGPT的思路相同,通過人類行為反饋來選出最優(yōu)答案。
MANA五大模型全面提升了毫末感知和認知層面系統(tǒng)化的底層技術(shù)能力。“在五大模型助力下,MANA最新的車端感知架構(gòu),從過去分散的多個下游任務(wù)集成到了一起,形成一個更加端到端的架構(gòu),包括通用障礙物識別、局部路網(wǎng)、行為預(yù)測等任務(wù),毫末車端感知架構(gòu)實現(xiàn)了跨代升級?!鳖櫨S灝表示,這也意味著毫末的感知能力更強,產(chǎn)品力更強,產(chǎn)品可以通過快速迭代向全無人駕駛加速邁進。
隨著毫末智算中心MANA OASIS的落地,數(shù)據(jù)智能體系MANA也實現(xiàn)了脫胎換骨的升級。在未來的日子里,不斷進化的MANA作為毫末產(chǎn)品迭代的核心動力,將持續(xù)助力毫末發(fā)揮核心技術(shù)優(yōu)勢,早日實現(xiàn)毫末“讓機器智能移動,給生活更多美好”的最新美好愿景。
相關(guān)文章
- 第九屆HAOMO AI DAY順利舉辦 毫末智行2023年四大戰(zhàn)役迎來收官階段
- 華為云攜手毫末智行,共筑自動駕駛產(chǎn)業(yè)未來
- 加快適應(yīng)大模型的自動駕駛剛需 毫末智行引領(lǐng)建設(shè)智算中心等AI新基建
- 向大算力發(fā)起沖擊 毫末智行聯(lián)合火山引擎打造中國自動駕駛行業(yè)最大智算中心
- 毫末智行的數(shù)據(jù)“內(nèi)功”:智算中心成立、六大閉環(huán)、MANA五大模型
- 毫末智行公布城市NOH規(guī)劃:2024上半年落地百城
- 自動駕駛普及來到關(guān)鍵期 毫末智行加速進入自動駕駛3.0時代
- 毫末智行成立中國自動駕駛行業(yè)最大智算中心 一文讀懂MANA五大模型全新升級
- 毫末智行三周年 張凱顧維灝內(nèi)部信曝光:堅定恪守“第一性原理”
- 毫末智行三年磨一劍 漸進式路線重塑自動駕駛行業(yè)信心
- 毫末智行:用技術(shù)工程化的能力量產(chǎn) 用漸進式路線提速
- 毫末智行顧維灝開啟新任務(wù):以數(shù)據(jù)驅(qū)動沖刺自動駕駛3.0時代
- 外媒點贊毫末智行:正在智能化浪潮中保持優(yōu)勢
- 四維圖新與毫末智行簽署戰(zhàn)略合作協(xié)議,攜手研發(fā)智能出行創(chuàng)新產(chǎn)品
- 2022《財富》中國最具社會影響力創(chuàng)業(yè)公司公布,毫末智行再獲殊榮
- 奔馳、特斯拉、毫末智行們的自動駕駛使命:不止“代駕”,更為“安全”
人工智能企業(yè)
更多>>- 形態(tài)再革新 三星Galaxy S25 Edge給出輕薄旗艦終極答案
- 從超薄曲面屏到全場景AI,傳音手機推動前沿科技落地新興市場
- 神眸BC22+全新上市,重新定義“真無線”智能安防
- 華為《AIDC機房參考設(shè)計白皮書》重磅發(fā)布,賦能AI算力基礎(chǔ)設(shè)施邁向新高度
- 億萬克R322A7+服務(wù)器上新,可靠性封神!
- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計算”論壇圓滿召開——攜產(chǎn)界實踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗
人工智能產(chǎn)業(yè)
更多>>- AIDC產(chǎn)業(yè)發(fā)展大會隆重召開,開啟AIDC新紀元
- 絢星破局AI落地困境,四大業(yè)務(wù)重構(gòu)企業(yè)智能生產(chǎn)力新范式
- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
人工智能技術(shù)
更多>>- 騰訊開源框架 Kuikly 再升級!率先適配 “液態(tài)玻璃”,原生體驗更極致
- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能