商湯科技聯(lián)合團隊獲CVPR最佳論文,推出首個“感知決策一體化”自動駕駛通用大模型
2023-06-23 13:57:30AI云資訊938
一篇最佳論文,一篇最佳論文候選,共計54篇論文被接收,商湯科技及聯(lián)合實驗室交出CVPR 2023閃亮的成績單。
6月18日-22日,全球計算機視覺盛會CVPR 2023(Computer Vision and Pattern Recognition)在加拿大溫哥華舉行。本屆CVPR論文投稿總量達9155篇,最終共有2369篇論文被接收。最佳論文候選為12篇,接收率僅為0.13%。
商湯兩篇論文登上最佳論文候選名單(Award Candidate),其中自動駕駛研究論文《Planning-oriented Autonomous Driving》(以路徑規(guī)劃為導(dǎo)向的自動駕駛)斬獲本屆CVPR最佳論文獎(Best Paper Award)。
這是CVPR歷史上第一篇以自動駕駛為主題的最佳論文,該論文首次提出感知決策一體化的自動駕駛通用大模型UniAD,開創(chuàng)了以全局任務(wù)為目標(biāo)的自動駕駛大模型架構(gòu)先河, 標(biāo)志著自動駕駛技術(shù)的重要突破, 為自動駕駛技術(shù)與產(chǎn)業(yè)的發(fā)展提出了新的方向。
CVPR 2023最佳論文,自動駕駛研究獲重要突破
自動駕駛技術(shù)高度復(fù)雜,需要融合多學(xué)科領(lǐng)域的知識和技能,包括傳感器技術(shù)、機器學(xué)習(xí)、路徑規(guī)劃等方面。自動駕駛還需要適應(yīng)不同的道路規(guī)則和交通文化,與車輛和行人進行良好交互,以實現(xiàn)高度可靠和安全的自動駕駛系統(tǒng)。大部分自動駕駛相關(guān)的工作都聚焦在具體的某個模塊,缺少能夠?qū)崿F(xiàn)端到端聯(lián)合優(yōu)化的通用網(wǎng)絡(luò)模型。
論文提出的自動駕駛通用算法框架——Unified Autonomous Driving(UniAD)首次將檢測、跟蹤、建圖、軌跡預(yù)測,占據(jù)柵格預(yù)測以及規(guī)劃整合到一個基于Transformer 的端到端網(wǎng)絡(luò)框架下,更高效契合了“多任務(wù)”和“高性能”的特點,取得自動駕駛技術(shù)研究重要突破。
自動駕駛UniAD框架對比(a)模塊化(b)多任務(wù)模塊(c)端到端自動駕駛模塊
商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、絕影智能汽車事業(yè)群總裁王曉剛表示,UniAD是業(yè)內(nèi)首個感知決策一體化的端到端自動駕駛解決方案,并且整體系統(tǒng)和性能取得大幅提升,代表了未來自動駕駛技術(shù)的發(fā)展趨勢。
這種端到端的優(yōu)化在多項關(guān)鍵技術(shù)指標(biāo)上超越了SOTA。比如,多目標(biāo)跟蹤準(zhǔn)確率超越SOTA 20%,車道線預(yù)測準(zhǔn)確率提升30%,預(yù)測運動位移誤差降低38%,規(guī)劃誤差降低28%。
UniAD 是一項極具創(chuàng)新性的自動駕駛技術(shù),且因其具有很大的潛力和應(yīng)用價值,目前在學(xué)術(shù)界和工業(yè)界都引起了廣泛興趣和關(guān)注。
隨著通用人工智能(AGI)引領(lǐng)的二次革命的到來,以此為基礎(chǔ),期待在未來能推動實現(xiàn)更高階的自動駕駛?cè)斯ぶ悄堋?
CVPR 2023最佳論文候選,加速推動AIGC時代真實感3D內(nèi)容生成
面向真實 3D 物體的感知、理解、重建與生成是計算機視覺領(lǐng)域一直倍受關(guān)注的問題。由于缺乏大規(guī)模的真實掃描三維數(shù)據(jù)庫,最近在三維物體建模方面的進展大多依賴于合成數(shù)據(jù)集。
為促進現(xiàn)實世界中3D感知、重建和生成的發(fā)展,論文《OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation》提出了OmniObject3D,一個具有大規(guī)模高質(zhì)量真實掃描3D物體的大型詞匯3D物體數(shù)據(jù)集,覆蓋近200個類別、約6000個三維物體數(shù)據(jù),包括高精表面網(wǎng)格、點云、多視角渲染圖像和實景采集的視頻,借助專業(yè)掃描設(shè)備保證了物體數(shù)據(jù)的精細(xì)形狀和真實紋理。
OmniObject3D是目前學(xué)界最大的真實世界三維掃描模型數(shù)據(jù)集,為未來三維視覺研究提供了廣闊空間。
利用該數(shù)據(jù)集,研究人員精心探討了點云識別、神經(jīng)渲染、表面重建、三維生成等多種學(xué)術(shù)任務(wù)的魯棒性和泛化性,驗證其從感知、重建、到生成領(lǐng)域的開放應(yīng)用前景,有望在AIGC 時代推動真實感3D生成方面發(fā)揮至關(guān)重要的作用。持續(xù)引領(lǐng)前沿創(chuàng)新,是商湯在以大裝置SenseCore和大模型為核心的AI基礎(chǔ)設(shè)施領(lǐng)域長期投入,并堅持產(chǎn)學(xué)研協(xié)同創(chuàng)新的成果。
王曉剛教授認(rèn)為,在大算力、大數(shù)據(jù)的支撐下,大模型將以更強大的通用能力引發(fā)人工智能領(lǐng)域的巨大變革,同時也會拓展我們的研究視野,激發(fā)新一輪研究范式革新。
自今年4月初“商湯日日新SenseNova”大模型體系公布以來,商湯的大模型已在氣象預(yù)報、遙感解譯、開放環(huán)境中的決策問題等領(lǐng)域取得了諸多突破性成就。未來,商湯將繼續(xù)與產(chǎn)學(xué)研各界共同擁抱和探索大模型帶來的范式革新,為AI的前沿探索開拓新方向和新路徑。
相關(guān)文章
- 商湯科技連續(xù)九年領(lǐng)跑中國計算機視覺市場,CV 2.0時代再顯龍頭實力
- 曦望與商湯科技、無極資本達成戰(zhàn)略合作,共拓中國AI算力生態(tài)新高地
- 值得買科技與商湯科技達成戰(zhàn)略合作,共聚WAIC探索消費智能體新機遇
- 商湯科技即將發(fā)布“日日新6.5”,多項產(chǎn)品升級驅(qū)動生產(chǎn)力革新和交互升級
- 商湯科技計劃進軍具身智能:核心團隊已初步組建完畢
- 商湯科技將在2025WAIC發(fā)布日日新6.5大模型及具身智能平臺
- 中韓科技對話再升級,韓國高規(guī)格代表團到訪商湯科技
- 國內(nèi)首家!商湯科技大裝置萬象獲得中國信通院“大模型推理平臺”最高評級認(rèn)證
- 云知聲與商湯科技達成戰(zhàn)略合作 推動多模態(tài)智能交互協(xié)同進化
- 商湯科技與云知聲達成戰(zhàn)略合作 推動多模態(tài)智能交互協(xié)同進化
- 想法流x商湯科技大裝置:端到端全棧賦能,造就現(xiàn)象級應(yīng)用
- 商湯科技擔(dān)當(dāng)引領(lǐng)者,牽動XR及虛擬數(shù)字人標(biāo)準(zhǔn)化未來
- 商湯科技當(dāng)選工信部人工智能標(biāo)準(zhǔn)技術(shù)委員會首屆委員單位
- 商湯科技董事長徐立:強化創(chuàng)新,以人工智能助力高質(zhì)量發(fā)展
- 鈦動科技閃耀量子位MEET 2025,與零一萬物、商湯科技等共探AI新浪潮
- 商湯科技與中智股份達成合作,AI大模型賦能人力資源能力躍遷
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
- 筑牢安全芯基石,紫光同芯無線充電鑒權(quán)芯片T9系列亮相2025(秋季)亞洲充電展
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案