群核科技空間理解模型SpatialLM技術報告發(fā)布,3D空間識別精度達全球領先水平
2025-06-24 15:39:03AI云資訊976
近日,空間理解模型SpatialLM發(fā)布首份技術報告,該模型來自于空間智能公司群核科技。 據悉,該模型于今年3月正式開源,并在開源后迅速與DeepSeek-V3、Qwen2.5-Omni一起登上全球最大的開源社區(qū)HuggingFace全球趨勢榜前三。
圖說:來自杭州的三個大模型共同登榜HuggingFace全球趨勢榜前三
作為一款將大語言模型擴展到3D空間理解任務中的模型,SpatialLM能從3D點云輸入生成結構化的空間場景描述,這一過程突破了大語言模型對物理世界幾何與空間關系的理解局限,讓機器具備空間認知與推理能力,為具身智能等相關領域提供空間理解基礎訓練框架。
在開源后經過廣泛的實際驗證,本次技術報告聚焦SpatialLM 1.1升級版本,其不僅包含了詳細的消融實驗與訓練配方,還在點云編碼方式、分辨率、用戶指定識別類目等維度上實現(xiàn)優(yōu)化。多項基準測試數據顯示:該模型在任務數據集微調后,在空間布局識別、3D物體檢測任務中,均達到了相比與最新專業(yè)模型持平或更優(yōu)的效果。
圖說:SpatialLM1.1 在戶型、物體檢測任務中與SOTA方法的跑分對比
本次報告重點圍繞算法框架和訓練數據兩方面展開。在算法架構層面,SpatialLM將大語言模型(LLMs)擴展到3D空間理解任務中,特別在結構化室內建模領域實現(xiàn)了重要突破。這一技術路線打破了傳統(tǒng)任務專屬架構(task-specific architecture)的限制,創(chuàng)新性地采用可編輯的文本形式表達場景結構。這一創(chuàng)新設計具有雙重技術優(yōu)勢:一方面發(fā)揮了群核科技強大數據集能力,通過持續(xù)訓練不斷優(yōu)化空間識別精度;另一方面通過接入大語言模型,系統(tǒng)可直接接收并理解自然語言指令,使空間理解模型從簡單任務執(zhí)行工具轉變?yōu)槟軌蛘嬲斫庥脩粢鈭D的智能系統(tǒng),從而推進了LLMs在空間理解和推理方向的能力邊界。
圖說:SpatialLM1.1 模型的網絡結構
同時,SpatialLM構建了一個全新的包含3D結構化信息的合成點云數據集,打破了真實數據稀缺且難以標注的局限。該數據集包含超1.2萬場景、5.4萬個房間的結構化室內點云數據,其規(guī)模遠超ScanNet(僅包含1,513個場景)等現(xiàn)有數據集。所有數據均源自真實項目的專業(yè)設計模型,經嚴格篩選與解析后形成符合真實世界統(tǒng)計分布的虛擬環(huán)境,相較程序化生成的ProcTHOR等數據集具有更高真實性。據了解,三維可交互數據是群核科技在空間智能領域的重要優(yōu)勢,該模型訓練數據大多來自于群核空間智能平臺SpatialVerse。早在2018年,群核科技就面向全球發(fā)布了名為InteriorNet的深度學習數據集,其包含了共計約1億3千萬空間數據,這是當時全球最大的室內場景認知深度學習數據集。
圖說:SpatialLM1.1 數據集與目前開源數據的對比
據悉,自SpatialLM 空間理解模型開源以來,在全球開發(fā)者社區(qū)持續(xù)引發(fā)討論,開發(fā)者普遍認為,該模型標志著大語言模型從"理解文字"到"認知空間"的跨越,推動3D空間理解落地應用,為AI探索物理世界開辟了新路徑。其中,來自香港科技大學計算機科學與工程系譚平教授作為研究合作方指出:"SpatialLM創(chuàng)新性地將大語言模型應用于3D空間理解,在布局估計和物體檢測等任務上取得了顯著成果。這項突破對AR/VR和具身智能等領域的發(fā)展具有重要價值。"
相關文章
- 群核科技空間理解模型SpatialLM技術報告發(fā)布,3D空間識別精度達全球領先水平
- 從思考到實踐:全球17位領袖、600+嘉賓,Style3D大會解碼AI+時尚產業(yè)落地新路徑
- 讓AI成為服裝行業(yè)的新引擎:Style3D引領智能輔助制版變革
- Style3D榮登2025中國AI創(chuàng)業(yè)十駿,獲《贏在AI+》專業(yè)評審第一名
- 3D打印農場生態(tài)在華南凝聚,F(xiàn)ormnext深圳增材展農場大會精彩看點
- Style3D斬獲《贏在AI+》設計賽道冠軍,評委點評:AI+3D技術世界第一
- 6月Style3D這場年度大會,五百位行業(yè)嘉賓、多項重磅發(fā)布......精彩提前劇透!
- 3D 打印材料展商爆增 68%,增材制造全產業(yè)鏈技術矩陣即將亮相深圳Formnext展
- 國產激光配件集體亮相華南Formnext Asia深圳展,展示3D打印領域硬核實力
- 當虹科技2D轉3D技術“首秀”,帶你“一秒穿越阿勒泰”
- 天勤箱包XStyle3D:效率提升50%,輕松斬獲8w件訂單!
- 錯過等一年!2025 華南 Formnext 3D 打印農場大會,開啟增材制造新篇章
- 先導智能以AI+3D方案解決視覺檢測行業(yè)難題 引領智能制造新風向
- 大疆系再出獨角獸:拓竹3D“印鈔機”凈利率30%領跑行業(yè)
- 2025 年下半年必看!增材制造與 3D 打印值得推薦的展會及論壇
- AI實力認證!Style3D 獲評杭州準獨角獸及 AI“十八羅漢”
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術雙重進化,技嘉2025線下產品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球對話
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產業(yè)鏈展主題發(fā)布
- 北京數基建發(fā)布“知行IntAct”混合智能體產品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數據價值化重構醫(yī)療未來
- 破解AI落地難題!北大這場特訓營,為企業(yè)找到轉型“最優(yōu)解”
- 腦神經成像提速數倍、AI練就“遺忘術”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數據處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術迎來落地新突破
- 聲網兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數據湖落地深勢科技,提升科研數據處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案