精品国产18久久久久久,一个人在线观看的www,亚洲一区二区久久久,成人国内精品久久久久影院vr,最近免费中文字幕大全高清大全1

中科視語重磅發(fā)布 LightPlanner!首個(gè)開源輕量化具身推理大模型,打破機(jī)器人輕量與推理能力困局

2025-03-21 10:43:55AI云資訊10580

中科視語在具身智能領(lǐng)域再獲突破!此前,中科視語發(fā)布了PhysVLM——首個(gè)開源機(jī)器人物理空間具身大模型。該模型突破了傳統(tǒng)模型普遍存在的局限,通過多模態(tài)感知、動(dòng)態(tài)環(huán)境建模與自主決策規(guī)劃的深度融合,PhysVLM成功賦予機(jī)器人在復(fù)雜物理空間中類人級(jí)的操作能力。

當(dāng)前,中科視語再次取得關(guān)鍵進(jìn)展,發(fā)布首個(gè)開源輕量化具身決策深度推理大模型——LightPlanner,通過創(chuàng)新的層次化決策框架,成功突破邊緣設(shè)備上 “輕量與智能不可兼得” 的行業(yè)難題,為機(jī)器人在物流、制造、服務(wù)等場(chǎng)景的規(guī)?;渴鸬於思夹g(shù)基礎(chǔ),持續(xù)引領(lǐng)具身智能技術(shù)的創(chuàng)新與發(fā)展。

讓邊緣端機(jī)器人“既能思考又能行動(dòng)”

傳統(tǒng)大語言模型(LLM)在具身任務(wù)中展現(xiàn)了強(qiáng)大的語義理解能力,但其龐大的參數(shù)規(guī)模難以在邊緣設(shè)備上高效運(yùn)行。輕量級(jí)模型雖解決了算力限制,卻因缺乏復(fù)雜推理能力,如在 “抓取最大積木” 等需動(dòng)態(tài)邏輯判斷的任務(wù)中表現(xiàn)乏力。這一“推理能力瓶頸”已成為制約輕量級(jí)具身智能系統(tǒng)規(guī)?;瘧?yīng)用的核心障礙。

圖1: LightPlanner與主流任務(wù)規(guī)劃方法的對(duì)比

針對(duì)這一挑戰(zhàn),中科視語提出了首個(gè)具身規(guī)劃決策的輕量化深度推理大模型——LightPlanner。借鑒DeepSeek-R1在復(fù)雜任務(wù)推理中的成功經(jīng)驗(yàn),LightPlanner通過創(chuàng)新的層次化深度推理和動(dòng)態(tài)參數(shù)化技能控制方法,充分釋放了多種規(guī)格輕量級(jí)LLM的推理能力,以提升其在復(fù)雜任務(wù)規(guī)劃中的性能。LightPlanner在機(jī)器人規(guī)劃決策任務(wù)中復(fù)現(xiàn)了類似DeepSeek-R1的“回溯、反思、糾錯(cuò)”行為,從而顯著提高了任務(wù)規(guī)劃的準(zhǔn)確性和系統(tǒng)的魯棒性。

圖2: LightPlanner在決策推理時(shí)出現(xiàn)的“回溯、反思、糾錯(cuò)”行為

圖3: LightPlanner框架,生成層次化深度推理與動(dòng)態(tài)技能控制

LightPlanner三大核心創(chuàng)新突破

層次化深度推理

模擬人類決策邏輯,在每一步執(zhí)行前觸發(fā)三層驗(yàn)證:

· 執(zhí)行反饋:通過歷史記憶動(dòng)態(tài)修正偏差,實(shí)現(xiàn) “錯(cuò)誤自愈”;

·語義一致性:確保子動(dòng)作與全局任務(wù)目標(biāo)對(duì)齊;

·參數(shù)有效性:實(shí)時(shí)計(jì)算抓取對(duì)象的空間位置等連續(xù)參數(shù),提升動(dòng)作精度。

參數(shù)化動(dòng)態(tài)技能鏈

突破固定技能模板限制,通過上下文感知的函數(shù)調(diào)用機(jī)制,動(dòng)態(tài)解析指令中的動(dòng)態(tài)參數(shù)(如 “最大積木” 需實(shí)時(shí)計(jì)算面積并定位),使得系統(tǒng)能夠執(zhí)行需要視覺或空間推理的復(fù)雜具身任務(wù)。

邊緣設(shè)備友好架構(gòu)

在大模型的輸入端引入一個(gè)動(dòng)態(tài)更新的歷史行動(dòng)記憶模塊,結(jié)合迭代式上下文管理,顯著降低顯存占用。在長期任務(wù)規(guī)劃中,平均顯存占用不超過3.9G(未量化),滿足邊緣端設(shè)備的部署需求。當(dāng)前設(shè)備已支持Nvidia jetson 系列邊緣計(jì)算設(shè)備,以及瑞芯微、算能、華為Atlas等國產(chǎn)化邊緣計(jì)算設(shè)備

開源生態(tài):4萬級(jí)數(shù)據(jù)集+輕量模型,加速產(chǎn)業(yè)落地

為推動(dòng)技術(shù)普惠,團(tuán)隊(duì)同步開源了:

開源量化模型:模型提供0.9到2.7g多種量化版本,憑借其卓越性能與實(shí)用價(jià)值,近期在Hugging Face平臺(tái)熱度飆升,單周下載總量已突破300次。

LightPlan-40K 數(shù)據(jù)集:首個(gè)具身決策深度推理數(shù)據(jù)集,覆蓋動(dòng)作序列長度為2-13的不同復(fù)雜度任務(wù),總計(jì)包含4萬個(gè)帶有層次化深度推理的動(dòng)作決策步驟,其中精選2.3萬條高質(zhì)量數(shù)據(jù)作為訓(xùn)練集。

表1: 不同復(fù)雜度的任務(wù)中的性能表現(xiàn)

我們基于LightPlan-40K數(shù)據(jù)集訓(xùn)練了LightPlanner模型。實(shí)驗(yàn)結(jié)果顯示,在真實(shí)世界環(huán)境中的具身決策規(guī)劃任務(wù)中,盡管LightPlanner的參數(shù)數(shù)量最少,僅為1.5B,但其任務(wù)成功率最高。在需要空間語義推理的任務(wù)中,其成功率比ReAct高出14.9%。此外,實(shí)驗(yàn)還展示了LightPlanner在邊緣設(shè)備上的運(yùn)行潛力,突顯其在資源受限環(huán)境中的適用性。

圖4: LightPlanner在Jetson Xavier Orin上的部署展示


相關(guān)文章

人工智能企業(yè)

更多>>

人工智能硬件

更多>>

人工智能產(chǎn)業(yè)

更多>>

人工智能技術(shù)

更多>>
AI云資訊(愛云資訊)立足人工智能科技,打造有深度、有前瞻、有影響力的泛科技媒體平臺(tái)。
合作QQ:1211461360微信號(hào):icloudnews