信通院許志遠(yuǎn):人工智能為實現(xiàn)通用機(jī)器人打開大門
2024-12-25 09:47:45AI云資訊520
12月23日,“2025中國信通院深度觀察報告會”在北京舉辦。中國信息通信研究院副總工程師許志遠(yuǎn)在大會期間發(fā)表了自身對機(jī)器人領(lǐng)域的觀點和見解。
他表示,以大模型為代表的人工智能技術(shù)突破性發(fā)展,為實現(xiàn)通用機(jī)器人打開了大門。目前硬件解決方案基本收斂,但軟件算法仍在快速迭代創(chuàng)新,數(shù)據(jù)稀缺性是機(jī)器人能力泛化的關(guān)鍵制約。
人工智能為實現(xiàn)通用機(jī)器人打開大門
在許志遠(yuǎn)看來,人工智能技術(shù)突破性發(fā)展,為實現(xiàn)通用機(jī)器人打開了大門,其核心是增強(qiáng)了機(jī)器人的認(rèn)知與交互能力,并賦予機(jī)器人在物理世界中執(zhí)行任務(wù)的強(qiáng)大泛化能力。
“能力泛化可以理解為一種遷移學(xué)習(xí),即把從過去的經(jīng)驗中學(xué)習(xí)到的知識、策略和行為應(yīng)用到新的領(lǐng)域,這使機(jī)器人能夠在在動態(tài)和復(fù)雜環(huán)境中自主進(jìn)行任務(wù)理解,并通過感知、決策規(guī)劃和運動控制實現(xiàn)任務(wù)的閉環(huán),機(jī)器人真正成為一個可以與世界交互、存在自主智能的個體?!痹S志遠(yuǎn)進(jìn)一步解釋稱。
可以看到,這兩年投資市場和產(chǎn)業(yè)界對機(jī)器人的關(guān)注熱度高漲,具身智能和人形機(jī)器人這兩個詞匯出現(xiàn)的頻率很高。而中國和美國是最活躍的兩個國家,谷歌、特斯拉、OpenAI等國外頭部科技企業(yè)紛紛加碼機(jī)器人投入,國內(nèi)也涌現(xiàn)出銀河通用、智元這樣的優(yōu)秀企業(yè),小米、小鵬等也在造人形機(jī)器人。
未來仍需聚焦硬件及軟件算法創(chuàng)新
據(jù)許志遠(yuǎn)介紹,機(jī)器人的概念最早起源于上個世紀(jì)20年代,經(jīng)過多年的發(fā)展,相關(guān)硬件技術(shù)趨于成熟,模塊化、高度集成等成為重要特點,移動機(jī)器人形態(tài)基本收斂至人形、四足、輪式等。
硬件創(chuàng)新方面,機(jī)器人主要涵蓋執(zhí)行機(jī)構(gòu)、傳感器、芯片、電池和新材料等技術(shù)。執(zhí)行機(jī)構(gòu)作為機(jī)器人本體的核心,近兩年已從液壓驅(qū)動轉(zhuǎn)向電驅(qū)動,相關(guān)旋轉(zhuǎn)和線性運動方案也基本清晰。“未來,隨著技術(shù)進(jìn)步和需求聚焦,機(jī)器人將進(jìn)一步與前沿仿生、類腦等技術(shù)結(jié)合,結(jié)合新材料、電子皮膚、仿生設(shè)計等技術(shù),實現(xiàn)類人級感知與精巧操作。”
軟件算法方面,目前業(yè)界主流的智能機(jī)器人解決方案是將大腦和小腦分層,大腦負(fù)責(zé)交互、感知、決策,是基于現(xiàn)有大語言模型(LLM)或視覺語言模型(VLM),小腦負(fù)責(zé)具體的運動控制,有的是基于傳統(tǒng)動力學(xué)建模,也有基于模仿學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等技術(shù)。“未來看,隨著邊緣計算增強(qiáng)、交互數(shù)據(jù)豐富,軟件技術(shù)可能逐步向端到端大模型驅(qū)動的一體化架構(gòu)演進(jìn),以全面實現(xiàn)自學(xué)習(xí)、自適應(yīng)和自演化能力,即只需要一個模型便可以驅(qū)動多個不同的異構(gòu)機(jī)器人,例如人形、四足等?!?
人形機(jī)器人仍不夠成熟,需漸進(jìn)落地
談及人形機(jī)器人距離走入我們生活還有多遠(yuǎn)這一問題,許志遠(yuǎn)坦言,工業(yè)制造、商業(yè)服務(wù)、家庭服務(wù)將是人形機(jī)器人落地三個主要的場景,并且呈現(xiàn)依次漸進(jìn)落地的關(guān)系,1-3年內(nèi)用于汽車制造、商超補(bǔ)貨等封閉/半封閉場景的人形機(jī)器人將出現(xiàn),而與我們共處同一環(huán)境,可幫助執(zhí)行家務(wù)、助老等人形機(jī)器人產(chǎn)品落地可能在5年甚至10年以上。
究其原因,許志遠(yuǎn)表示,人形機(jī)器人在環(huán)境適應(yīng)性、人機(jī)交互的自然性和接受度等方面更具有優(yōu)勢,是通用機(jī)器人追求的終極形態(tài)。但人形機(jī)器人不一定是完全仿照人來設(shè)計,因為現(xiàn)階段人形并不一定是商業(yè)化落地的最優(yōu)解,短期內(nèi)市場上應(yīng)該還是存在“主體人形”搭配“定制化組件”,例如腿部采用輪式底盤或輪腿組合,上肢采用機(jī)械臂,手部為三指靈巧手或夾爪、吸盤等。
目前,人形機(jī)器人仍然不夠成熟。硬件方面,頭部公司的人形機(jī)器人產(chǎn)品除手部以外,全身有50多個自由度,如果在復(fù)雜的環(huán)境中行走需要更強(qiáng)大的運動控制能力。機(jī)器人上肢要想實現(xiàn)精細(xì)化操作,則依賴高自由度的靈巧手,但手部觸覺傳感器、執(zhí)行機(jī)構(gòu)等關(guān)鍵部分仍存在問題。此外,電池續(xù)航、成本、端側(cè)算力等也是機(jī)器人規(guī)?;瘧?yīng)用的重要難題。
除硬件以外,軟件其實是機(jī)器人落地的更大挑戰(zhàn)。大模型的本質(zhì)是數(shù)據(jù)驅(qū)動,只有基于龐大的數(shù)據(jù)量來訓(xùn)練,才能實現(xiàn)智能的涌現(xiàn)。而機(jī)器人大模型與這兩年成熟的大語言模型不一樣,語言模型的數(shù)據(jù)可以來自龐大的互聯(lián)網(wǎng),機(jī)器人還需要物理世界中高精度操作數(shù)據(jù),這些數(shù)據(jù)是互聯(lián)網(wǎng)沒有的。只有解決了這些問題,機(jī)器人才能大規(guī)模走入我們的生活。
相關(guān)文章
- 亞信科技通過中國信通院首批“大模型應(yīng)用交付總體能力”評估
- 權(quán)威認(rèn)可!方向標(biāo)FangMail連續(xù)入選中國信通院數(shù)安能力全景圖及“磐安”優(yōu)秀案例
- 信通院劉泰:人形機(jī)器人走近“智慧覺醒”奇點
- 嘉為藍(lán)鯨參編信通院行業(yè)報告,為央國企數(shù)智化轉(zhuǎn)型注入強(qiáng)勁動能!
- 青云科技與信通院、焱融啟動 AI 推理場景高性能存儲技術(shù)推進(jìn)計劃
- 引領(lǐng)普惠算力新征程 九章云極DataCanvas首批首家通過中國信通院“普惠算力”能力測試
- 容聯(lián)云攜手信通院,啟動“智能體服務(wù)生態(tài)共創(chuàng)計劃”
- 青云攜手珠海華發(fā)入選信通院 2025 可信云用戶典型實踐
- 青云科技入選信通院 2025 可信云技術(shù)典型實踐
- 信通院曹峰:AI技術(shù)演進(jìn)詮釋“化繁為簡”產(chǎn)業(yè)邏輯
- 星火大模型內(nèi)容安全防護(hù)平臺通過中國信通院“云上大模型內(nèi)容安全防護(hù)產(chǎn)品能力評估”
- 浪潮KaiwuDB 連續(xù)三年入選中國信通院數(shù)據(jù)庫產(chǎn)業(yè)圖譜,持續(xù)筑牢可信數(shù)字底座
- CACTER郵件安全入選信通院《數(shù)字安全護(hù)航技術(shù)能力全景圖》,大模型網(wǎng)關(guān)引領(lǐng)AI安全新突破!
- 首批! 啟明星辰大模型應(yīng)用防火墻通過中國信通院“可信安全”評估
- 錨定AI賽道!浩鯨科技深度參編中國信通院多項人工智能技術(shù)標(biāo)準(zhǔn)
- 首批!凱美瑞德入選中國信通院《AI Agent智能體產(chǎn)業(yè)圖譜1.0》
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計算”論壇圓滿召開——攜產(chǎn)界實踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機(jī)器人技能大賽在滬啟動,助推智能建造實戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機(jī)賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎”,以芯片級創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案