NVIDIA 宣布推出 Cosmos 世界基礎(chǔ)模型和物理 AI 數(shù)據(jù)工具的重大更新
2025-03-20 10:54:24AI云資訊11944
美國加利福尼亞州圣何塞—— GTC ——太平洋時間2025年3月18日——NVIDIA今日宣布推出全新NVIDIA Cosmos?世界基礎(chǔ)模型(WFM)的重大更新,該模型引入了開放式、可完全定制的物理AI開發(fā)推理模型,讓開發(fā)者以前所未有的方式控制世界生成。
NVIDIA還推出了兩款由NVIDIA Omniverse?和Cosmos平臺提供支持的新藍圖,為開發(fā)者提供用于機器人和自動駕駛汽車后訓(xùn)練的大規(guī)??煽睾铣蓴?shù)據(jù)生成引擎。
1X、Agility Robotics、Figure AI、Foretellix、Skild AI和Uber是首批采用Cosmos的企業(yè),可更快、更大規(guī)模地為物理AI生成更豐富的訓(xùn)練數(shù)據(jù)。
“正如大語言模型改變了生成式和代理式AI,Cosmos世界基礎(chǔ)模型是物理AI的一項重大突破,”NVIDIA創(chuàng)始人兼CEO黃仁勛表示。“Cosmos為物理AI帶來了一個開放式、可完全定制的推理模型,為機器人和物理工業(yè)領(lǐng)域的突破性發(fā)展帶來了機遇。”
用于合成數(shù)據(jù)生成的Cosmos® Transfer
Cosmos Transfer WFM能夠吸收結(jié)構(gòu)化視頻輸入,如分割圖、深度圖、激光雷達掃描、姿態(tài)估計圖和軌跡圖等,以生成可控、逼真的視頻輸出。
Cosmos Transfer可簡化感知AI訓(xùn)練,將Omniverse中創(chuàng)建的3D仿真或真值轉(zhuǎn)換為逼真視頻,用于大規(guī)模可控合成數(shù)據(jù)生成。
Agility Robotics將是最早采用Cosmos Transfer和Omniverse進行大規(guī)模合成數(shù)據(jù)生成,用以訓(xùn)練其機器人模型的公司之一。
Agility Robotics首席技術(shù)官Pras Velagapudi表示:“Cosmos為我們提供了一個在真實世界可采集的數(shù)據(jù)之外,擴展逼真訓(xùn)練數(shù)據(jù)的機會。我們很期待看到使用新平臺解鎖的新性能,同時充分利用我們已有的基于物理學(xué)的仿真數(shù)據(jù)?!?
用于自動駕駛汽車仿真的NVIDIA® Omniverse Blueprint借助Cosmos Transfer放大基于物理傳感器數(shù)據(jù)的變化。借助該藍圖,F(xiàn)oretellix可以通過為不同駕駛數(shù)據(jù)集改變天氣和光照等條件來豐富行為場景。Parallel Domain也正在使用該藍圖將類似的變更應(yīng)用于他們的傳感器仿真。
用于合成操作運動生成的NVIDIA GR00T Blueprint結(jié)合了Omniverse和Cosmos Transfer,可大規(guī)模生成多樣化數(shù)據(jù)集,利用OpenUSD驅(qū)動的仿真,將數(shù)據(jù)采集和增強時間從數(shù)天縮短到數(shù)小時。
Cosmos Predict用于智能世界生成
一月在CES上宣布的Cosmos Predict WFM能夠通過文本、圖像和視頻等多模態(tài)輸入生成虛擬世界狀態(tài)。新的Cosmos Predict模型將支持多幀生成,在給定開始和結(jié)束輸入圖像的情況下,預(yù)測中間行為或運動軌跡。這些模型專為后訓(xùn)練而打造,可使用NVIDIA開放的物理AI數(shù)據(jù)集進行定制。
借助NVIDIA Grace Blackwell® NVL72系統(tǒng)及其龐大的NVIDIA NVLink?域的推理計算能力,開發(fā)者可以實現(xiàn)實時世界生成。
1X正在使用Cosmos Predict和Cosmos Transfer來訓(xùn)練其新型人形機器人NEO Gamma。機器人大腦開發(fā)商Skild AI正在利用Cosmos Transfer增強其機器人的合成數(shù)據(jù)集。此外,Nexar和Oxa正在使用Cosmos Predict來升級其自動駕駛系統(tǒng)。
用于物理AI的多模態(tài)推理
Cosmos Reason是一個開放式、可完全定制的WFM,具有時空感知能力,它使用思維鏈推理來理解視頻數(shù)據(jù),并能夠預(yù)測交互結(jié)果,如一個人走進人行道或一個盒子從架子上掉下來。
開發(fā)者可以使用Cosmos Reason來提升物理AI數(shù)據(jù)標(biāo)注和管理,增強現(xiàn)有世界基礎(chǔ)模型或創(chuàng)建新的視覺語言動作模型。他們還可以對其進行后訓(xùn)練,構(gòu)建高級規(guī)劃器,以指導(dǎo)物理AI如何完成所需操作。
加速物理AI的數(shù)據(jù)管理和后訓(xùn)練
基于其下游任務(wù),開發(fā)者可以在NVIDIA DGX? Cloud上使用原生PyTorch腳本或NVIDIA NeMo?框架對Cosmos WFM進行后訓(xùn)練。
Cosmos開發(fā)者還可以使用DGX Cloud上的NVIDIA NeMo Curator來加速數(shù)據(jù)處理和管理。Linker Vision和Milestone Systems正將其用于管理海量視頻數(shù)據(jù),訓(xùn)練用于視覺智能體的大視覺語言模型,這些智能體基于NVIDIA AI Blueprint進行視頻搜索和總結(jié)。Virtual Incision正在探索將其部署在未來的手術(shù)機器人中,而Uber和Waabi正在推動自動駕駛汽車的開發(fā)。
推動負責(zé)任的AI和內(nèi)容透明度
根據(jù)NVIDIA一貫的可信AI原則,NVIDIA在所有Cosmos WFM中都采用開放式護欄。此外,NVIDIA正在與Google DeepMind合作,將SynthID集成到水印中,幫助識別Cosmos WFM NVIDIA NIM?微服務(wù)的AI生成結(jié)果。
相關(guān)文章
- 國慶出國游,時空壺新T1翻譯機,首個端側(cè)模型突破助力跨語言交流
- 快手發(fā)布多模態(tài)大模型Keye-VL-1.5 8B性能領(lǐng)先、視頻理解能力更強
- 攻克“全球化難題”!元戎啟行用VLA模型破解歐洲復(fù)雜路況
- 皓麗全球首款四攝AI會議平板:AI全視之眼 + AI智會大模型雙加持
- 當(dāng)翻譯失去網(wǎng)絡(luò),時空壺新T1翻譯機開創(chuàng)首個離線模型賦能全球溝通新體驗
- 聯(lián)通數(shù)智“模型、數(shù)據(jù)、安全”三位一體,精彩亮相2025智博會
- Soul全雙工語音大模型升級 迭代人機交互體驗感
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 模型選型專題系列 | 業(yè)界首個!元景MaaS平臺上線《大模型選型說明書》
- 模型選型專題系列 | “一句話選模型”智能體,助你告別模型選型困境
- 蘋果為Siri開發(fā)的AI搜索工具或?qū)⒗霉雀璧腉emini AI模型來匯總網(wǎng)絡(luò)信息
- 獲央視點贊 深蘭科技AI醫(yī)療大模型落地打浦橋街道社區(qū)服務(wù)中心
- 新達內(nèi)與百度智能云達成戰(zhàn)略合作 聯(lián)合培養(yǎng)人工智能大模型人才
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案
- 知識圖譜人崗匹配模型為人力資源智能化轉(zhuǎn)型提供新引擎
- 打造廣東首個地方文獻專題處理AI大模型,南沙區(qū)圖書館“阿貝數(shù)字人”項目重磅上線!
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當(dāng)“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學(xué)品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案