物理AI正成爲科技巨頭新戰場。OpenAI、英偉達與特斯拉近期在具身智能領域推出重大舉措,表明機器人產業競爭從硬件製造升級爲底層基礎設施與行業標準制定。OpenAI新成立“OpenAI Robotics”團隊,標誌着科技巨頭深度下場,打破初創和傳統企業主導格局。
OpenAI宣佈成立Robotics事業部,將AI從軟件拓展至具身智能領域,旨在通過大模型連接物理世界。CEO山姆·奧特曼公開招募全棧硬件、運營、系統及機器學習工程師,強調AI應切實幫助人類生活。團隊計劃分階段推進,短期內專注研發,以逐步實現現實世界應用。
騰訊 Robotics X 與混元團隊聯合開源HY-Embodied-0.5-X多模態大模型,專爲機器人具身任務優化。該模型基於MoT-2B架構,強化“看懂、想清、做到”能力,在精細操作、空間推理、動作預測和風險判斷上表現突出。系列包含MoT-2B和MoE-32B兩個版本,旨在提升機器人在真實環境的智能交互水平。
波士頓動力與谷歌DeepMind合作,將Gemini Robotics-ER1.6 AI模型集成到Spot機器人中,顯著提升了其在工業檢測中的能力,特別是在泄漏識別和儀表數據讀取方面,增強了機器人的自主決策性能。
基於Gemini 2.0的機器人模型,將AI帶入物理世界,具備視覺、語言和動作能力。
用於雙手操作的擴散基礎模型
robotics-diffusion-transformer
RDT-170M是一個擁有1.7億參數的模仿學習擴散Transformer模型,用於機器人視覺-語言-動作任務。
Ethan-pooh
基於robotics-diffusion-transformer/rdt-1b衍生的RDT模型,專注於機器人技術領域。
基於100萬+多機器人操作數據預訓練的10億參數模仿學習擴散Transformer模型,支持多視角視覺語言動作預測