科技公司 Google 宣布與 波士頓動態 該公司將 Gemini Robotics 的具身推理模型整合到四足機器人 Spot 中,這標誌著人工智慧在現實世界機器人領域的應用向前邁…科技公司 Google 宣布與 波士頓動態 該公司將 Gemini Robotics 的具身推理模型整合到四足機器人 Spot 中,這標誌著人工智慧在現實世界機器人領域的應用向前邁…

Google和波士頓動力公司將Gemini機器人模型整合到Spot中,以實現更高級的感知和任務執行。

2026/04/16 23:16
阅读时长 5 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。
Google和波士頓動力公司將Gemini機器人模型整合到Spot中,以實現更高級的感知和任務執行。

科技公司 Google 宣布與 波士頓動態 該公司將 Gemini Robotics 的具身推理模型整合到四足機器人 Spot 中,這標誌著人工智慧在現實世界機器人領域的應用向前邁進了一步。此次合作使機器人能夠更好地理解周圍環境、識別物體,並根據自然語言指令執行任務,而不再僅依賴預先編程的程式。

此次整合基於2025年內部黑客馬拉松期間進行的實驗性工作,當時開發人員探索如何利用大型語言模型和視覺推理系統來增強Spot的自主性。透過利用Gemini Robotics的技術,該機器人可以處理來自攝影機的視覺輸入,並將諸如整理房間內物品之類的高級指令轉化為協調的物理動作。

與通常依賴僵化的、循序漸進邏輯的傳統機器人程式設計不同,該系統引入了一種基於對話提示的更靈活的介面。開發人員使用 Spot 的軟體開發工具包創建了一個中間軟體層,使 Gemini 模型能夠與機器人的應用程式介面 (API) 進行通訊。該框架使人工智慧能夠從…中進行選擇。 defi一系列動作,包括導航、物件偵測、影像擷取、抓取和放置。

自然語言介面重塑機器人任務執行方式

在實際演示中,該系統展現了理解通用指令並適應動態環境的能力。例如,在執行整理物品的任務時,人工智慧模型會分析視覺數據,辨識相關物品,並引導機器人完成一系列動作。機器人的回饋資訊(例如任務完成情況或物理限制)會被即時整合,使系統能夠在無需人工幹預的情況下調整自身行為。

該方法透過將人工智慧限制在預定義範圍內來維護作業邊界。defi機器人API內建了多種功能,確保效能可預測且可控。這種設計兼顧了適應性和安全性,這對於在實體系統中部署人工智慧至關重要。

該合作關係也凸顯了開發人員潛在的效率提升。透過減少大量手動編碼的需求,自然語言介面使工程師能夠專注於… defi不再需要對每個動作序列進行編程,而是設定目標。這種轉變可望加速機器人技術在製造業、檢測業和物流業等各行業的應用發展。

儘管該技術仍處於實驗階段,但此次演示反映了物理人工智慧領域的更廣泛趨勢,即越來越多地利用基礎模型來增強機器的感知和決策能力。兩家公司都表示,他們正在進行進一步的研發工作,包括繼續將基於Gemini的系統整合到機器人平台中。

此次合作預示著人機互動將朝著更直觀的方向發展,複雜的機器人行為可以透過簡化的輸入進行引導。隨著人工智慧模型的不斷發展,此類整合有望拓展自主系統的功能範圍,同時降低其部署的技術門檻。


Source link

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

USD1 Genesis:0 费率 + 12% APR

USD1 Genesis:0 费率 + 12% APRUSD1 Genesis:0 费率 + 12% APR

新用户:质押最高享 600% APR。限时福利!