บริษัทเทคโนโลยี Google ประกาศความร่วมมือกับ Boston Dynamics เพื่อผสานรวมโมเดลการให้เหตุผลแบบรูปธรรม Gemini Robotics เข้ากับหุ่นยนต์สี่ขา Spot ซึ่งถือเป็นก้าวสำคัญในการประยุกต์ใช้ปัญญาประดิษฐ์กับหุ่นยนต์ในโลกแห่งความเป็นจริง ความร่วมมือนี้ช่วยให้หุ่นยนต์สามารถตีความสภาพแวดล้อม ระบุวัตถุ และปฏิบัติงานตามคำสั่งภาษาธรรมชาติได้ดีขึ้น แทนที่จะพึ่งพาเพียงโปรแกรมที่ตั้งไว้ล่วงหน้า
การผสานรวมนี้สร้างจากงานทดลองที่ดำเนินการในระหว่างแฮกกาธอนภายในปี 2025 ซึ่งนักพัฒนาได้สำรวจว่าโมเดลภาษาขนาดใหญ่และระบบการให้เหตุผลด้วยภาพสามารถเพิ่มความเป็นอิสระของ Spot ได้อย่างไร ด้วยการใช้ Gemini Robotics หุ่นยนต์สามารถประมวลผลภาพจากกล้องและแปลคำสั่งระดับสูง เช่น การจัดระเบียบวัตถุในห้อง ให้เป็นการกระทำทางกายภาพที่ประสานกัน
ต่างจากการเขียนโปรแกรมหุ่นยนต์แบบดั้งเดิมที่มักพึ่งพาตรรกะแบบทีละขั้นตอนที่เข้มงวด ระบบนี้นำเสนออินเทอร์เฟซที่ยืดหยุ่นกว่าโดยอิงจากพรอมต์แบบสนทนา นักพัฒนาสร้างชั้นซอฟต์แวร์กลางโดยใช้ชุดพัฒนาซอฟต์แวร์ของ Spot ทำให้โมเดล Gemini สามารถสื่อสารกับอินเทอร์เฟซการเขียนโปรแกรมแอปพลิเคชันของหุ่นยนต์ได้ กรอบงานนี้ช่วยให้ AI เลือกจากชุดการกระทำที่กำหนดไว้ รวมถึงการนำทาง การตรวจจับวัตถุ การจับภาพ การจับ และการวางวัตถุ
ในการสาธิตเชิงปฏิบัติ ระบบแสดงความสามารถในการตีความคำสั่งทั่วไปและปรับตัวเข้ากับสภาพแวดล้อมที่เปลี่ยนแปลง ตัวอย่างเช่น เมื่อได้รับมอบหมายให้จัดระเบียบสิ่งของ โมเดล AI จะวิเคราะห์ข้อมูลภาพ ระบุวัตถุที่เกี่ยวข้อง และสั่งการหุ่นยนต์ผ่านลำดับการกระทำ ข้อเสนอแนะจากหุ่นยนต์ เช่น การทำงานเสร็จสมบูรณ์หรือข้อจำกัดทางกายภาพ ถูกนำมาใช้แบบเรียลไทม์ ทำให้ระบบสามารถปรับพฤติกรรมได้โดยไม่ต้องมีการแทรกแซงด้วยตนเอง
แนวทางนี้รักษาขอบเขตการดำเนินงานโดยจำกัด AI ให้อยู่ในความสามารถที่กำหนดไว้ล่วงหน้าภายใน API ของหุ่นยนต์ เพื่อให้มั่นใจในประสิทธิภาพที่คาดการณ์ได้และควบคุมได้ การออกแบบนี้สร้างสมดุลระหว่างความสามารถในการปรับตัวกับความปลอดภัย ซึ่งเป็นข้อพิจารณาสำคัญสำหรับการใช้งาน AI ในระบบทางกายภาพ
ความร่วมมือนี้ยังเน้นถึงการเพิ่มประสิทธิภาพที่เป็นไปได้สำหรับนักพัฒนา ด้วยการลดความจำเป็นในการเขียนโค้ดด้วยตนเองอย่างกว้างขวาง อินเทอร์เฟซภาษาธรรมชาติช่วยให้วิศวกรมุ่งเน้นที่การกำหนดวัตถุประสงค์แทนการเขียนโปรแกรมทุกลำดับการกระทำ การเปลี่ยนแปลงนี้อาจเร่งการพัฒนาแอปพลิเคชันหุ่นยนต์ในอุตสาหกรรมต่างๆ เช่น การผลิต การตรวจสอบ และโลจิสติกส์
แม้ว่าการนำไปใช้ยังคงอยู่ในขั้นทดลอง การสาธิตสะท้อนถึงแนวโน้มที่กว้างขึ้นใน AI ทางกายภาพ ซึ่งโมเดลพื้นฐานถูกนำมาใช้มากขึ้นเพื่อเพิ่มการรับรู้และการตัดสินใจของเครื่องจักร ทั้งสองบริษัทได้ระบุว่ามีการพัฒนาเพิ่มเติมกำลังดำเนินการอยู่ รวมถึงการผสานรวมระบบที่ใช้ Gemini เข้ากับแพลตฟอร์มหุ่นยนต์อย่างต่อเนื่อง
ความร่วมมือนี้บ่งชี้ถึงการเปลี่ยนผ่านสู่การโต้ตอบระหว่างมนุษย์กับเครื่องจักรที่ใช้งานง่ายขึ้น ซึ่งพฤติกรรมหุ่นยนต์ที่ซับซ้อนสามารถถูกนำทางผ่านข้อมูลที่เรียบง่าย เมื่อโมเดล AI พัฒนาต่อไป การผสานรวมดังกล่าวอาจขยายขอบเขตการทำงานของระบบอัตโนมัติในขณะที่ลดอุปสรรคทางเทคนิคในการใช้งาน
บทความ Google และ Boston Dynamics ผสานรวมโมเดล Gemini Robotics เข้ากับหุ่นยนต์ Spot เพื่อการรับรู้และการปฏิบัติงานขั้นสูง ปรากฏครั้งแรกใน Metaverse Post


