구글의 로봇
구글 로봇
개요
구글은 최근 로봇 공학 분야에서 획기적인 발전을 이루며, 로봇이 사람들에게 더 유용하고 다재다능하게 서비스를 제공할 수 있도록 하는 여러 모델을 발표했습니다. 이 중에서도 제미나이 로보틱스(Gemini Robotics)와 로보틱 트랜스포머 2(Robotic Transformer 2, RT-2)가 주목받고 있습니다. 이 모델들은 구글 딥마인드(DeepMind)의 최신 대규모 언어 모델(LLM)과 로봇 공학 기술을 결합하여 만들어졌습니다.
제미나이 로보틱스
제미나이 로보틱스 개요
제미나이 로보틱스는 제미나이 2.0을 기반으로 구축된 첨단 시각-언어-행동(VLA) 모델입니다. 이 모델은 이전의 단순한 디지털 영역을 넘어 물리적 세상에서도 활용될 수 있도록 설계되었습니다. 제미나이 로보틱스는 물리적 행동을 새로운 출력 형식으로 추가하여 로봇이 직접 상호작용하고 작업을 수행할 수 있도록 했습니다.
핵심 특성
범용성
제미나이 로보틱스는 다양한 상황에서 즉각적으로 응답할 수 있으며, 이전에 본 적 없는 명령이나 환경에서도 유연하게 대처합니다. 이는 서술한 기술 보고서에서 다른 최첨단 모델보다 두 배 이상의 성능 향상을 보여주었습니다.
상호작용성
이 모델은 사람과 일상적인 대화체로 소통할 수 있으며, 다양한 자연어 명령을 이해하고 반응할 수 있습니다. 또한, 주변 환경을 지속적으로 모니터링하여 실시간으로 반응을 조정합니다.
숙련도
제미나이 로보틱스는 섬세한 운동 제어 능력을 갖추어 매우 복잡한 작업도 수행할 수 있습니다. 예를 들어, 종이접기나 작은 물건을 정리하는 작업도 문제 없이 해낼 수 있습니다.
응용 분야 및 파트너십
구글은 앱트로닉(Apptronik), 보스톤 다이내믹스(Boston Dynamics), 인챈티드 툴스(Enchanted Tools) 등과 협력하여 제미나이 로보틱스를 시험하고 피드백을 수집하고 있습니다.
예시
구글의 데모 영상에서는 로봇이 농구공을 덩크슛하거나, 과일을 정리하는 등의 작업을 수행하는 모습을 보여주었습니다.
로보틱 트랜스포머 2 (RT-2)
개요
로보틱 트랜스포머 2(RT-2)는 구글의 최신 연구 성과로, 비전-언어-행동(VLA) 모델을 사용하여 로봇이 직접적인 로봇 행동을 출력할 수 있게 합니다. RT-2는 웹 데이터와 로봇 데이터를 결합하여 로봇 제어를 위한 일반화된 지침을 제공합니다.
주요 특징
학습 및 일반화
RT-2는 웹 스케일 데이터와 로봇 데이터를 통해 학습하여 새로운 명령을 해석하고 사용자 명령에 반응하는 능력을 갖추고 있습니다. 로봇 데이터와 웹 스케일 데이터의 결합을 통해 정교한 추론을 수행할 수 있으며, 물건을 구별하거나 고유한 작업을 수행할 수 있습니다.
체인 오브 소트 추론
RT-2는 체인 오브 소트 추론을 활용하여 다단계 의미 추론을 수행합니다. 예를 들어, 어느 물체가 임시 망치를 대체할 수 있는지 또는 피로한 사람에게 적합한 음료가 무엇인지 판단할 수 있습니다.
효율성 향상
기존 VLM 모델을 사용하여 큰 변형 없이 로봇 데이터를 학습할 수 있도록 하고, 이를 통해 모델의 성능을 향상시킵니다.
성능 검증
RT-2는 6,000번 이상의 로봇 시도에서 성공률을 높였으며, 이전 모델인 RT-1보다 두 배 이상 높은 성능을 보였습니다. RT-2는 새로운 작업과 환경에서도 높은 성공률을 기록하며 로봇의 적응성을 크게 향상시켰습니다.
책임감 있는 AI 및 로봇 공학 발전
구글은 로봇 공학과 AI의 책임 있는 발전을 위해 여러 계층의 안전 프로토콜을 적용하고 있습니다. 이는 로봇의 물리적 안전성과 사람들의 안전을 보장하는 것을 목표로 하며, 제미나이 로보틱스와 RT-2 모델 모두 이러한 접근 방식을 따르고 있습니다.
안전 제어 및 헌법
구글은 로봇 헌법을 기반으로 한 규칙을 설정하여 로봇이 안전하게 행동할 수 있도록 합니다. 이 헌법은 로봇이 사람을 다치게 하지 않도록 하고, 위험한 물질을 다루지 않도록 설계되어 있습니다.
협력 및 데이터셋
구글은 다양한 신뢰할 수 있는 파트너와 협력하며, 로봇 공학의 안전성을 평가하고 개선할 수 있는 새로운 데이터 세트도 공개하고 있습니다.
결론
구글의 제미나이 로보틱스와 로보틱 트랜스포머 2는 로봇 공학의 새로운 시대를 열어가는 중요한 발전을 이뤄냈습니다. 이 모델들은 로봇이 더 유연하고 지능적으로 사람들을 도울 수 있도록 하며, 안전한 상호작용이 가능하도록 설계되었습니다. 앞으로의 연구와 개발을 통해 더 많은 실제 응용 사례가 등장할 것으로 기대됩니다.


