Openai Operator 출시 - 사용자를 대신해서 웹서핑을 하는 에이전트
Openai Operator
개요
소개
OpenAI는 최근 자사의 최신 AI 에이전트인 Operator를 발표했다. Operator는 컴퓨터를 사용하여 웹 브라우징과 같은 다양한 업무를 자율적으로 수행할 수 있는 능력을 갖춘 도구이다. 이 도구는 OpenAI의 프리미엄 서비스인 미국의 ChatGPT Pro 가입자들에게 먼저 제공된다. 20불짜리 플러스 사용자에게는 추후 공개된다고 한다.
오퍼레이터 사이트 주소 : Operator
의의
Operator의 출시는 AI 기술이 단순 데이터 처리에서 벗어나 실제 세계에서 유의미한 행동을 수행할 수 있는 단계로 진입했음을 시사한다. 이는 사용자의 생산성 향상에 기여하고, 반복적이고 번거로운 작업을 간소화하는 데 큰 도움이 될 것으로 예상된다.
기능 및 특징
작업 처리
Operator는 웹 브라우저를 통해 사용자가 지시하는 다양한 작업을 수행할 수 있다. 명령을 해석하고 웹 페이지와 상호 작용하여 작업을 완료하는 과정을 자동화한다. 예를 들어, 여행 일정 예약, 레스토랑 예약, 온라인 쇼핑 등이 가능하다.
작은 브라우저를 열어서 작업을 하는 것을 알 수 있다.
AI 모델 - Computer-Using Agent (CUA)
Operator는 OpenAI의 GPT-4o 모델을 기반으로 한 Computer-Using Agent(CUA) 모델을 사용한다. CUA 모델은 웹사이트의 그래픽 사용자 인터페이스(GUI)를 통해 사람처럼 버튼을 누르거나 텍스트를 입력하며 작업을 수행한다.
사용자 인터페이스
사용자가 Operator를 활성화하면 작은 창이 뜨면서 전용 웹 브라우저가 열리고, Operator는 이 브라우저를 통해 작업을 수행한다. 사용자는 작업이 진행되는 동안에도 필요시 직접 제어를 할 수 있다.
사용 사례
실생활 적용 예시
여행 준비: Operator는 사용자가 항공권을 예매하거나 호텔을 예약하는 과정을 도와준다.
레스토랑 예약: 특정 시간대에 레스토랑을 예약하고, 예약 상황을 실시간으로 확인할 수 있다.
온라인 쇼핑: 필요한 물품을 선택하고, 주문 과정을 진행한다.
협력업체
현재 OpenAI는 DoorDash, eBay, Instacart, OpenTable, Priceline, StubHub, Uber 등과 협력하여 Operator가 이들 플랫폼의 이용 약관을 준수하며 원활하게 작업을 수행할 수 있도록 하고 있다.
제한사항 및 고려 사항
초기 한계
Operator는 아직 모든 시나리오에서 완벽하게 작업을 수행하지는 못한다. 예를 들어, 복잡한 일정 관리나 비표준화된 웹 인터페이스와 상호 작용하는 데에 어려움이 있을 수 있다. 또한 보안상의 이유로 이메일 전송이나 일정 삭제와 같은 작업은 수행하지 않는다.
사용자 감독 필요
특히 은행 업무나 민감한 웹사이트에서는 사용자가 모델의 작업을 감독해야 한다. Operator는 외부에 영향을 미칠 수 있는 작업, 예를 들어 주문을 확정하기 전에 사용자 확인을 받는다. 이는 잘못된 작업이 영구화되지 않도록 하기 위함이다.
보안 및 프라이버시
OpenAI는 Operator가 악의적인 프롬프트나 피싱 시도를 차단할 수 있는 여러 안전장치들을 마련했다. 의심스러운 활동이 감지되면 작업을 중단하고, 자동화된 및 사람에 의한 리뷰 과정을 통해 지속적으로 안전 장치를 업데이트 한다.
사용 데이터 관리
사용자는 모델의 추가 학습을 위해 제공되는 데이터 수집을 옵트아웃 할 수 있으며, 데이터는 설정을 통해 삭제할 수 있다.
추가 사항
실제로 데모 영상에서 피자를 주문하고, 스포츠 경기를 예약하고, 청소부를 부르는 등 다양한 작업을 처리하는 모습을 보여줬다. 한번에 여러 개의 처리를 할 수 있다고 한다. 비동기적으로 작동하기 때문에 하나를 요청하고 다른 하나를 요청하는 식이다.
API를 통해서도 사용할 수 있게 된다.
만약 급하게 브라우징 기능을 사용해야 한다면 langchain 의 browser-use 가 이미 나와있기 때문에 사용하면 된다.
결론
OpenAI의 Operator는 AI 에이전트가 앞으로 나아가야 할 중요한 단계를 열었다. Operator가 보여준 초기 성과와 기능은 보다 복잡한 AI 에이전트 개발을 위한 발판이 될 것이다. 이는 AI 기술의 잠재력을 실생활에 활용하는 데 중요한 이정표로 평가된다.
Operator의 발전과 함께 OpenAI는 사용자와의 협력을 통해 모델의 성능과 안정성을 지속적으로 개선하고 있다. 앞으로 고객과의 인터랙션을 통해 Operator가 얼마나 효과적이고 유용하게 자리잡을지 기대가 된다.
OpenAI의 첫번째 에이전트라고 한다. 오퍼레이터 자체의 성능 향상도 이루어지겠지만 다른 다양한 에이전트들도 출시될 예정이다.


