검색
검색
공개 노트 검색
회원가입로그인

OpenAI, 자율 AI 어시스턴트 'Operator' 출시

OpenAI, 자율 AI 어시스턴트 'Operator' 출시

최근 OpenAI는 새로운 AI 도구 'Operator'의 출시를 발표했습니다. 이 도구는 웹 검색과 같은 다양한 작업을 자율적으로 수행할 수 있는 능력을 가지고 있습니다. 현재는 미국에서 ChatGPT Pro 구독자들만 사용할 수 있지만, 앞으로 더 많은 사용자들에게 확대될 예정입니다.

Operator의 주요 기능

'Operator'는 다음과 같은 주요 기능을 제공합니다:

  • 웹 페이지 탐색: Operator는 독립적으로 웹 페이지를 탐색하고 필요에 따라 클릭, 입력 등의 작업을 수행할 수 있습니다.

  • 다양한 웹 작업 수행: 레스토랑 예약, 온라인 쇼핑, 여행 예약 등 다양한 작업을 자동화할 수 있습니다.

  • 사용자 지시 따르기: 사용자가 입력한 지시에 따라 웹 브라우저에서 작업을 수행하며, 필요한 경우 사용자 승인을 요청하기도 합니다.

이 모든 기능들은 OpenAI의 새로운 모델인 'Computer-Using Agent (CUA)'를 기반으로 동작합니다. CUA는 GPT-4o 모델의 시각적 능력과 강화 학습을 통해 발전된 추론 능력을 조합하여, 웹 페이지의 그래픽 사용자 인터페이스(GUI)와 상호작용할 수 있습니다.

성공률과 제한 사항

Operator는 특정 작업에서 높은 성공률을 기록하고 있지만, 완벽하지는 않습니다. OpenAI의 내부 테스트에 따르면, 다양한 작업에서 다음과 같은 성공률을 보였습니다:

  • WebVoyager: 87%

  • WebArena: 58.1%

  • OSWorld: 38.1%

복잡한 인터페이스나 캘린더 관리 같은 작업에서는 여전히 어려움을 겪고 있습니다. 또한, 민감한 작업(예: 이메일 발송, 온라인 구매)에서는 사용자 승인이 필요하며, 특정 웹사이트(성인 콘텐츠, 도박 사이트 등) 접근이 제한됩니다.

보안과 프라이버시

OpenAI는 Operator의 보안과 프라이버시를 높이기 위해 여러 가지 조치를 취하고 있습니다. 사용자가 민감한 정보를 입력할 때마다 확인을 요청하며, 악의적인 프롬프트나 지시를 감지하고 차단하기 위한 모니터링 시스템을 운영 중입니다. 이러한 조치는 Operator가 안전하게 사용될 수 있도록 보장합니다.

향후 계획과 경쟁

Operator는 현재 미국 ChatGPT Pro 구독자들만 사용할 수 있지만, 향후 더 많은 사용자들에게 확대될 예정입니다. OpenAI는 Operator를 ChatGPT의 모든 클라이언트에 통합할 계획입니다. 이와 같은 움직임은 Google DeepMind의 Mariner, Anthropic의 Computer Use와 같은 경쟁 제품들과의 경쟁에서 우위를 점하기 위한 전략으로 보입니다.

결론

OpenAI의 'Operator'는 AI의 새로운 가능성을 보여주는 중요한 도구입니다. 이 도구는 단순한 정보 제공을 넘어 실제 작업을 수행하는 능력을 갖추고 있어 사용자의 삶을 더욱 편리하게 만들어 줄 것입니다. 앞으로의 발전이 기대됩니다.

공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기
조회수 : 621
heart
T
페이지 기반 대답
AI Chat