클로드 컴퓨터 사용 기능 사용법 (Cluade computer use)

T
tilnote

클로드의 컴퓨터 유즈란?

AI를 통해 컴퓨터를 조작할 수 있는 기능. API와 앤트로픽에서 제공하는 데모를 통해 사용 가능.

컴퓨터 사용 기능 (베타) 신규 도입 (computer use)

  • AI가 사람처럼 컴퓨터를 사용할 수 있는 혁신적 기능

  • 커서 이동, 클릭, 텍스트 입력 등 가능

  • OSWorld 평가에서 screenshot-only 카테고리 성공율 14.9% 기록.

    OSWorld 는 AI 모델의 컴퓨터 사용 능력을 평가.

    화면 캡처만을 보고 컴퓨터 작업을 수행해야 하는 제한된 조건.

    아직 초기 단계이지만 다음으로 높은 AI 시스템 7.8%과 비교했을 때 앞선 성능.

    더 많은 단계로 작업을 수행할 수 있도록 했을 때 22.0%의 성능을 기록.

  • 현재는 실험적 단계로, 스크롤링, 드래깅, 확대/축소 등에서 한계 존재

Computer use (beta) - Anthropic

데모 사용법

anthropic-quickstarts/computer-use-demo at main · anthropics/anthropic-quickstarts

준비된 데모 도커 파일을 통해 사용할 수 있음.

  1. 도커 설치

Docker: Accelerated Container Application Development

  1. API 키 세팅하기

Anthropic Console

콘솔에서 키를 만든 후 사용하기.

무료로도 사용할 수 있지만 금방 rate limit 에 걸려서 충전해서 사용했습니다. 그런데 컴퓨터 유즈는 여러 스텝을 밟기 때문에 충전해서 티어 1이 되어도 rate limit 에 많이 걸리더라구요.

이렇게 한 후 윈도우의 경우 커맨드 창 또는 파워쉘에서 키를 세팅하면 됩니다.

파워쉘

$env:ANTHROPIC_API_KEY="your_api_key_value"

커맨드창

set ANTHROPIC_API_KEY=your_api_key

맥이나 리눅스

export ANTHROPIC_API_KEY=%your_api_key%

  1. 도커 실행하기

같은 터미널에서 다음 명령어로 도커 컨테이너를 만들고 실행합니다. 복사하기 쉽게 한줄로 정리했습니다.

파워쉘 버전

docker run -e ANTHROPIC_API_KEY=$env:ANTHROPIC_API_KEY -v ${HOME}\.anthropic:/home/computeruse/.anthropic -p 5900:5900 -p 8501:8501 -p 6080:6080 -p 8080:8080 -it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest

커맨트 프롬프트

docker run -e ANTHROPIC_API_KEY=%ANTHROPIC_API_KEY% -v %USERPROFILE%\.anthropic:/home/computeruse/.anthropic -p 5900:5900 -p 8501:8501 -p 6080:6080 -p 8080:8080 -it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest

리눅스 및 맥 버전

docker run -e ANTHROPIC_API_KEY=$env:ANTHROPIC_API_KEY -v ${HOME}\.anthropic:/home/computeruse/.anthropic -p 5900:5900 -p 8501:8501 -p 6080:6080 -p 8080:8080 -it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest

자세한 내용은 위의 깃허브 링크 참조.

기타

다시 docker start 로 실행을 할 때는 display 환경 변수 때문에 오류가 발생한다. 그래서 컨테이너를 지우고 다시 시작하거나 --rm 을 붙여서 컨테이터를 종료 시 지우게 할 수 있다. 곧 패치 될 것 같다.

우분투 환경 한글 깨질 시

sudo apt install fonts-noto-cjk

예시

구글에서 tilnote 검색. (한글 틸노트는 틸까지만 입력하는 오류)

뉴욕으로 가는 비행기 티켓 찾기

찾은 내용을 스프레드시트로 정리 하기

다양한 영역에 활용할 수 있을 것으로 보입니다.

공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기
조회수 : 3605
heart1
T
tilnote
tilnote를 개발하고 있습니다. 인공지능과 테크에 대한 소식을 전해 드립니다. 이메일 구독을 하시면 매주 화요일 인공지능 관련 뉴스레터를 메일로 보내드립니다. 영상으로 만나보시려면 아래 틸노트 유튜브를 구독해 주세요. AI 스퀘어 단톡방에는 매일 AI 뉴스와 아티클이 공유됩니다. AI에 관심이 있다면 아래 카카오톡 오픈챗에 참여해 주세요! (비번 : tilnote)
kakaotalk 오픈챗
최신 AI 트렌드를 한눈에 담은 틸노트 AI 레벨업 전자책. 170만 방문자가 검증한 틸노트의 인사이트를 경험하세요. 지금 8000원에, 7일간 20% 할인 중!
확인하기
T
페이지 기반 대답
AI Chat