Launch HN: Skyvern (YC S23) - 브라우저 자동화를 위한 오픈 소스 AI 에이전트
-
제목: "Launch HN: Skyvern (YC S23) – open-source AI agent for browser automations"
-
Skyvern:
- LLM(대형 언어 모델)과 컴퓨터 비전을 활용하여 브라우저 기반 워크플로우 자동화
- 다양한 웹사이트에서 수작업 워크플로우 완전 자동화 API 제공
- 기존 자동화 방법은 DOM 파싱 및 XPath 기반으로, 웹사이트 레이아웃 변경에 취약했음
-
특징:
- 코드 기반 XPath 상호작용 대신 실시간으로 뷰포트를 파싱하여 상호작용 계획 수립 및 실행
- 새로운 웹사이트에서도 작동 가능, 맞춤형 코딩 불필요
- 웹사이트 레이아웃 변경에도 견디는 능력
- 단일 워크플로우를 여러 웹사이트에 적용 가능
-
구성:
- 상호작용 요소 에이전트
- 네비게이션 에이전트
- 데이터 추출 에이전트
- 비밀번호 에이전트
- 2단계 인증(2FA) 에이전트
- 동적 자동완성 에이전트
-
Skyvern Cloud:
- 관리형 클라우드 버전 제공
- 다중 인스턴스 병렬 실행 가능
- 안티봇 탐지, 프록시 네트워크, CAPTCHA 해결 기능 포함
-
설치 방법:
- Docker Compose 설정
- Python 3.11 필요
- PostgreSQL 14 필요
-
기능:
- 태스크: 웹 사이트 내 특정 목표를 달성하기 위한 단일 요청
- 워크플로우: 여러 태스크를 연결하여 일관된 작업 단위 형성
- 라이브스트리밍: 브라우저 뷰포트 실시간 스트리밍
- 폼 입력, 데이터 추출, 파일 다운로드 및 인증 지원
-
사용 사례:
- 다양한 웹사이트에서 송장 다운로드
- 구직 신청 자동화
- 제조업체의 자재 조달 자동화
- 정부 웹사이트에서 계정 등록 또는 폼 작성
-
문서와 지원:
- 문서 웹사이트에서 더 자세한 정보 제공
- LLM(대형 언어 모델) 지원: OpenAI, Anthropic, Azure, AWS Bedrock 등
-
향후 계획:
- 오픈 소스 핵심 코드베이스
- 워크플로우 지원 개선
- 사용자 친화적 UI 도입
- 비용 절감 및 안정성 개선
-
참여 방법:
- PR 및 제안 환영
- Skyvern 저장소에 대한 기여 가이드 참조
- 사용 통계 수집, 기본적으로 활성화 된 상태
- AGPL-3.0 라이선스
4github.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.