검색
검색
공개 노트 검색
회원가입로그인

AI 소프트웨어 엔지니어 Devin - 엔지니어링 작업을 수행하는 자율 에이전트

Cognition에서 공개한 첫번째 AI 소프트웨어 엔지니어 데빈.

데빈은 자율 에이전트인데 소프트웨어 엔지니어링 일들을 할 수 있습니다. 쉘이나 코드 에디터, 웹 브라우저에서 활동할 수 있습니다.

SWE-Bench 라는 벤치마크가 있습니다. 이 벤치마크는 AI에게 Github 이슈를 풀게 하는 것입니다. 데빈은 13.86%를 도움 없이 풀었다고 합니다. 이는 기존의 도움없이 1.96%, 도움이 있는 상태에서 4.8%에 비하면 최고의 성능이라고 하네요.

또 데빈은 여러 AI 회사들의 엔지니어링 인터뷰를 성공적으로 통과했고 Upwork에서 실제로 작업들을 완료했다고 하네요.

AI 소프트웨어 엔지니어 Devin - 엔지니어링 작업을 수행하는 자율 에이전트 image 1

데빈이 동작하는 모습. 특정 task를 요청하면 plan을 세우고 이를 실행한다. 쉘, 웹브라우저, 코드 에디터 등을 조작하여 실제로 작업을 완료한다. 에러가 나면 스스로 디버깅도 한다.

Congnition의 트윗에서 작동하는 동영상을 보실 수 있습니다.

데빈 웹사이트 : Cognition

대기자 신청하기 : Request Access to Devin

조회수 : 179
공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기