AI 소프트웨어 엔지니어 Devin - 엔지니어링 작업을 수행하는 자율 에이전트
Cognition에서 공개한 첫번째 AI 소프트웨어 엔지니어 데빈.
데빈은 자율 에이전트인데 소프트웨어 엔지니어링 일들을 할 수 있습니다. 쉘이나 코드 에디터, 웹 브라우저에서 활동할 수 있습니다.
SWE-Bench 라는 벤치마크가 있습니다. 이 벤치마크는 AI에게 Github 이슈를 풀게 하는 것입니다. 데빈은 13.86%를 도움 없이 풀었다고 합니다. 이는 기존의 도움없이 1.96%, 도움이 있는 상태에서 4.8%에 비하면 최고의 성능이라고 하네요.
또 데빈은 여러 AI 회사들의 엔지니어링 인터뷰를 성공적으로 통과했고 Upwork에서 실제로 작업들을 완료했다고 하네요.
데빈이 동작하는 모습. 특정 task를 요청하면 plan을 세우고 이를 실행한다. 쉘, 웹브라우저, 코드 에디터 등을 조작하여 실제로 작업을 완료한다. 에러가 나면 스스로 디버깅도 한다.
Congnition의 트윗에서 작동하는 동영상을 보실 수 있습니다.
데빈 웹사이트 : Cognition
대기자 신청하기 : Request Access to Devin
공유하기
조회수 : 362