메인 콘텐츠로 건너뛰기

2025년 기준 Droid CLI, GLM-4.6, 무료 Sonnet 4.5, GPT-5 실사용 후기: Claude Code와 비교한 실제 코드 생성 경험 및 한계

DODOSEE
DODOSEE
조회수 398
요약

이 노트는 AI의 도움을 받아 요약·비평·학습 목적으로 작성되었습니다.

출처 및 참고 : https://www.youtube.com/watch?v=oenjvN0hHeE

저작권 문의가 있으시면 에서 알려주세요.

Droid CLI와 GLM-4.6, Sonnet 4.5, 그리고 GPT-5를 활용해 코드 생성 도구로서의 성능과 한계를 직접 경험해봄으로써 많은 분들이 궁금해하실만한 현실적인 사용 후기와 노하우를 정리해 봅니다. 최근 제법 많은 이들이 Droid라는 도구에 대해 이야기하고 있는데, 실제로 설치부터 주요 기능, 그리고 모델별 퍼포먼스까지 꼼꼼하게 테스트해 본 경험을 바탕으로 말씀드리겠습니다.

Droid CLI의 기본 설정 및 특징

Droid CLI는 오픈소스는 아니지만, CLI(커맨드라인 인터페이스) 툴 자체는 무료로 제공됩니다. 개인 API 키와 베이스 URL 등 다양한 환경을 직접 설정할 수 있다는 점이 돋보이며, 클로드 코드와 유사하게 다양한 모델을 연동하여 사용이 가능합니다. 가입만 하면 카드 정보 없이 프로 트라이얼을 바로 이용할 수 있고, Sonnet, GPT-5 등 대형모델의 경우 2천만 토큰을 무료로 사용하게 해준다는 점도 실질적인 이점 중 하나입니다.

특히, 에이전트 기반 퍼포먼스 강화를 내세우며 Sonnet을 Opus 수준으로 끌어올릴 수 있다는 점을 강조하는데, 실사용에서 이 주장에 대한 결과는 후속에서 다룹니다. 커스텀 API 적용이 자유롭고, MCP 지원에도 대응되어 기능적으로는 상당히 갖춰져 있다고 보입니다.

sub agent 및 IDE 연동 활용법

Droid에서는 sub agent 생성도 가능합니다. 클로드 코드의 서브 에이전트 기능과 유사한 흐름이며, 직접 커스텀 droid나 agent를 구축할 수 있습니다. 또한 IDE 연동 기능이 있어 코드 편집/확인 작업이 더욱 부드러워집니다. 작업 공간 인식 및 코드 블록 선택, 빠른 레퍼런스가 지원되고, markdown 기반 명세, 직접 프로바이더와 키 연결 지원 등 실무 환경에서의 외부 인프라 연계에 용이합니다.

Ninja Chat 등 AI 플랫폼 연동 및 실질 요금 정보

별도로 소개된 Ninja Chat 같은 플랫폼도 언급할 만합니다. 연 11달러로 GPT-4.0, Claude, Gemini 2.5 Pro 등 주요 모델들을 한 곳에서 사용할 수 있는 구성이 인상적이며, AI playground와 마인드맵 기능 등 추가적인 도구 활용법도 구체적으로 안내됩니다. 메시지, 이미지, 영상 등 월별 할당량이 명시되어 있어 효율적으로 자원관리도 가능합니다. Ninja Chat 사용시 할인 코드도 공개되었습니다.

모델 직접 사용 경험: Sonnet, GPT-5, Codeex 등 결과

설치 및 설정을 마치면 Droid CLI 상단에 브랜드명이 크게 표기되고, 하단의 프롬프트박스를 통해 모델 선택과 명령어 입력이 가능하게 됩니다. 모델 전환은 /model 명령어로 set high, GPT-5, codeex 등 빠르게 바꿀 수 있으며, 토큰 사용 현황이나 비용도 실시간으로 확인 가능합니다. 세팅 메뉴를 통해 reasoning effort, diff 모드, completion 벨, 클라우드 동기화, 커스텀 에이전트 등 세세한 옵션까지 조정할 수 있습니다.

Expo Movie Tracker 프로젝트 테스트

직접 만든 Expo 기반의 영화 트래커 앱에 대한 코드 요청을 해보았습니다. 코드 생성 프로세스는 클로드 코드와 상당히 유사하며, 단, 클로드 코드처럼 편집 승인 요청 과정은 Droid에서는 생략됩니다. 작업 결과는 Radix UI를 사용했으나 패키지 설치를 누락하여 에러가 발생했고, 추가 설치 후 렌더링에는 성공했으나 UI나 UX 면에서 큰 만족은 없었습니다. 캘린더 UI는 활용도 면에서 괜찮았지만, 세부적인 폰트 색상, 레이아웃 등 미세한 오류가 반복되어 일반적인 수준의 결과였습니다.

Go Tui 계산기, Godot FPS 게임 수정 결과

Go TUI 계산기 예제에서는 정상 동작하지 않아 실질적으로 클로드 코드, Kilo Code, Klein 등과 비교하여 아쉬운 결과가 나왔습니다. Godot 기반 FPS 게임의 step counter와 life bar 추가 요청에서도 step counter가 정상적으로 동작하지 않는 등 완성도 측면에서 부족했습니다. 소규모 작업뿐 아니라 대형 오픈소스 리포지터리 관련 질문에서도 기대 이하의 결과를 보여, Codeex 기반 GPT-5처럼 완성도가 높은 프로젝트를 생성하는 데에는 한계가 있었습니다.

GLM-4.6 연동 후 개선점

그렇다면 Sonnet 자체의 한계 때문은 아닐지 검증하기 위해 GLM-4.6 모델로 전환해 보았습니다. Droid의 설정 파일 경로에서 직접 GLM 코딩 플랜을 anthropic API에 연결하면 GLM4.6 모델 사용이 가능합니다. GLM4.6을 통한 코드 실험에서는 이전 Sonnet 대비 좀 더 유사하게 클로드 코드, Kilo Code에 근접한 품질의 결과물을 확인할 수 있었습니다.

Expo 앱 프롬프트에서는 라이트 테마의 깔끔한 UI와 캘린더 기능까지 포함해볼 수 있었고, Go TUI 계산기의 동작도 정상에 가까웠습니다. Godot FPS 예제에서도 life bar, step counter 기능이 요구조건대로 구현되었습니다. 반면, 오픈코드 리포지터리 관련 요청에서는 여전히 해결을 못해 모델 본연의 한계는 UI나 에이전트 레벨에서 완전히 극복되지는 않습니다. 전체적으로 "GLM-4.6"과 Droid CLI 조합은 Sonnet만 사용했을 때보다 분명 개선되었으나, 클로드 코드나 Kilo Code 등 경쟁 강자 대비 뚜렷한 우위는 아니라는 판단입니다.

기능과 실제 퍼포먼스, 그리고 실용적 한계

Droid CLI의 UI는 클로드 코드와 느낌이 흡사하면서도 처리 속도가 더 빠른 경우가 있었고, 복수의 툴 콜이 동시에 실행되는 듯해 효율감을 더합니다. 다만 핵심인 코드 생성 품질 면에서는 "마법 같은 혁신"을 느끼기 어렵습니다. 직관적인 설정 및 빠른 연동은 장점이나, 실제 콤플렉스한 프로젝트 완성도나 oneshot 생성능력, 에이전트 퍼포먼스 등은 여전히 경쟁 모델에 미치지 못하는 점을 직접 경험하였습니다.

회사 측의 "비밀 소스"나 "최상위 토퍼 에이전트"라는 홍보 문구와 실제 체감 간에는 분명한 차이가 존재했고, 별다른 신기술 도입이나 새로운 기능적 가치는 제한적임을 확인했습니다. 다양한 모델 연동, 커스텀 API 적용, 개별 에이전트 구성 등 실무에 활용 가능한 옵션은 많으나, 결국 결과물의 품질 자체가 중요할 수밖에 없습니다.

요약 및 실제 활용 팁

실제로 코드 생성 툴을 선택할 때, Droid CLI는 편리함이나 다양한 모델 실험에는 용이하겠지만, 주요 개발 작업이나 테스트 자동화, 대형 리포지터리 관리 등 본격적인 생산성 향상에는 여전히 Cloude Code, Kilo Code, 그리고 각종 오픈소스 코드 생성 도구들이 더 안정적이고 우수한 퍼포먼스를 보여준다는 실감입니다.

GLM-4.6과 Droid CLI의 조합을 통해 얻은 경험은 Sonnet 단독 사용 때보다 분명 개선되었으나, 높은 완성도를 기대한다면 대안 사용이 권장됩니다. 설정의 유연성이나 무료 토큰 정책, 자유로운 서브 에이전트 생성 등 다양한 실험과 조합은 충분히 의미있으니, 원하는 환경에 맞춰 기능을 활용해보는 것도 좋은 방법일 수 있습니다.

출처 및 참고 :