Claude Sonet 4.5와 GLM 4.6, GPT-5 Codeex의 실전 비교: 실제 코드 생성 경험담

최근 공개된 Claude Sonet 4.5, GLM 4.6, 그리고 GPT-5 Codeex를 직접 코드 생성 실험에 활용하며 얻은 구체적인 경험담과 평가를 중심으로 비교 분석합니다. 2025년 기준 변화된 모델 간 경쟁 구도, 실질적인 가격 정책, 각 모델 별 실전 성능, 그리고 실제 프로젝트 진행 시 체감한 장단점을 상세히 기록합니다.

Claude의 시대가 끝났는가? 실전 테스트를 통한 세 모델 현황

2025년 AI 모델 시장에서 Claude Sonet 4.5의 위상이 변화하고 있습니다. GLM 4.6은 Sonet 4.5보다 하루 늦게 공개됐으며, 공격적으로 기능 개선과 가격 인하로 시장에 임하고 있습니다. GPT-5 Codeex 역시 코드 생성 분야에서 강한 존재감을 보이고 있습니다. 실제 비교 결과에 따라, 이제는 Claude가 더이상 왕좌를 확실히 지키고 있다고 보기 어렵다는 판단도 나오고 있습니다.

각 모델의 세부 구축 사례와 작업 과정, 그리고 성능 차이를 하나하나 살펴보겠습니다.

쉬운 작업 테스트: 사진작가 포트폴리오 웹사이트 제작

첫 번째 실전 비교는 "사진작가 포트폴리오 웹사이트"를 HTML/CSS/JavaScript 기반으로 구현하는 작업이었습니다.

Claude Sonet 4.5

완성까지 소요 시간: 2분 미만
비용: 15
특징: Unsplash 이미지 활용, 세련된 배경 및 버튼, 빠른 작업 속도
유사한 디자인 반복되는 경향

GLM 4.6

완성까지 소요 시간: 2분 30초
비용: Claude와 동일(비교 기준은 오픈코드와 GLM 간 차이 있음)
특징: 라이트/다크 모드 토글, 'About Me' 및 연락처 페이지 추가
버튼 미구현 등 아쉬움, 실용적 추가 기능 탑재

GPT-5 Codeex

완성까지 소요 시간: 가장 오래(구체적 시간 미기록)
비용: 가장 많음
특징: 포트폴리오 사이트의 명칭 및 작가명 자동 생성
각기 다른 이미지 길이와 카드형 디자인, 차별화된 시각적 완성도
이 작업에서는 GPT-5가 디자인 측면에서 최고 결과물 도출

중간 난이도 테스트: Hacker News 프로젝트 업그레이드

Hacker News 클론에 무한 스크롤, 캐싱, 실시간 댓글, 고급 검색을 추가하는 작업을 진행했습니다.

GPT-5 Codeex

작업 시간: 약 20분 / 15만 토큰 이상 사용
완성도: 깔끔한 디자인, 실시간 댓글 기능 정상 동작
문제점: 초기 스토리 로딩 오류 → 모델에게 직접 수정 요청해 해결
검색 기능 일부 불완전, 전체적으로 대체로 준수한 결과

GLM 4.6

작업 시간: 9분 남짓 / GPT-5의 절반 토큰 소모
완성도: 타산스택 최신 버전 반영, 스켈레톤 로딩, 댓글/답글 기능 구현
고급 검색 실시간 드롭다운, 빠른 응답 및 효율적인 코드 생성
디자인/기능 거의 완벽, 이 라운드의 우승

Claude Sonet 4.5

작업 시간: 4분대 / 가장 적은 토큰 소모
디자인: 아쉬운 점 많음
기능: 무한 스크롤, 댓글, 투표, 검색 등 기본 기능 구현
이전 버전 Sonet 4 대비 완성도가 낮아지는 현상 존재

이 중 GLM 4.6의 가격 효율성과 빠른 작업 속도가 돋보였습니다.

고난이도 테스트: 마인크래프트 유사 1인칭 게임 개발

마지막 실험은 1인칭 게임을 웹 기반으로 제작하는 매우 난도 높은 프로젝트입니다.

GLM 4.6

작업 시간: 3분 50초
창의적 옵션(적, 아이템, 체력, 중력 등) 자유롭게 추가
시각적 완성도는 높으나, 버그 및 게임 플레이 불안정 (반복되는 Game Over, 낙하 등)
직접 오류 수정 지시 후 부분 개선, 여전히 불안정성 존재

GPT-5 Codeex

작업 시간: 11분 이상 / 8만6천 토큰
UI: 'Click to enter the wild' 명령창, 콘솔 오류 → 자체 수정
게임 플레이: 방향키 뒤바뀜, 적도 존재하지만 상호작용 미흡
전체적으로 GLM 버전보다 플레이어 입장에서 더 즐길 수 있음

Claude Sonet 4.5

작업 시간: 1분46초 / 가장 적은 토큰
초기 화면에서 아무것도 실행되지 않는 오류
재배포 후 프레임레이트 극심하게 낮아서 아예 플레이 불가

가격과 실제 활용성: 2025년 최신 기준

GLM 4.6은 연간 $36, 사용 한도(쿼터)도 Claude Pro 대비 월등합니다. 단, 싱가포르 데이터 서버를 사용하는 점을 주목할 필요가 있습니다. Sonet 4.5는 속도가 매우 빠르고, 토큰 소모가 확실히 적은 장점이 있으나, 항상 최고 품질을 내지는 못했습니다. GPT-5 Codeex는 디자인·창의력 측면에서 최상위이지만 작업 속도와 비용 면에서 부담이 큽니다.

실제 프로젝트 경험상 얻은 조언과 참고 사항

프로젝트를 직접 진행해보니, GLM 4.6은 가격과 작업 속도 측면에서 누구나 한번쯤 써볼 만합니다. 다만, 데이터 센터가 싱가포르라는 점은 민감하게 받아들일 수 있습니다. 디자인에 강점을 두고 싶다면 GPT-5 Codeex가 유리합니다. Claude Sonet 4.5는 빠르게 결과물을 받아보고 싶을 때 적합하나, 복잡한 요구사항엔 한계가 있었습니다.

모델별 코드 제출 후 직접 오류나 버그를 설명해 수정 명령을 내릴 수 있었던 점이 사용 경험에서 유익했습니다.
각자가 만드는 코드의 스타일, 효율, 유지보수 측면에서 모두 차이가 존재했고, 특히 최신 버전 업데이트에 따라 성능 편차가 감지되고 있습니다.

결론: "이젠 Claude 혼자 독주하는 시대는 아니다"

2025년 현재, Claude Sonet 4.5의 빠른 처리와 가격 경쟁력은 여전히 유효하지만, GLM 4.6과 GPT-5 Codeex가 각각 가격과 창의력의 영역에서 강점을 드러내며 치열한 경쟁 구도가 펼쳐지고 있습니다. 실제 코드를 직접 생성하고 실험해본 경험을 바탕으로, 이제는 단일 모델에만 의존하기보다는 요구 작업 내용과 예산에 따라 최적의 선택을 고민할 수 있는 시대가 열리고 있음을 체감합니다.

각 모델의 실제 구현 방법과 장단점, 그리고 오류 수정 가능성까지 구체적으로 경험하며 얻은 인사이트를 기록합니다. 사용자는 본인의 프로젝트 특성에 따라 모델의 응답 속도, 완성도, 가격, 데이터 위치 등을 꼭 체크해 보는 것이 바람직합니다.

출처 및 참고 :

Claude Sonet 4.5와 GLM 4.6, GPT-5 Codeex의 실전 비교: 실제 코드 생성 경험담과 최신 가격·성능·문제점 상세 분석

Claude의 시대가 끝났는가? 실전 테스트를 통한 세 모델 현황

쉬운 작업 테스트: 사진작가 포트폴리오 웹사이트 제작

Claude Sonet 4.5

GLM 4.6

GPT-5 Codeex

중간 난이도 테스트: Hacker News 프로젝트 업그레이드

GPT-5 Codeex

GLM 4.6

Claude Sonet 4.5

고난이도 테스트: 마인크래프트 유사 1인칭 게임 개발

GLM 4.6

GPT-5 Codeex

Claude Sonet 4.5

가격과 실제 활용성: 2025년 최신 기준

실제 프로젝트 경험상 얻은 조언과 참고 사항

결론: "이젠 Claude 혼자 독주하는 시대는 아니다"