생성형 AI 도구를 활용하여 작성 및 편집된 노트입니다.
Claude Sonnet 4.6 공개: 코딩·에이전트 성능을 ‘기본값’으로 만든 이유

Anthropic이 2월 중순 Claude Sonnet 4.6을 공개하면서, 이제 많은 사용자는 별도 설정 없이도 “최신 Sonnet”을 기본 모델로 쓰게 됐습니다.1 이 업데이트가 중요한 이유는 단순한 성능 향상이 아니라, 코딩·업무 자동화(에이전트)·대용량 문맥 처리 같은 “돈 되는 작업”이 중간급 모델 가격대로 내려왔기 때문입니다.2
Claude Sonnet 4.6이 뭐가 달라졌나: ‘중간급’의 재정의
Sonnet 라인은 원래 Opus(최상위)와 Haiku(경량) 사이의 균형형 포지션인데, 4.6은 그 균형추를 “거의 Opus급인데 비용은 Sonnet” 쪽으로 확 밀었습니다. 실제로 Sonnet 4.6은 코딩, 컴퓨터 사용, 지식노동, 디자인 등 전반 능력을 올렸고, “예전엔 Opus를 꺼내야 했던 수준의 사무 작업”을 Sonnet에서 처리할 수 있다고 강조합니다.3
특히 눈에 띄는 건 1M 토큰 컨텍스트(베타)입니다.4 이게 체감되는 순간은 거창한 연구가 아니라, 현실의 “지저분한 일감”에서 나옵니다. 예를 들어 레거시 저장소의 폴더 구조, 사내 위키, 요구사항 문서, 이전 이슈 토론까지 한 번에 들고 와서 흐름을 끊지 않고 판단하게 만드는 식이죠.
코딩이 빨라진 게 아니라, ‘검색과 지시 따르기’가 좋아졌다
이번 버전의 핵심은 “코드를 더 잘 짠다”보다 “코딩 업무를 더 잘 끝낸다”에 가깝습니다. GitHub Copilot에서도 Sonnet 4.6을 모델 선택지로 제공하기 시작했는데, 초기 테스트에서 에이전트형 코딩에 강하고 특히 검색 작업에서 성과가 좋다고 언급합니다.5
개발 현장에서 진짜 시간을 잡아먹는 건 ‘작성’보다 ‘찾기’입니다. 어디서 설정이 바뀌는지, 비슷한 유틸이 이미 있는지, 동일 버그가 과거에 어떻게 해결됐는지. Sonnet 4.6이 큰 코드베이스 탐색과 지시 준수에 더 안정적으로 반응한다는 평은, “PR 하나를 통째로 맡기는” 흐름을 더 쉽게 만든다는 뜻입니다.2
컴퓨터 사용(브라우저·UI 조작) 능력: 자동화의 마지막 1m
기업 자동화가 막히는 지점은 의외로 단순합니다. API가 없거나, 있어도 권한/감사/보안 이슈로 못 붙이는 시스템이 너무 많죠. 그래서 모델이 화면을 보고 클릭·입력으로 일을 처리하는 ‘컴퓨터 사용’ 능력이 중요해지는데, Microsoft 쪽 설명에 따르면 Sonnet 4.6은 OSWorld Verified에서 72.5%를 기록하며 클릭 정확도 같은 정밀도가 개선됐다고 합니다.4
이 능력은 “멋진 데모”를 넘어 QA와 운영 업무에 바로 연결됩니다. 예를 들어 릴리즈 후 주요 화면을 돌아다니며 폼 검증을 하고, 어드민에서 설정 값을 확인하고, 로그인을 포함한 일련의 체크리스트를 수행하는 작업은 사람 손이 많이 가는데, 여기서 UI 자동화 에이전트가 힘을 씁니다.
가격과 배포: 기본 모델이 된 순간부터 판이 바뀐다
Sonnet 4.6은 Claude 챗봇에서 무료 사용자와 Pro 사용자 기본값으로 들어갔습니다.3 “써보고 좋으면 갈아타세요”가 아니라, 어느 날 접속했더니 이미 바뀐 겁니다. 이 방식은 사용자가 느끼는 변화 폭을 키우고, 팀 단위 도입도 빨라집니다. Microsoft Foundry에서도 Sonnet 4.6을 전면에 내세우며, 대규모 업무에 맞춘 ‘거의 Opus급’ 성능을 더 낮은 비용으로 제공하는 모델이라고 포지셔닝합니다.4
엔터프라이즈 관점에서 중요한 건 ‘최고 성능’이 아니라 ‘토큰 예산 내에서의 최고 성능’입니다. VentureBeat는 Sonnet 4.6의 API 가격이 입력/출력 기준 100만 토큰당 $3/$15로 유지된다고 짚었고2, 이 가격대에서 에이전트가 하루 수백만~수천만 토큰을 태울 때 선택지가 달라집니다. 모델이 조금 똑똑해진 것보다, “똑똑한 모델을 마음 놓고 오래 돌릴 수 있게 된 것”이 더 큰 사건이죠.
시사점
Sonnet 4.6은 코딩 모델 경쟁의 초점을 “정답률”에서 “업무 완주율”로 옮깁니다. 큰 문맥을 들고 검색하며, 지시를 덜 놓치고, 필요하면 화면까지 조작하는 방향이기 때문입니다.
실무에서의 추천은 단순합니다. 코드베이스 탐색이 많은 리팩터링/버그픽스, 문서·스프레드시트·보고서처럼 편집 라운드가 긴 지식노동, 그리고 API 없이 브라우저로 처리하는 운영 자동화에 먼저 붙여보세요. ‘비용 때문에 Sonnet, 성능 때문에 Opus’였던 기준선이 흔들리는 만큼, 지금은 파일럿으로 워크플로우를 다시 측정해볼 타이밍입니다.12
참고
1Introducing Claude Sonnet 4.6
3Anthropic releases Claude Sonnet 4.6, continuing breakneck pace of AI model releases
4Claude Sonnet 4.6 in Microsoft Foundry-Frontier Performance for Scale
5Claude Sonnet 4.6 is now generally available in GitHub Copilot