Claude Sonnet 4.6 공개: 코딩·에이전트 성능을 ‘기본값’으로 만든 이유

Anthropic이 2월 중순 Claude Sonnet 4.6을 공개하면서, 이제 많은 사용자는 별도 설정 없이도 “최신 Sonnet”을 기본 모델로 쓰게 됐습니다.¹ 이 업데이트가 중요한 이유는 단순한 성능 향상이 아니라, 코딩·업무 자동화(에이전트)·대용량 문맥 처리 같은 “돈 되는 작업”이 중간급 모델 가격대로 내려왔기 때문입니다.²

Claude Sonnet 4.6이 뭐가 달라졌나: ‘중간급’의 재정의

Sonnet 라인은 원래 Opus(최상위)와 Haiku(경량) 사이의 균형형 포지션인데, 4.6은 그 균형추를 “거의 Opus급인데 비용은 Sonnet” 쪽으로 확 밀었습니다. 실제로 Sonnet 4.6은 코딩, 컴퓨터 사용, 지식노동, 디자인 등 전반 능력을 올렸고, “예전엔 Opus를 꺼내야 했던 수준의 사무 작업”을 Sonnet에서 처리할 수 있다고 강조합니다.³

특히 눈에 띄는 건 1M 토큰 컨텍스트(베타)입니다.⁴ 이게 체감되는 순간은 거창한 연구가 아니라, 현실의 “지저분한 일감”에서 나옵니다. 예를 들어 레거시 저장소의 폴더 구조, 사내 위키, 요구사항 문서, 이전 이슈 토론까지 한 번에 들고 와서 흐름을 끊지 않고 판단하게 만드는 식이죠.

코딩이 빨라진 게 아니라, ‘검색과 지시 따르기’가 좋아졌다

이번 버전의 핵심은 “코드를 더 잘 짠다”보다 “코딩 업무를 더 잘 끝낸다”에 가깝습니다. GitHub Copilot에서도 Sonnet 4.6을 모델 선택지로 제공하기 시작했는데, 초기 테스트에서 에이전트형 코딩에 강하고 특히 검색 작업에서 성과가 좋다고 언급합니다.⁵

개발 현장에서 진짜 시간을 잡아먹는 건 ‘작성’보다 ‘찾기’입니다. 어디서 설정이 바뀌는지, 비슷한 유틸이 이미 있는지, 동일 버그가 과거에 어떻게 해결됐는지. Sonnet 4.6이 큰 코드베이스 탐색과 지시 준수에 더 안정적으로 반응한다는 평은, “PR 하나를 통째로 맡기는” 흐름을 더 쉽게 만든다는 뜻입니다.²

컴퓨터 사용(브라우저·UI 조작) 능력: 자동화의 마지막 1m

기업 자동화가 막히는 지점은 의외로 단순합니다. API가 없거나, 있어도 권한/감사/보안 이슈로 못 붙이는 시스템이 너무 많죠. 그래서 모델이 화면을 보고 클릭·입력으로 일을 처리하는 ‘컴퓨터 사용’ 능력이 중요해지는데, Microsoft 쪽 설명에 따르면 Sonnet 4.6은 OSWorld Verified에서 72.5%를 기록하며 클릭 정확도 같은 정밀도가 개선됐다고 합니다.⁴

이 능력은 “멋진 데모”를 넘어 QA와 운영 업무에 바로 연결됩니다. 예를 들어 릴리즈 후 주요 화면을 돌아다니며 폼 검증을 하고, 어드민에서 설정 값을 확인하고, 로그인을 포함한 일련의 체크리스트를 수행하는 작업은 사람 손이 많이 가는데, 여기서 UI 자동화 에이전트가 힘을 씁니다.

가격과 배포: 기본 모델이 된 순간부터 판이 바뀐다

Sonnet 4.6은 Claude 챗봇에서 무료 사용자와 Pro 사용자 기본값으로 들어갔습니다.³ “써보고 좋으면 갈아타세요”가 아니라, 어느 날 접속했더니 이미 바뀐 겁니다. 이 방식은 사용자가 느끼는 변화 폭을 키우고, 팀 단위 도입도 빨라집니다. Microsoft Foundry에서도 Sonnet 4.6을 전면에 내세우며, 대규모 업무에 맞춘 ‘거의 Opus급’ 성능을 더 낮은 비용으로 제공하는 모델이라고 포지셔닝합니다.⁴

엔터프라이즈 관점에서 중요한 건 ‘최고 성능’이 아니라 ‘토큰 예산 내에서의 최고 성능’입니다. VentureBeat는 Sonnet 4.6의 API 가격이 입력/출력 기준 100만 토큰당 $3/$15로 유지된다고 짚었고², 이 가격대에서 에이전트가 하루 수백만~수천만 토큰을 태울 때 선택지가 달라집니다. 모델이 조금 똑똑해진 것보다, “똑똑한 모델을 마음 놓고 오래 돌릴 수 있게 된 것”이 더 큰 사건이죠.

시사점

Sonnet 4.6은 코딩 모델 경쟁의 초점을 “정답률”에서 “업무 완주율”로 옮깁니다. 큰 문맥을 들고 검색하며, 지시를 덜 놓치고, 필요하면 화면까지 조작하는 방향이기 때문입니다.

실무에서의 추천은 단순합니다. 코드베이스 탐색이 많은 리팩터링/버그픽스, 문서·스프레드시트·보고서처럼 편집 라운드가 긴 지식노동, 그리고 API 없이 브라우저로 처리하는 운영 자동화에 먼저 붙여보세요. ‘비용 때문에 Sonnet, 성능 때문에 Opus’였던 기준선이 흔들리는 만큼, 지금은 파일럿으로 워크플로우를 다시 측정해볼 타이밍입니다.¹²

참고

¹Introducing Claude Sonnet 4.6

²Anthropic's Sonnet 4.6 matches flagship AI performance at one-fifth the cost, accelerating enterprise adoption

³Anthropic releases Claude Sonnet 4.6, continuing breakneck pace of AI model releases

⁴Claude Sonnet 4.6 in Microsoft Foundry-Frontier Performance for Scale

⁵Claude Sonnet 4.6 is now generally available in GitHub Copilot