생성형 AI 도구를 활용하여 작성 및 편집된 노트입니다.
Anthropic Sonnet 4.6 출시: 1M 컨텍스트로 ‘가성비 에이전트’ 시대 열리나

Anthropic이 2026년 2월 17일, 중간급 모델인 Claude Sonnet 4.6을 공개했습니다.1 이번 업데이트가 흥미로운 이유는 “더 똑똑해졌다”보다 “더 많이, 더 싸게 일을 시킬 수 있게 됐다”에 가깝기 때문입니다. 1백만 토큰 컨텍스트(베타), 코딩·지시 이행·컴퓨터 사용 능력 강화가 핵심이고, 무료/Pro 기본 모델로 바뀌면서 체감도도 크게 올라갈 전망입니다.1
Anthropic Sonnet 4.6 핵심 변화: 1M 토큰 컨텍스트가 의미하는 것
Sonnet 4.6의 가장 눈에 띄는 포인트는 1M 토큰 컨텍스트 윈도우(베타)입니다.1 쉽게 말해 “대화창 메모리”가 엄청 커졌다는 뜻인데, 이게 왜 중요하냐면 AI를 ‘대답 머신’이 아니라 ‘작업자’로 쓸 때 병목이 주로 여기서 터지기 때문입니다.
예를 들어 대형 코드베이스를 붙여놓고 “이 버그의 원인이 되는 흐름을 찾아서 최소 수정으로 고쳐줘” 같은 요청은, 예전엔 파일을 쪼개 넣느라 사람이 중간 정리 역할을 해야 했습니다. 이제는 통째로 넣고 한 번에 설계·수정·검증 루프를 돌릴 가능성이 커졌습니다. 계약서 검토나 논문 더미 요약도 마찬가지고요.1
물론 “컨텍스트가 크다 = 무조건 정확하다”는 아닙니다. 하지만 업무 흐름에서 중요한 건 정답률만큼이나 “맥락 손실 없이 오래 달릴 수 있느냐”인데, 1M 컨텍스트는 그 지점을 정면으로 건드립니다.
Sonnet 4.6 가격과 성능: ‘Opus급을 Sonnet값에’가 왜 센가
Sonnet 4.6은 가격이 그대로 유지됐다고 알려졌습니다(입력 100만 토큰당 3달러, 출력 15달러).2 여기서 재미있는 장면이 나옵니다. Opus 라인은 이보다 5배 비싼 가격대인데, Sonnet 4.6이 여러 실사용형 평가에서 Opus 4.6과 거의 비슷한 성적을 냈다는 점이 강조됩니다.2
기업이 에이전트를 굴리기 시작하면 비용은 “한 번 호출”이 아니라 “하루 수만~수백만 번 호출”로 계산됩니다. 그러면 모델 선택은 취향이 아니라 회계가 됩니다. Sonnet 4.6이 성능 격차를 좁히면서도 단가를 유지했다는 건, 많은 팀이 ‘고급 모델은 꼭 필요할 때만’ 쓰고 평소엔 Sonnet으로 표준화할 명분이 생겼다는 뜻입니다.
즉, 이번 출시를 한 문장으로 요약하면 “똑똑한 모델의 대중화”가 아니라 “똑똑한 모델 운영비의 하향 평준화”에 가깝습니다.
컴퓨터 사용(Computer Use)과 안전: 에이전트 실전 투입의 조건
Sonnet 4.6에서 또 하나 반복해서 등장하는 키워드는 컴퓨터 사용 능력입니다. 실제 UI를 클릭하고 입력하며 웹·앱을 다루는 ‘에이전트’의 손발이 더 좋아졌다는 이야기죠. 관련 벤치마크로 OSWorld, SWE-Bench 같은 기록도 언급됩니다.1
여기서 중요한 건 “브라우저 자동화가 된다” 수준이 아니라, API가 없는 레거시 업무를 AI가 건드릴 수 있다는 점입니다. 회사 안에는 여전히 ‘사람이 화면에서 직접 처리해야만 하는 일’이 많습니다. 만약 모델이 화면을 보고 실수에서 스스로 되돌아오며, 여러 탭과 문서를 오가며 작업을 끝까지 마무리한다면, 자동화의 범위가 갑자기 넓어집니다.
다만 이 능력이 강해질수록 안전 문제가 커집니다. 특히 웹을 돌아다니며 작업할 때는 악성 지시가 섞인 페이지로 에이전트를 낚아채는 프롬프트 인젝션 위험이 자주 언급됩니다. Sonnet 4.6은 이 저항성이 이전 버전 대비 개선됐다는 평가도 함께 나옵니다.2 실무에서는 “성능”과 “안전한 실패 방식(권한, 결제, 삭제 같은 위험 행동 억제)”을 같이 설계해야 합니다.
시사점: 누가 Sonnet 4.6을 먼저 써야 할까?
Sonnet 4.6은 무료/Pro 기본 모델이 됐기 때문에, 대부분은 ‘별 일 안 해도’ 곧바로 혜택을 봅니다.1 특히 추천 타깃은 세 부류입니다.
첫째, 코드 수정·리팩터링·테스트 생성처럼 반복 호출이 많은 팀입니다. 모델 단가가 곧 운영비라서 체감이 큽니다.2
둘째, 문서가 큰 조직(법무, 영업, 리서치)입니다. 1M 컨텍스트는 “자료를 넣는 방식” 자체를 바꿉니다.1
셋째, 에이전트를 진짜로 굴리려는 팀입니다. 컴퓨터 사용 능력의 성숙은 ‘데모’와 ‘업무 투입’ 사이의 거리를 줄입니다.2
실용 팁으로 마무리하자면, Sonnet 4.6을 도입할 때는 “모델이 똑똑한가?”보다 “업무 흐름에서 토큰을 어디서 가장 많이 쓰는가?”, “긴 컨텍스트가 필요한 병목이 어디인가?”, “에이전트 권한을 어떻게 최소화할 것인가?”를 먼저 체크하는 편이 ROI가 빠릅니다. 이번 업데이트는 성능 경쟁의 한 페이지이기도 하지만, 동시에 ‘에이전트를 대량 운영하는 시대의 계산법’을 바꾼 사건에 더 가깝습니다.2