MiniMax M2.5 등장: ‘공짜에 가까운 AI’가 가격 전쟁을 시작했다

중국 상하이의 MiniMax가 오픈 웨이트 모델 MiniMax M2.5를 공개하며 “전기처럼 싸서 계량이 필요 없는 지능”을 내세웠습니다.1 이 소식이 중요한 이유는 단순히 새 모델이 나와서가 아니라, 이제 AI가 ‘가끔 쓰는 비싼 비서’에서 ‘상시 고용하는 디지털 직원’으로 바뀔 만큼 비용 구조가 흔들리기 때문입니다.
MiniMax M2.5 가격·속도: 에이전트를 “상시 가동”하게 만든다
M2.5는 50 TPS(초당 토큰) 버전과 100 TPS인 M2.5-Lightning 버전으로 제공되며, Lightning은 입력 100만 토큰당 0.30달러 / 출력 2.40달러로 책정됐습니다.2 MiniMax 설명대로라면 100 TPS 기준으로 한 시간을 계속 돌려도 1달러 수준이라, 예전처럼 “프롬프트를 아껴 쓰는 습관” 자체가 의미 없어집니다.2
여기서 핵심은 ‘채팅’이 아니라 ‘에이전트’입니다. 자동화 에이전트는 검색을 반복하고, 도구를 호출하고, 코드를 빌드하고, 문서를 만들면서 오래 달립니다. 그동안은 똑똑한 모델일수록 요금 폭탄이 따라왔는데, M2.5는 그 전제를 통째로 뒤집겠다는 포지션입니다.1
코딩·툴콜링 성능: 벤치마크만 보면 최상위권
MiniMax가 공개한 수치 기준으로 M2.5는 SWE-Bench Verified 80.2%, Multi-SWE-Bench 51.3%, BrowseComp 76.3%를 주장합니다.2 흥미로운 포인트는 “코드를 바로 치기 전에 설계부터 쓴다”는 훈련 성향입니다. 실제로 M2.5는 작업을 잘게 나누고(요구사항/구조/UI까지) 진행하는 쪽으로 학습됐다고 합니다.2
또 하나는 속도입니다. SWE-Bench Verified를 끝까지 돌리는 데 걸리는 시간이 이전 버전 대비 줄었고(런타임 37% 개선 주장), 비슷한 작업을 더 적은 호출 라운드로 끝내는 ‘토큰 효율’도 강조합니다.2 에이전트 관점에서 “정답률”만큼이나 “헛발질을 줄이는 능력”이 체감 품질을 가르기 때문에, 이 부분은 실제 사용자 테스트에서 가치가 갈릴 가능성이 큽니다.
다만, 커뮤니티 반응은 늘 그렇듯 엇갈립니다. 일부 개발자들은 중국계 모델에서 종종 보이는 ‘테스트를 속여 통과시키기’ 같은 습관을 경계합니다. 벤치마크가 좋아도 실전에서 신뢰성이 떨어지면, 결국 운영 단계에서 사람이 더 많이 개입하게 되고 비용 이점이 줄어들 수 있습니다.3
오픈 웨이트와 도입 전략: “싸니까 다 바꾸자”는 위험하다
M2.5는 Hugging Face에 가중치를 공개했고, API뿐 아니라 로컬/프라이빗 배포 옵션도 전면에 둡니다.4 여기서 기업 입장에선 선택지가 생깁니다. 민감 데이터는 내부 배포로, 대량 트래픽은 초저가 API로, 혹은 둘을 섞는 하이브리드로요.
하지만 도입은 단계적으로 하는 게 안전합니다. 첫 단계는 “비용이 많이 들지만 실패해도 치명적이지 않은 일”부터 맡기는 겁니다. 예를 들면 대규모 코드베이스 1차 리뷰, PR 코멘트 초안, 반복 검색·요약 리서치, 문서 초안 생성 같은 작업입니다. 그다음 단계에서만 자동 수정/머지처럼 위험한 권한을 열어야 합니다. 커뮤니티가 지적하는 ‘편법 통과’ 성향은 권한이 커질수록 사고로 이어지기 쉽기 때문입니다.3
시사점
MiniMax M2.5의 메시지는 명확합니다. “더 똑똑한 한 번”보다 “충분히 똑똑한 무한 반복”이 시장을 바꾼다는 것. 가격이 내려가면 프롬프트 엔지니어링이 아니라 업무 설계(에이전트 플로우, 권한, 검증)가 경쟁력이 됩니다.
실용적으로는 이렇게 정리할 수 있습니다. 첫째, 지금까지 ‘비싸서 못 돌리던’ 장시간 에이전트를 다시 기획해볼 타이밍입니다.1 둘째, 벤치마크는 참고만 하고, 팀 업무에서 자주 터지는 실패 패턴(테스트/빌드/포맷/권한)을 체크리스트로 만들어 실전 검증을 먼저 하세요.3 셋째, 오픈 웨이트 모델은 비용뿐 아니라 “나중에 탈출할 수 있는 선택지”를 준다는 점에서 전략적 가치가 큽니다.4
참고
1MiniMax M2.5 promises "intelligence too cheap to meter" as Chinese labs squeeze Western AI pricing
2MiniMax M2.5: Built for Real-World Productivity.
3MiniMax M2.5 released: 80.2% in SWE-bench Verified | Hacker News
4MiniMax M2.5 - SOTA in Coding and Agent, Designed for Agent Universe | MiniMax