구글 제미나이 3 프로 출시. 차세대 AI의 등장

unnamed

구글이 드디어 새로운 판을 뒤집을 카드를 꺼내들었다. 2025년 11월 18일, 구글은 '가장 지능적인' AI 모델이라 자부하는 Gemini 3 Pro를 정식 출시했다. 단순히 정보를 찾아주는 수준을 넘어 스스로 사고하고, 계획을 세우고, 무언가를 만들어내는 진정한 의미의 '생각하는 AI'가 탄생한 것이다. 그렇다면 이전 세대인 2.5 Pro와 비교해 무엇이 달라졌을까? 지금부터 하나하나 파헤쳐보자.

벤치마크를 씹어먹은 추론 능력

Gemini 3 Pro의 가장 눈에 띄는 변화는 추론 성능의 폭발적 향상이다. LMArena 리더보드에서 1501점을 기록하며 이전 1위였던 2.5 Pro(1451점)를 제치고 정상을 차지했다. 박사 수준의 과학 질문에 답하는 GPQA Diamond 테스트에서는 91.9%를 달성했는데, 2.5 Pro의 86.4%와 비교하면 확연한 차이다. 특히 도구 없이 수학 문제를 푸는 AIME 2025 테스트에서는 95.0%를 기록했고, 코드 실행을 활용하면 완벽한 100% 정확도를 자랑한다. 사실 정확도를 측정하는 SimpleQA Verified에서는 72.1%를 기록해 클로드의 29%, GPT-5.1의 35%를 압도적으로 능가했다. 환각 현상이 크게 줄어들었다는 뜻이다.

Code_Generated_Image

비디오도 읽는다, 멀티모달의 진화

텍스트만 잘한다고 끝이 아니다. Gemini 3 Pro는 이미지와 비디오 이해 능력에서도 한 단계 도약했다. Video-MMMU 테스트에서 87.6%를 기록하며 빠른 동작이 포함된 영상도 프레임 단위로 정확하게 분석해낸다. 초당 1프레임 이상의 고속 비디오 분석이 가능하니 긴 영상도 맥락을 놓치지 않고 세밀하게 파악한다. UI 내비게이션 테스트인 ScreenSpot-Pro에서는 72.7%를 달성했는데, 이는 전용 모델인 Holo2(66.1%)보다 높고, 2.5 Pro(11.4%)와 비교하면 6배 이상 향상된 수치다. 이제 AI가 화면을 보고 '어디를 클릭해야 하는지' 정확히 파악한다는 얘기다.

Code_Generated_Image (1)

깊게 생각하는 Deep Think 모드

Gemini 3의 새로운 무기는 바로 Deep Think 모드다. 일반 Pro 모드보다 더 깊이 있게 사고하는 이 모드는 Humanity's Last Exam에서 41.0%, GPQA Diamond에서 93.8%를 기록했다. 일반 모드보다 3~6%p 높은 수준이다. 복잡한 문제일수록 차이가 더 벌어진다. 현재는 안전성 테스터에게만 제공되지만, 곧 AI Ultra 구독자에게도 제공될 예정이다. 진짜 어려운 문제를 풀 때 AI가 '잠깐 더 생각해볼게'라고 말하는 시대가 온 것이다.

Code_Generated_Image (2)

코딩도 척척, 에이전틱 능력의 폭발

개발자들에게 희소식이다. Gemini 3 Pro는 코딩 분야에서도 혁명을 일으켰다. Terminal-Bench 2.0에서 54.2%를 기록하며 터미널을 통한 자율적 도구 사용이 가능해졌고, WebDev Arena에서는 1487점을 기록하며 '바이브 코딩' 능력을 입증했다. 바이브 코딩이란 "예쁜 쇼핑몰 사이트 하나 만들어줘" 같은 자연어 설명만으로 완전한 인터랙티브 애플리케이션을 생성하는 능력을 말한다. SWE-Bench Verified에서도 70% 이상의 성과를 보이며 전체 코드베이스를 관리하고 다중 파일 리팩토링까지 해낸다. 이제 AI가 개발팀의 일원으로 참여하는 시대가 현실이 됐다.

Code_Generated_Image (3)

생성형 UI와 이미지 생성의 혁신

Gemini 3 Pro는 단순히 답변만 주지 않는다. 생성형 UI 기능을 통해 사용자 질문에 맞춤화된 동적 인터페이스를 만들어낸다. 질문에 답하는 대신 직접 탐색할 수 있는 도구를 구축해주는 방식이다. 이미지 생성 모델인 Nano Banana 2는 네이티브 2K 해상도와 4K 업샘플링을 지원하며, 텍스트 렌더링 품질이 획기적으로 개선됐다. 무엇보다 자기 수정 기능이 있어 원근감, 텍스트, 기하학적 오류를 스스로 감지하고 수정한다. 완성도 높은 이미지를 얻기까지 반복 작업이 줄어든다는 뜻이다.

달라진 가격과 사용 방식

성능이 좋아진 만큼 가격도 조금 올랐다. Gemini 3 Pro Preview API는 100만 토큰당 입력 2달러, 출력 12달러로 책정됐다. 2.5 Pro가 입력 1.25달러, 출력 10달러였던 것과 비교하면 프리미엄 가격이다. 하지만 향상된 추론 능력을 고려하면 충분히 납득 가능한 수준이다. Thinking 제어 방식도 달라졌다. 3 Pro는 새로운 thinkingLevel 파라미터를 사용하는데, "low"나 "high"로 설정할 수 있고 기본값은 "high"다. 2.5 Pro의 thinkingBudget 방식과는 다른 접근이다.

답변 스타일의 변화, 진짜 파트너가 되다

Gemini 3 Pro는 답변 방식 자체도 바뀌었다. 과도한 친절함이나 클리셰 대신 직접적이고 통찰력 있는 답변을 제공한다. "듣고 싶은 것"이 아니라 "알아야 할 것"을 전달하는 진정한 사고 파트너로 작동한다. 출시 첫날부터 Gemini 앱, AI Mode, Google AI Studio, Vertex AI에서 이용 가능하며, 처음으로 새 모델이 출시 당일 Google Search에서도 제공된다. AI Pro와 AI Ultra 구독자는 검색 내 AI Mode에서 "Thinking: 3 Pro reasoning and generative layouts"를 선택해 사용할 수 있다.

결론적으로 Gemini 3 Pro는 추론, 멀티모달 이해, 코딩, 생성형 UI 등 모든 측면에서 2.5 Pro를 크게 뛰어넘는 진화를 이뤘다. 단순한 업그레이드가 아니라 AI 모델의 새로운 시대를 여는 전환점이라 봐도 무방하다. 이제 AI는 정보를 찾아주는 도구를 넘어 함께 생각하고 만들어가는 동반자가 됐다.

구글 제미나이3 프로와 이전 버전의 차이점 정리