Gemini 2.0 Flash Thinking: Google's 가장 작은 모델이 Chatbot Arena에서 선두를 차지함

2025-01-23

구글의 실험적인 AI 모델 Gemini 2.0 Flash Thinking이 경쟁자들을 앞지르며 수학, 과학 및 일반 성능 테스트에서 인상적인 결과를 기록함.
테스트 플랫폼 lmarena.ai에 따르면, Gemini의 최신 버전은 2024년 12월 이후 점수가 17점 상승하며 OpenAI의 GPT-4o 모델과 Anthropic의 Claude 3.5 Sonnet을 앞서게 됨.
모델은 복잡한 작업, 프로그래밍 및 창의적 글쓰기 등 거의 모든 카테고리에서 개선을 보였으나, 출력 형식 제어에서는 여전히 개선이 필요함.
구글은 코드 실행, 최대 백만 토큰을 처리할 수 있는 확장된 문맥 창 등을 추가하고 모델의 사고 과정과 최종 응답의 일치도를 개선함.
Google DeepMind CEO Demis Hassabis는 이번 성과가 AlphaGo까지 거슬러 올라가는 AI 계획 시스템에서의 10년 이상의 경험에 기반하고 있다고 밝힘.
Gemini 2.0 Flash Thinking 모델은 AIME(수학) 73.3% 및 GPQA Diamond(과학) 74.2%의 점수를 기록하며 빠른 성과를 보임.
첫 번째 Flash 2.0 Thinking 버전은 2024년 12월에 출시되었으며, 명확한 사고 과정을 도입해 모델의 추론 능력을 개선함.

4the-decoder.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.