Gemini 2.0 Flash Thinking: Google's 가장 작은 모델이 Chatbot Arena에서 선두를 차지함
- 구글의 실험적인 AI 모델 Gemini 2.0 Flash Thinking이 경쟁자들을 앞지르며 수학, 과학 및 일반 성능 테스트에서 인상적인 결과를 기록함.
- 테스트 플랫폼 lmarena.ai에 따르면, Gemini의 최신 버전은 2024년 12월 이후 점수가 17점 상승하며 OpenAI의 GPT-4o 모델과 Anthropic의 Claude 3.5 Sonnet을 앞서게 됨.
- 모델은 복잡한 작업, 프로그래밍 및 창의적 글쓰기 등 거의 모든 카테고리에서 개선을 보였으나, 출력 형식 제어에서는 여전히 개선이 필요함.
- 구글은 코드 실행, 최대 백만 토큰을 처리할 수 있는 확장된 문맥 창 등을 추가하고 모델의 사고 과정과 최종 응답의 일치도를 개선함.
- Google DeepMind CEO Demis Hassabis는 이번 성과가 AlphaGo까지 거슬러 올라가는 AI 계획 시스템에서의 10년 이상의 경험에 기반하고 있다고 밝힘.
- Gemini 2.0 Flash Thinking 모델은 AIME(수학) 73.3% 및 GPQA Diamond(과학) 74.2%의 점수를 기록하며 빠른 성과를 보임.
- 첫 번째 Flash 2.0 Thinking 버전은 2024년 12월에 출시되었으며, 명확한 사고 과정을 도입해 모델의 추론 능력을 개선함.
4the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.