OpenAI O3 돌파구 높은 점수 ARC-AGI-PUB

2024-12-21

OpenAI의 새로운 o3 시스템이 ARC-AGI-1 Public Training 세트에서 75.7% 점수를 기록하였고, 고연산 구성에서는 87.5% 점수를 기록함.
이는 AI의 새로운 능력과 GPT 계열 모델의 한계를 넘어선 것으로 평가됨.
ARC Prize는 2025년에 ARC-AGI-2를 출범할 예정이며, 고효율이고 오픈소스 솔루션을 목표로 함.
o3 모델은 새로운 아이디어를 통해 기존 GPT 시리즈와는 다른 방식으로 작업을 수행함.
테스트 결과, o3는 두 가지 ARC-AGI 데이터셋에서 전례 없는 성능을 보임.
- Semi-Private 평가: 고효율 설정에서 75.7%, 저효율 설정에서 87.5%
- Public 평가: 고효율 설정에서 82.8%, 저효율 설정에서 91.5%
그러나 인간과 비교하면 여전히 비용이 비싸며, ARC-AGI-2에서 30% 이하로 점수가 떨어질 가능성이 있음.
o3의 작동 원리는 자연어 프로그램 검색 및 실행으로, 이는 테스트 시 점진적으로 프로그램을 생성하고 실행하는 과정이 포함됨.
OpenAI는 향후 연구 커뮤니티와 협력하여 o3의 장단점을 분석하고, 추후 성능 확장을 위한 방향성을 모색할 계획.
이를 위해 커뮤니티의 참여를 독려하며, 해결되지 않은 작업에 대한 공동 분석을 요청함.

5arcprize.org링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.