OpenAI O3 돌파구 높은 점수 ARC-AGI-PUB
- OpenAI의 새로운 o3 시스템이 ARC-AGI-1 Public Training 세트에서 75.7% 점수를 기록하였고, 고연산 구성에서는 87.5% 점수를 기록함.
- 이는 AI의 새로운 능력과 GPT 계열 모델의 한계를 넘어선 것으로 평가됨.
- ARC Prize는 2025년에 ARC-AGI-2를 출범할 예정이며, 고효율이고 오픈소스 솔루션을 목표로 함.
- o3 모델은 새로운 아이디어를 통해 기존 GPT 시리즈와는 다른 방식으로 작업을 수행함.
- 테스트 결과, o3는 두 가지 ARC-AGI 데이터셋에서 전례 없는 성능을 보임.
- Semi-Private 평가: 고효율 설정에서 75.7%, 저효율 설정에서 87.5%
- Public 평가: 고효율 설정에서 82.8%, 저효율 설정에서 91.5%
- 그러나 인간과 비교하면 여전히 비용이 비싸며, ARC-AGI-2에서 30% 이하로 점수가 떨어질 가능성이 있음.
- o3의 작동 원리는 자연어 프로그램 검색 및 실행으로, 이는 테스트 시 점진적으로 프로그램을 생성하고 실행하는 과정이 포함됨.
- OpenAI는 향후 연구 커뮤니티와 협력하여 o3의 장단점을 분석하고, 추후 성능 확장을 위한 방향성을 모색할 계획.
- 이를 위해 커뮤니티의 참여를 독려하며, 해결되지 않은 작업에 대한 공동 분석을 요청함.
5arcprize.org링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.