OpenAI가 o3, 지금까지 가장 진보된 추론 모델을 공개합니다.

2024-12-21

OpenAI는 복잡한 추론 작업에서 획기적인 성능을 발휘하는 새로운 AI 모델 o3을 발표했다.
2025년 1월 말에 저비용 미니 버전이 출시되고, 이후 정식 버전이 출시될 예정이다.
o3 모델은 문제 해결 방식에서 큰 진보를 이루었다.
표준 컴퓨팅 파워를 사용하여 o3은 AGI 벤치마크 ARC Prize에서 75.7%를 기록, 자원을 더 투입하면 87.5%를 달성했다.
o3은 연산 성능에서도 두드러진 성과를 보였다. 2024년 American Mathematical Olympiad에서 96.7%의 문제를 해결했다.
EpochAI의 Frontier Math Benchmark에서 25.2%를 기록, 이전 모델을 크게 능가했다.
소프트웨어 작업 정확도는 o1보다 20% 향상되어 71.7%를 기록했다.
경쟁 프로그래밍에서 Codeforces 점수 2727을 기록, OpenAI의 최고 과학자 점수(2665)를 넘었다.
GPT Diamond Benchmark의 PhD 수준 과학 질문에서는 87.7%를 기록, PhD 전문가 평균(약 70%)보다 높았다.
ARC 벤치마크 개발자인 François Chollet는 o3의 성능을 "놀랍고 중요한 단계적 증가"라고 평가했다.
o3는 전통적인 언어 모델과 달리 실시간으로 새로운 프로그램을 만들어 문제를 해결한다.
이 과정은 많은 컴퓨팅 파워를 필요로 하며, 한 작업당 최대 3300만 토큰을 처리한다.
고효율 버전은 한 작업당 약 $20의 비용이 소요된다.
저효율 버전은 고효율 버전보다 172배 많은 컴퓨팅 파워를 요구한다.
o3는 아직 AGI가 아니며, 인간이 쉽게 해결할 수 있는 작업에서 어려움을 겪는다.
OpenAI는 2025년에 더 도전적인 ARC-AGI-2 벤치마크를 발표할 예정이며, 초기 테스트에서 o3은 약 30%를 기록한다.
OpenAI는 2025년 1월 말에 더 저렴한 o3 미니 버전을 출시할 예정이다.
라이브 데모에서 o3 미니는 독립적으로 코드 생성 및 실행을 포함한 작업을 성공적으로 수행했다.
OpenAI는 출시 전에 안전 테스트 프로그램을 시작하고 있으며, 새로운 안전 접근 방식인 "Deliberative Alignment"를 도입하고 있다.
모델 이름은 통신사 O2를 고려하여 "o2"를 건너뛰고 "o3"로 정했다.

5the-decoder.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.

📰AI 뉴스 리스트 보기

원본 뉴스 보기