검색
검색
AI news 검색
회원가입로그인

OpenAI가 o3, 지금까지 가장 진보된 추론 모델을 공개합니다.

  • OpenAI는 복잡한 추론 작업에서 획기적인 성능을 발휘하는 새로운 AI 모델 o3을 발표했다.
  • 2025년 1월 말에 저비용 미니 버전이 출시되고, 이후 정식 버전이 출시될 예정이다.
  • o3 모델은 문제 해결 방식에서 큰 진보를 이루었다.
  • 표준 컴퓨팅 파워를 사용하여 o3은 AGI 벤치마크 ARC Prize에서 75.7%를 기록, 자원을 더 투입하면 87.5%를 달성했다.
  • o3은 연산 성능에서도 두드러진 성과를 보였다. 2024년 American Mathematical Olympiad에서 96.7%의 문제를 해결했다.
  • EpochAI의 Frontier Math Benchmark에서 25.2%를 기록, 이전 모델을 크게 능가했다.
  • 소프트웨어 작업 정확도는 o1보다 20% 향상되어 71.7%를 기록했다.
  • 경쟁 프로그래밍에서 Codeforces 점수 2727을 기록, OpenAI의 최고 과학자 점수(2665)를 넘었다.
  • GPT Diamond Benchmark의 PhD 수준 과학 질문에서는 87.7%를 기록, PhD 전문가 평균(약 70%)보다 높았다.
  • ARC 벤치마크 개발자인 François Chollet는 o3의 성능을 "놀랍고 중요한 단계적 증가"라고 평가했다.
  • o3는 전통적인 언어 모델과 달리 실시간으로 새로운 프로그램을 만들어 문제를 해결한다.
  • 이 과정은 많은 컴퓨팅 파워를 필요로 하며, 한 작업당 최대 3300만 토큰을 처리한다.
  • 고효율 버전은 한 작업당 약 $20의 비용이 소요된다.
  • 저효율 버전은 고효율 버전보다 172배 많은 컴퓨팅 파워를 요구한다.
  • o3는 아직 AGI가 아니며, 인간이 쉽게 해결할 수 있는 작업에서 어려움을 겪는다.
  • OpenAI는 2025년에 더 도전적인 ARC-AGI-2 벤치마크를 발표할 예정이며, 초기 테스트에서 o3은 약 30%를 기록한다.
  • OpenAI는 2025년 1월 말에 더 저렴한 o3 미니 버전을 출시할 예정이다.
  • 라이브 데모에서 o3 미니는 독립적으로 코드 생성 및 실행을 포함한 작업을 성공적으로 수행했다.
  • OpenAI는 출시 전에 안전 테스트 프로그램을 시작하고 있으며, 새로운 안전 접근 방식인 "Deliberative Alignment"를 도입하고 있다.
  • 모델 이름은 통신사 O2를 고려하여 "o2"를 건너뛰고 "o3"로 정했다.

5the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기