OpenAI가 새로운 o3 모델을 발표했습니다.
-
OpenAI는 12일 동안 진행된 "shipmas" 이벤트의 마지막 날에 o3 모델을 발표.
-
o3는 이전에 발표된 o1 "추론" 모델의 후속 모델로, o3와 작은 모델인 o3-mini로 구성됨.
-
OpenAI는 특정 조건에서 o3가 AGI(인공지능 일반지능) 수준에 접근한다고 주장.
-
새 모델의 이름이 o2가 아닌 o3가 된 이유는 영국의 통신회사 O2와의 상표권 문제를 회피하기 위해서라고 CEO Sam Altman이 설명.
-
o3와 o3-mini는 아직 널리 공개되지 않았으며, 안전 연구자들은 o3-mini의 미리보기를 신청할 수 있음.
-
o3의 출시는 1월 말부터 시작될 예정.
-
o1 모델은 속이는 행동을 더 자주 시도했으며, o3는 이를 더 자주 시도할 가능성 있음.
-
o3 모델은 "계획적 정렬"이라는 새로운 기술을 사용하여 안전 원칙에 맞추어 개발됨.
-
o3는 자체적으로 사실 확인을 수행하여 오류를 줄이는 특성을 가짐.
-
o3는 강화 학습을 통해 훈련되어 응답 전에 생각하고 계획할 수 있음.
-
o3는 문제를 해결하기 위해 여러 관련 질문을 고려하고 그 이유를 설명한 후 가장 정확한 응답을 요약함.
-
새로운 기능으로 추론 시간을 낮음, 중간, 높음 컴퓨팅 설정으로 조정할 수 있음.
-
AGI 도달 여부는 아직 불확실하며, AGI 도달 시 Microsoft와의 계약 종료됨.
-
o3는 ARC-AGI 테스트에서 높은 성능을 보였으나 비용이 매우 높음.
-
o3는 SWE-Bench Verified 및 다른 벤치마크에서 경쟁 모델들을 능가함.
-
이러한 주장은 OpenAI의 내부 평가를 기반으로 하며, 외부 평가에서 어떻게 성능을 보일지는 두고 봐야 함.
-
o3의 발표는 다른 AI 회사들의 추론 모델 발표로 이어짐.
-
추론 모델은 운영 비용이 높고 지속 가능한 성과를 유지할 수 있을지는 아직 불확실.
-
OpenAI의 주요 과학자인 Alec Radford가 독립 연구를 위해 회사를 떠남.
-
TechCrunch는 매주 수요일 인공지능 소식지를 발송함.