OpenAI o1 시스템 카드 요약

OpenAI o1 모델 시리즈는 체인 오브 소트를 활용한 대규모 강화 학습을 통해 복잡한 추론을 수행하도록 훈련되었습니다.
o1-preview와 o1-mini는 각각 고성능 및 빠른 응답 속도를 제공하는 모델입니다. 특히 o1-mini는 코딩에 효과적입니다.
이 모델들은 데이터 필터링 과정을 거쳐 안전성을 강화하고, 잠재적으로 위험한 콘텐츠를 생성하지 않도록 설계되었습니다.
다양한 데이터 소스를 활용하여 학습되었으며, 오픈소스와 파트너십을 통해 확보한 데이터가 포함됩니다.
o1 모델 시리즈는 안전성 평가에서 높은 성과를 보이며, 특히 위험한 요청에 대한 저항성이 뛰어납니다.
모델은 불법적인 조언이나 혐오 발언을 포함한 유해 콘텐츠를 생성하지 않도록 설계되었으며, 이에 대한 평가에서 우수한 성적을 기록했습니다.
o1-preview는 GPT-4o 모델보다 더 강력한 안전성을 보여주며, 특히 탈옥(jailbreak) 공격 저항성에서 두드러진 성과를 보였습니다.
허용되지 않은 콘텐츠 생성, 환각(hallucination) 문제, 편향성 평가 등의 다양한 안전성 평가를 거쳐, 모델은 정밀하게 개선되고 있습니다.
모델은 스스로 문제를 해결하기 위해 체인 오브 소트를 사용하며, 체인 오브 소트 감시에 관한 연구도 진행 중입니다.