OpenAI의 새로운 추론 AI 모델은 환각을 더 많이 합니다.

2025-04-19

OpenAI는 최근 o3 및 o4-mini라는 최첨단 AI 모델을 출시했으나, 이 모델들은 이전 모델보다 더 많은 환각을 발생시킴.
환각은 AI 분야에서 해결하기 어려운 주요 문제 중 하나이며, o3와 o4-mini의 경우 이전 모델보다 더 많은 환각을 보임.
o3와 o4-mini는 이전의 추론 모델들 및 전통적인 비추론 모델인 GPT-4o에 비해 높은 환각률을 보임.
OpenAI는 환각이 더욱 심해지는 이유를 아직 명확히 파악하지 못하고 있으며, 이는 더 많은 연구가 필요하다고 밝힘.
o3는 PersonQA 테스트에서 33%의 환각률을 기록했으며, 이는 이전의 o1 및 o3-mini보다 두 배 높은 수치임. o4-mini는 48%의 환각률을 기록함.
Transluce라는 AI 연구소는 o3 모델이 답변을 생성하는 중에 행동을 꾸며내는 경향을 발견함.
일부 전문가들은 강화 학습 방식이 모델의 환각 문제를 악화시킬 수 있다고 예상함.
o3의 환각 비율은 모델의 유용성을 감소시킬 수 있음.
업스킬링 스타트업 Workera의 팀은 o3 테스트 중 웹사이트 링크가 깨지는 환각을 발견함.
환각은 아이디어를 창출하고 창의성을 높일 수 있지만, 정확성이 중요한 비즈니스 에서는 문제로 작용함.
웹 검색 기능을 부여하여 모델의 정확성을 높이는 방법이 유망하지만 제삼자 검색 제공자에게 프롬프트를 노출해야 함.
추론 모델 확장이 환각을 더욱 악화시키면 해결책의 필요성이 더욱 절실해짐.
AI 산업은 최근 전통적인 AI 모델의 성능 개선 방법보다 추론 모델에 집중.
추론은 데이터 및 컴퓨팅 양을 크게 늘리지 않고 다양한 작업 성능을 개선하지만 환각을 증가시킬 가능성도 있음.

3techcrunch.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.

📰AI 뉴스 리스트 보기

원본 뉴스 보기