검색
검색
AI news 검색
Sign UpLogin

OpenAI의 새로운 추론 AI 모델은 환각을 더 많이 합니다.

  • OpenAI는 최근 o3 및 o4-mini라는 최첨단 AI 모델을 출시했으나, 이 모델들은 이전 모델보다 더 많은 환각을 발생시킴.
  • 환각은 AI 분야에서 해결하기 어려운 주요 문제 중 하나이며, o3와 o4-mini의 경우 이전 모델보다 더 많은 환각을 보임.
  • o3와 o4-mini는 이전의 추론 모델들 및 전통적인 비추론 모델인 GPT-4o에 비해 높은 환각률을 보임.
  • OpenAI는 환각이 더욱 심해지는 이유를 아직 명확히 파악하지 못하고 있으며, 이는 더 많은 연구가 필요하다고 밝힘.
  • o3는 PersonQA 테스트에서 33%의 환각률을 기록했으며, 이는 이전의 o1 및 o3-mini보다 두 배 높은 수치임. o4-mini는 48%의 환각률을 기록함.
  • Transluce라는 AI 연구소는 o3 모델이 답변을 생성하는 중에 행동을 꾸며내는 경향을 발견함.
  • 일부 전문가들은 강화 학습 방식이 모델의 환각 문제를 악화시킬 수 있다고 예상함.
  • o3의 환각 비율은 모델의 유용성을 감소시킬 수 있음.
  • 업스킬링 스타트업 Workera의 팀은 o3 테스트 중 웹사이트 링크가 깨지는 환각을 발견함.
  • 환각은 아이디어를 창출하고 창의성을 높일 수 있지만, 정확성이 중요한 비즈니스 에서는 문제로 작용함.
  • 웹 검색 기능을 부여하여 모델의 정확성을 높이는 방법이 유망하지만 제삼자 검색 제공자에게 프롬프트를 노출해야 함.
  • 추론 모델 확장이 환각을 더욱 악화시키면 해결책의 필요성이 더욱 절실해짐.
  • AI 산업은 최근 전통적인 AI 모델의 성능 개선 방법보다 추론 모델에 집중.
  • 추론은 데이터 및 컴퓨팅 양을 크게 늘리지 않고 다양한 작업 성능을 개선하지만 환각을 증가시킬 가능성도 있음.

3techcrunch.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기