LAION이 아동 학대 이미지 링크가 제거된 AI 데이터셋 Re-LAION-5B를 공개합니다.
- LAION이 새로운 AI 학습 데이터셋 Re-LAION-5B를 공개함.
- Re-LAION-5B는 아동 성 학대 자료(CSAM) 링크가 없는 것으로 보고됨.
- 스탠포드 인터넷 옵저버(2023년 12월 보고서)가 식별한 1,008개 링크를 포함하여 총 2,236개의 링크가 제거됨.
- 데이터셋은 Re-LAION-5B Research와 Re-LAION-5B Research-Safe 두 가지 버전으로 제공됨.
- Re-LAION-5B는 총 55억 개의 텍스트-이미지 쌍을 포함.
- 다른 사용자들은 메타데이터를 사용해 기존 파생 데이터셋을 정리할 수 있음.
- LAION은 Re-LAION-5B가 웹 규모 데이터셋 정리의 새로운 안전 기준을 수립했다고 주장.
- AI 생성 CSAM 문제 때문에 실제 아동 학대 사건 조사에 어려움이 생기고 있음.
- IWF는 2023년 가을 AI 생성 CSAM이 급증했다고 보고함.
3the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.