Anthropic, "차세대 AI 안전 완화 시스템" 테스트 중
- Anthropic은 AI 안전 완화 조치를 위한 차세대 시스템을 테스트하기 위해 버그 바운티 프로그램을 확장하고 있음.
- 이 프로그램은 "유니버설 탈옥 공격"을 식별하고 방어하는 데 중점을 둠.
- 화학, 생물학, 방사선, 핵 (CBRN) 방어 및 사이버 안전과 같은 고위험 영역에서의 중요한 취약점을 우선시함.
- 참가자들은 공개되기 전에 Anthropic의 최신 안전 시스템에 대한 조기 접근 권한을 얻음.
- 이들의 과제는 안전 조치를 우회하는 취약점을 찾는 것.
- Anthropic은 새로운 유니버설 탈옥 공격을 발견하면 최대 $15,000의 보상을 제공함.
- 온라인 저널리스트 Matthias는 THE DECODER의 공동 창립자이자 발행인이며, 인공지능이 인간과 컴퓨터 간의 관계를 근본적으로 변화시킬 것이라고 믿음.
4the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.