Anthropic, "차세대 AI 안전 완화 시스템" 테스트 중

2024-08-10

Anthropic은 AI 안전 완화 조치를 위한 차세대 시스템을 테스트하기 위해 버그 바운티 프로그램을 확장하고 있음.
이 프로그램은 "유니버설 탈옥 공격"을 식별하고 방어하는 데 중점을 둠.
화학, 생물학, 방사선, 핵 (CBRN) 방어 및 사이버 안전과 같은 고위험 영역에서의 중요한 취약점을 우선시함.
참가자들은 공개되기 전에 Anthropic의 최신 안전 시스템에 대한 조기 접근 권한을 얻음.
이들의 과제는 안전 조치를 우회하는 취약점을 찾는 것.
Anthropic은 새로운 유니버설 탈옥 공격을 발견하면 최대 $15,000의 보상을 제공함.
온라인 저널리스트 Matthias는 THE DECODER의 공동 창립자이자 발행인이며, 인공지능이 인간과 컴퓨터 간의 관계를 근본적으로 변화시킬 것이라고 믿음.

4the-decoder.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약 한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.