Evo 2: 생명의 언어를 이해하는 AI 모델
- 연구팀, 생물학 응용을 위해 가장 큰 AI 모델 Evo 2 개발
- Evo 2, 박테리아, 고세균 및 진핵생물 포함 10만 종 이상의 유기체에서 수집된 9.3조 개의 DNA 염기쌍으로 훈련
- 연구 기관: Arc Institute, 스탠퍼드 대학교, UC 버클리, UC 샌프란시스코, Nvidia
- 두 가지 버전: 70억 및 400억 파라미터, 최대 100만 염기쌍 길이의 서열 처리 가능
- 추가적인 과제 특정 훈련 없이 DNA 서열 분석을 통해 유전자 변이 기능 예측 학습
- 복잡한 유전 구조와 다양한 생물학적 특성 생성 능력 입증
- 유방암 유전자 BRCA1 돌연변이 분석에서 기존 AI 모델과 유사한 정확도 확인
- 추론 시간 검색을 통해 염색질 접근성 같은 복잡한 후성유전체 구조 정밀 제어 가능
- 후성유전적 조절 패턴을 포함한 DNA 서열 설계 가능
- Evo 2, 모델 파라미터, 훈련 및 추론 코드, OpenGenome2 데이터셋을 포함한 오픈 소스 제공
- Evo 1 대비 30배 더 많은 데이터로 광범위한 생명체를 포함하여 훈련, 개선된 정확도로 모든 생명 영역의 게놈 예측 가능
- 기술 아키텍처에 대한 칭찬과 함께 먼 비코딩 서열의 유전자 활동 조절 이해 필요성 언급
- 안전 및 윤리적 이유로 인간과 복잡한 병원체 제외하여 훈련, 이러한 병원체에 대한 유용한 응답 제공 안 함
3the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.