검색
검색
AI news 검색
회원가입로그인

AI 스타트업 Cohere의 비영리 연구 부문 Cohere for AI가 다국어 8B- 및 35B-파라미터 언어 모델인 Aya 23의 가중치를 오픈 소스합니다.

  • Cohere for AI(캐나다 기업 Cohere의 비영리 연구 기관)는 새로운 최첨단 다국어 언어 모델인 Aya 23을 공개했습니다.
  • Aya 23은 8B 및 35B 파라미터 변형으로 제공되며, 이는 AI 모델 내 인공 뉴런 간의 연결 강도를 나타내며, 일반적으로 더 많은 수는 더 강력하고 능력 있는 모델을 의미합니다.
  • 이 모델은 23개 언어를 지원하며 아랍어, 중국어(간체 및 번체), 체코어, 네덜란드어, 영어, 프랑스어, 독일어, 그리스어, 히브리어, 힌디어, 인도네시아어, 이탈리아어, 일본어, 한국어, 페르시아어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 스페인어, 터키어, 우크라이나어 및 베트남어를 포함합니다.
  • 이 연구에 따르면, Aya 23은 Aya 101은 물론 Google의 Gemma 및 Mistral의 다양한 오픈 소스 모델보다 높은 품질의 응답을 제공하며, 세계 인구의 거의 절반에 해당하는 다국어 모델링 기능을 확장합니다.
  • 다국어 사전 훈련 모델의 부족과 다양한 언어를 다루는 교육 스타일 데이터의 부족이 큰 문제였으나 Aya 이니셔티브는 이 문제들을 해결하기 위해 발족되었습니다.
  • 이 이니셔티브는 3,000명 이상의 독립 연구자들과 함께 시작되어, 101개 언어를 다루는 거대한 다국어 교육 스타일 데이터셋인 Aya 컬렉션을 만들었습니다.
  • Aya 23은 이전 모델 Aya 101을 기반으로 하여 생성에서 23개 언어에 더 많은 용량을 할당함으로써 개선됩니다.
  • Aya 23의 모델 가중치는 Hugging Face에서 Creative Commons attribution-noncommercial 4.0 국제 공공 라이선스로 공개되었습니다.

5venturebeat.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기