텐센트, 두 개의 성능이 뛰어난 번역 모델을 오픈 소스화하다.

  • 텐센트, 세계적인 기술 기업, 두 개의 고성능 번역 모델을 오픈 소스화.
  • 이 모델들은 Google Translate를 포함한 기존 번역 도구보다 국제 벤치마크에서 우수한 성과를 달성.
  • WMT2025에서 31개 언어쌍 중 30개 언어쌍에서 1위를 차지한 Hunyuan MT 7B와 Hunyuan MT Chimera 7B.
  • 이 모델들은 중국어, 영어, 일본어를 포함하여 33개 언어를 지원하며, 체코어, 마라티어, 에스토니아어, 아이슬란드어 등 덜 디지털화된 언어도 포함.
  • 중국의 소수 민족 언어와 만다린 중국어 간의 번역에 중점을 둠.
  • Hunyuan 모델, 더 큰 경쟁 모델보다 우수한 성능을 발휘.
  • 구글 번역 모델과 비교하여 15%에서 65%까지 성능 향상.
  • GPT-4.1, Claude 4 Sonnet, Gemini 2.5 Pro 같은 독점 AI 시스템 대비 더 나은 성과.
  • 7B 파라미터 모델, 더 적은 컴퓨팅 파워로 실행 가능하며 성능은 대형 시스템에 필적.
  • Tower Plus 시리즈(72억 파라미터까지) 대비 10%에서 58% 성능 향상.
  • Hugging Face와 GitHub에서 오픈 소스로 제공.
  • 다섯 단계의 훈련 프로세스, 일반 텍스트 시작, 번역 특화 데이터로 정제, 준지도 학습, 강화 학습 사용.
  • 소수 언어용으로 1.3조 토큰의 훈련 데이터, 총 112개 언어 및 방언 포함.
  • 강력한 최종 결과 생성을 위한 Chimera 모델의 합성 접근법.
  • 구글, 실시간 대화 및 개인화된 언어 학습 모드 포함 새로운 AI 기능 발표.

4the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기