Meta, 100개에 가까운 언어를 전사 및 번역할 수 있는 AI 모델 - SeamlessM4T 공개
SeamlessM4T는 메타에서 만든 번역 모델로 약 100개 언어로 음성-텍스트, 음성-음성, 텍스트-음성, 텍스트-텍스트 번역이 가능한 AI 모델이다.
이미지 출처 : 메타 AI 블로그
연구 라이선스 하에 공개하였고 (CC BY-NC 4.0으로 연구자와 개발자가 사용할 수 있음.) 멀티 모달 번역 데이터셋인 SeamlessAlign의 메타데이터(27만 시간 이상의 음성과 텍스트 세트)도 함께 공개했다.
이를 통해 전세계 언어 번역기를 구축할 수 있으며 언어의 장벽을 허물어줄 수 있는 가능성이 있다.
메타는 미래에는 이 기초 모델을 통해 새로운 커뮤니테이션 기능을 탐구하고 모두가 이해할 수 있는 세계로 나아가길 희망한다고 한다.
메타 뉴스 : Introducing SeamlessM4T, a Multimodal AI Model for Speech and Text Translations | Meta
메타 AI 블로그 : Introducing a foundational multimodal model for speech translation
데모 : Seamless Communication Translation Demo
내 생각
유튜브가 다언어를 통해 업그레이드를 하려고 하는 것처럼 메타도 다언어 통,번역기를 통해 커뮤니케이션의 지경을 넓히려고 하는 것 같다. 저커버그는 메타버스에 통합하는 것도 이미 염두에 두고 있는 듯. 또 저커버그의 이야기에 따르면 모델 사용료를 지불하는 것보다 오픈 모델로 만드는 것이 가치가 더 크다고 생각한다고 한다. whisper랑 경쟁하게 될 수 도 있다. 기존 서비스에 붙여서 다국어를 지원할 때 매우 유용하게 사용할 수 있을 것 같다.