Google의 Magenta RealTime: 라이브 음악 창작을 위한 혁신적인 오픈 소스 AI 모델

Google의 음악 혁신, Magenta RealTime 공개

구글은 최근 음악 창작의 새로운 지평을 열기 위한 인공지능 모델인 Magenta RealTime(Magenta RT)을 공개했습니다. 이 모델은 실시간으로 음악을 생성하고 제어할 수 있는 능력을 갖추고 있으며, 텍스트 명령어와 오디오 샘플을 동시에 컴퓨터에게 전달하여 다양한 음악을 그 즉시 창작할 수 있게 해줍니다.

기술적 배경과 훈련 데이터

Magenta RT는 8억 개의 파라미터를 가진 자동 회귀 변환기(Transformer) 기반의 모델입니다. 이는 주로 기악 음악으로 이루어진 약 19만 시간의 데이터로 훈련되었습니다. 이러한 방대한 데이터는 모델이 더욱 정교하고 다양한 음악을 만들어내는 데 기여합니다.

또한, 현재 기술적 한계로 인해 생성된 음악의 마지막 10초만 접근 가능한 상태입니다. Magenta RT는 아직 초기 단계에 있으며, 이러한 한계를 극복하기 위한 다양한 연구가 계속될 것으로 보입니다.

오픈 소스 라이선스와 사용

Magenta RT의 코드와 모델은 오픈 라이선스로 GitHub 및 Hugging Face에서 제공됩니다. 사용자는 Colab TPU를 통해 무료로 모델을 테스트해볼 수 있습니다. 이러한 개방성과 접근성은 다양한 사용자들이 실시간으로 AI가 만드는 음악을 체험하고, 모델의 발전에 기여할 수 있도록 합니다.

앞으로의 계획

구글은 Magenta RT를 더욱 발전시키기 위해 지역적인 사용 지원, 사용자 맞춤 기능 추가 및 자세한 연구 논문 발표를 계획하고 있습니다. 이는 사용자와 개발자 모두에게 더 많은 선택지를 제공할 것이며, AI 기술 발전에 기여할 것으로 기대됩니다.