AI 기반 성우? - TTS를 위해 설계된 최초의 LLM
- 첫 번째 LLM 기반 음성 합성 모델인 Octave by Hume AI를 소개
- Octave는 텍스트의 의미를 이해하고 감정을 표현하며 전달방식을 조정할 수 있음
- 사용자가 연기 지시를 통해 특정한 감정과 전달 방식을 지시할 수 있음
- 모델은 사용자가 원하는 목소리를 만들 수 있으며, 결과물이 매우 자연스러움
- Hume AI의 Octave가 11 Labs 대비 Naturalness와 Audio Quality 부분에서 더 뛰어남
- 벤치마크를 테스트해본 결과, 실제 사용 경험을 통해 Octave의 성능을 확인
- 텍스트에 따라 자연스러움과 감정 전달이 다를 수 있음
- 일부 사용 제한이 있지만, 무료로 체험 가능
- 사용자가 스크립트와 연기 지시를 정교하게 조정할 수 있는 프로젝트 기능 제공
- 전통적인 텍스트 음성 변환에 비해 감정 표현이 풍부하지만, 일관성을 유지하는 데 어려움이 있음
- Hume AI는 가까운 시일 내에 이 문제를 해결할 계획
- 매우 경쟁력 있는 가격 책정, 3달러부터 시작
- LLM 기반 텍스트 음성 변환이 더 높은 감정과 자연스러움을 제공하므로 장기적으로 유망함
- 사용자가 직접 체험해 보고 피드백을 주기를 권장
3youtube.com(MattVidPro AI)링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.