ElevenLabs, AI 음성 제어를 위한 정밀한 v3 Audio Tags 출시

  • ElevenLabs의 v3 Audio Tags는 AI 음성의 타이밍, 리듬, 강조에 대한 세밀한 제어를 가능하게 해줍니다.
  • [pause], [rushed], [stammers], [drawn out]와 같은 태그를 사용하여 각 문장의 전달을 감정적, 리듬적 측면에서 조정할 수 있습니다.
  • Delivery control은 스피치의 흐름을 조정하는 능력으로, 드라마틱하게, 편안하게, 긴장감 있게, 코믹하게 만드는 것입니다.
  • Eleven v3를 사용하면 기본 페이싱에 국한되지 않고, 긴장감을 위해 느리게, 긴급함을 위해 빠르게, 유머를 위해 리듬 있게 조정할 수 있습니다.
  • 태그는 자연스러운 말하기를 위한 미묘한 신호를 제공합니다: 포즈 & 브레이크, 속도 단서, 망설임 & 리듬, 강조.
  • 예시: "[drawn out] Sooooo... you're saying... [suspicious tone] you didn't eat the last slice?"
  • 전달 방식이 변하면 소리의 해석도 달라지고, 같은 말을 다른 어조로 표현할 수 있습니다.
  • 음성 전달 제어는 단어 선택이 아닌 타이밍과 의도를 통해 어조가 생성되도록 합니다.
  • 태그 조합을 사용하여 감정적 또는 캐릭터적 단서를 추가하여 장면의 분위기를 조성할 수 있습니다.
  • Eleven v3는 스크립트를 악보로 변환하며, 창작자에게 대사의 전개 과정을 완전히 제어할 수 있게 합니다.
  • Professional Voice Clones(PVCs)는 현재 v3에 최적화되지 않았으며, Instant Voice Clone(IVC) 또는 디자인된 음성을 사용하는 것이 권장됩니다.

4elevenlabs.io링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기