ElevenLabs, AI 음성 제어를 위한 정밀한 v3 Audio Tags 출시

2025-06-16

ElevenLabs의 v3 Audio Tags는 AI 음성의 타이밍, 리듬, 강조에 대한 세밀한 제어를 가능하게 해줍니다.
[pause], [rushed], [stammers], [drawn out]와 같은 태그를 사용하여 각 문장의 전달을 감정적, 리듬적 측면에서 조정할 수 있습니다.
Delivery control은 스피치의 흐름을 조정하는 능력으로, 드라마틱하게, 편안하게, 긴장감 있게, 코믹하게 만드는 것입니다.
Eleven v3를 사용하면 기본 페이싱에 국한되지 않고, 긴장감을 위해 느리게, 긴급함을 위해 빠르게, 유머를 위해 리듬 있게 조정할 수 있습니다.
태그는 자연스러운 말하기를 위한 미묘한 신호를 제공합니다: 포즈 & 브레이크, 속도 단서, 망설임 & 리듬, 강조.
예시: "[drawn out] Sooooo... you're saying... [suspicious tone] you didn't eat the last slice?"
전달 방식이 변하면 소리의 해석도 달라지고, 같은 말을 다른 어조로 표현할 수 있습니다.
음성 전달 제어는 단어 선택이 아닌 타이밍과 의도를 통해 어조가 생성되도록 합니다.
태그 조합을 사용하여 감정적 또는 캐릭터적 단서를 추가하여 장면의 분위기를 조성할 수 있습니다.
Eleven v3는 스크립트를 악보로 변환하며, 창작자에게 대사의 전개 과정을 완전히 제어할 수 있게 합니다.
Professional Voice Clones(PVCs)는 현재 v3에 최적화되지 않았으며, Instant Voice Clone(IVC) 또는 디자인된 음성을 사용하는 것이 권장됩니다.

4elevenlabs.io링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.

📰AI 뉴스 리스트 보기

원본 뉴스 보기