Skip to main content
Views 11

VoiceRun, 550만 달러로 ‘음성 에이전트 공장’을 짓는 이유

콜센터에 전화 걸었다가 “원하시는 서비스를 말씀해 주세요”라는 기계음 듣는 순간, 살짝 한숨부터 나오지 않나요?
끊자니 일은 해야 하고, 계속 듣자니 답답하고.

이 지긋지긋한 경험을 뜯어고치겠다며 등장한 스타트업이 있습니다. 바로 ‘VoiceRun’.
이 회사가 최근 550만 달러(약 73억 원) 시드 투자를 유치하며, 스스로를 “음성 에이전트 공장”이라고 선언했습니다.12

오늘 글에서는 단순 투자 뉴스가 아니라,

  • VoiceRun이 해결하려는 진짜 문제는 뭔지

  • 왜 ‘노코드’ 대신 ‘코드 기반’ 음성 에이전트인지

  • 기업 입장에서 어떤 점이 다르고, 어디에 쓸 수 있는지

  • 앞으로 음성 에이전트 시장이 어떻게 변할지

를 개발자, 기획자, CX 담당자 시점에서 이해할 수 있도록 정리해 보겠습니다.


코드로 짓는 음성 에이전트 공장, VoiceRun은 무엇을 하나

VoiceRun을 만든 두 공동창업자 Nicholas Leonard(CEO)와 Derek Caneja(CTO)는 처음엔 그냥 “잘 만든 음성 AI 에이전트”를 만들고 싶었습니다.1
그런데 실제로 시장을 살펴보니, 구조적인 문제가 보였죠.

하나는 ‘노코드/로우코드’ 플랫폼이었습니다.
블록을 끌어다 놓고, 박스 안에 프롬프트를 적어서 음성 흐름을 설계하는 방식. 프로토타입 만들기는 빠르지만, 복잡해질수록 유지보수가 악몽이 됩니다.1

다른 하나는 “돈과 인력이 넘치는” 대기업들의 자체 구축 방식입니다.
이들은 전용 음성 파이프라인, 인프라, 툴을 몇 달 동안 따로 개발합니다. 잘 돌아가긴 하는데, 대부분의 기업에게는 이 정도 리소스가 현실적으로 불가능하죠.1

Leonard는 여기서 “개발자와 엔터프라이즈를 위한 제3의 길”이 필요하다고 봤습니다.
그래서 나온 해법이 바로 VoiceRun:

  • 개발자가 코드로 음성 에이전트를 설계하고

  • 코드 에이전트(코드도 짜는 AI)가 함께 동작하며

  • 그 위에 VoiceRun이 글로벌 음성 인프라와 운영 툴을 제공하는 구조입니다.13

간단히 말하면,
“콜센터용 Alexa를 한 번에 뚝딱 만드는 공장”이 아니라,
“기업이 직접 설계도(코드)를 쥐고, VoiceRun 인프라 위에서 음성 에이전트를 양산하는 공장”에 가깝습니다.23

이번 시드 라운드에서 VoiceRun은 Flybridge Capital이 리드하고, RRE Ventures와 Link Ventures가 참여하는 550만 달러 투자를 유치했습니다.23
본격적으로 “파일럿을 넘어 실제 운영 단계로 가는” 기업들을 공략하겠다는 신호입니다.


왜 ‘노코드’ 대신 ‘코드 기반’ 음성 에이전트인가

요즘 AI 에이전트 빌더들을 보면 “노코드”, “시각적 플로우”, “드래그 앤 드롭”이 기본 문구입니다.45
그런데 VoiceRun은 거꾸로 갑니다. 핵심은 딱 하나입니다.

“코딩 에이전트의 모국어는 코드”라는 전제입니다.1

시각적 플로우로 음성 에이전트를 만들면 처음엔 편합니다.
하지만, 현실적인 요구사항이 붙으면 순식간에 한계가 드러납니다.

예를 들어 이런 것들입니다.

  • 특정 지역 방언/억양을 반영해야 할 때

  • 비정형적인 예외 케이스가 계속 추가될 때

  • 고객의 계정 상태, 결제 이력, 위험 점수 등 내부 API와 복잡하게 얽힐 때

  • A/B 테스트로 프롬프트, 말투, 정책을 조금씩 바꿔가며 성능을 최적화할 때

시각적 인터페이스는 결국, 도구 제공자가 미리 만들어둔 옵션 안에서만 움직일 수 있습니다.
“이 기능은 아직 안 돼요”라는 말이 나오는 순간, 노코드는 장애물이 됩니다.1

반대로, VoiceRun은 처음부터 코드를 전제로 설계합니다.123

  • 음성 에이전트의 행동, 정책, 예외 처리 로직을 코드로 명시

  • 내부 API, 데이터베이스, 서드파티 서비스와의 연동을 코드 레벨에서 제어

  • Git 기반 워크플로우와 CLI로 개발·배포·롤백까지 개발자 수준의 경험 제공3

여기에 Leonard가 말하는 “코딩 에이전트” 개념이 올라탑니다.
그의 구상은 이렇습니다.

  • 개발자가 상위 레벨에서 구조와 가드레일을 정의하고

  • 코딩 에이전트(AI)가 세부 코드를 작성·테스트·배포·개선 제안을 하는 루프를 돌며

  • VoiceRun은 이 전체 라이프사이클을 관리하는 플랫폼 역할을 한다는 것.1

결국 VoiceRun은 노코드 툴이 아니라,
“개발자와 코드 에이전트가 함께 쓰는, 엔터프라이즈급 음성 에이전트용 개발 스택”에 가깝습니다.


엔터프라이즈를 겨냥한 풀스택 음성 AI 인프라

시드 라운드와 함께 발표된 또 하나의 핵심 키워드가 “풀스택(Full-Stack) 보이스 AI 플랫폼”입니다.23
단순 TTS(STT/TTS) API가 아니라, 엔드 투 엔드로 전부 붙여주는 인프라라는 뜻입니다.

VoiceRun의 주요 구성 요소를 조금 쪼개보면 다음과 같습니다.

첫째, 음성 파이프라인 오케스트레이션

VoiceRun은 음성 AI의 기본 파이프라인인 음성 인식(STT), LLM, 음성 합성(TTS)을 하나의 오케스트레이션 레이어에서 관리합니다.23

  • 다양한 STT/LLM/TTS 모델을 플러그인처럼 끼웠다 뺐다 할 수 있고

  • 턴 테이킹(누가 언제 말하고 끊을지), 인터럽트(고객이 말을 끊었을 때 즉시 반응),

  • 통신 지연(레이턴시) 관리까지 포함합니다.23

최근 NVIDIA의 Nemotron 같은 초저지연 ASR 모델과 오픈소스 음성 파이프라인을 활용해 초저지연 음성 에이전트를 구축하는 흐름이 늘고 있는데,6
VoiceRun은 이런 복잡한 조합을 엔터프라이즈 개발자가 “서비스로” 바로 쓸 수 있게 해주는 셈입니다.

둘째, 배포 옵션의 유연성

엔터프라이즈가 AI 도입을 망설이는 가장 큰 이유 중 하나는 보안·규제입니다.
민감한 음성 데이터, 통화 녹취, 금융/의료 정보까지 엮이다 보니, “어디에 올려서 돌릴 것인가”가 매우 중요합니다.

VoiceRun은 세 가지 배포 방식을 제공합니다.23

  • 퍼블릭 클라우드(가장 빠른 시작)

  • 고객 VPC(가상 사설 클라우드, 기업 인프라 안에서 구동)

  • 온프레미스(자체 데이터센터 내 설치)

특히 VPC/온프레미스 옵션은, 데이터 주권과 컴플라이언스가 까다로운 금융, 통신, 보험, 헬스케어 업계에서 치명적인 장벽을 해결해 줍니다.23

셋째, 엔터프라이즈급 평가·관측·개선 툴

VoiceRun이 강조하는 차별점 중 하나가 “평가 기반 라이프사이클”입니다.123

  • LLM-as-a-judge: LLM이 다른 LLM의 응답을 평가해 품질을 자동 점검

  • Telemetry: 콜 단위 메트릭(응답 시간, 이탈 지점, 성공률 등)을 세밀하게 수집

  • Synthetic Data: 인위적으로 다양한 통화 상황을 만들어 회귀 테스트 수행23

실제 고객인 Tivly는 VoiceRun을 통해 몇 주 만에 제로에서 프로덕션까지 갔고, 이후 매주 정확도와 고객 만족도를 개선하는 인사이트를 얻었다고 합니다.2

이건 단순 “음성봇 생성기”가 아니라,
“음성 에이전트 품질을 계속해서 측정·개선하는 공장 자동화 시스템에 가깝다”고 보는 편이 맞습니다.


어디에 쓰나: 레스토랑부터 보험, 은행, 통신까지

그렇다면 이 공장에서 찍혀 나오는 음성 에이전트들은 실제로 어디에 쓰이고 있을까요?

현재 공개된 사례들을 보면, 크게 네 가지 축으로 정리할 수 있습니다.1235

  1. 레스토랑/리테일

    • 전화 예약, 주문, 변경, 취소

    • 피크타임에 전화가 몰려도 AI가 먼저 받게 하고, 예외 상황만 사람에게 넘김

    • “60초 이상 대기 → 이탈” 패턴을 줄이는 데 효과적

  2. 콜센터·컨택센터(보험, 통신, 금융 등)

    • 1차 상담: 본인 확인, 용건 파악, 간단한 문의는 AI가 바로 해결

    • 복잡한 이슈는 정리된 컨텍스트와 함께 사람 상담원에게 패스

    • 상담원의 ‘단순 반복 업무’를 걷어내고, 고난도 케이스에 집중하게 만드는 역할

  3. 리드 자격 검증·세일즈 퍼널 상단

    • 대량 아웃바운드 콜에서 “실제 구매 의사가 있는 사람”만 골라내어 전달

    • 지원서, 대출 신청, 보험 문의 등에서 기본 정보와 조건 확인을 자동화

  4. 고관여 서비스(헬스케어, 금융) 사전 안내

    • 병원 예약 전 안내·준비 사항 확인

    • 대출 심사 전 필요한 서류·조건 설명 및 기본 정보 수집6

이 영역들에는 공통점이 있습니다.

  • 통화량 변동이 크고

  • 단순 반복 질문·응답이 많으며

  • 잘 만들어진 스크립트만 있어도 자동화 가능성이 높은 업무라는 점입니다.65

VoiceRun은 여기서 한 발 더 나아가, “개발자가 코딩 에이전트를 감독하는 구조”를 상정합니다.
코딩 에이전트가 새로운 플로우를 만들고 테스트한 뒤, 평가 도구를 통해 검증하고, 안전하다고 판단되면 실제 고객 통화에 적용하는 식입니다.1

이게 제대로 돌아가기 시작하면,
새로운 프로모션, 정책 변경, 스크립트 수정이 필요할 때마다 ‘사람이 노가다로 수정’하던 시대에서
“코드 에이전트가 먼저 제안하고, 개발자가 승인하는” 시대가 열립니다.


여전히 사람을 선호하는 고객, VoiceRun이 바꾸려는 인식

그런데 한 가지 현실적인 문제는 여전히 남아 있습니다.
사람들은 아직도 “AI보다는 사람 상담”을 더 선호한다는 점입니다.

Five9의 한 조사에 따르면, 응답자의 약 4분의 3이 고객센터 문제를 해결할 때 사람과 직접 통화하길 선호한다고 합니다.1
“0번 누르니까 사람이 나오길 바라는 마음”은 아직도 강하죠.

Leonard는 이 인식 자체를 바꾸고 싶어 합니다.
그의 생각은 단순합니다.

  • 지금까지 음성 자동화가 ‘부서지기 쉬운 플로우, 느린 응답, 틀에 박힌 말투’였기 때문에

  • 고객이 자동 응답을 듣는 순간부터 이미 기대치가 바닥을 치고,

  • 사람 상담원이 나오면 “휴… 다행이다”를 느낀다는 것.1

하지만 인간 상담원도 완벽하진 않습니다.

  • 언어 장벽, 억양 문제

  • 개인 감정 상태에 따라 달라지는 응대 품질

  • “판단 받는 느낌”, “압박받는 느낌”을 줄 수 있는 미묘한 뉘앙스1

VoiceRun이 그리고 있는 미래는,
“사람보다 더 묵묵히 잘 듣고, 빠르게 처리하고, 판단하지 않는” 음성 에이전트입니다.

Leonard는 이런 비유를 들었습니다.
“모델 T 이전에도 훌륭한 자동차는 있었지만, 컨베이어 벨트(조립 라인)가 나오기 전까지 자동차는 대중적이지 못했다. 지금도 잘 만든 음성 에이전트는 존재하지만, ‘음성 에이전트 공장’이 나오기 전까지는 널리 쓰이지 못할 것”이라는 말입니다.1

그가 생각하는 그 공장이 바로 VoiceRun입니다.


시사점: 개발자와 기업이 지금부터 준비해야 할 것들

음성 에이전트는 더 이상 “콜봇 하나 붙여볼까?” 수준의 실험 프로젝트가 아닙니다.
몇 가지 포인트로 정리해 보면, 앞으로 준비해야 할 방향이 더 명확해집니다.

첫째, “노코드로 다 되겠지”라는 환상을 내려놓기

파일럿, PoC 단계에서는 노코드/로우코드가 유리할 수 있습니다.
하지만 실제 운영 단계에서는,

  • 복잡한 비즈니스 로직

  • 도메인 특화 규제

  • 내부 시스템과의 긴밀한 연동

이 본격적으로 문제를 일으킵니다.234

VoiceRun 같은 코드 기반 플랫폼, 혹은 오픈소스 음성 에이전트 스택을 검토할 때가 됐습니다.236

둘째, “데이터·로직의 소유권”을 전략적으로 바라보기

VoiceRun이 강조하는 차별점 중 하나가 “비즈니스 로직 코드와 데이터를 고객이 소유한다”는 점입니다.123
이는 장기적으로 매우 큰 의미를 가집니다.

  • 특정 벤더에 락인되지 않고

  • 내부 ML·데이터 팀이 쌓아온 지식을 재사용할 수 있으며

  • 규제 변화에 따라 배포 위치·모델 구성을 유연하게 바꿀 수 있기 때문입니다.

셋째, “평가·관측·개선 루프”를 조직 역량으로 키우기

좋은 음성 에이전트는 한 번 만들어 끝나는 제품이 아닙니다.
매일 통화 데이터를 통해 학습하고, 프롬프트와 플로우를 조금씩 고쳐 가며, 점점 더 사람 같은 경험을 만들어 가는 “시스템”에 가깝습니다.236

  • 어떤 질문에서 가장 자주 막히는지

  • 고객이 어느 타이밍에서 이탈하는지

  • 사람에게 넘겼을 때, 왜 넘겼는지

이런 것들을 꾸준히 모니터링하고 개선할 수 있는 팀·프로세스를 갖추는 것이 중요합니다.

넷째, “사람 + AI”를 함께 설계하기

VoiceRun도 사람 상담원을 없애겠다는 이야기는 하지 않습니다.
오히려 잘 쓰인 음성 에이전트는,

  • 고객이 “간단한 일은 AI가 더 편하다”고 느끼게 만들고

  • 복잡하고 민감한 의사결정이 필요한 부분에서 사람 상담원의 시간을 확보해 줍니다.15

앞으로 경쟁력 있는 CX 조직은,
“AI로 최대한 전단계 경험을 정리하고, 마지막 10~20% 구간에서 인간의 공감과 판단을 최대치로 발휘하는 구조”를 얼마나 세련되게 만드는지가 승부 포인트가 될 것입니다.


정리하자면, VoiceRun의 550만 달러 시드 라운드는 단순 투자 소식이 아니라 신호탄에 가깝습니다.
음성 에이전트를 “프로젝트가 아니라 제품 라인처럼, 공장에서 찍어내듯” 만들고 관리하겠다는 발상의 전환입니다.

  • 개발자에게는: 음성 에이전트를 위한 새로운 애플리케이션 스택

  • 기업에게는: 콜센터·세일즈·고객 경험을 자동화하는 새로운 인프라

  • 사용자에게는: “제발 사람 좀 바꿔주세요”에서 “이 정도면 AI도 괜찮네”로 바뀌는 경험

이제 질문은 하나입니다.
“우리 회사는 언제, 어떤 부분부터 음성 에이전트 공장을 도입할 것인가?”

지금부터라도, 파일럿 수준을 넘어서 프로덕션까지 이어지는 로드맵을 그려볼 때입니다.


참고

1VoiceRun nabs $5.5M to build a voice agent factory

2VoiceRun Raises $5.5 Million Seed Funding for Enterprise Voice AI Platform

3VoiceRun gets $5.5M in seed funding to give enterprises more control over voice AI agents

4The 8 Best AI Voice Agents for Business in 2026

VoiceRun, 550만 달러로 ‘음성 에이전트 공장’을 짓는 이유

이 노트는 요약·비평·학습 목적으로 작성되었습니다. 저작권 문의가 있으시면 에서 알려주세요.