검색
회원가입로그인

Deepgram의 Aura는 AI 에이전트에게 음성을 제공합니다.

  • Deepgram은 음성 인식 분야의 선도적인 스타트업이다.
  • 새로운 실시간 텍스트-음성 변환 API인 'Aura'를 출시했다.
  • Aura는 현실감 있는 음성 모델을 제공하며 낮은 대기 시간의 API로 개발자가 실시간 대화형 AI 에이전트를 개발할 수 있게 한다.
  • 이 AI 에이전트들은 대규모 언어 모델(Large Language Models, LLM)을 기반으로 하여 고객 서비스 에이전트로서 역할을 할 수 있다.
  • Deepgram의 공동 창립자이자 CEO인 Scott Stephenson은 고품질의 음성 모델 접근성은 이미 가능하지만 비싸고 계산 시간이 오래 걸리며, 대기 시간이 짧은 모델은 로봇처럼 들린다고 말했다.
  • Deepgram의 Aura는 인간과 유사한 음성 모델을 매우 빠르게 (대체로 반 초 미만) 제공하며, 저렴한 가격으로도 제공한다고 Stephenson은 강조했다.
  • Aura의 현재 가격은 1,000자당 $0.015로 경쟁업체들보다 낮은 가격을 제공한다.
  • Aura는 현재 약 12개의 음성 모델을 제공하며, 이는 Deepgram이 목소리 배우들과 함께 만든 데이터셋으로 훈련되었다.
  • 속도와 더불어 Deepgram의 기존 고품질 음성-텍스트 모델도 주목할 만하다.
  • Deepgram은 오랜 시간 개발하여 이 제품이 빠른 속도로 음성 반응을 생성하는 것을 강조한다.
  • Deepgram은 기업용 음성 인식 사업 확대를 위해 새로운 자금을 확보했다.

3techcrunch.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기