검색
검색
공개 노트 검색
회원가입로그인

OpenAI가 GPT-4o의 고급 음성 모드를 일부 유료 사용자에게 출시합니다.

OpenAI가 이야기했던대로 제한된 수의 ChatGPT Plus 사용자에게 Advanced boice mode의 초기 접근을 제공하고 있습니다. 2024년 가을까지 모든 Plus 사용자에게 점진적으로 롤아웃 예정이라고 합니다.

이번 모드는 다음과 같은 두 가지 특성이 있습니다.

  • 감정적 억양 인식 및 사용 가능. : 감정을 이해하고 감정을 담아 이야기할 수 있음.

  • GPT-4o는 다중 모드로 작동, 더 낮은 지연 시간 제공. : 정말 낮은 지연 시간으로 응답 가능.

OpenAI가 GPT-4o의 고급 음성 모드를 일부 유료 사용자에게 출시합니다. image 1

Deepfake 논란 방지를 위해 다른 사람의 목소리는 모사가 불가합니다. 새로운 음성 모드는 Juniper, Breeze, Cove, Ember라는 4개의 사전 설정된 목소리로 제한합니다.

저작권 보호를 위해 특정 요청과 음원 생성 필터링을 도입했다고 합니다.

OpenAI가 GPT-4o의 고급 음성 모드를 일부 유료 사용자에게 출시합니다. image 2

작동하는 모습.

보시면 현재 음성 모드만 있습니다. 비디오와 스크린 쉐어링은 차후 공개될 예정입니다.

x.com : 데모. 파일럿의 목소리를 흉내내는 GPT.

x.com : 프랑스어를 배우는 모습.

x.com : 실시간 일본어 번역. 게임보기 - GPT.

x.com : vision 으로 집분석하기.

x.com : 그 밖에 다양한 사례 큐레이션.

OpenAI 공지 트윗 : x.com

그 외에 알아야할 사항 요약 (OpenAI FAQ)

  1. Advanced Voice Mode는 iOS 및 Android ChatGPT 앱에서 사용 가능

  2. 시스템 요구 사항: Android 앱 버전 1.2024.206 이상, iOS 앱 버전 1.2024.206 이상 및 iOS 16.4 이상

  3. 자연스럽고 실시간 대화, 감정 및 비언어적 신호 인식 기능 포함

  4. 현재 제한된 알파 버전, 오류 발생 가능성 있음

  5. 알파 버전에 초대된 사용자는 이메일로 안내받음

  6. Advanced Voice Mode 활성화 방법: 화면 하단 오른쪽 음성 아이콘 선택

  7. 대화 중 마이크 아이콘으로 음소거/음소거 해제 가능, 빨간 아이콘으로 대화 종료 가능

  8. Advanced Voice Mode는 메모리 또는 사용자 지정 명령어를 사용하지 않음

  9. Advanced Voice Mode 대화는 고급 음성, 텍스트 또는 표준 음성으로 재개 가능

  10. 끊김 방지를 위해 헤드폰 사용 권장, iPhone에서는 음성 격리 모드 사용 권장

  11. Advanced Voice Mode는 차량 블루투스나 스피커폰 사용에 최적화되지 않음

  12. Advanced Voice Mode는 GPTs와 함께 사용할 수 없음

  13. 음악 콘텐츠 생성 불가

  14. 비디오 및 화면 공유 기능은 추후 제공 예정

  15. 가을에 모든 Plus 사용자에게 제공 예정

  16. 무료 계정으로 다운그레이드 시 Advanced Voice Mode 접근 불가

  17. 음성 대화의 전사 내용이 대화와 일치하지 않을 수 있음

  18. 알파 기간 동안 공유된 음성 데이터를 모델 훈련에 사용 가능, 데이터 공유 설정에서 옵트아웃 가능

  19. 표준 음성 모드에서 음성 데이터를 공유하면 모델 훈련에 사용 가능, 개인 정보 감소 조치 시행

공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기
조회수 : 2156
heart
T
페이지 기반 대답
AI Chat