검색
검색
공개 노트 검색
회원가입로그인

whisper - 음성을 인식해서 다양한 일을 할 수 있는 인공지능

OpenAI의 whisper

위스퍼는 오픈AI에서 만든 음성 인식 뉴럴넷 (인공신경망) 이다. 오픈 소스로 공개되어 있다.

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

다양한 오디오 파일 데이터셋을 학습한 모델을 가지고 있다. 이 모델은 여러 언어의 음성 인식과 통역을 할 수 있다고 한다.

예를 들어 음성 파일에서 목소리를 추출해 글로 만들 수 있다. 자막이나 받아쓰기를 할 때 좋을것 같다.

Introducing Whisper : OpenAI의 블로그 글이다. 여기서 예시를 볼 수 있다.

허깅페이스에서 사용해 볼 수 있게 데모가 올라와 있다. 말을 하면 문자로 표기(transcribe) 해준다.
Whisper - a Hugging Face Space by openai

조회수 : 763
공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기