whisper - 음성을 인식해서 다양한 일을 할 수 있는 인공지능
OpenAI의 whisper
위스퍼는 오픈AI에서 만든 음성 인식 뉴럴넷 (인공신경망) 이다. 오픈 소스로 공개되어 있다.
GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision
다양한 오디오 파일 데이터셋을 학습한 모델을 가지고 있다. 이 모델은 여러 언어의 음성 인식과 통역을 할 수 있다고 한다.
예를 들어 음성 파일에서 목소리를 추출해 글로 만들 수 있다. 자막이나 받아쓰기를 할 때 좋을것 같다.
Introducing Whisper : OpenAI의 블로그 글이다. 여기서 예시를 볼 수 있다.
허깅페이스에서 사용해 볼 수 있게 데모가 올라와 있다. 말을 하면 문자로 표기(transcribe) 해준다.
Whisper - a Hugging Face Space by openai
공유하기
조회수 : 967