GPT-4o 로 한글 OCR 하기
GPT-4o에서 정말 성능이 많이 향상된 것은 비전 능력입니다. 이 이미지 인식 능력을 활용해서 한글 OCR을 할 수 있는데요. 성능이 장난이 아닙니다.
이런 식으로 변형이 된 텍스트도 인식할 수 있습니다. 프롬프트는 다음 이미지 OCR
을 입력했습니다.
이번에는 화면을 캡처 한 후 질문하겠습니다. 한글과 영어가 섞여 있는 화면입니다.
프롬프트 : 다음 이미지에서 텍스트 추출
거의 완벽하게 한글과 영어를 OCR 한 것을 알 수 있습니다.
오디오 인식 기능도 whisper v3를 넘어섰는데 아직 테스트 해보지는 못했습니다.
gpt4-o의 장점은 바로 이런 멀티 모달리티입니다.
공유하기
조회수 : 3041