microsoft visual chatgpt 공개 - 이미지를 다룰 수 있는 chatgpt
마이크로소프트에서 Visual ChatGPT를 발표했습니다.
Visual Foundation Model을 활용해서 이미지를 받거나 전송할 수 있다고 합니다.
chatgpt에 이미지를 인풋과 아웃풋으로 활용할 수 있네요. 전에 말씀 드렸던 다양한 포맷을 지원하는 멀티 모달의 한 양식인것 같습니다.
파이썬으로 설치해서 사용할 수 있습니다. chatgpt 부분은 OpenAI API 키를 활용해서 사용할 수 있는 것 같습니다.
GitHub - microsoft/visual-chatgpt: VisualChatGPT
ImageEditing이 6667MB VRAM을 필요로 하고 ImageCaption은 1277MB네요. colab으로 충분히 돌려볼 수 있을 것 같습니다.
멀티모달이 가능해 지면 회사에서능 고객센터 등 다양한 영역에 적용할 수 있고 실생활 데이터도 처리할 수 있다.
허깅페이스에서 사용해 볼 수 있습니다.
공유하기
조회수 : 2337