마이크로소프트에서 Visual ChatGPT를 발표했습니다.

Visual Foundation Model을 활용해서 이미지를 받거나 전송할 수 있다고 합니다.

![](https://server.tilnote.io/images/pages/b9b36e46-bcaa-4967-8b56-f0e05d909be4.gif)

chatgpt에 이미지를 인풋과 아웃풋으로 활용할 수 있네요. 전에 말씀 드렸던 다양한 포맷을 지원하는 멀티 모달의 한 양식인것 같습니다.

파이썬으로 설치해서 사용할 수 있습니다. chatgpt 부분은 OpenAI API 키를 활용해서 사용할 수 있는 것 같습니다.

[GitHub - microsoft/visual-chatgpt: VisualChatGPT](https://github.com/microsoft/visual-chatgpt)

ImageEditing이 6667MB VRAM을 필요로 하고 ImageCaption은 1277MB네요. colab으로 충분히 돌려볼 수 있을 것 같습니다.

멀티모달이 가능해 지면 회사에서능 고객센터 등  다양한 영역에 적용할 수 있고 실생활 데이터도 처리할 수 있다.

허깅페이스에서 사용해 볼 수 있습니다.

https://microsoft-visual-chatgpt.hf.space

마이크로소프트에서 Visual ChatGPT를 발표했습니다.Visual Foundation Model을 활용해서 이미지를 받거나 전송할 수 있다고 합니다.<img src="https://server.tilnote.io/images/pages/b9b36e46-bcaa-4967-8b56-f0e05d909be4.gif" alt="microsoft visual chatgpt 공개 - 이미지를 다룰 수 있는 chatgpt image 1">chatgpt에 이미지를 인풋과 아웃풋으로 활용할 수 있네요. 전에 말씀 드렸던 다양한 포맷을 지원하는 멀티 모달의 한 양식인것 같습니다.파이썬으로 설치해서 사용할 수 있습니다. chatgpt 부분은 OpenAI API 키를 활용해서 사용할 수 있는 것 같습니다.<a href="https://github.com/microsoft/visual-chatgpt">GitHub - microsoft/visual-chatgpt: VisualChatGPT</a>ImageEditing이 6667MB VRAM을 필요로 하고 ImageCaption은 1277MB네요. colab으로 충분히 돌려볼 수 있을 것 같습니다.멀티모달이 가능해 지면 회사에서능 고객센터 등 다양한 영역에 적용할 수 있고 실생활 데이터도 처리할 수 있다.허깅페이스에서 사용해 볼 수 있습니다.<a href="https://microsoft-visual-chatgpt.hf.space">https://microsoft-visual-chatgpt.hf.space</a>