구글의 새로운 AI 모델인 MobileDiffusion은 텍스트로 이미지를 스마트폰에서 생성할 수 있습니다. 이 모델은 DALL-E나 스테이블 디퓨전, Imagen 보다 더 작은 모델을 가지고 있습니다. (520M 파라미터)

모바일 디퓨전은 512X512 이미지를 약 0.5초만에 생성할 수 있습니다. iOS나 안드로이드 디바이스 자체에서 실행되는 모델입니다.

[MobileDiffusion: Rapid text-to-image generation on-device](https://blog.research.google/2024/01/mobilediffusion-rapid-text-to-image.html) (Google research 블로그)

![](https://server.tilnote.io/images/pages/140767bb-0016-4a17-965a-334cdc05cebd.gif)

이런 식으로 글자를 입력할 때 마다 이미지를 실시간으로 생성하는 것을 알 수 있습니다.

이렇게 빠른 성능은 DiffusionGAN을 이용해서 원 스텝 샘플링을 사용함으로써 가능했다고 합니다. 스테이블 디퓨전 XL Turbo에서 스텝을 줄여 빠르게 이미지를 생성하는 것과 비슷한 것 같습니다.

생각보다 빠르게 모바일 기기에서 AI가 적용되는 모습들을 볼 수 도 있을 것 같습니다.

구글의 새로운 AI 모델인 MobileDiffusion은 텍스트로 이미지를 스마트폰에서 생성할 수 있습니다. 이 모델은 DALL-E나 스테이블 디퓨전, Imagen 보다 더 작은 모델을 가지고 있습니다. (520M 파라미터)모바일 디퓨전은 512X512 이미지를 약 0.5초만에 생성할 수 있습니다. iOS나 안드로이드 디바이스 자체에서 실행되는 모델입니다.<a href="https://blog.research.google/2024/01/mobilediffusion-rapid-text-to-image.html">MobileDiffusion: Rapid text-to-image generation on-device</a> (Google research 블로그)<img src="https://server.tilnote.io/images/pages/140767bb-0016-4a17-965a-334cdc05cebd.gif" alt="구글의 MobileDiffusion은 높은 품질의 이미지를 스마트폰에서 0.5초만에 생성한다. image 1">이런 식으로 글자를 입력할 때 마다 이미지를 실시간으로 생성하는 것을 알 수 있습니다.이렇게 빠른 성능은 DiffusionGAN을 이용해서 원 스텝 샘플링을 사용함으로써 가능했다고 합니다. 스테이블 디퓨전 XL Turbo에서 스텝을 줄여 빠르게 이미지를 생성하는 것과 비슷한 것 같습니다.생각보다 빠르게 모바일 기기에서 AI가 적용되는 모습들을 볼 수 도 있을 것 같습니다.