구글의 MobileDiffusion은 높은 품질의 이미지를 스마트폰에서 0.5초만에 생성한다.
구글의 새로운 AI 모델인 MobileDiffusion은 텍스트로 이미지를 스마트폰에서 생성할 수 있습니다. 이 모델은 DALL-E나 스테이블 디퓨전, Imagen 보다 더 작은 모델을 가지고 있습니다. (520M 파라미터)
모바일 디퓨전은 512X512 이미지를 약 0.5초만에 생성할 수 있습니다. iOS나 안드로이드 디바이스 자체에서 실행되는 모델입니다.
MobileDiffusion: Rapid text-to-image generation on-device (Google research 블로그)
이런 식으로 글자를 입력할 때 마다 이미지를 실시간으로 생성하는 것을 알 수 있습니다.
이렇게 빠른 성능은 DiffusionGAN을 이용해서 원 스텝 샘플링을 사용함으로써 가능했다고 합니다. 스테이블 디퓨전 XL Turbo에서 스텝을 줄여 빠르게 이미지를 생성하는 것과 비슷한 것 같습니다.
생각보다 빠르게 모바일 기기에서 AI가 적용되는 모습들을 볼 수 도 있을 것 같습니다.
공유하기
조회수 : 193