Views 42•
Z-Image 출시 요약
Summary
Z-Image는 ⚡️- Image 패밀리의 기본(foundation) 이미지 생성 모델로, 높은 품질·다양성·정확한 프롬프트 반영을 목표로 한 풀사이즈 디퓨전 트랜스포머입니다. 속도 최적화 버전인 Z-Image-Turbo와 달리, 비증류(undistilled) 구조로 전체 학습 신호를 유지해 강력한 Classifier-Free Guidance(CFG), 정교한 프롬프트 엔지니어링, LoRA/ControlNet 등 후속 파인튜닝과 연구에 적합합니다.
사진·디지털 아트·애니메이션·일러스트 등 폭넓은 스타일을 지원하며, 다양한 시드에서 구도·인물·조명 변화가 크게 나타나 다인원 장면에서도 높은 다양성을 제공합니다. 또한 네거티브 프롬프트에 잘 반응해 노이즈나 원치 않는 요소를 억제하기 쉽습니다.
권장 설정은 해상도 512×512~2048×2048, guidance scale 3.0–5.0, 추론 스텝 28–50이며, Hugging Face diffusers의 ZImagePipeline으로 간단히 사용할 수 있습니다. Turbo 모델과 비교하면 Z-Image는 CFG·네거티브 프롬프트·파인튜닝·다양성 측면에서 우위, Turbo는 속도와 시각적 품질(단일 샷 기준) 및 RL 최적화 측면에서 강점을 갖는 것으로 소개됩니다.