검색
검색
공개 노트 검색
회원가입로그인

stable diffusion 사용법 - txt2img (첫 화면)

stable diffusion webui

스테이블 디퓨전의 webui에 접속하면 화면이 이렇게 나온다.

stable diffusion 사용법 - txt2img (첫 화면) image 1

사용법은 매우 간단하다. Prompt에 원하는 키워드를 넣고 Generate를 누르면 된다. 사물을 묘사하는데 어려움이 있다면 구글 번역이나 파파고 번역을 사용하자.

Negative prompt에는 나오지 않기를 원하는 키워드를 넣으면 된다.

sampling method

stable diffusion은 샘플링 타입에 따라 이미지를 생성한다. sampler들 간의 차이는 크지 않다. 하지만 미묘한 차이를 위해서 sampling method를 바꿀 수 있다.

가능한 모델은 다음과 같다.

Euler a, Euler, LMS, Heun, DPM2, DPM2 a, DPM++ 2S a, DPM++ 2M, DPM++ SDE, DPM fast, DPM adaptive, LMS Karras, DPM2 Karras, DPM2 a Karras, DPM++ 2S a Karras, DPM++ 2M Karras, DPM++ SDE Karras, DDIM, PLMS

stable diffusion 사용법 - txt2img (첫 화면) image 2

sampling steps

sampling steps는 수치가 높을 수록 더 높은 퀄리티의 사진을 만들 수 있다. sampling steps는 보통 20~25정도를 사용한다. 25 이상은 조금 다른 이미지를 만들어낼 수 있지만 더 나은 퀄리티를 보장하지는 않는다고 한다. 이 수치가 높을 수 록 이미지를 생성해 내는데 시간이 더 걸린다.

width and height

이미지의 넓이와 높이를 이야기 한다. 높을 수록 자원을 더 많이 사용한다. 많이 사용하는 포맷은 512x512와 768x768px이 있다.

batch count (이미지의 개수)

한 번의 배치에 생성이 되는 이미지의 갯수를 이야기한다. 순차적으로 실행되기 때문에 속도나 vram에 영향을 끼치지는 않는다.

batch size (배치의 개수)

한 번의 몇 개의 배치를 병렬로 처리할지를 설정하는 옵션. 높을 수록 속도가 빨라지지만 vram을 더 많이 사용한다.

그래서 최종 생성되는 이미지는 batch count * batch size 가 된다. 그래픽 카드 메모리가 작으면 batch count를 올리고 메모리가 충분하면 batch size를 높이면 될 것 같다.

그래도 이미지 생성에는 시간이 들어가니 최적의 균형은 본인이 사용해 보면서 찾아보자. 나의 경우 1로 놓고 원하는 이미지 스타일을 찾다가 원하는 방향이 나오면 batch count 2, batch size를 2로 각각 높여서 찾아 본다.

CFG scale

이미지 생성에 얼마나 자유도 (freedom) 을 주느냐를 이야기한다. cfg가 높으면 프롬프트와 다른 결과가 나올 확률이 크다. 처음 값은 7로 세팅되어 있다. 높을 수록 자유로운 이미지를 생성한다.

seed

이미지를 생성에 영향을 미치는 숫자이다. 같은 프롬프트, 같은 세팅, 같은 시드를 사용하면 정확히 같은 이미지가 나온다. -1로 설정하면 매번 다른 값을 만들어서 진행한다.

controlnet

이미지에 구조를 입력해서 해당 구조와 같은 이미지로 변형할 수 있는 기술이다. stable diffusion + controlnet 사용해 보기 - 뼈대만으로 이미지 만들기

todo

이미지 생성해 보기. 이미지를 생성해 보자!

cat 을 입력해 보세요. 어떤가요. 잘 나왔나요?

stable diffusion 사용법 - txt2img (첫 화면) image 3

지켜보고 있다...

stable diffusion 사용법 - txt2img (첫 화면) image 4

이미지가 나오면 Save를 누른 후 (조금 기다려야 한다.) Download를 눌러서 다운받아 보자.

추가 설명

  • Restore faces : 얼굴이나 눈이 이상하게 나왔을 때 해당 부분을 다시 그릴 수 있는 옵션이다.

  • Tiling : 이미지를 타일링화 하는 기술이다.

  • Hires fix : 이미지 업스케일러. 예를 들어 512x512 를 1024x1024로 해상도를 높여서 업스케일을 해주는 기능이다.

조회수 : 18971
heart
공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기
T
페이지 기반 대답
AI Chat