메인 콘텐츠로 건너뛰기

제10장. 시나리오 지문을 이미지 프롬프트로 변환하기

시나리오의 지문은 원래 카메라와 미술, 조명을 위한 지시문이다.
이 장의 목표는 이 지문을 그대로 AI 이미지·영상 프롬프트 언어로 번역하는 능력을 기르는 것이다.

장르와 툴은 무엇이든 좋다. Midjourney, Stable Diffusion, Runway, Sora, Veo 같은 도구들은 모두 "텍스트로 된 지문"을 입력받아 이미지를 만든다.810
각 툴의 문법은 조금씩 다르지만, 공통적으로 잘 먹히는 기본 구조는 같다.

지문을 프롬프트로 바꾸는 기본 구조

AI 이미지 프롬프트는 보통 세 덩어리로 생각하면 편하다.5

주어(무엇이/누가 보이는가)

상황·환경(어디서, 무엇을, 어떻게 하는가)

스타일·카메라(어떤 느낌과 화면 구성인가)

이 구조는 시나리오 지문의 기본 구성과 거의 1:1로 대응된다.

시나리오 지문 예시:

"늦은 오후. 비 내리는 골목. 주인공 민지가 축축한 우산을 접으며 허겁지겁 뛰어 들어온다."

이를 AI 이미지 프롬프트로 옮기면:

"a young woman named Minji running into a narrow alley on a rainy late afternoon, folding a wet umbrella in a hurry, wet asphalt reflecting neon signs, cinematic lighting, medium shot, from behind, shallow depth of field, high-resolution photo"

같은 지문이지만, AI가 이해할 수 있도록 시각 정보를 명시적으로 풀어 쓴 것이다.
이제 각 요소를 어떻게 추출하는지 쪼개 보자.

1. "무엇이 보이는가": 주어를 명확하게

AI 프롬프트의 첫 줄은 보통 "보여야 하는 것"부터 시작하는 것이 좋다.5

시나리오 지문에서 인물, 대상, 사물을 추려서 한 문장으로 만든다.

"민지가 골목으로 뛰어 들어온다."
→ "a young Korean woman in her 20s, slightly soaked from rain"

"낡은 다세대 건물들이 양옆으로 빽빽이 서 있다."
→ "old narrow apartment buildings crowding both sides of the alley"

가능하면 추상어(절망, 희망, 외로움)보다는 구체적인 물질(사람, 건물, 우산, 물웅덩이)을 앞에 둔다.5

2. "어디서, 무엇을 하는가": 상황·환경을 시각 언어로 풀기

시나리오 지문은 종종 이렇게 적는다.

"골목은 을씨년스럽다. 사람의 기척이 없다."

AI에게는 너무 추상적이다. 같은 의미를 시각적으로 번역해야 한다.

"을씨년스럽다"
→ "empty narrow alley, trash bags piled up, flickering neon sign, few broken street lights, wet asphalt, light fog"

"사람의 기척이 없다"
→ "no people, deserted street"

설정(장소·시간·날씨)은 프롬프트에서 꼭 적는다.3

"late afternoon, light rain, overcast sky"

이렇게 환경과 상황을 풀어주면, 같은 지문에서도 훨씬 구체적인 이미지가 나온다.5

3. 카메라 위치와 거리: 영화 지문 → 카메라 프레이밍/앵글

영화 시나리오의 "카메라 지시"에 해당하는 부분은 곧바로 카메라 프레이밍과 앵글 키워드로 치환할 수 있다.12

프레이밍(거리) 핵심 키워드 예:2

"extreme close-up" (눈, 입술, 손가락 같은 디테일 강조)

"close-up" (얼굴 감정 전달)

"medium shot" (허리 위, 동작과 표정 균형)

"full body shot" (전신, 움직임 강조)

"establishing shot" (장소 전체 스케일 보여주기)

앵글(위치) 핵심 키워드 예:12

"low angle shot", "from below", "hero view"
→ 인물을 커 보이게, 위압적·영웅적으로

"high angle shot", "from above"
→ 인물을 작고 약하게

"bird's-eye view", "overhead shot", "top down shot"
→ 위에서 내려다보며 패턴과 구조 강조

"side view", "back view", "from behind", "straight on"
→ 인물 방향 지정

시나리오 지문 예:

"우리는 민지를 아래에서 올려다본다. 거대한 빌딩 사이에 갇힌 듯 위축돼 보인다."

프롬프트:

"full body shot of Minji standing between two tall buildings, low angle shot, from below, buildings towering over her, she looks small and intimidated"

카메라 거리를 쓰지 않으면 모델이 제멋대로 잡기 때문에, "close-up / medium shot / full body shot / establishing shot" 같은 기본 키워드는 적극적으로 넣어주는 것이 좋다.25

4. 감정과 분위기: 추상어 대신 화면에 보이는 증거

지문에서 감정은 보통 이렇게 적힌다.

"민지는 두려움에 질린 얼굴로 뒤를 돌아본다."

프롬프트에는 "fear"라고만 적기보다, 얼굴과 몸짓을 구체적으로 서술한다.

"Minji glances back over her shoulder with wide, fearful eyes, tense shoulders, slightly open mouth as if gasping"

분위기도 마찬가지다.

"불길한 분위기"
→ "dark narrow alley, deep shadows, only one flickering neon sign, light fog, muted colors, high contrast lighting, cinematic, suspenseful mood"

이런 식으로 "기분"을 "보이는 것"으로 번역하면, AI가 훨씬 정확히 따른다.5

5. 스타일과 매체: 한 줄로 통제하기

같은 시나리오라도, 콘셉트 아트, 사진, 3D, 수채화 등 어떤 결과를 원하느냐에 따라 스타일 키워드가 달라진다.53

사진 느낌:
"high-resolution photograph, realistic, shallow depth of field"

콘셉트 아트:
"cinematic concept art, digital painting, dramatic lighting"

도시·건축이 중요한 장면이라면 건축 렌더링 스타일도 사용할 수 있다.3

"archdaily style, photorealistic architectural rendering, many details, dramatic lighting"

너무 많은 카메라 브랜드와 렌즈 숫자를 나열하는 것은 대체로 의미가 없다. Midjourney 같은 도구는 실제 카메라처럼 ISO, 조리개를 정확히 조정하지 않는다.7
"hyper realistic photo, cinematic lighting, shallow depth of field"처럼 결과에 직접적인 영향을 주는 단어들 위주로 간결하게 쓰는 편이 좋다.7

6. 지문 한 단락 → 프롬프트 한 문단으로 옮기는 예시

시나리오 지문:

"밤. 옥상. 민지는 도시 불빛을 내려다본다. 카메라는 멀리서 다가오며, 결국 그녀의 눈동자 속에 비친 네온사인을 클로즈업한다. 바람이 세게 분다."

프롬프트로 번역:

"establishing shot, night rooftop in a big city, countless neon signs glowing in the distance, cold wind blowing her hair, then medium shot pushing in to a close-up of Minji's eyes reflecting neon lights, cinematic, moody, high contrast lighting, shallow depth of field, hero view, 16:9 aspect ratio"

이미지 생성용이라면 "한 컷"만 뽑는다고 가정하고, 가장 중요한 순간만 골라 간결하게 정리한다.

"close-up of Minji's eyes on a windy rooftop at night, neon city lights reflected in her pupils, cinematic, moody, high contrast lighting, shallow depth of field"

영상 생성(Sora, Veo, Runway 등)이라면 카메라 움직임까지 문자로 지시할 수 있다.6810

"a slow push-in shot on a windy rooftop at night, Minji stands at the edge, looking at the neon city below, camera slowly moves from a medium shot to an extreme close-up of her eyes reflecting neon lights, cinematic, 16:9"

7. 초보자를 위한 최소 프롬프트 틀

프롬프트를 쓸 때마다 아래 네 줄을 채운다고 생각하면 편하다.

  1. 주어
    "who/what"부터: "a young woman", "a rainy alley", "a futuristic cliffside building"

  2. 상황·환경
    "doing what, where, when, weather": "running through a narrow alley at night, heavy rain, neon reflections on wet pavement"

  3. 카메라
    "framing + angle": "medium shot, from behind", "bird's-eye view", "low angle shot, full body shot"125

  4. 스타일·분위기
    "medium + mood": "cinematic concept art, dramatic lighting, moody, high contrast", 또는 "photorealistic, soft lighting, calm atmosphere"35

이 네 줄만 지켜도, 지문을 거의 자동 번역하듯이 프롬프트를 만들 수 있다.

8. 샷 설계와 스토리보드: 같은 지문, 다른 샷들

하나의 지문에서 여러 샷을 뽑아야 할 때는, 프롬프트에서 프레이밍과 앵글만 교체하며 시리즈를 만든다.29

예시 지문:

"민지는 골목 입구에 멈춰 서서 숨을 고른다. 뒤에서 누군가 다가오는 발소리가 점점 커진다."

샷 A - 분위기용 Establishing Shot:

"establishing shot, high angle, from above, a lonely narrow alley at night, Minji standing at the entrance, small and vulnerable, dim street lights, wet asphalt, cinematic, suspenseful"

샷 B - 감정용 Close-Up:

"close-up, straight on, Minji's face sweating and nervous, breathing heavily, neon reflections on her wet skin, shallow depth of field, dark background, cinematic lighting"

샷 C - 공포 강조용 Low Angle Full Body:

"full body shot, low angle shot from below behind Minji, a dark silhouette approaching from the far end of the alley, Minji frozen in fear, long shadows, foggy, dramatic lighting, horror mood"

이렇게 이미지 샷들을 뽑아두면, 나중에 Runway나 Sora의 스토리보드 기능으로 연결해 영상 시퀀스를 만들 수 있다.489

9. 도구별로 살짝 다듬기

Midjourney: 짧고 신호가 강한 문장을 선호한다. 관용적인 카메라 용어("wide shot", "hero view", "low angle shot", "close-up")를 잘 이해한다.135

Stable Diffusion / SDXL: "close-up, medium shot, full body shot, from below, from above" 같은 키워드를 콤마로 나열하는 방식이 잘 먹힌다. 필요하다면 가중치도 쓸 수 있다. 예: "(hero view:1.3)".25

Runway, Sora, Veo: 시네마틱 용어("over the shoulder shot", "timelapse", "aerial shot")와 카메라 움직임("camera pans left", "slow dolly in")을 비교적 충실하게 따른다.4689

핵심은, 시나리오에 이미 있는 '카메라 감각'을 그대로 문자로 옮기되, 각 모델이 잘 이해하는 표현 쪽으로 살짝 번역해 주는 것이다.

10. 연습법: 기존 시나리오 한 장면을 "프롬프트 대본"으로 만들기

연습 단계에서는 한 장면을 이렇게 정리해 보라.

첫째, 원본 시나리오 지문을 한 단락으로 쓴다.

둘째, 그 장면에서 꼭 필요한 샷 3~5개를 머릿속으로 설계한다.
(Establishing / 주인공 표정 / 액션 / 디테일 클로즈업 등)

셋째, 각 샷마다

"주어 + 상황·환경 + 카메라 + 스타일·분위기"

를 한 문단 프롬프트로 적는다.

이렇게 만들어진 문서를 "프롬프트용 대본(prompt script)"이라고 생각하면 된다.
이 대본은 곧바로 이미지 생성, 그리고 나중에는 영상 생성 파이프라인으로 이어진다.4689

당신이 익숙한 언어는 시나리오 지문의 언어다.
이 장에서 한 일은 그 언어를 "AI가 이해하는 시각 언어"로 옮기는 번역 연습이다.
이 번역이 익숙해지는 순간, 당신은 더 이상 AI 툴의 '사용자'가 아니라, AI 스태프를 이끄는 '감독'이 된다.

참고

115 Midjourney Camera Angles and How to Choose (with Examples)

2SDXL Guide to Camera Framing and Angle | Weird Wonderful AI Art

3Best Architecture Prompts for Midjourney and Stable Diffusion | MyArchitectAI

4Storyboarding with AI | Stable Diffusion 2.1

5How to write AI image prompts like a pro | LetsEnhance

6Ditch These Pointless Midjourney Photography Terms

7Introducing Gen-3 Alpha: A New Frontier for Video Generation | Runway

8Machine Learning Guide | AI Video Generation: Veo 3 vs Sora, Kling, Runway, Stable Video Diffusion

9The Most Affordable and Stable Sora 2 API | Kie.ai

10Veo 3 vs Top AI Video Generators: Sora, Runway, Kling, Seedance, and More Compared

115 Generative AI Video Tools Take On the Same Prompt, Starting with Sora

이 노트는 요약·비평·학습 목적으로 작성되었습니다. 저작권 문의가 있으시면 에서 알려주세요.