콘텐츠로 이동

AI 영상 생성 프롬프트 엔지니어링 2026 완전 가이드

2026년 AI 영상 생성은 "작성법의 좋고 나쁨에 따라 결과가 천지 차이" 단계에 돌입했습니다. 같은 모델로도 어떤 사람은 영화급 퀄리티를 만들어내는 반면, 어떤 사람은 왜곡된 픽셀 덩어리를 얻게 됩니다 -- 그 차이는 전적으로 프롬프트에 있습니다.

이 기사에서는 불필요한 내용을省고 핵심만 전달합니다.读完你就能 쓸 수 있는, 재사용 가능한 영상 생성 프롬프트.

왜 영상 프롬프트가 이미지 프롬프트보다 어려운가?

이미지 생성은 "한 프레임"의 묘사만으로 충분합니다. 반면 영상 생성은 공간(영상 콘텐츠) + 시간(움직임 변화) + 오디오(대사/효과음)의 세 차원을 동시에 컨트롤해야 합니다.

어떤 차원이 빠져도 모델이 스스로 보완합니다 -- 그리고 모델의 보완은 대개 당신이 원하는 것이 아닙니다.

프롬프트의 6요소 구조

완전한 영상 프롬프트는 다음 6차원을 커버해야 합니다. 매번 모두 채울 필요는 없지만, 각 차원의 존재를 알아야 합니다.

1. 주체 (Subject)

화면에 누가/무엇이 있는지를 묘사합니다. 구체적이면 구체적일수록 좋습니다.

# 모호함
소녀가 거리를 걷고 있다

# 구체적
20세 아시아 여성, 빨간 트렌치코트를 입고, 검은 생머리, 도쿄 시부야 스크램블 교차로를 걷고 있다

2. 움직임 (Motion)

주체가 무엇을, 어떻게 움직이는지를 묘사합니다. 이것이 영상 프롬프트와 이미지 프롬프트의 핵심적인 차이입니다.

# 움직임 정보 없음
소녀가 거리를 걷고 있다

# 명확한 움직임
그녀가 경쾌하게 앞으로 걸으며, 코트 자락이 바람에 흔들리고, 발걸음은 가볍게, 카메라가 그녀를 따라 전진

자주 쓰는 움직임 묘사 키워드:

움직임 종류 영어 키워드 효과
평행 이동 walking, running, flying 주체의 이동
느린 움직임 slowly drifting, gently swaying 부드러운 분위기
빠른 움직임 sprinting, rushing, zooming 속도감
회전 운동 spinning, rotating, orbiting 주회 카메라
변형/용해 morphing, dissolving, transforming 크리에이티브 트랜지션

3. 환경/シーン (Environment)

어디서를 묘사합니다. 장소, 날씨, 시간을 포함합니다.

# 완전한 환경 묘사
도쿄 시부야 스크램블 교차로, 밤, 네온이 반짝이고, 가랑비가 내리며, 땅에 컬러풀한 빛 반점이 반사

4. 카메라워크 (Camera Work)

많은 초보자가 간과하는 부분입니다. 어떤 카메라로 찍는지가 영상의 퀄리티를 직접 결정합니다.

# 프로페셔널한 카메라 묘사
미디엄 쇼트, 얕은 피사계 심도, 배경 흐림, 슬로우 푸시인, 핸드헬드 카메라 스타일

자주 쓰는 카메라 용어:

카메라 종류 효과
close-up / 클로즈업 표정이나 디테일 강조
medium shot / 미디엄 쇼트 인물 상반신, 가장 일반적
wide shot / 와이드 쇼트 환경의 전체상 제시
bird's eye view / 버드아이 뷰 정면 위에서의 조감
low angle / 로 앵글 로 앵글, 압박감이나 영웅감 연출
dolly zoom / 돌리 줌 배경 압축, 클래식 스릴러 효과
tracking shot / 트래킹 쇼트 카메라가 주체의 움직임에 추종
pan / 팬 카메라의 수평 회전
slow push-in / 슬로우 푸시인 긴장감이나 집중감 연출

5. 빛과 색조 (Lighting & Mood)

빛이 영상의 분위기를 결정합니다.

# 빛 묘사
따뜻한 색조의 석양 백라이트, 얼굴에 금빛 광채, 하이 콘트라스트, 영화급 컬러 그레이딩(cinematic color grading)

자주 쓰는 빛 키워드:

  • golden hour -- 골든아워(일몰/일출의 따뜻한 빛)
  • blue hour -- 블루아워(황혼의 푸른 톤)
  • dramatic lighting -- 드라마틱한 빛과 그림자
  • soft diffused light -- 부드러운 확산광
  • neon glow -- 네온의輝き
  • backlit / silhouette -- 백라이트/실루엣
  • high key / low key -- 하이키/로키

6. 스타일과 화질 (Style & Quality)

모델에게 어떤 스타일의 영상이 필요한지伝えます.

# 스타일 묘사
영화급 퀄리티, 4K 해상도, 필름 그레인, 디킨스 촬영 스타일, 화면 비율 2.39:1

자주 쓰는 스타일 키워드:

  • cinematic -- 영화급 퀄리티
  • photorealistic -- 리얼리즘 스타일
  • anime style -- 애니메이션 스타일
  • documentary style -- 다큐멘터리 스타일
  • 3D animation -- 3D 애니메이션
  • watercolor / oil painting -- 수채화/유화 스타일

완전한 프롬프트 템플릿

6요소를 연결하면 완전한 프롬프트가 됩니다:

[주체] + [움직임] + [환경/シーン] + [카메라워크] + [빛과 색조] + [스타일과 화질]

실전 예시:

A 30-year-old man in a dark suit, standing on a rooftop at midnight, rain falling around him.
He slowly turns his head toward the camera, a faint smile on his face.
Medium shot, slow push-in, shallow depth of field with the city skyline softly blurred in the background.
Cold blue moonlight from above, warm orange neon signs reflecting on wet surfaces,
high contrast, cinematic color grading, 4K resolution, anamorphic lens flares,
aspect ratio 2.39:1.

중국어 프롬프트도 같은 구조로 사용 가능하지만, 대부분의 AI 영상 모델은 영어 프롬프트 이해가 중국어보다 훨씬 뛰어나다는 점에 주의하세요. 가능하면 항상 영어를 사용하세요.

주요 플랫폼의 프롬프트 차이

모델에 따라 프롬프트에 대한 감도가 다릅니다. 이러한 차이를 이해하면 많은 우회로를 피할 수 있습니다.

Kling 3.0 (可霊)

  • 물리적 움직임 이해가 뛰어나며, 움직임 묘사는 구체적이어야 함
  • 중국어 프롬프트 지원, 국내 사용에 친화적
  • 리얼한シーン에 강하고, 소재와 빛의 재현성이 높음
  • 프롬프트 조언: 동작과 물리적 상호작용을 상세히 묘사
  • 공식 사이트: klingai.com
# Kling 3.0 스타일 프롬프트
A woman pouring coffee from a ceramic mug into a glass cup,
liquid streams visible with natural physics, steam rising,
close-up shot, warm kitchen lighting, photorealistic, 4K

Google Veo 3.1

  • 네이티브 음성 동기 지원, 프롬프트에서 음성을 묘사할 수 있음
  • 최대 15초, 1080p 출력
  • 영화급 화질, 내러티브 콘텐츠에 적합
  • 프롬프트 조언: 음성 묘사(대사, 환경음 등) 추가
  • 공식 사이트: deepmind.google/veo
# Veo 3.1 스타일 프롬프트(음성 포함)
A jazz pianist playing in a dimly lit club, fingers moving across the keys,
slow zoom into the piano. Smooth jazz music playing,
crowd murmuring softly in the background,
warm amber lighting, cinematic, 4K

Runway Gen-4.5

  • 강력한 이미지에서 영상으로(I2V) 기능
  • 정밀한 움직임 컨트롤(Motion Brush) 지원
  • 정지 영상에서 영상을 제작하는 데 최적
  • 프롬프트 조언: 참고 이미지와 병용하고, 텍스트 묘사로 움직임을 보완
  • 공식 사이트: runwayml.com
# Runway Gen-4.5 스타일 프롬프트(I2V 병용)
The camera slowly orbits around the subject,
wind blowing through her hair, subtle breathing motion,
gentle handheld camera movement, cinematic lighting

Wan 2.6 (通義万相)

  • 알리바바의 최신 모델, 멀티쇼트 내러티브 지원
  • 네이티브 음성 동기, 립싱크 정확
  • 최대 15초, 1080p
  • 프롬프트 조언: 멀티쇼트 전환(cut to, transition to 등) 묘사
  • 공식 사이트: wan.video
# Wan 2.6 스타일 프롬프트(멀티쇼트)
Opening shot: a rocket launching from a launchpad,
wide angle, smoke billowing. Cut to:
close-up of the astronaut inside the cockpit,
control panels glowing blue. Transition to:
view from the window as Earth shrinks below,
cinematic orchestral music swelling, 4K

프롬프트 고급 팁

팁 1: 짧게 시작해서 길게

처음부터 200자의 긴 프롬프트를 쓰지 마세요. 핵심 요소부터 시작해 점차 추가합니다.

# 1回目: 주체 + 움직임
A cat jumping onto a table

# 2回目: + 환경 + 카메라
A ginger cat jumping onto a wooden dining table in a sunny kitchen,
medium shot, slow motion

# 3回目: + 빛 + 스타일
A ginger cat jumping onto a wooden dining table in a sunny kitchen,
morning light streaming through windows, dust particles in the air,
medium shot, slow motion, photorealistic, 4K, warm tones

팁 2: 네거티브 프롬프트로 원하지 않는 콘텐츠 제외

일부 플랫폼은 네거티브 프롬프트를 지원하며, 모델에게 무엇이 필요 없는지를 전달할 수 있습니다.

Negative prompt: deformed, blurry, extra limbs, text, watermark,
cartoon, low resolution, unnatural movement, flickering

팁 3: 참고 이미지가 텍스트보다 효과적

이미지에서 영상으로(I2V)シーン에서는 좋은 참고 이미지 1장 + 짧은 움직임 묘사가 순수 텍스트 프롬프트의 10배 효과가 있는 경우가 많습니다.

# 참고 이미지와 병용하는 프롬프트(Runway / Kling 등)
The camera slowly pushes in, wind blowing through the trees,
leaves gently falling, cinematic lighting

팁 4: 콘티로 리듬 컨트롤

10초 이상의 영상의 경우, 콘티 형식의 묘사를 시도해 보세요:

0-3s: Wide establishing shot of a cityscape at dawn,
      clouds moving slowly across the sky
3-6s: Cut to street level, people walking, camera tracking forward
6-10s: Close-up on a coffee cup being placed on a café table,
       steam rising, warm lighting

흔한 실수와回避 가이드

실수 결과 수정 방법
주체만 쓰고 움직임을 안 씀 정지 화면 또는 랜덤 움직임 움직임 방향과 속도를 명확히 묘사
움직임 묘사가 모순됨 영상이撕裂되거나 부자연스러움 "정지+달리기" 같은 모순 피하기
카메라워크 무시 밋밋한 영상 최소한 하나의 카메라 용어 추가
프롬프트가 너무 긺 모델이 핵심을 잃음 50~150단어로 제한
중국어 프롬프트 이해 차이가 큼 가능한 한 영어 사용
이터레이션 안 함 한 번에不理想이면 포기 여러 번 조정, 베스트 버전 저장

마지막으로

프롬프트 엔지니어링은 신비로운 것이 아니라 체계적인 학습으로 마스터할 수 있는 스킬입니다. 핵심 포인트:

  1. 구조가 명확: 6요소 프레임워크
  2. 플랫폼 맞춤화: 각 모델의 성향을 이해
  3. 이터레이션 사고: 쓰기 → 생성 → 조정 → 다시 쓰기
  4. 영어 우선: 대부분의 모델은 영어 이해가 더 뛰어남

이러한 팁을 마스터하면 같은 모델로도 다른 사람보다 훨씬 좋은 결과를 낼 수 있다는 것을 알게 될 것입니다. 이것은 재능이 아니라 방법론입니다.

추가 참고: - Wan AI 공식 문서 - Kling AI 프롬프트 가이드 - Runway Gen-4.5 튜토리얼 - Google Veo 심층 분석