TIP/AI

20년차 영상 제작자가 알려주는 Google Flow 사용법

고생쨩 2026. 1. 30. 08:13

20년차 영상 제작자한테 배워옴. 블로그에 올려도 된다해서 정리해서 올림.

1. 영상 기본 개념 이해

1.1 해상도와 비율

구분 해상도 비율 용도
FHD 1920 × 1080 16:9 일반 가로형 영상 (유튜브, 웹사이트)
FHD 세로 1080 × 1920 9:16 쇼츠, 릴스, 모바일 콘텐츠
정사각형 1080 × 1080 1:1 인스타그램, 모바일 배너
4K 3840 × 2160 16:9 고해상도 작업 (크롭 여유 확보)

실전 팁: 웹사이트 배너처럼 PC·모바일 동시 대응이 필요하면, 4K로 생성 후 중앙에 핵심 콘텐츠를 배치함. 이러면 다양한 비율로 크롭 가능함.

Flow에서 지원하는 비율은 16:9(가로), 9:16(세로), 1:1(정사각형) 세 가지임.

1.2 프레임 레이트(FPS)

FPS 특징 사용처
24fps 영화적 느낌, 약간의 모션 블러 시네마틱 영상, 영화
30fps 자연스러운 재생, 기본 설정 유튜브, 일반 콘텐츠
60fps 매우 부드러운 움직임 스포츠, 게임 영상

Flow(Veo 3)는 기본 24~30fps로 영상을 생성함. 유튜브나 SNS 콘텐츠에는 30fps가 가장 무난함.


2. Google Flow 핵심 기능

2.1 Flow란?

Google Labs에서 제공하는 AI 영상 제작 도구임. Veo 3 모델 기반으로 텍스트 프롬프트만으로 시네마틱 영상을 생성함.

  • 접속: Google Labs Flow에서 Google 계정으로 로그인
  • 요금: Google AI Pro 또는 Ultra 요금제 필요 (무료 크레딧 제공)
  • 기본 생성 길이: 8초 단위 클립

2.2 주요 기능 4가지

기능 설명
카메라 제어 (Camera Controls) 카메라 움직임, 앵글, 시점을 직접 제어해서 원하는 샷 연출
씬 빌더 (Scenebuilder) 기존 클립을 자연스럽게 이어가거나 확장함. 캐릭터·동작의 연속성 유지
에셋 관리 (Asset Management) 이미지, 캐릭터, 배경 등을 등록하고 여러 영상에 반복 활용
Flow TV 다른 사용자의 영상과 프롬프트를 탐색해서 영감·학습 가능

2.3 씬 빌더(Scene Builder) 상세

씬 빌더는 Flow의 가장 핵심적인 기능임.

작동 방식:

  1. 8초짜리 영상 클립을 생성함
  2. "장면에 추가" 버튼을 누름
  3. 다음 장면에 대한 새로운 프롬프트를 입력함
  4. AI가 이전 장면과 자연스럽게 이어지는 새 8초 클립을 생성함
  5. 이 과정을 반복하면 약 40초~1분까지 확장 가능함

⚠️ 주의 — 장면 전환의 함정:
씬 빌더로 확장하면 AI가 이전 장면에서 자연스럽게 이어지는 영상을 만들려고 함. 그래서 장면 전환(예: 지하철 → 관광지)이 필요할 때, AI가 중간 연결 장면을 멋대로 만들어버리는 문제가 생김.

해결 방법:

  • 장면 전환이 필요하면 각 씬을 별도로 생성
  • 생성된 개별 클립들을 편집 소프트웨어(필모라, 프리미어 프로 등)에서 이어 붙임
  • 같은 배경에서 연속되는 장면만 씬 빌더로 확장함

3. 영상 제작 워크플로우

3.1 전체 프로세스

기획 → 스토리보드 → 씬 분석 → 베이스 에셋 제작 → 클립 생성 → 편집 → 완성

3.2 Step 1: 스토리보드 작성

영상 만들기 전 반드시 글로 스토리를 먼저 써야 함.

스토리보드 작성 요소:

  • 등장인물이 누구이고
  • 어디서 무엇을 하고
  • 어떤 순서로 진행되는지

예시:

씬 1: 여행자가 공항 입국장 자동문을 통과하며 나옴 (풀샷)
씬 2: 여행자의 얼굴 클로즈업, 밝은 표정 (바스트샷)
씬 3: 캐리어를 끌고 걸어가는 뒷모습 (언더샷)
씬 4: 열차에 탑승해서 창밖 풍경을 보는 모습 (미디엄샷)

꿀팁: 스토리보드 작성이 어려우면 Gemini한테 시키면 됨. 생각하는 장면을 일상적인 말로 설명하면 프롬프트로 변환해줌.

3.3 Step 2: 씬 분석 및 분리

스토리보드 기반으로 각 씬을 분석함.

씬 분리 기준:

  • 배경이 바뀌는 지점
  • 등장인물이 바뀌는 지점
  • 카메라 화각이 크게 달라지는 지점

씬별 체크리스트:

항목 확인 내용
등장인물 누가 나오는지? 몇 명인지?
화각/샷 풀샷? 바스트샷? 클로즈업?
배경 어디인지? 시간대는? 날씨는?
카메라 움직임 고정? 패닝? 줌인? 트래킹?
분위기/컬러 따뜻한 톤? 차가운 톤? 어떤 무드?

3.4 Step 3: 베이스 에셋(레퍼런스) 준비

일관성 있는 영상을 만들려면 사전에 레퍼런스 이미지를 준비해야 함.

필수 에셋:

  1. 등장인물 레퍼런스

    • 정면, 좌측면, 우측면, 상단, 하단 등 다양한 각도
    • 표정 변화 (무표정, 웃음, 놀람 등)
    • 가능하면 하나의 이미지에 여러 각도를 배치
  2. 배경 레퍼런스

    • 영상에 사용할 장소의 참고 이미지
    • 360도 다양한 시점의 이미지가 있으면 이상적임
  3. 컬러 그레이딩 레퍼런스

    • 원하는 색감/분위기의 영화 장면 캡처
    • 또는 원하는 무드의 사진

에셋 관리 팁:

  • 파일명을 체계적으로 관리함 (예: 1_배경.png, 2_컬러그레이딩.png, 3_화각참조.png)
  • 프롬프트에서 각 파일의 용도를 명시함:
    • "1번 이미지에서는 배경만 참조"
    • "2번 이미지에서는 컬러 그레이딩만 참조"
    • "3번 이미지에서는 화각을 이대로 맞춰줘"

3.5 Step 4: 프롬프트 작성 및 클립 생성

프롬프트 공식:

[카메라 샷/움직임] + [피사체 + 상세 묘사] + [액션] + [배경 + 상세 묘사] + [조명] + [스타일/무드]

반드시 포함해야 할 요소:

  • 등장인물 외모 (머리 길이, 색상, 피부톤, 체형)
  • 의상 상세 묘사
  • 표정과 감정 상태
  • 배경 환경 (장소, 시간대, 날씨)
  • 조명 조건
  • 뒤에 보이는 소품이나 오브젝트

나쁜 프롬프트 예시:

비 오는 날에 울고 있는 여자를 만들어줘

→ 배경도 안 줬고, 머리 길이도 색상도 피부색도 아무것도 안 줬음. 이러면 매번 다른 결과가 나옴.

좋은 프롬프트 예시:

미디엄 샷, 20대 후반 동아시아 여성이 밤의 도심 보도에 혼자 서 있음.
긴 생머리 검은 머리카락, 베이지색 트렌치코트 착용.
비가 꾸준히 내리고 있고, 빗방울이 뒤쪽 네온사인의 따뜻한 빛에 반사됨.
눈이 붉고 눈물이 고여 있으며, 마스카라가 약간 번진 상태.
고통스러운 표정으로 아래를 내려다보며, 오른손에 접힌 우산을 꽉 쥐고 있음.
배경에 지나가는 차량의 부드러운 보케 조명.
블루-그린 톤의 시네마틱 컬러 그레이딩.
35mm 렌즈, 얕은 심도.

3.6 Step 5: 편집 및 조합

생성된 개별 클립들을 편집 소프트웨어에서 조합함.

추천 편집 도구:

  • 필모라 (Filmora) — 초보자 친화적
  • 프리미어 프로 (Premiere Pro) — 전문가용
  • 캡컷 (CapCut) — 모바일 편집

4. 화각과 샷 타입 가이드

4.1 기본 샷 타입

샷 타입 프레임 범위 용도 프롬프트 키워드
풀샷 (Full Shot) 머리부터 발끝 전체 배경과 인물 전체를 보여줄 때 풀샷 / full shot / wide shot
바스트샷 (Bust Shot) 가슴~머리 인물 중심 대화, 표정 전달 바스트샷 / bust shot / medium close-up
클로즈업 (Close-up) 얼굴 위주 감정 표현, 디테일 강조 클로즈업 / close-up shot
익스트림 클로즈업 눈, 입 등 일부분 극적 긴장감, 세부 표현 극단적 클로즈업 / extreme close-up
언더샷 (Low Angle) 아래에서 위로 위압감, 웅장함 표현 로우 앵글 / low angle shot
오버헤드 (Bird's Eye) 위에서 아래로 공간 전체 파악, 드론 뷰 버드아이 뷰 / bird's eye view

4.2 카메라 움직임

움직임 설명 프롬프트 키워드
고정 (Static) 카메라 움직임 없음 고정 촬영 / static shot
패닝 (Pan) 좌우 회전 카메라가 왼쪽/오른쪽으로 패닝 / camera pans left/right
틸트 (Tilt) 상하 회전 카메라가 위/아래로 틸트 / camera tilts up/down
줌 (Zoom) 확대/축소 천천히 줌인 / slow zoom in
달리 (Dolly) 카메라 전후 이동 달리 전진 / dolly forward
트래킹 (Tracking) 피사체 따라 이동 트래킹 샷 / tracking shot / camera follows
크레인 (Crane) 수직 이동 크레인 샷 상승 / crane shot ascending
오비탈 (Orbit) 피사체 주위 회전 피사체 주위를 카메라가 회전 / camera orbits around subject

4.3 렌즈(초점거리) 키워드

실제 렌즈 번호를 몰라도 됨. 구글에 각 초점거리별 화각을 검색해보고, 원하는 느낌을 프롬프트에 넣으면 됨.

초점거리 효과 프롬프트 키워드
14~24mm 광각, 넓은 배경, 왜곡 있음 광각 이스타블리싱 샷 / wide-angle establishing shot
35mm 자연스러운 시야각 자연스러운 시점, 35mm 렌즈 / natural perspective, 35mm lens
50mm 인간 시야와 유사 50mm 렌즈, 자연스러운 룩 / 50mm lens, natural look
85mm+ 얕은 심도, 배경 압축 85mm 인물 렌즈, 얕은 심도 / 85mm portrait lens, shallow DOF

4.4 심도(Depth of Field)

  • 심도가 깊다 (Deep DOF): 전체가 선명함 → 딥 포커스 / deep focus
  • 심도가 얕다 (Shallow DOF): 피사체만 선명, 배경 흐림(아웃포커싱) → 얕은 심도 / shallow depth of field / bokeh background

5. 일관성 유지 전략

AI 영상 제작에서 가장 어려운 부분은 씬 간 일관성 유지임.

5.1 인물 일관성

  • 모든 씬 프롬프트에 동일한 인물 묘사를 복사해서 넣음
  • 고유한 특징(예: 은색 목걸이, 빨간 자켓)을 앵커로 설정함
  • 인물 레퍼런스 이미지를 매번 같이 첨부함
  • 다양한 각도의 캐릭터 시트를 미리 만들어 둠

5.2 배경 일관성

  • 같은 배경 레퍼런스 이미지를 반복 사용함
  • 프롬프트에 동일한 환경 설정 유지 / same environment setting 등을 추가함

5.3 컬러/무드 일관성

  • 컬러 그레이딩 레퍼런스를 하나 정해서 모든 씬에 적용함
  • 영화 장면 캡처를 활용하면 매우 효과적임 (이미 컬러 그레이딩이 완성돼 있으니까)

5.4 여러 인물이 등장하는 경우

인터뷰/대화 씬 예시:

  1. 먼저 모든 인물이 함께 나오는 풀샷을 생성함
  2. 프롬프트에 각 인물을 A, B, C로 지정하고 상세히 묘사함
  3. 이후 개별 클로즈업 샷을 별도로 생성함
  4. 단, 인물을 각각 따로 만들어 이어 붙이면 배경 불일치가 생기므로, 고정 배경 이미지를 별도로 준비해야 함

6. 실전 제작 주의사항

6.1 씬별 개별 생성 vs 씬 빌더 확장

상황 권장 방법
같은 배경에서 연속 동작 씬 빌더로 확장
배경이 바뀌는 장면 전환 각 씬 별도 생성 후 편집으로 이어 붙이기
인물이 바뀌는 장면 별도 생성
카메라 화각이 크게 변하는 경우 별도 생성 권장

6.2 클로즈업과 풀샷의 관계

  • 풀샷에서 강제로 확대(크롭)하면 해상도가 깨짐
  • 표정 디테일이 필요하면 바스트샷이나 클로즈업을 별도로 생성해야 함
  • 각 샷을 만들 때 눈 깜빡임, 시선 방향, 표정 변화까지 프롬프트에 명시함

6.3 법적 주의사항

  • AI로 특정 실재 장소(예: 인천공항 외관)를 생성할 경우, 상업적 사용 시 초상/상표권 문제 가능함
  • 군사시설, 공항 외관 등은 촬영 허가가 필요한 곳이므로 AI 생성도 주의해야 함
  • 대안: 내부 로비 장면이나 스쳐 지나가는 배경으로 처리하면 됨

6.4 반응형 웹 대응 전략

웹사이트 배너에 영상을 넣을 경우:

  1. 4K 해상도로 생성해서 크롭 여유 확보함
  2. 중앙부에 핵심 콘텐츠 집중 배치함 (프롬프트에 명시)
  3. PC: 16:9 비율로 양쪽 배경이 보이도록
  4. 모바일: 중앙부의 9:16 또는 1:1 영역만 표시
[전체 16:9 프레임]
┌─────────────────────────────────┐
│     │  핵심 콘텐츠  │     │
│ 배경 │  (모바일 표시) │ 배경 │
│     │   영역       │     │
└─────────────────────────────────┘
  • 모바일 트래픽이 85% 이상인 서비스라면, 모바일 기준(9:16)으로 먼저 제작하고 PC에서는 UI를 조정하는 것도 방법임

7. 음성 및 오디오

7.1 Flow 내장 음성

  • Flow(Veo 3)는 대본을 넣으면 내장 TTS로 읽어줌
  • 8초 클립 기준으로 대본 분량을 조절해야 함
  • 내장 음성의 캐릭터성에는 한계가 있음

7.2 외부 AI 음성 서비스 활용

서비스 특징
타입캐스트 (TypeCast) 감정 표현이 뛰어남. 한국어 지원 우수. 프로 요금제 필요함
슈퍼톤 (Supertone) 음성 품질 보정에 강점
Eleven Labs 영어 음성 품질 최상급, 음성 클로닝

7.3 음성 작업 워크플로우

방법 A (유료): AI 음성 서비스로 음성 생성 → Flow 영상에 입 모양 맞추기(립싱크)

방법 B (무료): 직접 녹음 → 음원 편집(떨림, 실수 제거) → 영상에 입 모양 맞추기

💡 핵심 원칙: 돈을 안 쓸 거면 손을 더 대야 함. 초반에 캐릭터성(목소리, 말투, 어조)을 확실히 잡아두면 이후 작업이 수월해짐.


8. 프롬프트 작성 꿀팁

8.1 AI에게 프롬프트 쓰게 시키기

상상하는 장면을 일상적인 말로 Gemini한테 설명하면 됨:

"이런 장면이야. 여자가 비 오는 밤에 네온사인 앞에서 서 있는데, 
긴 머리에 트렌치코트 입고 있고, 좀 슬픈 표정이야. 
이거 Flow에 시킬 건데 프롬프트 만들어줘."

Gemini가 AI가 이해하기 좋은 구조화된 프롬프트로 변환해줌.

8.2 음성 입력 활용

키보드로 길게 타이핑하지 말고, 음성 입력(STT)을 활용해서 말로 설명하면 훨씬 빠름.

8.3 레퍼런스 활용법

전문 용어를 몰라도 됨. 대신:

  1. 원하는 화각의 영화/영상 장면을 캡처함
  2. 해당 이미지를 레퍼런스로 첨부함
  3. "이 이미지의 화각/컬러 그레이딩/분위기에 맞춰서 만들어줘"라고 지시하면 됨

8.4 영상 분석 훈련

기존 AI 영상이나 광고 영상을 보면서 분석하는 습관을 들여야 함:

  • 이 영상에 씬이 몇 개 들어갔는지?
  • 각 씬의 화각(샷 타입)은 뭔지?
  • 카메라 움직임은 어떤지?
  • 컬러 그레이딩 느낌은 어떤지?

9. 체크리스트

제작 전 체크리스트

  • 스토리보드(글) 작성했는지?
  • 씬을 분리하고 각 씬의 샷 타입을 결정했는지?
  • 등장인물 레퍼런스 이미지를 준비했는지? (다양한 각도)
  • 배경 레퍼런스 이미지를 준비했는지?
  • 컬러 그레이딩 레퍼런스를 정했는지?
  • 캐릭터의 목소리/말투를 설정했는지?
  • 최종 출력 비율과 해상도를 결정했는지?

프롬프트 체크리스트

  • 카메라 샷 타입을 명시했는지?
  • 카메라 움직임을 명시했는지?
  • 인물 외모를 상세히 묘사했는지? (머리, 피부, 의상 등)
  • 인물 표정/감정을 명시했는지?
  • 배경 환경을 상세히 묘사했는지? (장소, 시간, 날씨)
  • 조명 조건을 명시했는지?
  • 분위기/스타일을 명시했는지?
  • 레퍼런스 이미지를 첨부하고 용도를 명시했는지?

10. 빠른 참조: 프롬프트 템플릿

기본 템플릿

[샷 타입], [카메라 움직임].
[피사체 묘사: 나이, 성별, 외모, 의상, 표정].
[피사체 액션: 무엇을 하고 있는지, 바디랭귀지, 시선 방향].
[환경: 장소, 시간대, 날씨, 주변 사물].
[조명: 종류, 방향, 강도].
[스타일: 컬러 그레이딩, 무드, 영화 참조, 렌즈 타입].

실전 예시 — 여행 광고 영상

씬 1: 공항 도착

로우 앵글 트래킹 샷, 뒤에서 따라가며 촬영.
20대 후반 여성이 네이비색 기내용 캐리어를 끌고 공항 터미널 복도를 걸어감.
크림색 캐주얼 가디건에 블루진 착용.
카메라가 발걸음과 캐리어 바퀴 구르는 모습을 잡음.
밝은 형광등 터미널 조명에 큰 유리창을 통해 따뜻한 햇살이 들어옴.
현대적이고 깔끔한 건축물.
따뜻한 톤의 시네마틱 컬러 그레이딩, 자연스러운 시점 35mm 렌즈.

씬 2: 표정 전환

바스트 샷, 카메라 고정.
씬 1과 동일한 여성이 멈춰 서서 앞을 바라보며 밝고 설레는 미소를 짓고 있음.
눈이 살짝 커지면서 깊게 숨을 들이쉼.
왼쪽에서 부드러운 자연광이 얼굴을 비춤.
뒤쪽 공항 배경은 흐릿하고 따뜻한 보케 조명이 보임.
얕은 심도, 85mm 인물 렌즈.
이전 씬과 동일한 따뜻한 시네마틱 컬러 그레이딩 유지.

씬 3: 열차 탑승

미디엄 샷, 열차 내부에서 촬영.
동일한 여성이 창가에 앉아 밖을 바라보며 편안하고 평화로운 표정을 짓고 있음.
창밖으로 초록색 시골 풍경이 흐릿하게 스쳐 지나감.
부드러운 오후 햇살이 유리창을 통해 들어와 얼굴에 따뜻한 하이라이트를 만듦.
열차 내부는 현대적이고 깔끔함.
카메라가 천천히 그녀의 옆얼굴 쪽으로 전진함.
약간 따뜻한 톤의 자연스러운 컬러 그레이딩, 50mm 렌즈 시점.