콘텐츠로 이동

FLUX.2 AI 이미지 생성기 완전 가이드 - 2026년 최강 오픈소스 모델

FLUX.2가 주목받는 이유는?

2026년 1월 15일, Black Forest Labs는 FLUX.2 [klein] 모델 패밀리를 출시했습니다. 이는 현재 가장 빠른 오픈소스 AI 이미지 생성 모델입니다. 이전 세대 FLUX.1과 비교해 FLUX.2는 속도, 품질, 제어 가능성 측면에서 비약적인 발전을 이루었습니다:

  • 초당 생성: 소비자급 GPU에서 4MP 이미지를 1초 이내에 생성
  • 통합 아키텍처: 단일 모델로 텍스트→이미지, 단일 이미지 편집, 다중 참조 편집 지원
  • 오픈소스 친화적: 4B 모델은 Apache 2.0 라이센스로, 상업적 사용 및 파인튜닝 가능
  • VRAM 친화적: 4B 모델은 약 8GB VRAM만 필요 (RTX 3090/4070에서 실행 가능)

로컬 배포가 가능하고 빠르며 품질이 높은 AI 이미지 생성 솔루션을 찾고 있다면, FLUX.2가 2026년의 첫 번째 선택입니다.


FLUX.2 모델 패밀리详解

핵심 모델 비교

모델 파라미터 수 라이센스 최적 용도 필요 VRAM
FLUX.2 [klein] 4B 4B Apache 2.0 실시간 애플리케이션, 엣지 배포 ~8GB
FLUX.2 [klein] 9B 9B 비상업적 라이센스 고품질 텍스트→이미지 ~16GB
FLUX.2 [klein] 9B KV 9B 비상업적 라이센스 다중 이미지 편집 (가장 빠름) ~16GB
FLUX.2 [dev] 32B 비상업적 라이센스 최고 품질, 지연 제한 없음 ~24GB

모델 선택 방법은?

4B 모델을 선택하세요, 만약: - 실시간 생성이 필요한 경우 (<1초) - 소비자급 GPU만 있는 경우 (RTX 3090/4070) - 상업적 라이센스가 필요한 경우 (Apache 2.0) - LoRA 파인튜닝을 하고 싶은 경우

9B 모델을 선택하세요, 만약: - 더 고품질의 텍스트→이미지가 필요한 경우 - 16GB 이상의 VRAM이 있는 경우 - 개인/연구 목적으로만 사용하는 경우

dev 32B 모델을 선택하세요, 만약: - 품질이 최우선이고 속도는 중요하지 않은 경우 - 전문가급 GPU가 있는 경우 (RTX 4090/A100) - 가장 풍부한 출력 다양성이 필요한 경우


로컬 배포: ComfyUI 사용

환경 준비

# 가상 환경 생성
python3 -m venv flux2-env
source flux2-env/bin/activate

# ComfyUI 설치
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt

# FLUX.2 전용 노드 설치
pip install comfyui-flux2

모델 다운로드

# Hugging Face에서 4B 모델 다운로드 (권장)
cd ComfyUI/models/unet
wget https://huggingface.co/black-forest-labs/FLUX.2-klein-4B/resolve/main/flux2-klein-4b.safetensors

# T5 텍스트 인코더 다운로드
cd ../text_encoders
wget https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/t5xxl_fp8_e4m3fn.safetensors

# VAE 다운로드
cd ../vae
wget https://huggingface.co/black-forest-labs/FLUX.2-dev/resolve/main/ae.safetensors

ComfyUI 워크플로우 예시

FLUX.2의 워크플로우는 기존 Stable Diffusion과 유사하지만 다음 사항에 주의하세요:

  1. 올바른 샘플러 사용: euler 또는 dpmpp_2m 권장
  2. 스테ップ 설정:
  3. 증류 모델 (4B/9B): 4스텝으로 충분
  4. 베이스 모델: 50스텝 필요
  5. 해상도: 4MP를 기본 지원 (예: 2048x2048, 2560x1536)

API 호출: 공식 API

로컬 배포를 원하지 않는다면, Black Forest Labs에서 공식 API를 제공합니다:

Python SDK 예시

import requests

API_KEY = "your-api-key"
API_URL = "https://api.bfl.ai/v1/flux-2-pro"

def generate_image(prompt, width=1024, height=1024):
    response = requests.post(
        API_URL,
        headers={
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        },
        json={
            "prompt": prompt,
            "width": width,
            "height": height,
            "num_inference_steps": 4
        }
    )
    return response.json()["result"]["url"]

# 사용 예시
image_url = generate_image(
    "A futuristic cityscape at sunset, cyberpunk style, neon lights, 4k detailed"
)
print(f"Generated image: {image_url}")

API 가격 (2026년)

모델 가격/장 속도
FLUX.2 [klein] 4B $0.003 1초 미만
FLUX.2 [klein] 9B $0.006 약 2초
FLUX.2 [dev] 32B $0.015 약 5초

이미지 편집 기능

FLUX.2의 핵심 강점 중 하나는 통합된 편집 아키텍처입니다. 동일한 모델로 다음 작업을 수행할 수 있습니다:

단일 이미지 편집 (스타일 변환)

# 이미지 1을 이미지 2의 스타일로 변환
response = requests.post(
    API_URL + "/edit",
    json={
        "prompt": "Make it look like a vintage poster",
        "image_url": "https://example.com/source.jpg",
        "reference_url": "https://example.com/style.jpg"
    }
)

다중 참조 이미지 생성

# 여러 참조 이미지를 조합하여 새 이미지 생성
response = requests.post(
    API_URL + "/multi-reference",
    json={
        "prompt": "A person wearing the sweater from image 1",
        "reference_images": [
            "https://example.com/person.jpg",
            "https://example.com/sweater.jpg"
        ]
    }
)

성능 벤치마크

Black Forest Labs 공식 데이터 기준 (RTX 4090):

작업 FLUX.2 4B FLUX.2 9B KV FLUX.1
텍스트→이미지 (4MP) 0.8초 0.6초 3.2초
단일 이미지 편집 0.9초 0.7초 4.1초
다중 이미지 편집 1.2초 0.9초 5.8초

속도 향상: FLUX.1과 비교해 FLUX.2는 4~5배 빠릅니다!


실전 팁

1. 프롬프트 엔지니어링

FLUX.2는 자연어 이해 능력이 더 뛰어나 복잡한 태그 쌓기가 필요하지 않습니다:

권장:
"A middle-aged man in a green military jacket standing outdoors, 
photorealistic, natural lighting, earthy tones"

피해야 할 것:
"man, green, jacket, military, outdoors, 8k, ultra detailed, 
masterpiece, best quality, (photorealistic:1.3)"

2. 해상도 선택

  • 1024x1024: 빠른 반복, 소셜 미디어
  • 2048x2048: 고품질 출력, 인쇄
  • 2560x1536: 와이드스크린 배경화면, 배너

3. 네거티브 프롬프트 (선택 사항)

FLUX.2는 일반적으로 네거티브 프롬프트가 필요 없지만, 다음 경우에 사용할 수 있습니다:

negative_prompt = "blurry, low quality, distorted, watermark, text"

다른 모델과 비교

특징 FLUX.2 4B Midjourney v7 DALL-E 3 SDXL Turbo
속도 0.8초 10~30초 5~10초 0.3초
품질 (별 5개) (별 5개) (별 4개) (별 3개)
오픈소스 아니오 아니오
상업적 사용 아니오 아니오
로컬 배포 아니오 아니오
이미지 편집 아니오 아니오 아니오

결론: FLUX.2는 속도, 품질, 오픈소스성, 상업적 사용 가능성 사이에서 최적의 균형을 달성했습니다.


자주 묻는 질문

Q: FLUX.2를 상업적으로 사용할 수 있나요?

A: 4B 모델은 Apache 2.0 라이센스로 상업적 사용이 가능합니다. 9B 및 dev 모델은 비상업적 용도로 제한됩니다.

Q: GPU VRAM이 부족하면 어떻게 하나요?

A: FP8 양자화 버전을 사용하면 VRAM 요구량을 40% 줄일 수 있습니다. 또는 공식 API를 사용하세요.

Q: 어떤 해상도를 지원하나요?

A: 4MP 이하 해상도를 기본 지원합니다. 일반적인 크기: 1024x1024, 2048x2048, 2560x1536, 1536x2560.

Q: 파인튜닝이 가능한가요?

A: 네! 베이스 버전 (증류 버전이 아닌)을 사용하여 LoRA 파인튜닝을 하는 것이 가장 좋습니다.


리소스 링크


요약

FLUX.2는 2026년 가장 주목받는 오픈소스 AI 이미지 생성 모델입니다. 다음을 결합합니다:

  • 속도: 초당 생성
  • 품질: 4MP 포토리얼리스틱 출력
  • 제어 가능성: 텍스트→이미지, 단일/다중 이미지 편집 지원
  • 개방성: 4B 모델 Apache 2.0으로 상업적 사용 가능
  • 사용 편의성: ComfyUI, API 등 다양한 배포 방식

개발자, 디자이너, AI 애호가 모두에게 FLUX.2는 도구 키트에 추가할 가치가 있습니다.

다음 단계: 4B 모델부터 시작하여 초당 AI 이미지 생성의 매력을 경험하세요!