Vollständiger Leitfaden zu FLUX.2 AI-Bildgenerator

Die FLUX.2-Modellfamilie im Detail

Kernmodell-Vergleich

Modell	Parameter	Lizenz	Bester Einsatzzweck	VRAM-Bedarf
FLUX.2 [klein] 4B	4B	Apache 2.0	Echtzeitanwendungen, Edge-Bereitstellung	~8 GB
FLUX.2 [klein] 9B	9B	Nicht-kommerzielle Lizenz	Hochwertige Text-zu-Bild-Generierung	~16 GB
FLUX.2 [klein] 9B KV	9B	Nicht-kommerzielle Lizenz	Multi-Bild-Bearbeitung (am schnellsten)	~16 GB
FLUX.2 [dev]	32B	Nicht-kommerzielle Lizenz	Höchste Qualität, keine Latenzbeschränkung	~24 GB

Wie wählt man das richtige Modell?

Wählen Sie das 4B-Modell, wenn:

Sie Echtzeit-Generierung benötigen (<1 Sekunde)
Sie nur eine Consumer-GPU haben (RTX 3090/4070)
Sie eine kommerzielle Lizenz benötigen (Apache 2.0)
Sie LoRA-Feinabstimmung durchführen möchten

Wählen Sie das 9B-Modell, wenn:

Sie höherwertige Text-zu-Bild-Generierung benötigen
Sie 16 GB+ VRAM haben
Sie nur persönliche/Forschungszwecke verfolgen

Wählen Sie das dev 32B-Modell, wenn:

Qualität vorrangig ist, Geschwindigkeit zweitrangig
Sie eine professionelle GPU haben (RTX 4090/A100)
Sie die reichhaltigste Ausgabe-Vielfalt benötigen

Lokale Bereitstellung: ComfyUI verwenden

Umgebung einrichten

# Virtuelle Umgebung erstellen
python3 -m venv flux2-env
source flux2-env/bin/activate

# ComfyUI installieren
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt

# FLUX.2-spezifische Knoten installieren
pip install comfyui-flux2

Modelle herunterladen

# 4B-Modell von Hugging Face herunterladen (empfohlen)
cd ComfyUI/models/unet
wget https://huggingface.co/black-forest-labs/FLUX.2-klein-4B/resolve/main/flux2-klein-4b.safetensors

# T5-Textencoder herunterladen
cd ../text_encoders
wget https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/t5xxl_fp8_e4m3fn.safetensors

# VAE herunterladen
cd ../vae
wget https://huggingface.co/black-forest-labs/FLUX.2-dev/resolve/main/ae.safetensors

ComfyUI-Workflow-Beispiel

Der Workflow von FLUX.2 ist ähnlich wie bei traditionellem Stable Diffusion, aber beachten Sie:

Verwenden Sie den richtigen Sampler: euler oder dpmpp_2m empfohlen
Schritt-Einstellungen:
- Destillierte Modelle (4B/9B): 4 Schritte sind ausreichend
- Basis-Modell: benötigt 50 Schritte
Auflösung: Unterstützt nativ 4MP (z. B. 2048x2048, 2560x1536)

API-Aufruf: Offizielle API

Wenn Sie nicht lokal bereitstellen möchten, bietet Black Forest Labs eine offizielle API:

Python-SDK-Beispiel

import requests

API_KEY = "your-api-key"
API_URL = "https://api.bfl.ai/v1/flux-2-pro"

def generate_image(prompt, width=1024, height=1024):
    response = requests.post(
        API_URL,
        headers={
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        },
        json={
            "prompt": prompt,
            "width": width,
            "height": height,
            "num_inference_steps": 4
        }
    )
    return response.json()["result"]["url"]

# Anwendungsbeispiel
image_url = generate_image(
    "A futuristic cityscape at sunset, cyberpunk style, neon lights, 4k detailed"
)
print(f"Generated image: {image_url}")

API-Preisgestaltung (2026)

Modell	Preis/Bild	Geschwindigkeit
FLUX.2 [klein] 4B	$0.003	<1 Sekunde
FLUX.2 [klein] 9B	$0.006	~2 Sekunden
FLUX.2 [dev] 32B	$0.015	~5 Sekunden

Bildbearbeitungsfunktionen

Eine der Kernstärken von FLUX.2 ist die einheitliche Bearbeitungsarchitektur. Sie können dasselbe Modell verwenden für:

Einzelbildbearbeitung (Stiltransfer)

# Bild 1 in den Stil von Bild 2 umwandeln
response = requests.post(
    API_URL + "/edit",
    json={
        "prompt": "Make it look like a vintage poster",
        "image_url": "https://example.com/source.jpg",
        "reference_url": "https://example.com/style.jpg"
    }
)

Multi-Referenz-Generierung

# Mehrere Referenzbilder kombinieren, um ein neues Bild zu erzeugen
response = requests.post(
    API_URL + "/multi-reference",
    json={
        "prompt": "A person wearing the sweater from image 1",
        "reference_images": [
            "https://example.com/person.jpg",
            "https://example.com/sweater.jpg"
        ]
    }
)

Performance-Benchmarks

Laut offiziellen Daten von Black Forest Labs (RTX 4090):

Aufgabe	FLUX.2 4B	FLUX.2 9B KV	FLUX.1
Text-zu-Bild (4MP)	0,8 Sek.	0,6 Sek.	3,2 Sek.
Einzelbildbearbeitung	0,9 Sek.	0,7 Sek.	4,1 Sek.
Multi-Bild-Bearbeitung	1,2 Sek.	0,9 Sek.	5,8 Sek.

Geschwindigkeitssteigerung: FLUX.2 ist 4-5x schneller als FLUX.1!

Praxistipps

1. Prompt Engineering

FLUX.2 versteht natürliche Sprache besser und benötigt keine komplexe Tag-Stapelung:

Empfohlen:
"A middle-aged man in a green military jacket standing outdoors, 
photorealistic, natural lighting, earthy tones"

Vermeiden:
"man, green, jacket, military, outdoors, 8k, ultra detailed, 
masterpiece, best quality, (photorealistic:1.3)"

2. Auflösungsauswahl

1024x1024: Schnelles Iterieren, soziale Medien
2048x2048: Hochwertige Ausgabe, Druck
2560x1536: Breitbild-Hintergründe, Banner

3. Negative Prompts (optional)

FLUX.2 benötigt normalerweise keine negativen Prompts, kann sie aber in diesen Fällen verwenden:

negative_prompt = "blurry, low quality, distorted, watermark, text"

Vergleich mit anderen Modellen

Merkmal	FLUX.2 4B	Midjourney v7	DALL-E 3	SDXL Turbo
Geschwindigkeit	0,8 Sek.	10-30 Sek.	5-10 Sek.	0,3 Sek.
Qualität	(5 Sterne)	(5 Sterne)	(4 Sterne)	(3 Sterne)
Open Source	Ja	Nein	Nein	Ja
Kommerziell nutzbar	Ja	Nein	Nein	Ja
Lokale Bereitstellung	Ja	Nein	Nein	Ja
Bildbearbeitung	Ja	Nein	Nein	Nein

Fazit: FLUX.2 erzielt die beste Balance zwischen Geschwindigkeit, Qualität, Open-Source-Verfügbarkeit und kommerzieller Nutzbarkeit.

Häufig gestellte Fragen

F: Kann FLUX.2 kommerziell genutzt werden?

A: Das 4B-Modell verwendet die Apache 2.0-Lizenz und kann kommerziell genutzt werden. Die 9B- und dev-Modelle sind auf nicht-kommerzielle Nutzung beschränkt.

F: Was tun, wenn meine GPU nicht genug VRAM hat?

A: Verwenden Sie die FP8-quantisierte Version, die den VRAM-Bedarf um 40 % reduziert. Alternativ nutzen Sie die offizielle API.

F: Welche Auflösungen werden unterstützt?

A: Native Unterstützung von 4MP und darunter. Gängige Größen: 1024x1024, 2048x2048, 2560x1536, 1536x2560.

F: Kann das Modell feinabgestimmt werden?

A: Ja! Die Verwendung der Basisversion (nicht destilliert) für LoRA-Feinabstimmung liefert die besten Ergebnisse.

Ressourcen-Links

Zusammenfassung

FLUX.2 ist das bemerkenswerteste Open-Source-KI-Bildgenerierungsmodell des Jahres 2026. Es vereint:

Geschwindigkeit: Sub-Sekunden-Generierung
Qualität: 4MP fotorealistische Ausgabe
Kontrollierbarkeit: Unterstützt Text-zu-Bild, Einzel-/Multi-Bild-Bearbeitung
Offenheit: 4B-Modell Apache 2.0 für kommerzielle Nutzung
Benutzerfreundlichkeit: ComfyUI, API,多种 Bereitstellungsoptionen

Ob Entwickler, Designer oder KI-Enthusiast, FLUX.2 verdient einen Platz in Ihrem Toolkit.

Nächster Schritt: Beginnen Sie mit dem 4B-Modell und erleben Sie die Magie der Sub-Sekunden-KI-Bildgenerierung!

#FLUX.2 #KI-Bildgenerierung #Black Forest Labs #Open-Source-Modelle #ComfyUI