Zum Inhalt

Vollständiger Leitfaden zu FLUX.2 AI-Bildgenerator - 2026s leistungsstärkstes Open-Source-Modell

Warum sollte man sich für FLUX.2 interessieren?

Am 15. Januar 2026 veröffentlichte Black Forest Labs die FLUX.2 [klein]-Modellfamilie, derzeit das schnellste Open-Source-KI-Bildgenerierungsmodell. Im Vergleich zum Vorgänger FLUX.1 stellt FLUX.2 einen Quantensprung in Geschwindigkeit, Qualität und Kontrollierbarkeit dar:

  • Sub-Sekunden-Generierung: Erzeugt 4MP-Bilder in unter 1 Sekunde auf Consumer-GPUs
  • Einheitliche Architektur: Ein einzelnes Modell unterstützt Text-zu-Bild, Einzelbildbearbeitung und Multi-Referenz-Bearbeitung
  • Open-Source-freundlich: Das 4B-Modell verwendet die Apache 2.0-Lizenz, kommerziell nutzbar und feinabstimmbar
  • VRAM-freundlich: Das 4B-Modell benötigt nur etwa 8 GB VRAM (läuft auf RTX 3090/4070)

Wenn Sie nach einer KI-Bildgenerierungslösung suchen, die lokal bereitgestellt werden kann, schnell ist und hohe Qualität liefert, ist FLUX.2 die erste Wahl für 2026.


Die FLUX.2-Modellfamilie im Detail

Kernmodell-Vergleich

Modell Parameter Lizenz Bester Einsatzzweck VRAM-Bedarf
FLUX.2 [klein] 4B 4B Apache 2.0 Echtzeitanwendungen, Edge-Bereitstellung ~8 GB
FLUX.2 [klein] 9B 9B Nicht-kommerzielle Lizenz Hochwertige Text-zu-Bild-Generierung ~16 GB
FLUX.2 [klein] 9B KV 9B Nicht-kommerzielle Lizenz Multi-Bild-Bearbeitung (am schnellsten) ~16 GB
FLUX.2 [dev] 32B Nicht-kommerzielle Lizenz Höchste Qualität, keine Latenzbeschränkung ~24 GB

Wie wählt man das richtige Modell?

Wählen Sie das 4B-Modell, wenn: - Sie Echtzeit-Generierung benötigen (<1 Sekunde) - Sie nur eine Consumer-GPU haben (RTX 3090/4070) - Sie eine kommerzielle Lizenz benötigen (Apache 2.0) - Sie LoRA-Feinabstimmung durchführen möchten

Wählen Sie das 9B-Modell, wenn: - Sie höherwertige Text-zu-Bild-Generierung benötigen - Sie 16 GB+ VRAM haben - Sie nur persönliche/Forschungszwecke verfolgen

Wählen Sie das dev 32B-Modell, wenn: - Qualität vorrangig ist, Geschwindigkeit zweitrangig - Sie eine professionelle GPU haben (RTX 4090/A100) - Sie die reichhaltigste Ausgabe-Vielfalt benötigen


Lokale Bereitstellung: ComfyUI verwenden

Umgebung einrichten

# Virtuelle Umgebung erstellen
python3 -m venv flux2-env
source flux2-env/bin/activate

# ComfyUI installieren
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt

# FLUX.2-spezifische Knoten installieren
pip install comfyui-flux2

Modelle herunterladen

# 4B-Modell von Hugging Face herunterladen (empfohlen)
cd ComfyUI/models/unet
wget https://huggingface.co/black-forest-labs/FLUX.2-klein-4B/resolve/main/flux2-klein-4b.safetensors

# T5-Textencoder herunterladen
cd ../text_encoders
wget https://huggingface.co/comfyanonymous/flux_text_encoders/resolve/main/t5xxl_fp8_e4m3fn.safetensors

# VAE herunterladen
cd ../vae
wget https://huggingface.co/black-forest-labs/FLUX.2-dev/resolve/main/ae.safetensors

ComfyUI-Workflow-Beispiel

Der Workflow von FLUX.2 ist ähnlich wie bei traditionellem Stable Diffusion, aber beachten Sie:

  1. Verwenden Sie den richtigen Sampler: euler oder dpmpp_2m empfohlen
  2. Schritt-Einstellungen:
  3. Destillierte Modelle (4B/9B): 4 Schritte sind ausreichend
  4. Basis-Modell: benötigt 50 Schritte
  5. Auflösung: Unterstützt nativ 4MP (z. B. 2048x2048, 2560x1536)

API-Aufruf: Offizielle API

Wenn Sie nicht lokal bereitstellen möchten, bietet Black Forest Labs eine offizielle API:

Python-SDK-Beispiel

import requests

API_KEY = "your-api-key"
API_URL = "https://api.bfl.ai/v1/flux-2-pro"

def generate_image(prompt, width=1024, height=1024):
    response = requests.post(
        API_URL,
        headers={
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        },
        json={
            "prompt": prompt,
            "width": width,
            "height": height,
            "num_inference_steps": 4
        }
    )
    return response.json()["result"]["url"]

# Anwendungsbeispiel
image_url = generate_image(
    "A futuristic cityscape at sunset, cyberpunk style, neon lights, 4k detailed"
)
print(f"Generated image: {image_url}")

API-Preisgestaltung (2026)

Modell Preis/Bild Geschwindigkeit
FLUX.2 [klein] 4B $0.003 <1 Sekunde
FLUX.2 [klein] 9B $0.006 ~2 Sekunden
FLUX.2 [dev] 32B $0.015 ~5 Sekunden

Bildbearbeitungsfunktionen

Eine der Kernstärken von FLUX.2 ist die einheitliche Bearbeitungsarchitektur. Sie können dasselbe Modell verwenden für:

Einzelbildbearbeitung (Stiltransfer)

# Bild 1 in den Stil von Bild 2 umwandeln
response = requests.post(
    API_URL + "/edit",
    json={
        "prompt": "Make it look like a vintage poster",
        "image_url": "https://example.com/source.jpg",
        "reference_url": "https://example.com/style.jpg"
    }
)

Multi-Referenz-Generierung

# Mehrere Referenzbilder kombinieren, um ein neues Bild zu erzeugen
response = requests.post(
    API_URL + "/multi-reference",
    json={
        "prompt": "A person wearing the sweater from image 1",
        "reference_images": [
            "https://example.com/person.jpg",
            "https://example.com/sweater.jpg"
        ]
    }
)

Performance-Benchmarks

Laut offiziellen Daten von Black Forest Labs (RTX 4090):

Aufgabe FLUX.2 4B FLUX.2 9B KV FLUX.1
Text-zu-Bild (4MP) 0,8 Sek. 0,6 Sek. 3,2 Sek.
Einzelbildbearbeitung 0,9 Sek. 0,7 Sek. 4,1 Sek.
Multi-Bild-Bearbeitung 1,2 Sek. 0,9 Sek. 5,8 Sek.

Geschwindigkeitssteigerung: FLUX.2 ist 4-5x schneller als FLUX.1!


Praxistipps

1. Prompt Engineering

FLUX.2 versteht natürliche Sprache besser und benötigt keine komplexe Tag-Stapelung:

Empfohlen:
"A middle-aged man in a green military jacket standing outdoors, 
photorealistic, natural lighting, earthy tones"

Vermeiden:
"man, green, jacket, military, outdoors, 8k, ultra detailed, 
masterpiece, best quality, (photorealistic:1.3)"

2. Auflösungsauswahl

  • 1024x1024: Schnelles Iterieren, soziale Medien
  • 2048x2048: Hochwertige Ausgabe, Druck
  • 2560x1536: Breitbild-Hintergründe, Banner

3. Negative Prompts (optional)

FLUX.2 benötigt normalerweise keine negativen Prompts, kann sie aber in diesen Fällen verwenden:

negative_prompt = "blurry, low quality, distorted, watermark, text"

Vergleich mit anderen Modellen

Merkmal FLUX.2 4B Midjourney v7 DALL-E 3 SDXL Turbo
Geschwindigkeit 0,8 Sek. 10-30 Sek. 5-10 Sek. 0,3 Sek.
Qualität (5 Sterne) (5 Sterne) (4 Sterne) (3 Sterne)
Open Source Ja Nein Nein Ja
Kommerziell nutzbar Ja Nein Nein Ja
Lokale Bereitstellung Ja Nein Nein Ja
Bildbearbeitung Ja Nein Nein Nein

Fazit: FLUX.2 erzielt die beste Balance zwischen Geschwindigkeit, Qualität, Open-Source-Verfügbarkeit und kommerzieller Nutzbarkeit.


Häufig gestellte Fragen

F: Kann FLUX.2 kommerziell genutzt werden?

A: Das 4B-Modell verwendet die Apache 2.0-Lizenz und kann kommerziell genutzt werden. Die 9B- und dev-Modelle sind auf nicht-kommerzielle Nutzung beschränkt.

F: Was tun, wenn meine GPU nicht genug VRAM hat?

A: Verwenden Sie die FP8-quantisierte Version, die den VRAM-Bedarf um 40 % reduziert. Alternativ nutzen Sie die offizielle API.

F: Welche Auflösungen werden unterstützt?

A: Native Unterstützung von 4MP und darunter. Gängige Größen: 1024x1024, 2048x2048, 2560x1536, 1536x2560.

F: Kann das Modell feinabgestimmt werden?

A: Ja! Die Verwendung der Basisversion (nicht destilliert) für LoRA-Feinabstimmung liefert die besten Ergebnisse.



Zusammenfassung

FLUX.2 ist das bemerkenswerteste Open-Source-KI-Bildgenerierungsmodell des Jahres 2026. Es vereint:

  • Geschwindigkeit: Sub-Sekunden-Generierung
  • Qualität: 4MP fotorealistische Ausgabe
  • Kontrollierbarkeit: Unterstützt Text-zu-Bild, Einzel-/Multi-Bild-Bearbeitung
  • Offenheit: 4B-Modell Apache 2.0 für kommerzielle Nutzung
  • Benutzerfreundlichkeit: ComfyUI, API,多种 Bereitstellungsoptionen

Ob Entwickler, Designer oder KI-Enthusiast, FLUX.2 verdient einen Platz in Ihrem Toolkit.

Nächster Schritt: Beginnen Sie mit dem 4B-Modell und erleben Sie die Magie der Sub-Sekunden-KI-Bildgenerierung!