Anleitung

Stable Diffusion einrichten: ComfyUI auf dem GPU-Server

Diese Anleitung führt dich durch die Einrichtung von Stable Diffusion mit ComfyUI auf einem dedizierten GPU-Server — vom VRAM -Check über Modelle und LoRAs bis zum abgesicherten Remote-Zugriff.

Stable-Diffusion-Server ansehen

ComfyUI ist das flexibelste Frontend für Stable Diffusion: ein node-basierter Editor, der von einfachen Text-zu-Bild-Workflows bis zu komplexen Pipelines mit ControlNet, Upscaling und Video alles abbildet. Auf einer dedizierten RTX 4090 rendert es zügig — ohne geteilte GPU, ohne Warteschlange, ohne Preemption .

GPU und VRAM prüfen

Wie viel VRAM du brauchst, hängt vom Modell ab. SDXL läuft komfortabel ab rund 12 GB, mit Optimierungen auch darunter. Flux und aufwendige Pipelines mit mehreren Modellen gleichzeitig im Speicher profitieren spürbar von 24 GB (RTX 4090) oder 32 GB ( RTX 5090 ). Die Grundlagen erklärt unser Ratgeber GPU und VRAM richtig dimensionieren .

VRAM-Richtwerte für Bildgenerierung
Modell / Workflow	Empfohlenes VRAM	Passende Karte
SDXL, einfache Text-zu-Bild	ca. 12 GB+	RTX 4090
SDXL mit ControlNet / Upscaling	ca. 16–24 GB	RTX 4090
Flux und große Pipelines	24–32 GB	RTX 4090 / 5090
Video- und Mehrmodell-Workflows	32 GB	RTX 5090

ComfyUI einrichten — Schritt für Schritt

GPU-Server bereitstellen: Dedizierte RTX 4090 (24 GB) oder RTX 5090 (32 GB) mit aktuellem Linux und Root-Zugriff wählen.
Treiber und CUDA installieren: NVIDIA-Treiber einspielen, mit dem Kommando nvidia-smi prüfen und die zu PyTorch passende CUDA -Version bereitstellen.
ComfyUI installieren: Das Repository klonen, eine isolierte Python-Umgebung (venv oder conda) anlegen und die Abhängigkeiten samt GPU-fähigem PyTorch installieren.
Modelle laden: Checkpoints wie SDXL oder Flux in den Ordner models/checkpoints legen; VAE und weitere Komponenten an ihre vorgesehenen Pfade kopieren.
LoRAs und Erweiterungen: LoRA-Dateien in models/loras ablegen und über den ComfyUI-Manager bei Bedarf zusätzliche Custom Nodes installieren.
Remote-Zugriff absichern: ComfyUI an localhost binden und ausschließlich über einen Reverse Proxy mit TLS und Authentifizierung erreichbar machen — niemals ungeschützt ins Netz stellen.
Ersten Workflow testen: Einen Standard-Text-zu-Bild-Graph laden, einen Prompt setzen, die Generierung starten und dabei die VRAM-Auslastung mit nvidia-smi beobachten.

Modelle, VAE und LoRAs richtig einsortieren

Stable Diffusion lebt von der Modell-Ökonomie: Ein Basis-Checkpoint bestimmt den Stil, ein passender VAE die Farbwiedergabe, LoRAs fügen Konzepte oder Charaktere hinzu. Entscheidend ist, dass jede Datei im richtigen Ordner liegt — sonst findet ComfyUI sie im Loader-Node schlicht nicht.

Checkpoints (SDXL, Flux) gehören nach models/checkpoints und erscheinen dann direkt im Loader-Node.
Ein separater VAE kann Farben und Kontrast verbessern; lege ihn nach models/vae und wähle ihn im Graphen aus.
LoRAs nach models/loras legen und mit passender Gewichtung einbinden — zu hohe Werte überzeichnen das Bild sichtbar.
Upscaler-Modelle und ControlNet-Dateien haben eigene Ordner; der ComfyUI-Manager hilft, fehlende Nodes nachzuinstallieren.

Rendering beschleunigen

Die Geschwindigkeit hängt an drei Faktoren: Modellgröße, Auflösung und Sampler-Schritten. Auf einer dedizierten GPU ohne geteilte Ressourcen bleibt die Leistung konstant — kein Einbruch durch Nachbarn auf derselben Karte, keine Warteschlange zu Stoßzeiten und keine schwankenden Renderzeiten mitten in einer Serie.

Auflösung in Etappen: erst in Basisauflösung generieren, dann gezielt hochskalieren, statt alles in einem teuren Durchgang zu rendern.
Sampler und Schritte abstimmen: mehr Schritte bringen ab einem Punkt kaum sichtbaren Gewinn, kosten aber Zeit.
VRAM im Blick behalten: Wird es knapp, hilft eine sparsamere Attention-Einstellung oder der Wechsel auf die RTX 5090 mit 32 GB .

Häufig gestellte Fragen

Wie viel VRAM braucht SDXL bzw. Flux?

Warum ComfyUI statt AUTOMATIC1111?

Kann ich ComfyUI sicher aus der Ferne nutzen?

Reicht die RTX 4090 für Bildgenerierung?