Anleitung

Stable Diffusion einrichten: ComfyUI auf dem GPU-Server

Diese Anleitung führt dich durch die Einrichtung von Stable Diffusion mit ComfyUI auf einem dedizierten GPU-Server — vom VRAM -Check über Modelle und LoRAs bis zum abgesicherten Remote-Zugriff.

Stable-Diffusion-Server ansehen

ComfyUI ist das flexibelste Frontend für Stable Diffusion: ein node-basierter Editor, der von einfachen Text-zu-Bild-Workflows bis zu komplexen Pipelines mit ControlNet, Upscaling und Video alles abbildet. Auf einer dedizierten RTX 4090 rendert es zügig — ohne geteilte GPU, ohne Warteschlange, ohne Preemption .

GPU und VRAM prüfen

Wie viel VRAM du brauchst, hängt vom Modell ab. SDXL läuft komfortabel ab rund 12 GB, mit Optimierungen auch darunter. Flux und aufwendige Pipelines mit mehreren Modellen gleichzeitig im Speicher profitieren spürbar von 24 GB (RTX 4090) oder 32 GB ( RTX 5090 ). Die Grundlagen erklärt unser Ratgeber GPU und VRAM richtig dimensionieren .

VRAM-Richtwerte für Bildgenerierung
Modell / WorkflowEmpfohlenes VRAMPassende Karte
SDXL, einfache Text-zu-Bildca. 12 GB+RTX 4090
SDXL mit ControlNet / Upscalingca. 16–24 GBRTX 4090
Flux und große Pipelines24–32 GBRTX 4090 / 5090
Video- und Mehrmodell-Workflows32 GBRTX 5090

ComfyUI einrichten — Schritt für Schritt

  1. GPU-Server bereitstellen: Dedizierte RTX 4090 (24 GB) oder RTX 5090 (32 GB) mit aktuellem Linux und Root-Zugriff wählen.
  2. Treiber und CUDA installieren: NVIDIA-Treiber einspielen, mit dem Kommando nvidia-smi prüfen und die zu PyTorch passende CUDA -Version bereitstellen.
  3. ComfyUI installieren: Das Repository klonen, eine isolierte Python-Umgebung (venv oder conda) anlegen und die Abhängigkeiten samt GPU-fähigem PyTorch installieren.
  4. Modelle laden: Checkpoints wie SDXL oder Flux in den Ordner models/checkpoints legen; VAE und weitere Komponenten an ihre vorgesehenen Pfade kopieren.
  5. LoRAs und Erweiterungen: LoRA-Dateien in models/loras ablegen und über den ComfyUI-Manager bei Bedarf zusätzliche Custom Nodes installieren.
  6. Remote-Zugriff absichern: ComfyUI an localhost binden und ausschließlich über einen Reverse Proxy mit TLS und Authentifizierung erreichbar machen — niemals ungeschützt ins Netz stellen.
  7. Ersten Workflow testen: Einen Standard-Text-zu-Bild-Graph laden, einen Prompt setzen, die Generierung starten und dabei die VRAM-Auslastung mit nvidia-smi beobachten.

Modelle, VAE und LoRAs richtig einsortieren

Stable Diffusion lebt von der Modell-Ökonomie: Ein Basis-Checkpoint bestimmt den Stil, ein passender VAE die Farbwiedergabe, LoRAs fügen Konzepte oder Charaktere hinzu. Entscheidend ist, dass jede Datei im richtigen Ordner liegt — sonst findet ComfyUI sie im Loader-Node schlicht nicht.

  • Checkpoints (SDXL, Flux) gehören nach models/checkpoints und erscheinen dann direkt im Loader-Node.
  • Ein separater VAE kann Farben und Kontrast verbessern; lege ihn nach models/vae und wähle ihn im Graphen aus.
  • LoRAs nach models/loras legen und mit passender Gewichtung einbinden — zu hohe Werte überzeichnen das Bild sichtbar.
  • Upscaler-Modelle und ControlNet-Dateien haben eigene Ordner; der ComfyUI-Manager hilft, fehlende Nodes nachzuinstallieren.

Rendering beschleunigen

Die Geschwindigkeit hängt an drei Faktoren: Modellgröße, Auflösung und Sampler-Schritten. Auf einer dedizierten GPU ohne geteilte Ressourcen bleibt die Leistung konstant — kein Einbruch durch Nachbarn auf derselben Karte, keine Warteschlange zu Stoßzeiten und keine schwankenden Renderzeiten mitten in einer Serie.

  • Auflösung in Etappen: erst in Basisauflösung generieren, dann gezielt hochskalieren, statt alles in einem teuren Durchgang zu rendern.
  • Sampler und Schritte abstimmen: mehr Schritte bringen ab einem Punkt kaum sichtbaren Gewinn, kosten aber Zeit.
  • VRAM im Blick behalten: Wird es knapp, hilft eine sparsamere Attention-Einstellung oder der Wechsel auf die RTX 5090 mit 32 GB .

Häufig gestellte Fragen