Stable Diffusion — ControlNet krok po kroku (kontrola pozy i detali)

Chcesz mieć pełną kontrolę nad generowaną grafiką w Stable Diffusion? Sprawdź, jak użyć ControlNet, by precyzyjnie sterować pozą i detalami postaci.

Czym jest ControlNet i po co go używać?

Stable Diffusion z pluginem ControlNet to gamechanger dla wszystkich, którzy chcą uzyskać pełną kontrolę nad tym, co generuje AI. Dzięki ControlNet możesz narzucić AI nie tylko temat i styl, ale też konkretną pozę postaci, kontury, proporcje, kompozycję czy nawet układ światła. To idealne narzędzie dla grafików, twórców concept artów, ilustratorów i wszystkich, którym zależy na powtarzalności i precyzji.

Jak działa ControlNet?

ControlNet to rozszerzenie Stable Diffusion, które pozwala na korzystanie z tzw. map kontrolnych (np. map pozy, głębi, konturów). Łączysz obraz referencyjny i prompt tekstowy — AI trzyma się wytycznych z obrazka, generując nową grafikę zgodnie z Twoim opisem.

  • Najczęściej używane typy map to: pose (poza), canny (kontury), depth (głębia), openpose (szkic postaci).
  • Możesz użyć własnego zdjęcia lub wygenerować szkic w narzędziu typu PoseMyArt / OpenPose Editor.

Instalacja ControlNet — krótko i konkretnie

Załóżmy, że korzystasz z Stable Diffusion WebUI (AUTOMATIC1111) — najpopularniejszego interfejsu. Oto kroki:

  • Zainstaluj Stable Diffusion WebUI (jeśli jeszcze nie masz).
  • Wejdź w zakładkę Extensions → Available → Install from URL.
  • Wklej URL repozytorium ControlNet: https://github.com/Mikubill/sd-webui-controlnet.git
  • Naciśnij Install. Zrestartuj WebUI.
  • W zakładce txt2img lub img2img pojawi się nowy panel ControlNet.

Tip: Do działania ControlNet potrzebujesz odpowiednich modeli (np. control_sd15_openpose.pth lub control_sd15_canny.pth). Pobierz je z HuggingFace i wrzuć do folderu extensions/sd-webui-controlnet/models.

Krok po kroku: Tworzenie grafiki z kontrolą pozy

Krok 1: Przygotuj obraz referencyjny pozy

Możesz:

  • Skorzystać z gotowego narzędzia do generowania pozy (np. posemy.art lub mini-openpose-editor).
  • Wygenerować szkic w programie graficznym (najlepiej czarne linie na białym tle).
  • Użyć zdjęcia — ControlNet sam wyłapie pozę, ale najdokładniejsze efekty daje OpenPose (szkic szkieletu).

Krok 2: Ustaw ControlNet w WebUI

  • W zakładce txt2img (lub img2img) rozwiń panel ControlNet.
  • Wgraj swój obraz referencyjny (np. szkic pozy).
  • Wybierz model ControlNet (najczęściej control_sd15_openpose).
  • Zaznacz Enable oraz Pixel Perfect.
  • Opcjonalnie: pobaw się suwakiem Control Weight (im wyżej, tym AI mocniej trzyma się pozy).

Tip: Jeśli poza wychodzi za sztywno, zmniejsz Control Weight. Jeśli AI „ignoruje” pozę, zwiększ.

Krok 3: Ułóż prompt tekstowy

Teraz czas na prompt — opisuj, co ma znaleźć się na obrazku. Przykład promptu dla kobiety w dynamicznej pozie:

prompt: "dynamic female warrior, fantasy armor, dramatic lighting, masterpiece, ultra detailed"
negative prompt: "blurry, lowres, deformed, ugly, extra limbs"

Ten prompt wygeneruje wojowniczkę w fantastycznej zbroi, trzymając się szkieletu z obrazka referencyjnego.

Gotowe prompty do ControlNet — kopiuj i używaj

1. Kontrola pozy (OpenPose)

prompt: "athletic male runner, sportswear, running on track, dynamic pose, photorealistic, 8k"
negative prompt: "blurry, lowres, out of frame, deformed, extra hands"

Użyj tego promptu, gdy chcesz wygenerować postać w konkretnej pozie sportowej (np. z referencji z OpenPose).

2. Stylizacja postaci (Canny — kontury)

prompt: "anime style girl, school uniform, standing in classroom, soft colors, clean lines"
negative prompt: "blurry, lowres, bad anatomy, extra legs"

Wgraj wyraźny szkic konturowy (np. zrobiony w Procreate lub Photoshopie) i wybierz model ControlNet canny. AI zachowa kontury, ale nada całości styl anime.

3. Przekształcanie zdjęcia w ilustrację (Depth)

prompt: "cinematic portrait, oil painting, expressive brushstrokes, dramatic lighting"
negative prompt: "blurry, cartoon, lowres"

Użyj zdjęcia jako inputu, wybierz model depth — AI zachowa głębię i proporcje, ale przetworzy styl na malarski.

Zaawansowane tipy i triki

  • Możesz łączyć kilka ControlNetów naraz (np. poza + kontury) — każdy panel ControlNet możesz aktywować osobno.
  • Eksperymentuj z parametrem Guess Mode — pozwala AI dodać własną interpretację, ale czasem psuje detale.
  • Jeśli chcesz powtarzalności, używaj tego samego obrazu referencyjnego i tego samego promtpu — to gwarancja spójności serii postaci.
  • Do stylizacji używaj bardzo konkretnych promptów (np. „manga style, 90s, Masakazu Katsura style, muted palette”).
  • Do generowania referencji OpenPose polecam narzędzie posemy.art (łatwo ustawisz postać, ściągniesz szkic/obrazek z pozą, wrzucisz do ControlNet).

Podsumowanie

ControlNet to must-have, jeśli zależy ci na kontroli pozy, kompozycji lub stylu w Stable Diffusion. Wystarczy obraz referencyjny i dobrze napisany prompt, by generować powtarzalne, spójne grafiki pod dowolny projekt. Przetestuj powyższe prompty i eksperymentuj z różnymi modelami ControlNet — możliwości są praktycznie nieograniczone.