Stable Diffusion — ControlNet krok po kroku (kontrola pozy i detali)

Chcesz mieć pełną kontrolę nad generowaną grafiką w Stable Diffusion? Sprawdź, jak użyć ControlNet, by precyzyjnie sterować pozą i detalami postaci.

Czym jest ControlNet i po co go używać?

Stable Diffusion z pluginem ControlNet to gamechanger dla wszystkich, którzy chcą uzyskać pełną kontrolę nad tym, co generuje AI. Dzięki ControlNet możesz narzucić AI nie tylko temat i styl, ale też konkretną pozę postaci, kontury, proporcje, kompozycję czy nawet układ światła. To idealne narzędzie dla grafików, twórców concept artów, ilustratorów i wszystkich, którym zależy na powtarzalności i precyzji.

Jak działa ControlNet?

ControlNet to rozszerzenie Stable Diffusion, które pozwala na korzystanie z tzw. map kontrolnych (np. map pozy, głębi, konturów). Łączysz obraz referencyjny i prompt tekstowy — AI trzyma się wytycznych z obrazka, generując nową grafikę zgodnie z Twoim opisem.

Najczęściej używane typy map to: pose (poza), canny (kontury), depth (głębia), openpose (szkic postaci).
Możesz użyć własnego zdjęcia lub wygenerować szkic w narzędziu typu PoseMyArt / OpenPose Editor.

Instalacja ControlNet — krótko i konkretnie

Załóżmy, że korzystasz z Stable Diffusion WebUI (AUTOMATIC1111) — najpopularniejszego interfejsu. Oto kroki:

Zainstaluj Stable Diffusion WebUI (jeśli jeszcze nie masz).
Wejdź w zakładkę Extensions → Available → Install from URL.
Wklej URL repozytorium ControlNet: https://github.com/Mikubill/sd-webui-controlnet.git
Naciśnij Install. Zrestartuj WebUI.
W zakładce txt2img lub img2img pojawi się nowy panel ControlNet.

Tip: Do działania ControlNet potrzebujesz odpowiednich modeli (np. control_sd15_openpose.pth lub control_sd15_canny.pth). Pobierz je z HuggingFace i wrzuć do folderu extensions/sd-webui-controlnet/models.

Krok po kroku: Tworzenie grafiki z kontrolą pozy

Krok 1: Przygotuj obraz referencyjny pozy

Możesz:

Skorzystać z gotowego narzędzia do generowania pozy (np. posemy.art lub mini-openpose-editor).
Wygenerować szkic w programie graficznym (najlepiej czarne linie na białym tle).
Użyć zdjęcia — ControlNet sam wyłapie pozę, ale najdokładniejsze efekty daje OpenPose (szkic szkieletu).

Krok 2: Ustaw ControlNet w WebUI

W zakładce txt2img (lub img2img) rozwiń panel ControlNet.
Wgraj swój obraz referencyjny (np. szkic pozy).
Wybierz model ControlNet (najczęściej control_sd15_openpose).
Zaznacz Enable oraz Pixel Perfect.
Opcjonalnie: pobaw się suwakiem Control Weight (im wyżej, tym AI mocniej trzyma się pozy).

Tip: Jeśli poza wychodzi za sztywno, zmniejsz Control Weight. Jeśli AI „ignoruje” pozę, zwiększ.

Krok 3: Ułóż prompt tekstowy

Teraz czas na prompt — opisuj, co ma znaleźć się na obrazku. Przykład promptu dla kobiety w dynamicznej pozie:

prompt: "dynamic female warrior, fantasy armor, dramatic lighting, masterpiece, ultra detailed"
negative prompt: "blurry, lowres, deformed, ugly, extra limbs"

Ten prompt wygeneruje wojowniczkę w fantastycznej zbroi, trzymając się szkieletu z obrazka referencyjnego.

Gotowe prompty do ControlNet — kopiuj i używaj

1. Kontrola pozy (OpenPose)

prompt: "athletic male runner, sportswear, running on track, dynamic pose, photorealistic, 8k"
negative prompt: "blurry, lowres, out of frame, deformed, extra hands"

Użyj tego promptu, gdy chcesz wygenerować postać w konkretnej pozie sportowej (np. z referencji z OpenPose).

2. Stylizacja postaci (Canny — kontury)

prompt: "anime style girl, school uniform, standing in classroom, soft colors, clean lines"
negative prompt: "blurry, lowres, bad anatomy, extra legs"

Wgraj wyraźny szkic konturowy (np. zrobiony w Procreate lub Photoshopie) i wybierz model ControlNet canny. AI zachowa kontury, ale nada całości styl anime.

3. Przekształcanie zdjęcia w ilustrację (Depth)

prompt: "cinematic portrait, oil painting, expressive brushstrokes, dramatic lighting"
negative prompt: "blurry, cartoon, lowres"

Użyj zdjęcia jako inputu, wybierz model depth — AI zachowa głębię i proporcje, ale przetworzy styl na malarski.

Zaawansowane tipy i triki

Możesz łączyć kilka ControlNetów naraz (np. poza + kontury) — każdy panel ControlNet możesz aktywować osobno.
Eksperymentuj z parametrem Guess Mode — pozwala AI dodać własną interpretację, ale czasem psuje detale.
Jeśli chcesz powtarzalności, używaj tego samego obrazu referencyjnego i tego samego promtpu — to gwarancja spójności serii postaci.
Do stylizacji używaj bardzo konkretnych promptów (np. „manga style, 90s, Masakazu Katsura style, muted palette”).
Do generowania referencji OpenPose polecam narzędzie posemy.art (łatwo ustawisz postać, ściągniesz szkic/obrazek z pozą, wrzucisz do ControlNet).

Podsumowanie

ControlNet to must-have, jeśli zależy ci na kontroli pozy, kompozycji lub stylu w Stable Diffusion. Wystarczy obraz referencyjny i dobrze napisany prompt, by generować powtarzalne, spójne grafiki pod dowolny projekt. Przetestuj powyższe prompty i eksperymentuj z różnymi modelami ControlNet — możliwości są praktycznie nieograniczone.