Chcesz mieć pełną kontrolę nad generowaną grafiką w Stable Diffusion? Sprawdź, jak użyć ControlNet, by precyzyjnie sterować pozą i detalami postaci.
Czym jest ControlNet i po co go używać?
Stable Diffusion z pluginem ControlNet to gamechanger dla wszystkich, którzy chcą uzyskać pełną kontrolę nad tym, co generuje AI. Dzięki ControlNet możesz narzucić AI nie tylko temat i styl, ale też konkretną pozę postaci, kontury, proporcje, kompozycję czy nawet układ światła. To idealne narzędzie dla grafików, twórców concept artów, ilustratorów i wszystkich, którym zależy na powtarzalności i precyzji.
Jak działa ControlNet?
ControlNet to rozszerzenie Stable Diffusion, które pozwala na korzystanie z tzw. map kontrolnych (np. map pozy, głębi, konturów). Łączysz obraz referencyjny i prompt tekstowy — AI trzyma się wytycznych z obrazka, generując nową grafikę zgodnie z Twoim opisem.
- Najczęściej używane typy map to: pose (poza), canny (kontury), depth (głębia), openpose (szkic postaci).
- Możesz użyć własnego zdjęcia lub wygenerować szkic w narzędziu typu PoseMyArt / OpenPose Editor.
Instalacja ControlNet — krótko i konkretnie
Załóżmy, że korzystasz z Stable Diffusion WebUI (AUTOMATIC1111) — najpopularniejszego interfejsu. Oto kroki:
- Zainstaluj Stable Diffusion WebUI (jeśli jeszcze nie masz).
- Wejdź w zakładkę Extensions → Available → Install from URL.
- Wklej URL repozytorium ControlNet:
https://github.com/Mikubill/sd-webui-controlnet.git - Naciśnij Install. Zrestartuj WebUI.
- W zakładce txt2img lub img2img pojawi się nowy panel ControlNet.
Tip: Do działania ControlNet potrzebujesz odpowiednich modeli (np. control_sd15_openpose.pth lub control_sd15_canny.pth). Pobierz je z HuggingFace i wrzuć do folderu
extensions/sd-webui-controlnet/models.
Krok po kroku: Tworzenie grafiki z kontrolą pozy
Krok 1: Przygotuj obraz referencyjny pozy
Możesz:
- Skorzystać z gotowego narzędzia do generowania pozy (np. posemy.art lub mini-openpose-editor).
- Wygenerować szkic w programie graficznym (najlepiej czarne linie na białym tle).
- Użyć zdjęcia — ControlNet sam wyłapie pozę, ale najdokładniejsze efekty daje OpenPose (szkic szkieletu).
Krok 2: Ustaw ControlNet w WebUI
- W zakładce txt2img (lub img2img) rozwiń panel ControlNet.
- Wgraj swój obraz referencyjny (np. szkic pozy).
- Wybierz model ControlNet (najczęściej control_sd15_openpose).
- Zaznacz Enable oraz Pixel Perfect.
- Opcjonalnie: pobaw się suwakiem Control Weight (im wyżej, tym AI mocniej trzyma się pozy).
Tip: Jeśli poza wychodzi za sztywno, zmniejsz Control Weight. Jeśli AI „ignoruje” pozę, zwiększ.
Krok 3: Ułóż prompt tekstowy
Teraz czas na prompt — opisuj, co ma znaleźć się na obrazku. Przykład promptu dla kobiety w dynamicznej pozie:
prompt: "dynamic female warrior, fantasy armor, dramatic lighting, masterpiece, ultra detailed"
negative prompt: "blurry, lowres, deformed, ugly, extra limbs"
Ten prompt wygeneruje wojowniczkę w fantastycznej zbroi, trzymając się szkieletu z obrazka referencyjnego.
Gotowe prompty do ControlNet — kopiuj i używaj
1. Kontrola pozy (OpenPose)
prompt: "athletic male runner, sportswear, running on track, dynamic pose, photorealistic, 8k"
negative prompt: "blurry, lowres, out of frame, deformed, extra hands"
Użyj tego promptu, gdy chcesz wygenerować postać w konkretnej pozie sportowej (np. z referencji z OpenPose).
2. Stylizacja postaci (Canny — kontury)
prompt: "anime style girl, school uniform, standing in classroom, soft colors, clean lines"
negative prompt: "blurry, lowres, bad anatomy, extra legs"
Wgraj wyraźny szkic konturowy (np. zrobiony w Procreate lub Photoshopie) i wybierz model ControlNet canny. AI zachowa kontury, ale nada całości styl anime.
3. Przekształcanie zdjęcia w ilustrację (Depth)
prompt: "cinematic portrait, oil painting, expressive brushstrokes, dramatic lighting"
negative prompt: "blurry, cartoon, lowres"
Użyj zdjęcia jako inputu, wybierz model depth — AI zachowa głębię i proporcje, ale przetworzy styl na malarski.
Zaawansowane tipy i triki
- Możesz łączyć kilka ControlNetów naraz (np. poza + kontury) — każdy panel ControlNet możesz aktywować osobno.
- Eksperymentuj z parametrem Guess Mode — pozwala AI dodać własną interpretację, ale czasem psuje detale.
- Jeśli chcesz powtarzalności, używaj tego samego obrazu referencyjnego i tego samego promtpu — to gwarancja spójności serii postaci.
- Do stylizacji używaj bardzo konkretnych promptów (np. „manga style, 90s, Masakazu Katsura style, muted palette”).
- Do generowania referencji OpenPose polecam narzędzie posemy.art (łatwo ustawisz postać, ściągniesz szkic/obrazek z pozą, wrzucisz do ControlNet).
Podsumowanie
ControlNet to must-have, jeśli zależy ci na kontroli pozy, kompozycji lub stylu w Stable Diffusion. Wystarczy obraz referencyjny i dobrze napisany prompt, by generować powtarzalne, spójne grafiki pod dowolny projekt. Przetestuj powyższe prompty i eksperymentuj z różnymi modelami ControlNet — możliwości są praktycznie nieograniczone.