Stable Diffusion — jak trenować własny model LoRA krok po kroku

Chcesz generować grafiki w swoim unikalnym stylu? Zobacz, jak w praktyce wytrenować własny model LoRA dla Stable Diffusion i zacznij tworzyć obrazy, które wyglądają dokładnie tak, jak sobie wymarzysz.

Czym jest LoRA w Stable Diffusion?

LoRA (Low-Rank Adaption) to technika, która pozwala „douczyć” istniejący model Stable Diffusion na niewielkiej próbce twoich własnych obrazów. Dzięki temu możesz generować grafiki w specjalnym stylu lub z unikalnym motywem, bez potrzeby trenowania modelu od zera (co jest czasochłonne i kosztowne).

LoRA są lekkie — pliki mają zazwyczaj kilka do kilkudziesięciu MB.
Możesz je łatwo podłączać do różnych wersji Stable Diffusion.
Idealne np. do stylizacji postaci, marki, przedmiotów czy własnego stylu rysunku.

Co będzie ci potrzebne?

Podstawowa znajomość Stable Diffusion i środowiska Python.
Zbiór własnych obrazów (najlepiej 10-30, spójnych stylistycznie).
Dobre podpisy tekstowe (prompt) do każdego obrazu.
Środowisko do treningu (np. Google Colab z GPU lub własna karta graficzna z min. 8GB VRAM).
Narzędzie do trenowania LoRA, np. kohya-ss/sd-scripts.

TIP: Im bardziej spójny zbiór treningowy i lepsze promptowanie podpisów, tym wyższa jakość LoRA.

Przygotowanie datasetu

Twoje obrazy powinny być w jednym folderze, a do każdego pliku musi być tekstowa etykieta (prompt), np. nazwa_obrazka.jpg i nazwa_obrazka.txt z opisem.

Przykładowy prompt do podpisu obrazów

stylized portrait of a cat in cyberpunk goggles, neon colors, high detail, sharp focus

Opisuj dokładnie, co jest na obrazie i w jakim stylu. Używaj tych samych słów kluczowych (tokenów), które chcesz później wykorzystywać w generowaniu.

Konfiguracja narzędzi do treningu

Najprościej zacząć od gotowych notebooków Google Colab. Polecam kohya-ss/sd-scripts, bo jest stabilny i dobrze udokumentowany.

Fragment promptu do uruchomienia treningu LoRA:

!accelerate launch train_network.py \
  --pretrained_model_name_or_path="/path/to/stable-diffusion-v1-5" \
  --train_data_dir="/path/to/your/images" \
  --resolution=512,512 \
  --output_dir="/path/to/output" \
  --network_alpha=16 \
  --network_module=networks.lora \
  --learning_rate=1e-4 \
  --max_train_steps=2000 \
  --save_model_as=safetensors \
  --output_name="my-custom-lora" \
  --mixed_precision=fp16

Co robi ten prompt? Uruchamia trening LoRA na twoich obrazach, korzystając z wybranego pretreningowanego modelu Stable Diffusion. Wszystkie parametry możesz dostosować (np. liczbę kroków, rozdzielczość, learning rate).

network_alpha — im wyższe, tym LoRA mocniej „przebija” oryginalny styl.
max_train_steps — zwykle 1000-3000 wystarczy na mały zbiór.
learning_rate — nie przesadzaj, zwykle 1e-4 lub 5e-5.

TIP: Jeśli LoRA „przekoloryzuje” lub generuje artefakty, zmniejsz liczbę kroków lub learning rate i trenuj ponownie.

Testowanie własnego LoRA

Po treningu otrzymasz plik .safetensors (np. my-custom-lora.safetensors). Przenieś go do folderu LoRA w lokalnej instalacji (np. w stable-diffusion-webui/models/Lora) lub załaduj do serwisu online (np. CivitAI).

Prompt do użycia własnego LoRA:

stylized portrait of a cat, my-custom-lora:0.8, neon colors, high detail, sharp focus

Co robi ten prompt? Wstawia twoje LoRA do generacji z siłą 0.8 (zmieniaj od 0.5 do 1.2, zależnie od efektu). Używaj tokenu LoRA dokładnie tak, jak nazwałeś model podczas treningu.

TIP: Testuj różne siły LoRA (:0.6, :1, :1.2), by znaleźć optymalne ustawienie dla twojego stylu.

Najczęstsze błędy i jak ich unikać

Zbyt mało lub za mało różnorodne obrazy — LoRA będzie „zapominać” oryginalny model lub generować zbyt podobne obrazki.
Brak dobrych promptów przy podpisywaniu obrazów — model nie nauczy się właściwych skojarzeń.
Zbyt wysoki learning rate lub za dużo kroków — przepalenie, artefakty, dziwne kolory.
Niedopasowana rozdzielczość obrazów — najlepiej 512×512 lub 768×768, zgodnie z bazowym modelem SD.

Przykładowy workflow — podsumowanie krok po kroku

Zbierz 15-30 spójnych obrazów i napisz do nich prompty.
Przygotuj środowisko (Google Colab lub lokalny PC z GPU).
Skopiuj i dostosuj prompt treningowy (patrz wyżej).
Po treningu przenieś plik LoRA do folderu z modelami.
Generuj obrazy, używając promptu z tokenem twojego LoRA nazwa-lora:0.8.

FAQ i wskazówki praktyczne

LoRA możesz łączyć — podawaj w promptach kilka naraz, np. my-style-lora:0.7, cat-lora:0.5.
Nie musisz trenować LoRA na potężnym GPU — Google Colab z RTX T4 wystarczy.
Testuj różne wersje Stable Diffusion (1.5, 2.1, SDXL) — LoRA są częściowo kompatybilne, ale najlepiej trenować pod konkretną wersję.
Publikuj swoje LoRA na CivitAI i sprawdzaj feedback od innych.

Podsumowanie

Trenowanie własnego modelu LoRA do Stable Diffusion nie jest trudne, jeśli dobrze przygotujesz zestaw treningowy i wykorzystasz sprawdzone narzędzia. Dzięki temu możesz generować unikalne grafiki, które będą powtarzalne i zgodne z twoją wizją. Kopiuj gotowe prompty, testuj i baw się AI!