Stable Diffusion — jak trenować własny model LoRA krok po kroku

Chcesz generować grafiki w swoim unikalnym stylu? Zobacz, jak w praktyce wytrenować własny model LoRA dla Stable Diffusion i zacznij tworzyć obrazy, które wyglądają dokładnie tak, jak sobie wymarzysz.

Czym jest LoRA w Stable Diffusion?

LoRA (Low-Rank Adaption) to technika, która pozwala „douczyć” istniejący model Stable Diffusion na niewielkiej próbce twoich własnych obrazów. Dzięki temu możesz generować grafiki w specjalnym stylu lub z unikalnym motywem, bez potrzeby trenowania modelu od zera (co jest czasochłonne i kosztowne).

  • LoRA są lekkie — pliki mają zazwyczaj kilka do kilkudziesięciu MB.
  • Możesz je łatwo podłączać do różnych wersji Stable Diffusion.
  • Idealne np. do stylizacji postaci, marki, przedmiotów czy własnego stylu rysunku.

Co będzie ci potrzebne?

  • Podstawowa znajomość Stable Diffusion i środowiska Python.
  • Zbiór własnych obrazów (najlepiej 10-30, spójnych stylistycznie).
  • Dobre podpisy tekstowe (prompt) do każdego obrazu.
  • Środowisko do treningu (np. Google Colab z GPU lub własna karta graficzna z min. 8GB VRAM).
  • Narzędzie do trenowania LoRA, np. kohya-ss/sd-scripts.

TIP: Im bardziej spójny zbiór treningowy i lepsze promptowanie podpisów, tym wyższa jakość LoRA.

Przygotowanie datasetu

Twoje obrazy powinny być w jednym folderze, a do każdego pliku musi być tekstowa etykieta (prompt), np. nazwa_obrazka.jpg i nazwa_obrazka.txt z opisem.

Przykładowy prompt do podpisu obrazów

stylized portrait of a cat in cyberpunk goggles, neon colors, high detail, sharp focus

Opisuj dokładnie, co jest na obrazie i w jakim stylu. Używaj tych samych słów kluczowych (tokenów), które chcesz później wykorzystywać w generowaniu.

Konfiguracja narzędzi do treningu

Najprościej zacząć od gotowych notebooków Google Colab. Polecam kohya-ss/sd-scripts, bo jest stabilny i dobrze udokumentowany.

Fragment promptu do uruchomienia treningu LoRA:

!accelerate launch train_network.py \
  --pretrained_model_name_or_path="/path/to/stable-diffusion-v1-5" \
  --train_data_dir="/path/to/your/images" \
  --resolution=512,512 \
  --output_dir="/path/to/output" \
  --network_alpha=16 \
  --network_module=networks.lora \
  --learning_rate=1e-4 \
  --max_train_steps=2000 \
  --save_model_as=safetensors \
  --output_name="my-custom-lora" \
  --mixed_precision=fp16

Co robi ten prompt? Uruchamia trening LoRA na twoich obrazach, korzystając z wybranego pretreningowanego modelu Stable Diffusion. Wszystkie parametry możesz dostosować (np. liczbę kroków, rozdzielczość, learning rate).

  • network_alpha — im wyższe, tym LoRA mocniej „przebija” oryginalny styl.
  • max_train_steps — zwykle 1000-3000 wystarczy na mały zbiór.
  • learning_rate — nie przesadzaj, zwykle 1e-4 lub 5e-5.

TIP: Jeśli LoRA „przekoloryzuje” lub generuje artefakty, zmniejsz liczbę kroków lub learning rate i trenuj ponownie.

Testowanie własnego LoRA

Po treningu otrzymasz plik .safetensors (np. my-custom-lora.safetensors). Przenieś go do folderu LoRA w lokalnej instalacji (np. w stable-diffusion-webui/models/Lora) lub załaduj do serwisu online (np. CivitAI).

Prompt do użycia własnego LoRA:

stylized portrait of a cat, my-custom-lora:0.8, neon colors, high detail, sharp focus

Co robi ten prompt? Wstawia twoje LoRA do generacji z siłą 0.8 (zmieniaj od 0.5 do 1.2, zależnie od efektu). Używaj tokenu LoRA dokładnie tak, jak nazwałeś model podczas treningu.

TIP: Testuj różne siły LoRA (:0.6, :1, :1.2), by znaleźć optymalne ustawienie dla twojego stylu.

Najczęstsze błędy i jak ich unikać

  • Zbyt mało lub za mało różnorodne obrazy — LoRA będzie „zapominać” oryginalny model lub generować zbyt podobne obrazki.
  • Brak dobrych promptów przy podpisywaniu obrazów — model nie nauczy się właściwych skojarzeń.
  • Zbyt wysoki learning rate lub za dużo kroków — przepalenie, artefakty, dziwne kolory.
  • Niedopasowana rozdzielczość obrazów — najlepiej 512×512 lub 768×768, zgodnie z bazowym modelem SD.

Przykładowy workflow — podsumowanie krok po kroku

  1. Zbierz 15-30 spójnych obrazów i napisz do nich prompty.
  2. Przygotuj środowisko (Google Colab lub lokalny PC z GPU).
  3. Skopiuj i dostosuj prompt treningowy (patrz wyżej).
  4. Po treningu przenieś plik LoRA do folderu z modelami.
  5. Generuj obrazy, używając promptu z tokenem twojego LoRA nazwa-lora:0.8.

FAQ i wskazówki praktyczne

  • LoRA możesz łączyć — podawaj w promptach kilka naraz, np. my-style-lora:0.7, cat-lora:0.5.
  • Nie musisz trenować LoRA na potężnym GPU — Google Colab z RTX T4 wystarczy.
  • Testuj różne wersje Stable Diffusion (1.5, 2.1, SDXL) — LoRA są częściowo kompatybilne, ale najlepiej trenować pod konkretną wersję.
  • Publikuj swoje LoRA na CivitAI i sprawdzaj feedback od innych.

Podsumowanie

Trenowanie własnego modelu LoRA do Stable Diffusion nie jest trudne, jeśli dobrze przygotujesz zestaw treningowy i wykorzystasz sprawdzone narzędzia. Dzięki temu możesz generować unikalne grafiki, które będą powtarzalne i zgodne z twoją wizją. Kopiuj gotowe prompty, testuj i baw się AI!