RAG w praktyce — AI z własną bazą wiedzy krok po kroku

Chcesz, żeby AI odpowiadało na pytania na podstawie Twojej bazy wiedzy? Poznaj praktyczny tutorial RAG — krok po kroku, bez lania wody.

Czym jest RAG i dlaczego warto?

Retrieval-Augmented Generation (RAG) to sposób na połączenie AI, takiego jak GPT, z własną bazą wiedzy. Dzięki temu model nie halucynuje, tylko korzysta z Twoich dokumentów, plików lub FAQ. To idealne rozwiązanie, jeśli chcesz budować chatboty, asystentów lub automatyzacje, które muszą bazować na konkretnych, zamkniętych informacjach.

  • RAG = retrieval (wyszukiwanie) + generation (generowanie)
  • AI najpierw szuka pasujących fragmentów w Twojej bazie, potem generuje odpowiedź na ich podstawie
  • Unikasz przypadkowych odpowiedzi — model korzysta z tego, co mu podasz

Jak działa RAG w praktyce?

Proces RAG składa się z kilku etapów:

  1. Przygotowanie bazy wiedzy (np. PDF, strony, dokumenty, FAQ)
  2. Podzielenie jej na fragmenty (chunking) i utworzenie embeddingów
  3. Wyszukiwanie najbardziej pasujących fragmentów na podstawie pytania
  4. Przekazanie tych fragmentów do promptu generującego odpowiedź

Tip: Do testów możesz użyć darmowych narzędzi typu LangChain czy LlamaIndex, a nawet gotowych platform typu ChatPDF lub ChatWithPDF.

Krok 1: Przygotowanie bazy wiedzy

Zbierz wszystkie materiały, które mają być źródłem wiedzy. Mogą to być pliki PDF, dokumenty Word, strony internetowe, notatki czy FAQ.

  • Im bardziej uporządkowana baza, tym lepiej AI sobie poradzi
  • Unikaj bardzo długich fragmentów — lepiej podzielić tekst na logiczne akapity

Prompt do podzielenia dokumentu na fragmenty (chunking)

Jeśli nie masz narzędzia do automatycznego chunkowania, możesz użyć GPT do podziału tekstu na bloki po max 200 słów:


Podziel poniższy tekst na fragmenty po maksymalnie 200 słów. Każdy fragment zapisz jako osobny punkt listy:

---
{tu wklej swój tekst}
---

Użyj tego promptu, jeśli masz długi tekst i chcesz szybko przygotować go do dalszego przetwarzania.

Krok 2: Tworzenie embeddingów i wektorowej bazy danych

Każdy fragment tekstu zamieniasz na embedding (wektor liczbowy). Do tego potrzebujesz narzędzia typu OpenAI Embeddings, Cohere lub open-source (np. HuggingFace Sentence Transformers).

  • Embeddingi przechowuj w bazie wektorowej, np. Pinecone, Weaviate, ChromaDB
  • Dla małych baz możesz użyć lokalnych narzędzi (np. FAISS)

Tip: Jeśli nie programujesz, przetestuj ChatPDF lub Notion AI Q&A — działają „out of the box”.

Krok 3: Retrieval — wyszukiwanie fragmentów na podstawie pytania

Gdy użytkownik zadaje pytanie, AI tworzy embedding pytania i szuka najbardziej podobnych fragmentów w Twojej bazie.

Prompt do wyszukiwania (RAG retrieval)

Jeżeli testujesz RAG ręcznie, możesz poprosić GPT, by z listy fragmentów wybrał te najlepiej pasujące do pytania:


Odpowiedz na poniższe pytanie, korzystając wyłącznie z fragmentów wiedzy poniżej.

Pytanie: {tu wpisz pytanie}

Fragmenty wiedzy:
1. {fragment 1}
2. {fragment 2}
3. {fragment 3}

Jeśli nie znajdziesz odpowiedzi w fragmentach, napisz: "Brak odpowiedzi w bazie wiedzy." 

Ten prompt wymusza, by AI nie halucynowało i odpowiadało tylko na podstawie załączonych fragmentów.

Krok 4: Generation — budowanie odpowiedzi na podstawie retrieved context

Gdy masz już wybrane fragmenty, przekazujesz je do modelu generującego odpowiedź. Klucz: AI powinno korzystać tylko z tych fragmentów, nie ogólnej wiedzy.

Prompt do generowania odpowiedzi z kontekstem


Odpowiedz na pytanie wyłącznie na podstawie poniższych fragmentów:

{wklej fragmenty wiedzy}

Pytanie: {tu wpisz pytanie}

Jeśli nie możesz odpowiedzieć na podstawie fragmentów, napisz: "Brak odpowiedzi w bazie wiedzy."

To „core” RAG — AI generuje odpowiedź tylko z podanego kontekstu.

Automatyzacja: Jak złożyć to w całość?

W praktyce automatyzacja RAG to pipeline:

  1. Nowy dokument trafia do folderu → skrypt dzieli go na fragmenty, tworzy embeddingi i zapisuje w bazie wektorowej
  2. Gdy przychodzi pytanie, skrypt zamienia je na embedding, wyszukuje top 3-5 fragmentów
  3. Łączy fragmenty i pytanie w gotowy prompt (jak powyżej)
  4. Wysyła prompt do GPT/Claude/Gemini i zwraca odpowiedź

Tip: Do automatyzacji użyj Airflow, Zapier, n8n lub prostych skryptów Python. Warto testować całość na małej bazie, zanim wrzucisz setki dokumentów.

Najczęstsze problemy i jak ich uniknąć

  • Za długie fragmenty: Model nie „widzi” całości — dziel tekst na logiczne, krótkie bloki.
  • Za mało kontekstu: Lepiej dać 3-5 fragmentów niż tylko jeden.
  • Halucynacje: W promptach wymuś, by AI nie wykraczało poza podane fragmenty.
  • Nieczytelna baza: Usuwaj dublety i śmieciowe dane.

Pro tipy i gotowe prompty do RAG

  • Testuj różne typy promptów — czasem dodanie „jeśli nie możesz odpowiedzieć, napisz brak odpowiedzi” znacząco poprawia jakość!
  • Jeśli korzystasz z API, zawsze loguj pytanie, retrieved fragments i odpowiedź — ułatwia debugowanie.
  • Rozważ chain of thought: poproś AI, by najpierw oceniło, czy znalazło odpowiedni fragment, potem wygenerowało odpowiedź.

Prompt z chain of thought dla RAG


Odpowiedz na pytanie w dwóch krokach:
1. Oceń, czy poniższe fragmenty zawierają odpowiedź (napisz TAK lub NIE).
2. Jeśli TAK, odpowiedz na pytanie na podstawie fragmentów. Jeśli NIE, napisz: "Brak odpowiedzi w bazie wiedzy."

Fragmenty:
{wklej fragmenty wiedzy}

Pytanie: {tu wpisz pytanie}

Podsumowanie — Twój RAG tutorial w pigułce

RAG to realny sposób, by AI korzystało z Twojej bazy wiedzy. Zaczynasz od porządkowania dokumentów, potem budujesz embeddingi i automatyzujesz retrieval oraz generation. Dzięki gotowym promptom i narzędziom typu LangChain, LlamaIndex czy ChatPDF wdrożysz własnego „AI eksperta” szybciej, niż myślisz.

Tip na start: Zacznij od małego FAQ lub 1-2 plików PDF. Przetestuj RAG ręcznie z gotowymi promptami. Potem przejdź do automatyzacji.