Jak AI naprawdę rozumie dokumenty Twojej firmy: architektura wyszukiwania w Klemens.AI

Kamil Spletsteser
4 mar
4 minut(y) czytania

"Wrzuć dokumenty do AI"- za tym kryje się znacznie więcej

Hasło „AI, które rozumie Twoje dokumenty" brzmi prosto. Wrzucasz pliki, zadajesz pytanie, dostajesz odpowiedź. W rzeczywistości, architektura wyszukiwania powoduje, że jest to skomplikowane zagadnienie. Między załadowaniem dokumentu a uzyskaniem trafnej odpowiedzi dzieje się kilkanaście procesów, z których każdy wpływa na jakość końcowego wyniku. W tym artykule pokażemy, co naprawdę dzieje się „pod maską" Klemens.AI: od momentu, gdy ładujesz plik PDF, do chwili, gdy widzisz odpowiedź z precyzyjnymi cytowaniami.

Krok 1. Ekstrakcja treści jest trudniejsza niż się wydaje

Nie każdy PDF jest taki sam. Dokumenty firmowe to mieszanka formatów: tekst wygenerowany cyfrowo, skany papierowych dokumentów, pliki z tabelami, nagłówkami, stopkami i numeracją stron. Klemens.AI stosuje dwuetapową ekstrakcję danych:

Ekstrakcja standardowa

System próbuje odczytać tekst bezpośrednio z pliku. To szybkie i dokładne dla dokumentów tworzonych cyfrowo (np. eksportowanych z Worda).

Inteligentne rozpoznawanie obrazu

Jeśli standardowa ekstrakcja zwraca zbyt mało tekstu (co oznacza, że dokument jest prawdopodobnie skanem), Klemens automatycznie uruchamia rozpoznawanie treści przy pomocy AI wizualnego, czyli modelu, który potrafi „czytać" tekst z obrazów i skanów.

Użytkownik nie musi się o to martwić, bo system sam decyduje, która metoda jest odpowiednia. Efekt: czy wrzucisz dokument cyfrowy, czy skan z 2005 roku, Klemens.AI wyciągnie z niego treść.

Oprócz PDF-ów Klemens obsługuje też dokumenty Word (DOCX), automatycznie rozpoznając ich strukturę.

Krok 2. Indeksowanie: od tekstu do zrozumienia

Surowy tekst wyciągnięty z dokumentu to dopiero początek. Żeby AI mogło skutecznie odpowiadać na pytania, tekst musi zostać zaindeksowany, czyli przetworzony w sposób, który pozwala na szybkie i trafne wyszukiwanie. W uproszczeniu, indeksowanie zamienia tekst w formę, która pozwala AI rozumieć znaczenie słów, a nie tylko je wyszukiwać po literach. Dzięki temu, gdy zapytasz „jakie są zasady pracy zdalnej", system znajdzie odpowiedni fragment, nawet jeśli w dokumencie jest napisane „regulamin telepracy", bo rozumie, że to ten sam temat. To fundamentalna przewaga nad klasycznym wyszukiwaniem pełnotekstowym (jak Ctrl+F w przeglądarce), które wymaga dokładnego dopasowania słów.

Klemens.AI korzysta z zarządzanego silnika wyszukiwania Google (Discovery Engine). To ten sam typ technologii, który odpowiada za wyszukiwarkę Google, ale dostosowanego do prywatnych dokumentów firmowych. To nie jest prosty indeks tekstowy, ale zaawansowany system wyszukiwania semantycznego.

Krok 3. Automatyczne podsumowanie

Po zaindeksowaniu każdego dokumentu Klemens.AI automatycznie generuje jego podsumowanie przy pomocy AI, czyli krótki opis zawartości, kluczowe tematy i główne wątki.

Po co? Z kilku powodów:

Użytkownicy widzą skrót dokumentu jeszcze przed zadaniem pytania i mogą szybko ocenić, czy to właściwy dokument.
System ma dodatkowy kontekst przy wyszukiwaniu i wie nie tylko co jest w dokumencie słowo po słowie, ale też o czym dokument jest „w ogóle".
Przy dużych repozytoriach (setki dokumentów) podsumowania pomagają w nawigacji.

Krok 4. Wyszukiwanie: pytanie staje się odpowiedzią

Gdy użytkownik zadaje pytanie, Klemens.AI uruchamia sekwencję:

Wyszukiwanie semantyczne

System przeszukuje zaindeksowane dokumenty, szukając fragmentów, które odpowiadają na pytanie. Nie szuka dokładnych fraz, szuka znaczenia.

Selekcja fragmentów

Z potencjalnie setek pasujących fragmentów system wybiera te najbardziej trafne i kompletne.

Synteza odpowiedzi

Model AI dostaje wybrane fragmenty dokumentów i na ich podstawie formułuje spójną odpowiedź. Ważne: model odpowiada wyłącznie na podstawie dostarczonych fragmentów, nie na podstawie swojej „wiedzy ogólnej".

Cytowania

Każde twierdzenie w odpowiedzi jest powiązane z konkretnym fragmentem źródłowym. Użytkownik widzi, skąd pochodzi każda informacja.

Hybrydowa architektura wyszukiwania: prywatne dokumenty + bazy wiedzy

Klemens.AI oferuje wyszukiwanie hybrydowe. Ta funkcjonalność wyróżnia naszą platformę na tle prostych rozwiązań typu „chatbot na dokumentach".

Co to oznacza? Firma może tworzyć prywatne repozytoria- własne dokumenty, dostępne tylko dla danej firmy, oraz bazy wiedzy- współdzielone zasoby eksperckie, np. baza przepisów branżowych, standardów czy regulacji. Dzięki połączeniu z sejmową bazą aktualnych aktów prawnych (ustaw, rozporządzeń) oferujemy możliwość dostępu do wybranych, relewantnych przepisów zewnętrznych. Gdy użytkownik zadaje pytanie, Klemens może przeszukać jednocześnie prywatne dokumenty firmy i odpowiednie bazy wiedzy. Odpowiedź łączy informacje z obu źródeł, z jasnym wskazaniem, skąd pochodzi każda informacja.

Przykład: pracownik działu HR pyta o zasady rozliczania delegacji. Klemens może jednocześnie sprawdzić wewnętrzny regulamin firmy (repozytorium prywatne) i bazę wiedzy z aktualnymi przepisami podatkowymi (baza współdzielona) i dać kompletną odpowiedź uwzględniającą oba konteksty.

Zaawansowana analiza: głęboka inspekcja dokumentów

Standardowe wyszukiwanie świetnie sprawdza się przy konkretnych pytaniach. Ale co, gdy potrzebujesz przeanalizować kilkadziesiąt dokumentów pod kątem złożonego zagadnienia? Klemens ma tryb zaawansowanej analizy, który działa inaczej niż standardowe wyszukiwanie.

Jak to działa? System pobiera treść wskazanych dokumentów (do 50 jednocześnie). Następnie dzieli duże dokumenty na fragmenty (z zachowaniem kontekstu między nimi). Równolegle analizuje każdy fragment- nie jeden po drugim, ale wszystkie naraz. Potem każdy fragment jest oceniany pod kątem trafności dla Twojego pytania. Z trafnych fragmentów budowana jest kompleksowa odpowiedź.

Ten tryb jest szczególnie przydatny, gdy potrzebujesz np. porównać zapisy w kilkunastu umowach, znaleźć niespójności między procedurami albo przygotować kompleksową analizę tematu na podstawie wielu źródeł.

Skala ma znaczenie

Opisane mechanizmy nie są tylko teorią. W praktyce oznaczają konkretne korzyści.

Szybkość

Dzięki indeksowaniu semantycznemu odpowiedź na pytanie pojawia się w sekundach, nawet gdy repozytorium zawiera setki dokumentów.

Trafność

Wyszukiwanie po znaczeniu, nie po słowach kluczowych, oznacza mniej „pustych" wyników i więcej celnych odpowiedzi.

Skalowalność

Dodanie kolejnych dokumentów nie spowalnia systemu, bo każdy dokument jest indeksowany niezależnie.

Wiarygodność

Cytowania źródłowe pozwalają zweryfikować każdą odpowiedź.

Nie „wrzuć i pytaj", ale „przetwórz, zrozum i odpowiedz"

Różnica między Klemens.AI, a prostym narzędziem „wklej tekst do chatbota" jest taka, jak między biblioteką z katalogiem a stosem papierów na biurku. Oba zawierają te same informacje, ale tylko w jednym przypadku możesz je szybko, trafnie i wiarygodnie odnaleźć. Pipeline przetwarzania dokumentów w Klemens.AI od ekstrakcji, przez indeksowanie, podsumowania, wyszukiwanie semantyczne, aż po cytowania źródłowe, jest zaprojektowany tak, żeby dostarczać odpowiedzi, na których możesz polegać w codziennej pracy.