AI po polsku

Innowacyjny polski duży model językowy dla sektora publicznego i prywatnego

Czat PLLuM Pobierz modele Społeczność Jak wdrożyć

O Projekcie

Odkryj PLLuM

Modele PLLuM (Polish Large Language Model) to otwarte polskie modele językowe. Powstały z myślą o suwerenności cyfrowej Polski.

Obsługa języka polskiego

Modele zostały wytrenowane na uprzednio przygotowanych obszernych i zróżnicowanych zbiorach danych oddających złożoność języka polskiego.

Wsparcie innowacji w sektorze publicznym

Dzięki PLLuM innowacje oparte na dużych modelach językowych stają się dostępne dla polskiej administracji publicznej i sektora prywatnego.

Otwarta współpraca i łatwość użytkowania

Modele PLLuM udostępnione zostały na otwartej licencji. Za pośrednictwem platformy Huggingface udostępnione zostały modele do pobrania. Dostępny też jest interfejs graficzny (GUI) w postaci czatu.

Bezpieczeństwo i etyka

Dbamy, aby nasz model był bezpieczny, wolny od treści szkodliwych i nieprawdziwych, co jest kluczowe przy jego zastosowaniu w administracji publicznej.

Dołącz do społeczności PLLuM

Wymieniaj doświadczenia, zadawaj pytania i śledź rozwój polskiego modelu językowego razem z badaczami, deweloperami i instytucjami z całej Polski.

Dołącz na Discordzie

Modele

Pobierz modele PLLuM

Wszystkie modele dostępne są bezpłatnie na platformie HuggingFace. Modele oznaczone Non-commercial przeznaczone są wyłącznie do celów niekomercyjnych. Modele bez tego oznaczenia dostępne są na licencji Apache 2.0 lub llama3.1 - również do zastosowań komercyjnych.

Model	Parametry	Typ	Licencja	Generacja
Llama-PLLuM-70B-chat-2512	70B	Chat	llama3.1	Druga	Pobierz
Llama-PLLuM-70B-instruct-2512	70B	Instruct	llama3.1	Druga	Pobierz
Llama-PLLuM-8B-base-2512	8B	Base	llama3.1	Druga	Pobierz
Llama-PLLuM-8B-chat-2512	8B	Chat	llama3.1	Druga	Pobierz
Llama-PLLuM-8B-instruct-2512	8B	Instruct	llama3.1	Druga	Pobierz
PLLuM-12B-base-2512	12B	Base	Apache 2.0	Druga	Pobierz

Zastosowania

Jak urzędy i firmy korzystają z PLLuM

Modele można wdrożyć na wiele sposobów - od prostego narzędzia dla pracowników po w pełni zintegrowanego asystenta obsługującego zapytania obywateli.

Chatbot dla klienta

Automatyczna obsługa pytań obywateli na stronie urzędu. Model odpowiada na podstawie bazy dokumentów lub wcześniej przygotowanych scenariuszy.

Asystent pracownika

PLLuM zainstalowany lokalnie jako narzędzie dla urzędników. Pomaga pisać pisma, streszczać dokumenty, redagować korespondencję i wyszukiwać informacje w tekstach.

Asystent z bazą wiedzy

PLLuM połączony z wewnętrzną bazą dokumentów urzędu. Pracownik zadaje pytanie w języku naturalnym - system przeszukuje regulaminy, zarządzenia i odpowiada precyzyjnie na podstawie dokumentów.

Wdrożenie

Jak wdrożyć PLLuM w urzędzie lub firmie

Wdrożenie przebiega w czterech krokach. Rekomendujemy przejście przez nie przed zaangażowaniem wykonawcy.

Zdefiniowanie potrzeb

Określ, do czego model ma służyć: czy to wsparcie pracowników przy pisaniu pism, chatbot dla obywateli lub asystent przeszukujący dokumenty. Od tego zależy wybór modelu, tryb wdrożenia i potrzebne zasoby. Warto też ustalić liczbę użytkowników oraz poziomy dostępu.

Przygotowanie danych

Jeśli planujesz wdrożenie z systemem RAG, niezbędne jest zebranie i ustrukturyzowanie dokumentów: na przykład aktów prawnych, regulaminów, zarządzeń, procedur. Dokumenty muszą być w formacie tekstowym, oczyszczone z błędów OCR, tagów HTML i zbędnych znaków.

Zapewnienie zasobów sprzętowych

PLLuM wymaga serwera z kartą graficzną (GPU). Wymagania zależą od wybranego modelu - szczegółową specyfikację znajdziesz poniżej. System działa lokalnie (on-premise), co oznacza pełną kontrolę nad danymi i brakiem zależności od zewnętrznych dostawców chmury.

Uruchomienie przez zespół IT

Gdy dane i sprzęt są gotowe, zespół informatyczny może przystąpić do instalacji.

Masz pytania dotyczące wdrożenia?

Zapraszamy do kontaktu - chętnie doradzimy, odpowiemy na pytania techniczne i pomożemy ocenić, który model najlepiej odpowiada Twoim potrzebom.

Napisz do nas

Technologia

Co to jest RAG i dlaczego to ważne?

Duży model językowy zna język polski i rozumie pytania - ale nie zna dokumentów Twojej instytucji. System RAG (Retrieval Augmented Generation) łączy model z Twoją własną bazą wiedzy. Zamiast odpowiadać z pamięci, model najpierw przeszukuje Twoje dokumenty, a dopiero potem formułuje odpowiedź. Przygotowanie systemu RAG leży po stronie urzędu lub przedsiębiorstwa.

Krok 1

Retrieval

Wyszukiwanie

System semantycznie przeszukuje bazę dokumentów i wybiera fragmenty najlepiej pasujące do pytania użytkownika.

Krok 2

Reranking

Ocena trafności

Znalezione dokumenty są oceniane pod kątem rzeczywistej przydatności. Wybierane są tylko najbardziej relewantne fragmenty.

Krok 3

Generation

Generowanie odpowiedzi

Model otrzymuje pytanie wraz z wybranymi fragmentami i generuje precyzyjną odpowiedź opartą na Twoich dokumentach.

Infrastruktura

Wymagania techniczne

Poniższe wymagania dotyczą wdrożenia systemu RAG wraz z modelem PLLuM. Retrieval i Reranker współdzielą zasoby GPU.

Komponent	Wymagana pamięć GPU	Rekomendowane karty NVIDIA
Retrieval + Reranker	24–48 GB (zależnie od ustawień)	1× A10 (24 GB) · 1× V100 (32 GB) · 1× L40 (48 GB)
Generator 70B	~168 GB	2× H100 / GH200 · 4× A100 · 4× A6000 / L40
Generator 8×7B	~134 GB	2× H100 / GH200 · 2× A100 · 4× A6000 / L40
Generator 24B	~70 GB	1× A100 · 2× A6000 / L40 · 4× A10
Generator 12B	~48 GB	1× A100 · 2× A6000 / L40 · 4× A10
Generator 8B	~34 GB	1× A6000 / L40 · 2× A10

Blog

Najnowsze informacje ze świata AI

Wszystkie wpisy

Artykuł

21 maja 2026

Rodzina modeli PLLuM powiększyła się!

Ograniczenia modeli generatywnych. Cz. I. Toksyczność i bezpieczeństwo

Artykuł

24 lutego 2025

Ograniczenia modeli generatywnych. Cz. I. Toksyczność i bezpieczeństwo

Tworzenie modeli za pomocą modeli, czyli wartość oryginalnych zbiorów danych uczących

Artykuł

31 stycznia 2025

Tworzenie modeli za pomocą modeli, czyli wartość oryginalnych zbiorów danych uczących

Aktualności

9 stycznia 2025

Zakończenie projektu PLLuM

31 grudnia 2024 roku formalnie zakończyliśmy prace w projekcie PLLuM. To dobry moment, żeby podsumować, co udało się osiągnąć w ciągu ostatnich 11 miesięcy.

Artykuł

20 czerwca 2024

Pozyskiwanie w PLLuM

Jak zbieramy dane do budowy polskiego modelu językowego? Dane od wydawców: za zgodą i na podstawie umów licencyjnych.

Artykuł

19 marca 2024

Inteligentni asystenci a LLM-y

Siła rozwiązań ChatGPT i alternatyw dała nam poczucie, iż posiadają ogromną wiedzę, która pozwala odpowiadać na wszelkie pytanie. Po prostu wystarczy podłączyć się do nich po API, by mieć zintegrowaną wyrocznię wiedzy w naszym systemie. Diabeł, jak zwykle, tkwi w szczegółach. Co się stanie, gdy LLM (ang. large language model) zmyśli coś, nie zna najświeższych informacji. Są bowiem systemy, jak rządowe e-usługi dla Obywateli, w których aktualność i pewność danych są kluczowym aspektem.

Artykuł

16 marca 2024

Anatomia PLLuM-a

Z jakich elementów buduje się sztuczną inteligencję i jak będą one współgrać w modelu PLLuM

Artykuł

15 marca 2024

Czym karmimy PLLuM-a

Jakie cechy muszą mieć dane tekstowe, które posłużą do wytrenowania polskiej sztucznej inteligencji

Aktualności

1 marca 2024

No to PLLuM!

Świętujemy start projektu PLLuM, inicjatywy skupiającej czołowe polskie jednostki naukowe nad budową zaawansowanego modelu języka polskiego. Z nadzieją na rozwój, zbieramy dane na otwartych licencjach, zapewniając, że PLLuM będzie dostępny dla wszystkich zainteresowanych AI. Zapraszamy do współpracy i udostępniania tekstów!

Współtwórz PLLuM

Twoje dane mogą stać się częścią polskiej infrastruktury językowej

Jakość modelu językowego zależy bezpośrednio od jakości i różnorodności danych treningowych. Im więcej polskich tekstów - tym lepszy PLLuM dla wszystkich.

Twoja instytucja w historii polskiego AI

Dane które przekażesz staną się częścią otwartego modelu językowego budowanego dla całej Polski.

Wzajemność - model lepszy dla Ciebie

Im więcej danych z Twojej branży lub dziedziny, tym lepiej PLLuM rozumie jej specyfikę i terminologię.

Bezpieczeństwo i kontrola

Warunki udostępnienia ustalamy wspólnie. Twoje dane nie są przekazywane podmiotom trzecim.

Otwarta licencja - dostęp dla wszystkich

PLLuM jest i pozostanie otwarty. Twój wkład służy całemu środowisku naukowemu i biznesowemu w Polsce.

Szukamy w szczególności

Teksty prasowe i publicystyczneDokumenty urzędowe i prawneLiteratura i publikacje naukoweDane branżowe i specjalistyczneZasoby na licencji CC

Jak to działa

Trzy kroki do współtworzenia PLLuM

Zgłoś zasoby

Napisz do nas i powiedz co masz - teksty, dokumenty, dane branżowe. Nie musisz mieć gotowego formatu.

Ustalamy warunki i podpisujemy umowę

Wspólnie określamy zakres, licencję i sposób przekazania danych. Przedstawiamy gotowy wzór umowy o przekazaniu danych, który następnie podpisujemy.

Dane trafiają do treningu PLLuM

Po podpisaniu umowy przekazujesz zasoby w uzgodnionej formie. Nasze zespoły włączają je do procesu treningu PLLuM - Twój wkład staje się częścią polskiej infrastruktury językowej.

FAQ

Często zadawane pytania

Czy PLLuM jest dostępny dla wszystkich?

Tak, PLLuM udostępniany jest na otwartej licencji. Modele dostępne są do pobrania na platformie HuggingFace. Część modeli objęta jest licencją non-commercial - szczegóły znajdziesz w sekcji Modele.

Czy potrzebujemy własnego serwera do wdrożenia?

Tak - PLLuM działa lokalnie (on-premise) na serwerze z kartą GPU klasy NVIDIA. Gwarantuje to, że dane nie opuszczają infrastruktury instytucji. Szczegółowe wymagania sprzętowe znajdziesz w sekcji Wymagania techniczne.

Ile kosztuje dostęp do modelu?

Dostęp do modelu jest bezpłatny. Otwarta licencja umożliwia szerokie zastosowanie w celach edukacyjnych, badawczych i komercyjnych - w zależności od wariantu modelu.

Jak PLLuM zapewnia bezpieczeństwo danych?

Model działa wyłącznie na infrastrukturze instytucji wdrażającej - żadne dane nie są przesyłane do zewnętrznych serwerów. Otwarty kod źródłowy umożliwia pełny audyt. Projekt realizowany jest zgodnie z wytycznymi krajowymi i unijnymi dotyczącymi AI.

Kontakt

hive@nask.pl

Jeśli masz więcej pytań, chcesz nas wspomóc lub nawiązać współpracę - napisz do nas!

Wyślij wiadomość

Dla mediów

Materiały do pobrania

Logotypy i księga znaków
Informacje o projekcie
Informacje prasowe