AI po polsku

Innowacyjny polski duży model językowy dla sektora publicznego i prywatnego

O Projekcie

Odkryj PLLuM

Modele PLLuM (Polish Large Language Model) to otwarte polskie modele językowe. Powstały z myślą o suwerenności cyfrowej Polski.
icon

Obsługa języka polskiego

Modele zostały wytrenowane na uprzednio przygotowanych obszernych i zróżnicowanych zbiorach danych oddających złożoność języka polskiego.
icon

Wsparcie innowacji w sektorze publicznym

Dzięki PLLuM innowacje oparte na dużych modelach językowych stają się dostępne dla polskiej administracji publicznej i sektora prywatnego.
icon

Otwarta współpraca i łatwość użytkowania

Modele PLLuM udostępnione zostały na otwartej licencji. Za pośrednictwem platformy Huggingface udostępnione zostały modele do pobrania. Dostępny też jest interfejs graficzny (GUI) w postaci czatu.
icon

Bezpieczeństwo i etyka

Dbamy, aby nasz model był bezpieczny, wolny od treści szkodliwych i nieprawdziwych, co jest kluczowe przy jego zastosowaniu w administracji publicznej.

Dołącz do społeczności PLLuM

Wymieniaj doświadczenia, zadawaj pytania i śledź rozwój polskiego modelu językowego razem z badaczami, deweloperami i instytucjami z całej Polski.

Dołącz na Discordzie

Pobierz modele PLLuM

Wszystkie modele dostępne są bezpłatnie na platformie HuggingFace. Modele oznaczone Non-commercial przeznaczone są wyłącznie do celów niekomercyjnych. Modele bez tego oznaczenia dostępne są na licencji Apache 2.0 lub llama3.1 - również do zastosowań komercyjnych.

Licencja
Typ
Rozmiar
ModelParametryTypLicencjaGeneracja
Llama-PLLuM-70B-instruct-250801 70BInstructllama3.1Najnowszy Pobierz
Llama-PLLuM-70B-chat-250801 70BChatllama3.1Najnowszy Pobierz
Llama-PLLuM-70B-base-250801 70BBasellama3.1Najnowszy Pobierz
Llama-PLLuM-8B-base-250801 8BBasellama3.1Najnowszy Pobierz
PLLuM-12B-base-250801 12BBaseApache 2.0Najnowszy Pobierz
pllum-12b-nc-chat-250715 12BChatpllum-1.1Najnowszy Pobierz

Jak urzędy i firmy korzystają z PLLuM

Modele można wdrożyć na wiele sposobów - od prostego narzędzia dla pracowników po w pełni zintegrowanego asystenta obsługującego zapytania obywateli.

01
Chatbot dla petenta

Automatyczna obsługa pytań obywateli na stronie urzędu. Model odpowiada na podstawie bazy dokumentów lub wcześniej przygotowanych scenariuszy.

02
Asystent pracownika

PLLuM zainstalowany lokalnie jako narzędzie dla urzędników. Pomaga pisać pisma, streszczać dokumenty, redagować korespondencję i wyszukiwać informacje w tekstach.

03
Asystent z bazą wiedzy

PLLuM połączony z wewnętrzną bazą dokumentów urzędu. Pracownik zadaje pytanie w języku naturalnym - system przeszukuje regulaminy, zarządzenia i odpowiada precyzyjnie na podstawie dokumentów.

Jak wdrożyć PLLuM w urzędzie lub firmie

Wdrożenie przebiega w czterech krokach. Rekomendujemy przejście przez nie przed zaangażowaniem wykonawcy.

1
Zdefiniowanie potrzeb

Określ, do czego model ma służyć: czy to wsparcie pracowników przy pisaniu pism, chatbot dla obywateli lub asystent przeszukujący dokumenty. Od tego zależy wybór modelu, tryb wdrożenia i potrzebne zasoby. Warto też ustalić liczbę użytkowników oraz poziomy dostępu.

2
Przygotowanie danych

Jeśli planujesz wdrożenie z systemem RAG, niezbędne jest zebranie i ustrukturyzowanie dokumentów: na przykład aktów prawnych, regulaminów, zarządzeń, procedur. Dokumenty muszą być w formacie tekstowym, oczyszczone z błędów OCR, tagów HTML i zbędnych znaków.

3
Zapewnienie zasobów sprzętowych

PLLuM wymaga serwera z kartą graficzną (GPU). Wymagania zależą od wybranego modelu - szczegółową specyfikację znajdziesz poniżej. System działa lokalnie (on-premise), co oznacza pełną kontrolę nad danymi i brakiem zależności od zewnętrznych dostawców chmury.

4
Uruchomienie przez zespół IT

Gdy dane i sprzęt są gotowe, zespół informatyczny może przystąpić do instalacji.

?
Masz pytania dotyczące wdrożenia?

Zapraszamy do kontaktu - chętnie doradzimy, odpowiemy na pytania techniczne i pomożemy ocenić, który model najlepiej odpowiada Twoim potrzebom.

Napisz do nas

Co to jest RAG i dlaczego to ważne?

Duży model językowy zna język polski i rozumie pytania - ale nie zna dokumentów Twojej instytucji. System RAG (Retrieval Augmented Generation) łączy model z Twoją własną bazą wiedzy. Zamiast odpowiadać z pamięci, model najpierw przeszukuje Twoje dokumenty, a dopiero potem formułuje odpowiedź. Przygotowanie systemu RAG leży po stronie urzędu lub przedsiębiorstwa.

Krok 1
Retrieval
Wyszukiwanie

System semantycznie przeszukuje bazę dokumentów i wybiera fragmenty najlepiej pasujące do pytania użytkownika.

Krok 2
Reranking
Ocena trafności

Znalezione dokumenty są oceniane pod kątem rzeczywistej przydatności. Wybierane są tylko najbardziej relewantne fragmenty.

Krok 3
Generation
Generowanie odpowiedzi

Model otrzymuje pytanie wraz z wybranymi fragmentami i generuje precyzyjną odpowiedź opartą na Twoich dokumentach.

Wymagania techniczne

Poniższe wymagania dotyczą wdrożenia systemu RAG wraz z modelem PLLuM. Retrieval i Reranker współdzielą zasoby GPU.

KomponentWymagana pamięć GPURekomendowane karty NVIDIA
Retrieval + Reranker24–48 GB (zależnie od ustawień)1× A10 (24 GB) · 1× V100 (32 GB) · 1× L40 (48 GB)
Generator 70B~168 GB2× H100 / GH200 · 4× A100 · 4× A6000 / L40
Generator 8×7B~134 GB2× H100 / GH200 · 2× A100 · 4× A6000 / L40
Generator 24B~70 GB1× A100 · 2× A6000 / L40 · 4× A10
Generator 12B~48 GB1× A100 · 2× A6000 / L40 · 4× A10
Generator 8B~34 GB1× A6000 / L40 · 2× A10

Najnowsze informacje ze świata AI

Wszystkie wpisy
Ograniczenia modeli generatywnych. Cz. I. Toksyczność i bezpieczeństwoArtykuł
Ograniczenia modeli generatywnych. Cz. I. Toksyczność i bezpieczeństwo
Tworzenie modeli za pomocą modeli, czyli wartość oryginalnych zbiorów danych uczącychArtykuł
Tworzenie modeli za pomocą modeli, czyli wartość oryginalnych zbiorów danych uczących
Zakończenie projektu PLLuMAktualności
Zakończenie projektu PLLuM

31 grudnia 2024 roku formalnie zakończyliśmy prace w projekcie PLLuM. To dobry moment, żeby podsumować, co udało się osiągnąć w ciągu ostatnich 11 miesięcy.

Pozyskiwanie w PLLuMArtykuł
Pozyskiwanie w PLLuM

Jak zbieramy dane do budowy polskiego modelu językowego? Dane od wydawców: za zgodą i na podstawie umów licencyjnych.

Inteligentni asystenci a LLM-yArtykuł
Inteligentni asystenci a LLM-y

Siła rozwiązań ChatGPT i alternatyw dała nam poczucie, iż posiadają ogromną wiedzę, która pozwala odpowiadać na wszelkie pytanie. Po prostu wystarczy podłączyć się do nich po API, by mieć zintegrowaną wyrocznię wiedzy w naszym systemie. Diabeł, jak zwykle, tkwi w szczegółach. Co się stanie, gdy LLM (ang. large language model) zmyśli coś, nie zna najświeższych informacji. Są bowiem systemy, jak rządowe e-usługi dla Obywateli, w których aktualność i pewność danych są kluczowym aspektem.

Anatomia PLLuM-aArtykuł
Anatomia PLLuM-a

Z jakich elementów buduje się sztuczną inteligencję i jak będą one współgrać w modelu PLLuM

Czym karmimy PLLuM-aArtykuł
Czym karmimy PLLuM-a

Jakie cechy muszą mieć dane tekstowe, które posłużą do wytrenowania polskiej sztucznej inteligencji

No to PLLuM!Aktualności
No to PLLuM!

Świętujemy start projektu PLLuM, inicjatywy skupiającej czołowe polskie jednostki naukowe nad budową zaawansowanego modelu języka polskiego. Z nadzieją na rozwój, zbieramy dane na otwartych licencjach, zapewniając, że PLLuM będzie dostępny dla wszystkich zainteresowanych AI. Zapraszamy do współpracy i udostępniania tekstów!

Twoje dane mogą stać się częścią polskiej infrastruktury językowej

Jakość modelu językowego zależy bezpośrednio od jakości i różnorodności danych treningowych. Im więcej polskich tekstów - tym lepszy PLLuM dla wszystkich.

Twoja instytucja w historii polskiego AI
Twoja instytucja w historii polskiego AI
Dane które przekażesz staną się częścią otwartego modelu językowego budowanego dla całej Polski.
Wzajemność - model lepszy dla Ciebie
Wzajemność - model lepszy dla Ciebie
Im więcej danych z Twojej branży lub dziedziny, tym lepiej PLLuM rozumie jej specyfikę i terminologię.
Bezpieczeństwo i kontrola
Bezpieczeństwo i kontrola
Warunki udostępnienia ustalamy wspólnie. Twoje dane nie są przekazywane podmiotom trzecim.
Otwarta licencja - dostęp dla wszystkich
Otwarta licencja - dostęp dla wszystkich
PLLuM jest i pozostanie otwarty. Twój wkład służy całemu środowisku naukowemu i biznesowemu w Polsce.
Szukamy w szczególności
Teksty prasowe i publicystyczneDokumenty urzędowe i prawneLiteratura i publikacje naukoweDane branżowe i specjalistyczneZasoby na licencji CC
Jak to działa
Trzy kroki do współtworzenia PLLuM
01
Zgłoś zasoby
Napisz do nas i powiedz co masz - teksty, dokumenty, dane branżowe. Nie musisz mieć gotowego formatu.
02
Ustalamy warunki i podpisujemy umowę
Wspólnie określamy zakres, licencję i sposób przekazania danych. Przedstawiamy gotowy wzór umowy o przekazaniu danych, który następnie podpisujemy.
03
Dane trafiają do treningu PLLuM
Po podpisaniu umowy przekazujesz zasoby w uzgodnionej formie. Nasze zespoły włączają je do procesu treningu PLLuM - Twój wkład staje się częścią polskiej infrastruktury językowej.

Często zadawane pytania

Czy PLLuM jest dostępny dla wszystkich?

Tak, PLLuM udostępniany jest na otwartej licencji. Modele dostępne są do pobrania na platformie HuggingFace. Część modeli objęta jest licencją non-commercial - szczegóły znajdziesz w sekcji Modele.

Czy potrzebujemy własnego serwera do wdrożenia?

Tak - PLLuM działa lokalnie (on-premise) na serwerze z kartą GPU klasy NVIDIA. Gwarantuje to, że dane nie opuszczają infrastruktury instytucji. Szczegółowe wymagania sprzętowe znajdziesz w sekcji Wymagania techniczne.

Ile kosztuje dostęp do modelu?

Dostęp do modelu jest bezpłatny. Otwarta licencja umożliwia szerokie zastosowanie w celach edukacyjnych, badawczych i komercyjnych - w zależności od wariantu modelu.

Jak PLLuM zapewnia bezpieczeństwo danych?

Model działa wyłącznie na infrastrukturze instytucji wdrażającej - żadne dane nie są przesyłane do zewnętrznych serwerów. Otwarty kod źródłowy umożliwia pełny audyt. Projekt realizowany jest zgodnie z wytycznymi krajowymi i unijnymi dotyczącymi AI.

Kontakt

hive@nask.pl

Jeśli masz więcej pytań, chcesz nas wspomóc lub nawiązać współpracę - napisz do nas!

Wyślij wiadomość

Dla mediów

Materiały do pobrania

  • Logotypy i księga znaków
  • Informacje o projekcie
  • Informacje prasowe