AI po polsku
Innowacyjny polski duży model językowy dla sektora publicznego i prywatnego
Odkryj PLLuM
Obsługa języka polskiego
Wsparcie innowacji w sektorze publicznym
Otwarta współpraca i łatwość użytkowania
Bezpieczeństwo i etyka
Dołącz do społeczności PLLuM
Wymieniaj doświadczenia, zadawaj pytania i śledź rozwój polskiego modelu językowego razem z badaczami, deweloperami i instytucjami z całej Polski.
Pobierz modele PLLuM
Wszystkie modele dostępne są bezpłatnie na platformie HuggingFace. Modele oznaczone Non-commercial przeznaczone są wyłącznie do celów niekomercyjnych. Modele bez tego oznaczenia dostępne są na licencji Apache 2.0 lub llama3.1 - również do zastosowań komercyjnych.
| Model | Parametry | Typ | Licencja | Generacja | |
|---|---|---|---|---|---|
| Llama-PLLuM-70B-instruct-250801 | 70B | Instruct | llama3.1 | Najnowszy | Pobierz |
| Llama-PLLuM-70B-chat-250801 | 70B | Chat | llama3.1 | Najnowszy | Pobierz |
| Llama-PLLuM-70B-base-250801 | 70B | Base | llama3.1 | Najnowszy | Pobierz |
| Llama-PLLuM-8B-base-250801 | 8B | Base | llama3.1 | Najnowszy | Pobierz |
| PLLuM-12B-base-250801 | 12B | Base | Apache 2.0 | Najnowszy | Pobierz |
| pllum-12b-nc-chat-250715 | 12B | Chat | pllum-1.1 | Najnowszy | Pobierz |
Jak urzędy i firmy korzystają z PLLuM
Modele można wdrożyć na wiele sposobów - od prostego narzędzia dla pracowników po w pełni zintegrowanego asystenta obsługującego zapytania obywateli.
Automatyczna obsługa pytań obywateli na stronie urzędu. Model odpowiada na podstawie bazy dokumentów lub wcześniej przygotowanych scenariuszy.
PLLuM zainstalowany lokalnie jako narzędzie dla urzędników. Pomaga pisać pisma, streszczać dokumenty, redagować korespondencję i wyszukiwać informacje w tekstach.
PLLuM połączony z wewnętrzną bazą dokumentów urzędu. Pracownik zadaje pytanie w języku naturalnym - system przeszukuje regulaminy, zarządzenia i odpowiada precyzyjnie na podstawie dokumentów.
Jak wdrożyć PLLuM w urzędzie lub firmie
Wdrożenie przebiega w czterech krokach. Rekomendujemy przejście przez nie przed zaangażowaniem wykonawcy.
Określ, do czego model ma służyć: czy to wsparcie pracowników przy pisaniu pism, chatbot dla obywateli lub asystent przeszukujący dokumenty. Od tego zależy wybór modelu, tryb wdrożenia i potrzebne zasoby. Warto też ustalić liczbę użytkowników oraz poziomy dostępu.
Jeśli planujesz wdrożenie z systemem RAG, niezbędne jest zebranie i ustrukturyzowanie dokumentów: na przykład aktów prawnych, regulaminów, zarządzeń, procedur. Dokumenty muszą być w formacie tekstowym, oczyszczone z błędów OCR, tagów HTML i zbędnych znaków.
PLLuM wymaga serwera z kartą graficzną (GPU). Wymagania zależą od wybranego modelu - szczegółową specyfikację znajdziesz poniżej. System działa lokalnie (on-premise), co oznacza pełną kontrolę nad danymi i brakiem zależności od zewnętrznych dostawców chmury.
Gdy dane i sprzęt są gotowe, zespół informatyczny może przystąpić do instalacji.
Zapraszamy do kontaktu - chętnie doradzimy, odpowiemy na pytania techniczne i pomożemy ocenić, który model najlepiej odpowiada Twoim potrzebom.
Napisz do nasCo to jest RAG i dlaczego to ważne?
Duży model językowy zna język polski i rozumie pytania - ale nie zna dokumentów Twojej instytucji. System RAG (Retrieval Augmented Generation) łączy model z Twoją własną bazą wiedzy. Zamiast odpowiadać z pamięci, model najpierw przeszukuje Twoje dokumenty, a dopiero potem formułuje odpowiedź. Przygotowanie systemu RAG leży po stronie urzędu lub przedsiębiorstwa.
System semantycznie przeszukuje bazę dokumentów i wybiera fragmenty najlepiej pasujące do pytania użytkownika.
Znalezione dokumenty są oceniane pod kątem rzeczywistej przydatności. Wybierane są tylko najbardziej relewantne fragmenty.
Model otrzymuje pytanie wraz z wybranymi fragmentami i generuje precyzyjną odpowiedź opartą na Twoich dokumentach.
Wymagania techniczne
Poniższe wymagania dotyczą wdrożenia systemu RAG wraz z modelem PLLuM. Retrieval i Reranker współdzielą zasoby GPU.
| Komponent | Wymagana pamięć GPU | Rekomendowane karty NVIDIA |
|---|---|---|
| Retrieval + Reranker | 24–48 GB (zależnie od ustawień) | 1× A10 (24 GB) · 1× V100 (32 GB) · 1× L40 (48 GB) |
| Generator 70B | ~168 GB | 2× H100 / GH200 · 4× A100 · 4× A6000 / L40 |
| Generator 8×7B | ~134 GB | 2× H100 / GH200 · 2× A100 · 4× A6000 / L40 |
| Generator 24B | ~70 GB | 1× A100 · 2× A6000 / L40 · 4× A10 |
| Generator 12B | ~48 GB | 1× A100 · 2× A6000 / L40 · 4× A10 |
| Generator 8B | ~34 GB | 1× A6000 / L40 · 2× A10 |
Najnowsze informacje ze świata AI
Wszystkie wpisy
Aktualności31 grudnia 2024 roku formalnie zakończyliśmy prace w projekcie PLLuM. To dobry moment, żeby podsumować, co udało się osiągnąć w ciągu ostatnich 11 miesięcy.
Jak zbieramy dane do budowy polskiego modelu językowego? Dane od wydawców: za zgodą i na podstawie umów licencyjnych.
Siła rozwiązań ChatGPT i alternatyw dała nam poczucie, iż posiadają ogromną wiedzę, która pozwala odpowiadać na wszelkie pytanie. Po prostu wystarczy podłączyć się do nich po API, by mieć zintegrowaną wyrocznię wiedzy w naszym systemie. Diabeł, jak zwykle, tkwi w szczegółach. Co się stanie, gdy LLM (ang. large language model) zmyśli coś, nie zna najświeższych informacji. Są bowiem systemy, jak rządowe e-usługi dla Obywateli, w których aktualność i pewność danych są kluczowym aspektem.
Z jakich elementów buduje się sztuczną inteligencję i jak będą one współgrać w modelu PLLuM
Jakie cechy muszą mieć dane tekstowe, które posłużą do wytrenowania polskiej sztucznej inteligencji
Świętujemy start projektu PLLuM, inicjatywy skupiającej czołowe polskie jednostki naukowe nad budową zaawansowanego modelu języka polskiego. Z nadzieją na rozwój, zbieramy dane na otwartych licencjach, zapewniając, że PLLuM będzie dostępny dla wszystkich zainteresowanych AI. Zapraszamy do współpracy i udostępniania tekstów!
Twoje dane mogą stać się częścią polskiej infrastruktury językowej
Jakość modelu językowego zależy bezpośrednio od jakości i różnorodności danych treningowych. Im więcej polskich tekstów - tym lepszy PLLuM dla wszystkich.
Często zadawane pytania
Tak, PLLuM udostępniany jest na otwartej licencji. Modele dostępne są do pobrania na platformie HuggingFace. Część modeli objęta jest licencją non-commercial - szczegóły znajdziesz w sekcji Modele.
Tak - PLLuM działa lokalnie (on-premise) na serwerze z kartą GPU klasy NVIDIA. Gwarantuje to, że dane nie opuszczają infrastruktury instytucji. Szczegółowe wymagania sprzętowe znajdziesz w sekcji Wymagania techniczne.
Dostęp do modelu jest bezpłatny. Otwarta licencja umożliwia szerokie zastosowanie w celach edukacyjnych, badawczych i komercyjnych - w zależności od wariantu modelu.
Model działa wyłącznie na infrastrukturze instytucji wdrażającej - żadne dane nie są przesyłane do zewnętrznych serwerów. Otwarty kod źródłowy umożliwia pełny audyt. Projekt realizowany jest zgodnie z wytycznymi krajowymi i unijnymi dotyczącymi AI.
Kontakt
hive@nask.pl
Jeśli masz więcej pytań, chcesz nas wspomóc lub nawiązać współpracę - napisz do nas!
Wyślij wiadomośćDla mediów
Materiały do pobrania
- Logotypy i księga znaków
- Informacje o projekcie
- Informacje prasowe
