Konsorcjum HIVE udostępniło dziś 11 nowych, otwartych modeli językowych z rodziny PLLuM. To największe jak dotąd wydanie w historii tego projektu i wyraźny sygnał, że polska AI przestaje być eksperymentem laboratoryjnym.
Kluczowe fakty:
- Konsorcjum HIVE udostępniło 11 nowych otwartych modeli językowych PLLuM, które są dostępne bezpłatnie dla administracji publicznej, firm i użytkowników indywidualnych.
- Modele trenowano na około 7 milionach polskich tekstów z umów licencyjnych, domeny publicznej i licencji Creative Commons, wzbogaconych o dziesiątki tysięcy instrukcji, w tym 13 tysięcy przygotowanych specjalnie pod zastosowania urzędowe.
- Rodzina PLLuM oferuje cztery rozmiary modeli (4B, 8B, 12B, 70B parametrów), gdzie najmniejszy działa przy ograniczonej mocy obliczeniowej, a największy radzi sobie ze złożonymi zadaniami bez dodatkowego dostrajania.
Modele trafiają do trzech grup odbiorców: administracji publicznej, firm oraz użytkowników indywidualnych. Są dostępne bezpłatnie i bez żadnych formalności. Wystarczy pobrać.
Co właściwie potrafi nowy PLLuM?
Szymon Łukasik, dyrektor Ośrodka Badań nad Bezpieczeństwem AI w NASK, na dzisiejszej konferencji prasowej wyliczył konkretne kompetencje nowych modeli. Lista jest długa i całkiem praktyczna:
- obsługa ponad 20 gatunków pism i rodzajów komunikacji urzędowej
- upraszczanie skomplikowanego języka urzędowego
- rozumienie kontekstu procedur administracyjnych
- praca na wzorach dokumentów prawnych
- skuteczniejsze działanie w systemach RAG (Retrieval Augmented Generation), czyli na zbiorach dokumentów źródłowych
- zabezpieczenia przed generowaniem szkodliwych treści
Ten ostatni punkt warto podkreślić: modele w wariancie dialogowym nie powinny odpowiadać na pytania o charakterze szkodliwym. To istotne, zwłaszcza gdy myślimy o wdrożeniach obsługujących zwykłych obywateli.
Modele trenowano na około 7 milionach tekstów w języku polskim. Dane pochodzą z umów licencyjnych, domeny publicznej (Monitor Polski, Dziennik Ustaw, stenogramy parlamentarne) oraz zasobów na licencjach Creative Commons. Do zestawu dołączono też dziesiątki tysięcy instrukcji, w tym 13 tysięcy nowych, opracowanych specjalnie pod kątem zastosowań urzędowych.
Cztery rozmiary, trzy warianty
Rodzina PLLuM dostępna jest w czterech rozmiarach modeli:
- 4B – najmniejszy, działa nawet przy ograniczonej mocy obliczeniowej, najlepiej sprawdza się po dostosowaniu do konkretnego zadania
- 8B i 12B – modele średnie, kompromis między szybkością a jakością, polecane do wdrożeń produkcyjnych jako silnik w systemach RAG
- 70B – największy, najlepiej radzi sobie ze złożonymi zadaniami bez dodatkowego dostrajania
Mniejsze modele (4B, 8B, 12B) dostępne są w trzech wariantach: bazowym (do eksperymentów), instrukcyjnym (do konkretnych zadań) i dialogowym (z pełnymi zabezpieczeniami). Model 70B dostępny jest w wariantach instrukcyjnym i dialogowym.
PLLuM jako głos rozsądku w debacie o suwerenności AI
Cieszę się z każdego kolejnego wydania PLLuM, bo uważam, że Polska i Europa potrzebują własnych modeli językowych. To nie jest kwestia technologicznego patriotyzmu, ale realnej suwerenności. Model, który rozumie zawiłości polskiego prawa, kontekst kulturowy i specyfikę administracji, robi to lepiej niż globalny model wytrenowany głównie na angielskich danych.
Ale mam też pytania, na które nie słyszę odpowiedzi. Ile podmiotów naprawdę używa PLLuM w produkcji, a nie tylko pobiera i testuje? Jaka jest jakość w porównaniu z komercyjnymi modelami, które administracja publiczna i tak może kupić? I kto odpowiada za błędy modelu, gdy urzędnik zaakceptuje złą podpowiedź bez weryfikacji? Otwartość to zaleta, ale nie zwalnia z pytania o odpowiedzialność.
Piotr Wolniewicz, Redaktor Naczelny AIPORT.pl
Zgodność z AI Act i plany wdrożeniowe
Wiceminister cyfryzacji Dariusz Standerski podkreślił, że nowe modele PLLuM to pierwsze krajowe modele w pełni zgodne z unijnym rozporządzeniem AI Act. To ważne, bo przepisy zaczęły obowiązywać etapami i presja na zgodność rośnie z każdym miesiącem.
Standerski zapowiedział też konkretne wdrożenia na czerwiec: AI ma pojawić się w pracach Ministerstwa Cyfryzacji oraz Kancelarii Prezesa Rady Ministrów. Kolejne samorządy podpisują porozumienia i testują PLLuM w praktyce. Wiceminister wymienił Gdynię i Międzyzdroje, ale wskazał, że są też „miejscowości mniejsze i większe” z całej Polski.
Resort nie monitoruje jednak, ile podmiotów faktycznie pobrało i używa modeli. Jak wyjaśnił Standerski, PLLuM jest całkowicie otwarty i nie wymaga żadnego raportowania z wdrożeń.
Następny krok: model wizyjny i regularne aktualizacje
Łukasik zapowiedział, że konsorcjum pracuje już nad rozszerzeniem rodziny PLLuM o model wizyjny. Pierwsze prototypy zostały zbudowane i wyniki określił jako „obiecujące”. Podkreślił też coś, co często umyka w dyskusjach o modelach AI: regularną aktualizację wiedzy. Model, który nie jest odświeżany, szybko staje się przestarzały, a użytkownicy mogą się na tym niezorientować.
Za projektem stoi konsorcjum HIVE AI finansowane przez Ministerstwo Cyfryzacji. Tworzą je: NASK (lider), Centralny Ośrodek Informatyki, Ośrodek Przetwarzania Informacji, Uniwersytet Łódzki, Politechnika Wrocławska, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN oraz Akademickie Centrum Komputerowe Cyfronet AGH.
To spory przekrój polskiej nauki i administracji. Ciekawe, czy wystarczy, żeby dogonić tempo, w jakim komercyjne modele się rozwijają.
