Premiera PLLuM: polski model językowy AI

25.02.2025 |
| Clock Przeczytasz w 3 minuty
Premiera PLLuM: polski model językowy AI
Przeczytasz w 3 minuty
Zwiększ rozmiar tekstu

Dziś odbyła się premiera pierwszego w pełni polskiego modelu językowego. Wykorzystuje sztuczną inteligencję, a przedstawiło go Ministerstwo Cyfryzacji. Nie jest to kolejne rozwiązanie przypominające modele językowe GPT, czy LLAMA. Polish Large Language Model (PLLuM) ma bardziej profesjonalne zastosowanie. Ma być bowiem używany w biznesie, a nawet w krajowej administracji.

Ministerstwo Cyfryzacji prezentuje PLLuM – polski model językowy dla administracji i biznesu

Polskie Ministerstwo Cyfryzacji stoi za finansowaniem Polish Large Language Model. W pracach nad PLLuM uczestniczyli polscy eksperci z branży IT, a także lingwiści. Głównym celem jest w pełni bezpieczne wsparcie polskiej administracji publicznej.  PLLuM ma też pomóc w rozwoju innowacyjności polskich przedsiębiorców i biznesu. Dzięki własnemu narzędziu korzystającemu ze sztucznej inteligencji Polska (jako kraj oraz nasze firmy) stanie się bardziej suwerenna w obszarze związanym z AI.

Polski duży model językowy PLLuM jest otwarty. Można go wykorzystać w celach komercyjnych, a także naukowych.

Ministerstwo Cyfryzacji zapewnia, że krajowe rozwiązanie jest bardzo dobre, nie ustępuje bardziej uznanej konkurencji. Sporą rolę odgrywają także bezpieczeństwo i prywatność. Dane przetwarzane przez PLLuM pozostają pod kontrolą.

PLLuM - polski model językowy

Polish Large Language Model

PLLuM został wytrenowany na polskich danych. Uwzględnia złożoność języka polskiego – charakterystyczną fleksję i składnię. W wykorzystanych w czasie treningu zbiorach danych znalazło się ponad 100 miliardów słów. To prawie 286 milionów zapisanych stron A4, czy ponad 570 tysięcy książek o grubości 500 stron.

Polish Large Language Model to projekt o wartości 14,5 mln złotych (początkowy rozwój modelu językowego). Ministerstwo przygotowało też kolejne 19 mln złotych na dalszy rozwój.

Model językowy może przetwarzać 8-70 milionów parametrów. Wykorzystuje dwie główne architektury AI:

  • Mixture of Experts (MoE) do efektywnego zarządzanie zasobami modelu;
  • Retrieval Augmented Generation (RAG), pozwala na  precyzyjniejsze generowanie treści na podstawie baz wiedzy.

PLLuM w modelu naukowym (do badań) wykorzystuje dane pozyskane na otwartych licencjach, jak Common Crawl. W wersji komercyjnej narzędzie skorzysta natomiast z danych pozyskanych od właścicieli na licencji. Polski duży model językowy nie korzysta natomiast z treści wygenerowanych za pomocą innych modeli językowych AI.

Założeniami przy projektowaniu PLLuM było szeroko rozumiane bezpieczeństwo. Model językowy ma nie wprowadzać w błąd, unikać fałszowania treści i – typowych dla chatbotów AI – halucynacji. Wszystko to ma sprawić, że polski duży model językowy zostanie zaufanym i rzetelnym narzędziem. Czy będzie tak w rzeczywistości? Czas pokaże.

PLLuM zostanie wirtualnym asystentem w mObywatel i nie rylko

Polish Large Language Model zostanie użyty w kilku miejscach związanych z administracją publiczną i polską edukacją:

  • jako wirtualny pomocnik w aplikacji mobilnej mObywatel
  • w roli inteligentnego narzędzia dla administracji do przetwarzania dokumentów i analizy treści
  • jako wsparcie nauczycieli i uczniów w polskich szkołach
  • w aplikacjach edukacyjnych
  • wsparcie w tłumaczeniach na inne języki.

Poza tym zakłada się komercyjne wykorzystanie PLLuM przez polski biznes. Model językowy przyda się w tworzeniu narzędzi ze sztuczną inteligencją. Może być lepszym wyborem od zagranicznych rozwiązań — jest w końcu dobrze dopasowany do lokalnego rynku.

Kto stoi za stworzeniem PLLuM?

Projekt zrealizowało konsorcjum naukowo-badawcze pod przewodnictwem Politechniki Wrocławskiej. Poza tym w pracach uczestniczyły też takie instytucje, jak NASK, Uniwersytet Łódzki, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN i inne podmioty. Dalszy rozwój będzie też realny dzięki pomocy innych, zarówno instytucji publicznych, jak i polskich firm.

Dostosowaniem PLLuM do potrzeb polskiej administracji w 2025 zajmie się Centralny Ośrodek Informatyki. Aby potężne narzędzie miało odpowiednią moc obliczeniową, swoje zasoby udostępni też Akademickie Centrum Komputerowe Cyfronet AGH.

PLLuM trafi na Hugging Face, a strona internetowa narzędzia to http://pllum.clarin-pl.eu

Może Cię zainteresować:

TEMATYKA:
Telefonami komórkowymi interesował się jeszcze w czasach, gdy przedrostek “smart”-” oznaczał możliwość wysłania SMS-a. Przed dokonaniem jakiegokolwiek zakupu zawsze ogląda wszystkie recenzje i testy. W wolnych chwilach lubi grać w szachy i na gitarze basowej.