Premiera PLLuM: polski model językowy AI
Dziś odbyła się premiera pierwszego w pełni polskiego modelu językowego. Wykorzystuje sztuczną inteligencję, a przedstawiło go Ministerstwo Cyfryzacji. Nie jest to kolejne rozwiązanie przypominające modele językowe GPT, czy LLAMA. Polish Large Language Model (PLLuM) ma bardziej profesjonalne zastosowanie. Ma być bowiem używany w biznesie, a nawet w krajowej administracji.
Ministerstwo Cyfryzacji prezentuje PLLuM – polski model językowy dla administracji i biznesu
Polskie Ministerstwo Cyfryzacji stoi za finansowaniem Polish Large Language Model. W pracach nad PLLuM uczestniczyli polscy eksperci z branży IT, a także lingwiści. Głównym celem jest w pełni bezpieczne wsparcie polskiej administracji publicznej. PLLuM ma też pomóc w rozwoju innowacyjności polskich przedsiębiorców i biznesu. Dzięki własnemu narzędziu korzystającemu ze sztucznej inteligencji Polska (jako kraj oraz nasze firmy) stanie się bardziej suwerenna w obszarze związanym z AI.
Polski duży model językowy PLLuM jest otwarty. Można go wykorzystać w celach komercyjnych, a także naukowych.
Ministerstwo Cyfryzacji zapewnia, że krajowe rozwiązanie jest bardzo dobre, nie ustępuje bardziej uznanej konkurencji. Sporą rolę odgrywają także bezpieczeństwo i prywatność. Dane przetwarzane przez PLLuM pozostają pod kontrolą.
Polish Large Language Model
PLLuM został wytrenowany na polskich danych. Uwzględnia złożoność języka polskiego – charakterystyczną fleksję i składnię. W wykorzystanych w czasie treningu zbiorach danych znalazło się ponad 100 miliardów słów. To prawie 286 milionów zapisanych stron A4, czy ponad 570 tysięcy książek o grubości 500 stron.
Polish Large Language Model to projekt o wartości 14,5 mln złotych (początkowy rozwój modelu językowego). Ministerstwo przygotowało też kolejne 19 mln złotych na dalszy rozwój.
Model językowy może przetwarzać 8-70 milionów parametrów. Wykorzystuje dwie główne architektury AI:
- Mixture of Experts (MoE) do efektywnego zarządzanie zasobami modelu;
- Retrieval Augmented Generation (RAG), pozwala na precyzyjniejsze generowanie treści na podstawie baz wiedzy.
PLLuM w modelu naukowym (do badań) wykorzystuje dane pozyskane na otwartych licencjach, jak Common Crawl. W wersji komercyjnej narzędzie skorzysta natomiast z danych pozyskanych od właścicieli na licencji. Polski duży model językowy nie korzysta natomiast z treści wygenerowanych za pomocą innych modeli językowych AI.
Założeniami przy projektowaniu PLLuM było szeroko rozumiane bezpieczeństwo. Model językowy ma nie wprowadzać w błąd, unikać fałszowania treści i – typowych dla chatbotów AI – halucynacji. Wszystko to ma sprawić, że polski duży model językowy zostanie zaufanym i rzetelnym narzędziem. Czy będzie tak w rzeczywistości? Czas pokaże.
PLLuM zostanie wirtualnym asystentem w mObywatel i nie rylko
Polish Large Language Model zostanie użyty w kilku miejscach związanych z administracją publiczną i polską edukacją:
- jako wirtualny pomocnik w aplikacji mobilnej mObywatel
- w roli inteligentnego narzędzia dla administracji do przetwarzania dokumentów i analizy treści
- jako wsparcie nauczycieli i uczniów w polskich szkołach
- w aplikacjach edukacyjnych
- wsparcie w tłumaczeniach na inne języki.
Poza tym zakłada się komercyjne wykorzystanie PLLuM przez polski biznes. Model językowy przyda się w tworzeniu narzędzi ze sztuczną inteligencją. Może być lepszym wyborem od zagranicznych rozwiązań — jest w końcu dobrze dopasowany do lokalnego rynku.
Kto stoi za stworzeniem PLLuM?
Projekt zrealizowało konsorcjum naukowo-badawcze pod przewodnictwem Politechniki Wrocławskiej. Poza tym w pracach uczestniczyły też takie instytucje, jak NASK, Uniwersytet Łódzki, Instytut Podstaw Informatyki PAN, Instytut Slawistyki PAN i inne podmioty. Dalszy rozwój będzie też realny dzięki pomocy innych, zarówno instytucji publicznych, jak i polskich firm.
Dostosowaniem PLLuM do potrzeb polskiej administracji w 2025 zajmie się Centralny Ośrodek Informatyki. Aby potężne narzędzie miało odpowiednią moc obliczeniową, swoje zasoby udostępni też Akademickie Centrum Komputerowe Cyfronet AGH.
PLLuM trafi na Hugging Face, a strona internetowa narzędzia to http://pllum.clarin-pl.eu
Może Cię zainteresować: