Realizacją tego niewątpliwie ambitnego projektu zajmą się przedstawiciele sześciu rodzimych jednostek naukowych. Tak właśnie ma się zrodzić konkurencja dla popularnego ostatnimi czasy ChatGPT. Jeśli chodzi o dokładny skład konsorcjum, to na liście znalazły się: Politechnika Wrocławska, Państwowy Instytut Badawczy NASK, Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy, Instytut Podstaw Informatyki PAN, Uniwersytet Łódzki oraz Instytut Slawistyki PAN.
Czytaj też: Gmail będzie mądrzejszy. Sztuczna inteligencja zdusi spam i inne śmieci przesyłane pocztą e-mail
I choć mogłoby się wydawać, że konkurencja na rynku jest ogromna, to należy mieć na uwadze pewien bardzo istotny fakt: najpopularniejsze obecnie modele językowe były szkolone przede wszystkim na anglojęzycznych treściach. Prowadzi to do poważnych ograniczeń, gdy zadajemy pytania w języku polskim. Jak dodają pomysłodawcy, projekt ma zostać zrealizowany przy zachowaniu reprezentatywności, przejrzystości i sprawiedliwości danych.
Polski model językowy PLLuM ma stanowić odpowiedź na konkurencję w postaci niezwykle popularnych ChatGPT czy Google Bard
Wielkie modele językowe stały się uniwersalnymi, podstawowymi silnikami dla przetwarzania języka naturalnego, ale ich zbudowanie czy dotrenowanie przekracza możliwości polskich przedsiębiorców. Dlatego stworzenie otwartego polskiego wielkiego modelu językowego w połączeniu z dostępną już w Polsce infrastrukturą obliczeniową dla AI (np. na PWr) jest takie ważne, bo może wesprzeć rozwój nauki, ale także małe i średnie przedsiębiorstwa, które w obszarze IT oraz AI są motorem napędowym polskiej gospodarki. wyjaśnia kierownik projektu, prof. Maciej Piasecki
Członkowie zespołu zwracają także uwagę na inny aspekt: zwiększony udział tekstów oryginalnie napisanych w języku polskim czy też zawierających informacje o naszym kraju, dotyczące tutejszej nauki, kultury, historii czy gospodarki) powinny mieć korzystny wpływ na widoczność naszego języka i kultury. Obecnie, przynajmniej w odniesieniu do popularnych modeli językowych, takich jak wspomniany ChatGPT czy Google Bard, Polska i język polski są bez wątpienia marginalizowane.
Z jednej strony mówimy więc o przydatności z punktu widzenia polskiej gospodarki oraz tutejszej przedsiębiorców. Z drugiej natomiast PLLuM powinien mieć znacznie szerszy wpływ, obejmujący zarówno promowanie naszego kraju, jak i wspieranie użytkowników internetu, którzy nie byli w stanie w zadowalającym stopniu korzystać z modeli językowych szkolonych przede wszystkim na treściach anglojęzycznych. Oczywiście, mając w pamięci podatność tego typu projektów na “bylejakość”, należy podchodzić do całej sprawy z dystansem, lecz potencjał w tym przedsięwzięciu bez wątpienia jest niemały.