Czasami granice pomiędzy światem wirtualnym a rzeczywistym zacierają się w sposób, którego nikt się nie spodziewał. Minecraft, pozornie prosta gra o układaniu bloków, od lat staje się platformą dla najbardziej niezwykłych eksperymentów technicznych. Co się stanie, gdy połączy się tę kreatywną przestrzeń z najnowszymi osiągnięciami sztucznej inteligencji? Odpowiedź na to pytanie przynosi jeden z najbardziej znanych twórców w społeczności Minecraft. Sammyuri stworzył działający model językowy CraftGPT z ponad 439 milionów bloków, który potrafi prowadzić podstawowe rozmowy. To nie jest kolejna ciekawostka, ale pełnoprawny system AI funkcjonujący wewnątrz gry.
Architektura modelu językowego w blokach
Skala tego przedsięwzięcia naprawdę robi wrażenie. Konstrukcja o wymiarach 1020 na 260 na 1656 bloków tworzy gigantyczną strukturę mieszczącą wszystkie elementy potrzebne do działania sztucznej inteligencji. Każdy z tych milionów bloków pełni konkretną rolę w złożonym systemie obliczeniowym. Najbardziej zdumiewające jest to, że do budowy wykorzystano wyłącznie standardowe mechaniki Redstone dostępne w podstawowej wersji gry. Nie użyto żadnych bloków poleceń, modyfikacji czy dodatkowych pakietów danych, tylko czystą logikę obwodów stworzoną z materiałów dostępnych w Minecraft.
Czytaj też: Einstein się mylił? Czas płynie inaczej niż myśleliśmy. Najnowsze badania kwantowe zaskakują nawet naukowców
Jedynym wyjątkiem była modyfikacja Distant Horizons, która posłużyła wyłącznie do zwiększenia widocznego dystansu renderowania. CraftGPT to w pełni funkcjonalny model sztucznej inteligencji dysponujący 5 087 280 parametrami. Charakteryzuje się wymiarem osadzania wynoszącym 240, słownictwem obejmującym 1920 tokenów i składa się z sześciu warstw obliczeniowych. Okno kontekstowe ograniczone do 64 tokenów umożliwia prowadzenie bardzo krótkich rozmów.
Rozwiązania techniczne zastosowane w projekcie świadczą o głębokim zrozumieniu architektury modeli językowych. Większość wag skwantyzowano do 8 bitów, co pozwoliło zaoszczędzić miejsce i przyspieszyć obliczenia. Wagi osadzania przechowywane są w 18 bitach, a LayerNorm w 24 bitach, co stanowi kompromis między dokładnością a wydajnością.
Czytaj też: Brainly partnerem Białego Domu. Polska firma wprowadza AI do amerykańskich szkół
Chociaż CraftGPT działa, jego największym ograniczeniem jest dramatycznie niska wydajność. Nawet przy wykorzystaniu specjalnego serwera MCHPRS i przyspieszeniu tempa ticków około 40 000 razy, generowanie pojedynczej odpowiedzi zajmuje kilka godzin. Przy standardowej prędkości działania Minecraft sytuacja staje się wręcz absurdalna, ponieważ wygenerowanie odpowiedzi zajęłoby ponad dziewięć lat. To sprawia, że praktyczne wykorzystanie CraftGPT jest niemożliwe, choć prawdopodobnie nie o to tutaj chodziło.
Jakość generowanych odpowiedzi również pozostawia wiele do życzenia. Model ma tendencję do zbaczania z tematu, generuje wypowiedzi z błędami gramatycznymi lub po prostu produkuje przypadkowe treści. Wynika to z ograniczeń treningowych, ponieważ model wytrenowano w Pythonie na zbiorze danych TinyChat, zawierającym podstawowe konwersacje w języku angielskim.
Czytaj też: Niewyjaśnione odgłosy 340 kilometrów nad Ziemią. Yang Liwei ostrzega kolejnych astronautów
CraftGPT nie aspiruje do bycia praktycznym narzędziem. To przede wszystkim dowód koncepcji pokazujący, że wnioskowanie neuronowe można zaimplementować w niemal każdym logicznym substracie. Projekt demonstruje uniwersalność obliczeń i otwiera nowe perspektywy myślenia o sztucznej inteligencji.
Sammyuri nie jest nowicjuszem w budowaniu skomplikowanych konstrukcji w Minecraft. Wcześniej stworzył procesor o częstotliwości 1 Hz, rekurencyjną wersję Minecraft działającą w samej grze oraz komputer IRIS zdolny do uruchomienia DOOM z 1993 roku. CraftGPT to kolejny krok w jego fascynującej podróży przez możliwości wirtualnej inżynierii.
Projekt ma ogromną wartość edukacyjną i inspiracyjną. Pokazuje, że granice między grą a nauką są płynne, a kreatywność może prowadzić do przełomowych odkryć. CraftGPT stał się symbolem tego, że obliczenia to nie tylko krzem i procesory – to przede wszystkim logika, którą można zaimplementować w każdym środowisku zdolnym do przetwarzania informacji.