Poznaj Genie 2 – model, który może generować grywalne światy 3D

Google DeepMind, oddział firmy, który stworzył m.in. AlphaGo, ogłosił Genie 2. Ma być to przełomowe narzędzie, które może generować interaktywne światy 3D na podstawie… pojedynczego obrazu! Ten nowy model został zaprojektowany, aby pomóc w szkoleniu i testowaniu agentów AI, umożliwiając im interakcję z dynamicznymi środowiskami za pomocą klawiatury i myszy.
Genie 2
Genie 2

Brzmi to niesamowicie i już oczyma wyobraźni można zobaczyć setki gier powstających za pomocą sztucznej inteligencji. Genie 2 nie jest jednak wolna od kontrowersji. Kwestie praw autorskich i własności intelektualnej są głównymi punktami spornymi – modele są często trenowane na zestawach danych pobranych z Internetu, a czasami obejmuje to materiały chronione prawem autorskim.

Co potrafi Genie 2?

Artyści, twórcy gier, a nawet firmy technologiczne zgłaszają obawy dotyczące nieautoryzowanego wykorzystania ich treści w szkoleniu tych modeli. Pojawiły się już pozwy w innych obszarach generatywnej AI, skierowane przeciwko firmom takim jak OpenAI i Stability AI, a powodowie twierdzą, że ich prace zostały wykorzystane bez pozwolenia. Łatwo sobie wyobrazić podobne sprawy w tym przypadku, zwłaszcza że te generowane przez AI światy stają się coraz bardziej nieodróżnialne od projektów stworzonych przez człowieka.

Genie 2 – jak podaje Google – potrafi mnóstwo rzeczy. Są to:

  • kontrolowane przez akcję – Genie 2 reaguje na akcje, takie jak wprowadzanie danych za pomocą klawiatury i myszy, umożliwiając osobie lub sztucznej inteligencji interakcję z otoczeniem. Na przykład: gdy naciskasz klawisze strzałek, rozumie, że musi poruszyć postać, a zatem nie porusza omyłkowo obiektów, takich jak drzewa lub chmury;
  • Long Horizon Memory – Genie 2 potrafi zapamiętywać części świata, które nie są już widoczne, i renderować je, gdy znów pojawiają się na scenie, dzięki czemu symulacja wydaje się bardziej ciągła i realistyczna;
  • nowa treść na bieżąco – umożliwia tworzenie nowej, spójnej treści, zachowując jednocześnie integralność świata w czasie, dzięki czemu środowiska stale ewoluują w wiarygodny sposób;
  • złożone interakcje – takie, jak fizyka, grawitacja i oświetlenie, a nawet animowanie postaci i symulowanie zachowania postaci niezależnych (NPC). Może obsługiwać wszystko, od efektów wodnych po ruchy postaci i dym;
  • symulacja kontrfaktyczna – sstem może generować różne ścieżki z tego samego punktu początkowego. Ta funkcja pozwala badaczom testować różne wyniki, zapewniając sposób symulowania różnych doświadczeń w celach szkoleniowych;
  • Genie 2 nie ogranicza się wyłącznie do obrazów generowanych komputerowo. Potrafi również wykorzystywać jako podpowiedzi zdjęcia ze świata rzeczywistego, symulując naturalne zjawiska, takie jak poruszająca się na wietrze trawa czy płynąca woda;
  • szybkie prototypowanie – maukowcy mogą szybko tworzyć interaktywne doświadczenia za pomocą Genie 2, co pozwala na szybkie testowanie i szkolenie w różnych środowiskach. Może przekształcić koncepty artystyczne lub rysunki w pełne, interaktywne światy.

Czytaj też: Podróż w czasie? Były pracownik Google twierdzi, że to kwestia pięciu lat

Brzmi to imponująco? Owszem, brzmi. Zaczekajmy jednak na to, aż Genie 2 zacznie być używany w praktyce. Wówczas będzie można skonfrontować huczne zapowiedzi z rzeczywistością.