SI stworzona przez OpenAI nauczyła się bawić w chowanego

OpenAI stworzyło wirtualne środowisko ze ścianami, ruchomymi przedmiotami i rampami. Następnie do takiego pomieszczenia wpuszczono dwie drużyny SI, które bawiły się w chowanego. Jeden zespół otrzymywał punkty za ukrywanie się, natomiast drugi za znajdywanie przeciwników. Po około 25 milionach gier, SI nauczyła się korzystać z ruchomych przedmiotów.

Co ważne, SI nie miały innych wytycznych niż zasady gry, ani podpowiedzi jak wykorzystać narzędzia dostarczone przez programistów. Z tego powodu na początku algorytmy uczenia maszynowego po prostu biegały za sobą po wirtualnych pokojach. Jednak po około 25 milionach gier ukrywający się zespół zaczął zasłaniać wejścia do pokojów barykadami. Po kolejnych 75 milionach potyczek, poszukiwacze odkryli rampy, dzięki którym mogli dostrzec przeciwny zespół, wspinając się za ich pomocą na ściany.

SI nauczyła się korzystać z fizyki wirtualnego świata (graf. OpenAI)

I już 10 milionów iteracji później, ukrywająca się drużyna SI nauczyła się blokować rampy. Kiedy programistom OpenAI wydawało się, że to zakończyło zabawę, poszukiwacze znaleźli sposób na dostanie się do zablokowanych pokojów. SI zaczęła wspinać się na ruchome pudełka za pomocą zablokowanych ramp, po czym przesuwała takie platformy w stronę „fortów”. W końcu jednak ukrywający znaleźli wygrywającą strategię i zaczęli blokować wszystkie rampy i pudełka zanim zabarykadowali się w zbudowanym przez siebie pomieszczeniu.

Ukrywający się zespół znalazł w końcu sposób na ostateczne wygranie zabawy w chowanego (graf. OpenAI)

Ta, wydawałoby się, niewinna gra pozwoli tworzyć sztuczne inteligencje, które będą szukały błyskotliwych, nieoczywistych rozwiązań w dużo bardziej skomplikowanych zadaniach. Możemy wyobrazić sobie robota, który zakopany w piachu na obcej planecie sam przeanalizuje swoje położenie i odkryje odpowiednią sekwencję ruchów, dzięki którym wydostanie się z pułapki. W takiej sytuacji w 2005 roku znalazł się łazik Opportunity na Marsie. Wtedy inżynierowie NASA musieli zbudować na Ziemi podobną piaskownicę z kopią pojazdu kosmicznego. Dziś, zamiast czekać na instrukcje z Ziemi, Opportunity mógłby utworzyć model na podstawie danych z kamery i sprawdzić najlepsze możliwe strategie wyjścia z kłopotliwej sytuacji. | CHIP

JEDNE SIĘ BAWIĄ, INNE MALUJĄ:

Artyści są niepotrzebni

1
Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.