Player of Games to nowy algorytm od DeepMind. Zostanie mistrzem pokera

Umiejętność grania w gry przez algorytmy sztucznej inteligencji służy nam od jakiegoś czasu do oceny ich rozwoju. Do niedawna badacze byli w stanie sprawić, że dany algorytm potrafił opanować po mistrzowsku jeden tytuł. Potem pojawił się AlphaZero, który opanował aż trzy gry. Jego następcą ma być z kolei Player of Games.
player-of-games-deepmind

player-of-games-deepmind

Player of Games to nowy algorytm, nad którym pracują badacze z DeepMind. Zamiast jednak uczyć go grać w kolejną grę, w której gracz (w tym przypadku algorytm) ma do dyspozycji wszystkie informacje dotyczące rozgrywki i na ich podstawie może podejmować optymalne i w pełni analityczne decyzje, Player of Games będzie uczył się… przewidywania.

Player of Games nauczy się grać w pokera

Algorytm nauczy się podejmowania decyzji i rozumowania na podstawie teorii gier. Ma być to pierwszy krok, który pozwoli na tworzenie tzw. ogólnych algorytmów, zdolnych do rozwiązywania problemów w dowolnych środowiskach.

Czytaj również: Algorytm od DeepMind jest już niemal tak dobry jak licealista, ale tylko w niektórych kwestiach

Player of Games ma być początkowo testowany na szachach, go, pokerze i grze pod tytułem Scotland Yard, tak więc oprócz tytułów, w których wszystkie informacje dotyczące rozgrywki są jawne (szachy, go), nauczy się też przewidywać zdarzenia losowe i podejmować decyzje na podstawie niepełnego wachlarza informacji.

Dotychczasowe poczynania algorytmu są podobno bardzo obiecujące:

Przedstawiamy Player of Games, algorytm ogólnego przeznaczenia, który ujednolica poprzednie podejścia, łącząc takie metody jak guided search, uczenie się przez zabawę i podejmowanie decyzji na podstawie teorii gier. Nasz algorytm już teraz może pochwalić się wysoką wydajnością w grach. Osiąga dobre wyniki w szachach i go, pokonuje najsilniejszego, otwartego bota w pokerze heads-up no-limit Texas hold’em (Slumbot) i pokonuje najnowocześniejszego bota w Scotland Yardzie. – możemy przeczytać w opisie badań.

Plan na stworzenie uniwersalnego algorytmu, który będzie potrafił się dostosować do dowolnych warunków jest wbrew pozorom dość świeżym podejściem. W przyszłym roku zapewne usłyszymy o kolejnych sukcesach Player of Games.