Player of Games to nowy algorytm, nad którym pracują badacze z DeepMind. Zamiast jednak uczyć go grać w kolejną grę, w której gracz (w tym przypadku algorytm) ma do dyspozycji wszystkie informacje dotyczące rozgrywki i na ich podstawie może podejmować optymalne i w pełni analityczne decyzje, Player of Games będzie uczył się… przewidywania.
Player of Games nauczy się grać w pokera
Algorytm nauczy się podejmowania decyzji i rozumowania na podstawie teorii gier. Ma być to pierwszy krok, który pozwoli na tworzenie tzw. ogólnych algorytmów, zdolnych do rozwiązywania problemów w dowolnych środowiskach.
Czytaj również: Algorytm od DeepMind jest już niemal tak dobry jak licealista, ale tylko w niektórych kwestiach
Player of Games ma być początkowo testowany na szachach, go, pokerze i grze pod tytułem Scotland Yard, tak więc oprócz tytułów, w których wszystkie informacje dotyczące rozgrywki są jawne (szachy, go), nauczy się też przewidywać zdarzenia losowe i podejmować decyzje na podstawie niepełnego wachlarza informacji.
Dotychczasowe poczynania algorytmu są podobno bardzo obiecujące:
Przedstawiamy Player of Games, algorytm ogólnego przeznaczenia, który ujednolica poprzednie podejścia, łącząc takie metody jak guided search, uczenie się przez zabawę i podejmowanie decyzji na podstawie teorii gier. Nasz algorytm już teraz może pochwalić się wysoką wydajnością w grach. Osiąga dobre wyniki w szachach i go, pokonuje najsilniejszego, otwartego bota w pokerze heads-up no-limit Texas hold’em (Slumbot) i pokonuje najnowocześniejszego bota w Scotland Yardzie. – możemy przeczytać w opisie badań.
Plan na stworzenie uniwersalnego algorytmu, który będzie potrafił się dostosować do dowolnych warunków jest wbrew pozorom dość świeżym podejściem. W przyszłym roku zapewne usłyszymy o kolejnych sukcesach Player of Games.