Drawing bot Microsoftu potrafi stworzyć grafikę na podstawie tekstu

Gdyby ktoś poprosił nas o narysowanie żółtego ptaszka z czarnymi skrzydłami, prawdopodobnie nie mielibyśmy z tym problemu. Zaczęlibyśmy od korpusu, potem wypełnili go stosownym kolorem, a następnie to samo zrobili ze skrzydłami. Każdy z nas narysowałby go inaczej i pewnie niewiele rysunków odpowiadałoby istniejącemu na świecie gatunkowi. Działanie drawing bota Microsoftu jest podobne – maszyna potrafi piksel po pikselu stworzyć obraz o jakości niemal fotograficznej, ale niekoniecznie mający odbicie w rzeczywistości.
microsoft sztuczna inteligencja
microsoft sztuczna inteligencja

Bot korzysta z dwóch algorytmów uczenia maszynowego. Pierwszy analizuje treść opisu, wspierając się zasobami baz danych, i tworzy cyfrowy obraz, drugi ocenia czy powstały model jest wystarczająco autentyczny. Microsoft nie przedstawił innych przykładów niż te dwa, które widzicie w naszym newsie, ale firma zapewnia, że bot narysuje wszystko: od scen krajobrazowych, przez zwierzęta aż po obiekty nieco abstrakcyjne, jak pływający piętrowy autobus.

microsoft bot
Efekt pracy bota (graf. Microsoft)

Projektując tę sztuczną inteligencję Microsoft niejako zatoczył koło. Pierwotne badania zaczynały się bowiem od metod przetwarzania języka naturalnego, czego efektem był CaptionBot, dodający automatyczne napisy do zdjęć, czy później Seeing AI, aplikacja ułatwiająca osobom niewidomym rozpoznawanie otoczenia. Drawing bot jest jednak znacznie bardziej zaawansowanym algorytmem, ponieważ wymaga od maszyny wyobrażenia sobie szczegółów, których nie ma w treści opisu. W tej technologii tkwi spory potencjał. Microsoft uważa, że algorytm w przyszłości może zostać wykorzystany w roli rysownika filmu animowanego. Zamiast zatrudniać setki grafików i ilustratorów, komputer potrafiłby wygenerować cały obraz na podstawie scenariusza. Rozwiązanie mogłoby też znaleźć zastosowanie w tzw. bankach zdjęć, czyli zbiorach fotografii, z których korzystają np. media. Przychodzi wam do głowy jeszcze inny pomysł użycia rysującego bota? | CHIP