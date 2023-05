Za projektem stoi grupa badaczy z Google oraz zespoły naukowców z Max Planck Institute of Informatics oraz Massachusetts Institute of Technology Computer Science & Artificial Intelligence Laboratory. Opublikowali oni pracę naukową zawierającą przykłady działania interaktywnego edytora do manipulacji obrazem. Efekty są niezwykłe.

DragGAN, czyli interaktywna manipulacja generatorem obrazu

Idea działania DragGAN wygląda na pozór bardzo prosto: do źródłowego obrazu dodawane są punkty edycyjne, dla których można wskazać nowy punkt docelowy, a narzędzie przetwarza obraz wg zadanej ścieżki korzystając z algorytmów generowania obrazu. Do tego dochodzi możliwość ograniczenia pola działania do określonego obszaru obrazu za pomocą maski. Brzmi bardzo prosto i na pierwszy rzut oka nie różni się specjalnie od dostępnych w Photoshopie narzędzi takich jak Liquify.

Wystarczy jednak spojrzeć na załączone w ww. pracy przykłady, by zorientować się, jak pozorne jest to podobieństwo. Już w pierwszym kroku edycji brakujące elementy obrazu (otwarta lwia paszcza) tworzone są przez AI na podstawie rozpoznanej całej sceny, a nie w sposób zbliżony do narzędzi uwzględniających lokalną zawartość jak w Photoshopie. Po drugim kroku wynikowa grafika w zasadzie nie ma nic wspólnego ze źródłowym zdjęciem, poza tym, że także przedstawia lwa. Od lwa stworzonego przez Midjourney na podstawie zadanego zdjęcia w zasadzie nie różni się wiele.

Różnicę dobitnie pokazuje przykład powyżej – zwróćcie uwagę szczególnie na samochody: w kolejnych krokach edycji zmianom ulega nie tylko orientacja pojazdu, pod koniec edycji mamy w zasadzie zupełnie inne modele, niekoniecznie nawet podobne do początkowego, zgadza się w zasadzie tylko kolor.

O autentyczną fotografię będzie coraz trudniej

Możliwości prezentowane przez DragGAN wyglądają imponująco, szczególnie że wstępnie narzędzia wyglądają na bardzo proste w użyciu. Z jednej strony nic, tylko się cieszyć, ale z drugiej strony łatwa dostępność do podobnych manipulacji musi budzić wątpliwości. Dzieliłem się nimi już przy okazji premiery Magicznej Edycji zaprezentowanej przez Google – jeśli każde zdjęcie będzie mogło być poddane takiemu przetwarzaniu kilkoma ruchami ręki, to po fotografię naprawdę autentyczną trzeba będzie udawać się do muzeum. Nie mamy bowiem zwykle większych skrupułów przed upiększaniem rzeczywistości, czego dowodem może być dowolny profil influencerki/influencera z kontraktem reklamowym na Instagramie.

Oczywiście kijem Wisły nie zawrócę, narzędzia edycyjne ulegną zmianie czy mi się to podoba, czy nie, ba, jestem przekonany, że będę z nich w jakimś stopniu korzystał, choć nie jestem zwolennikiem zbyt daleko idącej ingerencji w materiał źródłowy nawet za pomocą obecnie dostępnych metod. Po prostu usuwając nielubianą ciotkę ze zdjęcia i zastępując ją doniczką z fikusem pamiętajmy, że ktoś to może zrobić także z nami…

Grafika tytułowa wygenerowana została przy pomocy Midjourney