Whisk różni się od innych narzędzi do generowania obrazów, ponieważ zamiast wymagać długich i szczegółowych monitów tekstowych, pozwala użytkownikom przeciągać i upuszczać obrazy jako monity dla tematu, sceny i stylu, aby stworzyć coś nowego. Poniższy filmik pokazuje, w jaki sposób się to odbywa.

Whisk – ewolucja generatorów obrazów

Jak działa Whisk? Użytkownicy muszą przesłać trzy obrazy. Jeden nadaje ogólny klimat, drugi określa scenę, trzeci – styl. Następnie sztuczna inteligencja łączy ich elementy, aby stworzyć unikalne “dzieła sztuki cyfrowej”. Jednak ponieważ z przesłanych obrazów wyodrębnianych jest tylko kilka kluczowych cech, Google podkreśliło, że wynik może nie spełniać oczekiwań twórcy. Aby temu zaradzić, Whisk udostępnia opcję edycji i przeglądania podstawowych monitów w celu odpowiedniej modyfikacji.

Cały mechanizm wykorzystuje Gemini do tworzenia szczegółowych podpowiedzi z obrazów, które są następnie przetwarzane przez Imagen 3, najnowszy model przeznaczony do ich generowania. Jak podaje Google, podczas wczesnych testów z artystami i twórcami ludzie opisywali Whisk jako nowy typ kreatywnego narzędzia – nie tradycyjny edytor obrazów. Ponieważ testy wypadły pomyślnie, producent wdrożył go dla 100 kolejnych krajów. Niestety, nie ma go na terenie UE, a więc również i w Polsce.

Czytaj też: Mapy Google świętują dwie dekady. Oto jak zmieniły nasze życie

A dlaczego Unia póki co jest wykluczona? Ponieważ nie ma jeszcze odpowiednich regulacji związanych z rozwiązaniami SI. Tak samo rzecz się ma w Wielkiej Brytanii oraz Indiach. Zanim Google wprowadzi je na tych trzech obszarach, musi upewnić się, że mechanizmy będą zgodne z przepisami dotyczącymi m.in. ochrony prywatności. Tak więc póki co dostępu do Whisk nie mamy, ale prędzej czy później go otrzymamy. Niecierpliwi mogą spróbować go uzyskać, zmieniając swoją lokalizację poprzez użycie sieci VPN – nie gwarantuję jednak, że na pewno się uda.