Sprawdziłem Bing Image Creator. Zabawa była przednia, ale konkurencja nie śpi

Nie ma w zasadzie tygodnia, by nie pojawiały się nowości związane ze sztuczną inteligencją. Microsoft, który jako pierwszy zaoferował integrację ChatGPT ze swoją wyszukiwarką Bing, rozpoczął właśnie publiczne testy usługi Bing Image Creator, która zgodnie z nazwą służy tworzeniu obrazów na podstawie słownego opisu. Także Adobe ogłosiło powstanie podobnej usługi, a i Google udostępnił swojego chatbota Bard testerom.
Sprawdziłem Bing Image Creator. Zabawa była przednia, ale konkurencja nie śpi

Póki co jedynie Bing Image Creator jest otwarty dla każdego chętnego by spróbować swoich sił.

Bing Image Creator – AI z którym każdy może się zapoznać

Najnowsza graficzna AI Microsoftu oparta jest o silnik DALL-E. Docelowo ma być całkowicie zintegrowana z AI Binga, póki co jednak nie ma o tym mowy: Bing Image Creator rozumie, póki co, tylko język angielski i w żaden sposób nie można go wywołać wprost z przeglądarki lub chatu Binga. Efektem działania AI jest seria czterech obrazów o kwadratowych proporcjach i rozdzielczości 1024 x 1024 pikseli, nie nastąpiły zatem większe zmiany w stosunku do DALL-E.

Zobacz także: Patrzę na Midjourney v5 i zastanawiam się – kiedy fotografia w ogóle przestanie być potrzebna? (chip.pl)

Jak wygląda skuteczność? Obrazom wyjściowym daleko do tego, co potrafi zaoferować Midjourney (nawet v4, nie mówiąc o v5), szczególnie słabo radzi sobie z fotorealistycznymi sylwetkami ludzkimi z widoczną twarzą. Ale są i udane interpretacje. Poniżej kilka przykładów wraz z opisem co przedstawiają (gdyby ktoś miał wątpliwości).

AI Bing Image Creator
Rey Skywalker w Hogsmeade, przed sklepem Zonka
AI Bing Image Creator
Rei Ayanami, mistrzyni Jedi
AI Bing Image Creator
Profesor Yoda w Hogwarcie
AI Bing Image Creator
Chani, córka Lieta, patrząca na zachód słońca na Diunie
AI Bing Image Creator
Chani, córka Lieta
AI Bing Image Creator
Profesor Yoda podczas zajęć z obrony przed czarną magią w Hogwarcie
AI Bing Image Creator
Corwin, rycerz Króla Artura Pendragona
AI Bing Image Creator
Yennefer z Vengerbergu wraz z Ciri i Geraltem
AI Bing Image Creator
CEO CHIP.PL rządzi polskimi portalami internetowymi jako Imperator
Bing Image Creator
Starship ląduje na Księżycu

Jak widać, niektóre rezultaty są bardzo ciekawe, a zabawa doskonała. Bing Image Creator oferuje w tej chwili pewną pulę punktów do wykorzystania na szybką kreację, po ich wykorzystaniu działanie jest znacznie wolniejsze. Punkty dodawane są codziennie, doładowanie ma być też możliwe między innymi za pomocą punktów Microsoft Rewards, lecz póki co takiej możliwości nie zauważyłem.

Co ciekawe, nie każdy tekst wejściowy zostanie przyjęty: Bing ma alergię na cycki, Elona Muska, swój autoportret, łączenie nazwisk z myślnikiem (nie pytajcie, co w tym złego – nie wiem), oraz Barda, którego najwyraźniej nie traktuje jako muzyka i trzeba go opisywać „na około” (ciekawe, dlaczego, prawda?).

Zobacz także: Twórca Midjourney przyznaje bez cienia żenady: tak, kradniemy miliony obrazków z internetu i co z tego? (chip.pl)

Adobe Firefly – AI, które nie kradnie

AI Adobe Firefly

Wyścig na graficzne silniki AI nabiera tempa i aby nie zostać w tyle Adobe także ogłosiło wersję beta nowej usługi, nazwanej Firefly. A raczej usług, gdyż Firefly ma stanowić zbiór narzędzi opartych o AI, a kreacja grafik na podstawie słownego opisu ma być tylko jednym z nich – drugim w tej chwili jest kreacja stylizowanych napisów.

Wg deklaracji producenta Firefly ma być szkolony na podstawie bazy Adobe Stock, obrazów z licencją uprawniającą do wykorzystania do nauki AI oraz z obrazami na wolnych licencjach, co przynajmniej teoretycznie nie powinno budzić kontrowersji. Docelowo Firefly ma pozwolić nie tylko na kreację grafik, ale także na ich częściową edycję, wymianę elementów składowych obrazu itp. Adobe w planach ma także narzędzia pracujące w 3D oraz tworzące materiały video.

Dostęp do Adobe Firefly jest w tej w fazie zamkniętej bety – zgłosiłem swój akces do testów i jeśli uzystam dostęp, to niewątpliwie podzielę się tutaj efektami.

Google Bard, wielki spóźniony

AI Bing Image Creator
Spóźniony Bard, grający smutną melodię (Bing Image Creator)

Google przespał swoją szansę i teraz zmuszony jest do gonienia innych. Dostęp do Google Bard mają już testerzy i zapewne niedługo dowiemy się o jego możliwościach nieco więcej – póki co pojedyncze przykłady jakie widziałem wskazują na to, że Bard jest wyraźnie głupszy od ChatGPT i Binga, lecz trudno wyrokować na takiej podstawie. Co jakiś czas pojawiają się przy tym opinie, że zdając sobie sprawę z opóźnień Google spróbuje wykupić Midjourney (który i tak działa już w oparciu o chmurę obliczeniową Google), lecz póki co domniemania te nie mają większej wartości. Trzeba przyznać jednak, że taki ruch wysunąłby Google na czoło wyścigu, jeśli chodzi pracę z obrazem.

Na zakończenie ciekawostka: jak się okazuje, Bard nie ma większych złudzeń, jaka go czeka przyszłość – na bazie doświadczeń przewiduje, że za rok-dwa lata zostanie zamknięty.