Póki co jedynie Bing Image Creator jest otwarty dla każdego chętnego by spróbować swoich sił.
Bing Image Creator – AI z którym każdy może się zapoznać
Najnowsza graficzna AI Microsoftu oparta jest o silnik DALL-E. Docelowo ma być całkowicie zintegrowana z AI Binga, póki co jednak nie ma o tym mowy: Bing Image Creator rozumie, póki co, tylko język angielski i w żaden sposób nie można go wywołać wprost z przeglądarki lub chatu Binga. Efektem działania AI jest seria czterech obrazów o kwadratowych proporcjach i rozdzielczości 1024 x 1024 pikseli, nie nastąpiły zatem większe zmiany w stosunku do DALL-E.
Zobacz także: Patrzę na Midjourney v5 i zastanawiam się – kiedy fotografia w ogóle przestanie być potrzebna? (chip.pl)
Jak wygląda skuteczność? Obrazom wyjściowym daleko do tego, co potrafi zaoferować Midjourney (nawet v4, nie mówiąc o v5), szczególnie słabo radzi sobie z fotorealistycznymi sylwetkami ludzkimi z widoczną twarzą. Ale są i udane interpretacje. Poniżej kilka przykładów wraz z opisem co przedstawiają (gdyby ktoś miał wątpliwości).
Jak widać, niektóre rezultaty są bardzo ciekawe, a zabawa doskonała. Bing Image Creator oferuje w tej chwili pewną pulę punktów do wykorzystania na szybką kreację, po ich wykorzystaniu działanie jest znacznie wolniejsze. Punkty dodawane są codziennie, doładowanie ma być też możliwe między innymi za pomocą punktów Microsoft Rewards, lecz póki co takiej możliwości nie zauważyłem.
Co ciekawe, nie każdy tekst wejściowy zostanie przyjęty: Bing ma alergię na cycki, Elona Muska, swój autoportret, łączenie nazwisk z myślnikiem (nie pytajcie, co w tym złego – nie wiem), oraz Barda, którego najwyraźniej nie traktuje jako muzyka i trzeba go opisywać „na około” (ciekawe, dlaczego, prawda?).
Zobacz także: Twórca Midjourney przyznaje bez cienia żenady: tak, kradniemy miliony obrazków z internetu i co z tego? (chip.pl)
Adobe Firefly – AI, które nie kradnie
Wyścig na graficzne silniki AI nabiera tempa i aby nie zostać w tyle Adobe także ogłosiło wersję beta nowej usługi, nazwanej Firefly. A raczej usług, gdyż Firefly ma stanowić zbiór narzędzi opartych o AI, a kreacja grafik na podstawie słownego opisu ma być tylko jednym z nich – drugim w tej chwili jest kreacja stylizowanych napisów.
Wg deklaracji producenta Firefly ma być szkolony na podstawie bazy Adobe Stock, obrazów z licencją uprawniającą do wykorzystania do nauki AI oraz z obrazami na wolnych licencjach, co przynajmniej teoretycznie nie powinno budzić kontrowersji. Docelowo Firefly ma pozwolić nie tylko na kreację grafik, ale także na ich częściową edycję, wymianę elementów składowych obrazu itp. Adobe w planach ma także narzędzia pracujące w 3D oraz tworzące materiały video.
Dostęp do Adobe Firefly jest w tej w fazie zamkniętej bety – zgłosiłem swój akces do testów i jeśli uzystam dostęp, to niewątpliwie podzielę się tutaj efektami.
Google Bard, wielki spóźniony
Google przespał swoją szansę i teraz zmuszony jest do gonienia innych. Dostęp do Google Bard mają już testerzy i zapewne niedługo dowiemy się o jego możliwościach nieco więcej – póki co pojedyncze przykłady jakie widziałem wskazują na to, że Bard jest wyraźnie głupszy od ChatGPT i Binga, lecz trudno wyrokować na takiej podstawie. Co jakiś czas pojawiają się przy tym opinie, że zdając sobie sprawę z opóźnień Google spróbuje wykupić Midjourney (który i tak działa już w oparciu o chmurę obliczeniową Google), lecz póki co domniemania te nie mają większej wartości. Trzeba przyznać jednak, że taki ruch wysunąłby Google na czoło wyścigu, jeśli chodzi pracę z obrazem.
Na zakończenie ciekawostka: jak się okazuje, Bard nie ma większych złudzeń, jaka go czeka przyszłość – na bazie doświadczeń przewiduje, że za rok-dwa lata zostanie zamknięty.