Google prezentuje Gemini 2.5 Flash Nano Banana. To nowa era tworzenia obrazów z AI?

Google dokonało znaczącego przełomu w generowaniu obrazów za pomocą sztucznej inteligencji. Firma zaprezentowała model Gemini 2.5 Flash, nazwany roboczo “Nano Banana”, który ma szansę zrewolucjonizować rynek. Już teraz model ten plasuje się na szczycie rankingu edytorów obrazów LMArena, zdobywając entuzjastyczne recenzje użytkowników. “Nano banana” ma za zadanie rozwiązać jeden z największych problemów dotychczasowej generatywnej AI: niespójność. Umożliwia precyzyjne edycje, wieloetapowe modyfikacje oraz płynne łączenie stylów, co ma szansę uczynić go równie popularnym, jak niedawno obrazy w stylu Studio Ghibli w przypadku ChatGPT.
...

Nowy model AI do edycji obrazów wkracza na rynek. Oto Gemini 2.5 Flash Nano Banana

Czy edycja obrazów przy pomocy sztucznej inteligencji wreszcie przestanie frustrować? Google ma na to odpowiedź w postaci nowego modelu, który próbuje rozwiązać największe bolączki twórców. Zamiast kolejnych obietnic bez pokrycia, firma z Mountain View koncentruje się na konkretnym problemie, który dotykał wszystkie dotychczasowe narzędzia. To może być moment, gdy AI do edycji grafiki faktycznie zacznie spełniać oczekiwania użytkowników.

Model Nano Banana powstał specjalnie po to, by poradzić sobie z kłopotliwą niespójnością między kolejnymi modyfikacjami obrazu. Dotychczasowe rozwiązania często wprowadzały niechciane zmiany w elementach, które powinny pozostać nienaruszone, co szczególnie irytowało profesjonalistów wymagających precyzji.

Dzięki nowej technologii, użytkownicy mogą:

  • Zachować ten sam obiekt lub postać w różnych środowiskach i stylach. Można na przykład umieścić tę samą osobę w różnych strojach, zmieniać jej fryzurę, a nawet przenieść ją do innej epoki, nie zniekształcając przy tym jej wizerunku.
  • Modyfikować obrazy wieloetapowo, co pozwala na ciągłe udoskonalanie grafik. Można np. dodawać meble do zdjęcia pokoju, by stworzyć inspirującą aranżację.
  • Łączyć style, przenosząc wzory z jednego obrazu na obiekt w innym, np. zmieniając wzór na sukience na taki, jaki ma motyl na swoich skrzydłach.

Model “Nano Banana” został tak zaprojektowany, by zapewnić twórcom treści niespotykaną dotąd swobodę i przyspieszyć ich pracę. Chyba najbardziej imponującą cechą jest możliwość przekształcenia pojedynczego obrazu w spójną sekwencję filmową. Eliminuje to żmudne ręczne tworzenie każdej klatki, co może radykalnie skrócić czas produkcji materiałów wizualnych. Natomiast w branży modowej technologia pozwala na realistyczne prezentowanie ubrań na zdjęciach z udziałem konkretnych osób. Wystarczy przesłać selfie i fotografię stroju, by otrzymać wizualizację w różnych naturalnych settingach – to świetna opcja w przypadku zakupów online.

Dalej dostajemy też funkcję mieszania stylów, umożliwiającą przenoszenie tekstur i wzorów między obrazami. Można na przykład zastosować motyw ze skrzydeł motyla do projektu sukienki, zachowując przy tym naturalne oświetlenie i proporcje. Edycja wieloetapowa sprawdza się natomiast się doskonale przy aranżacji wnętrz – pozwala na stopniowe dodawanie mebli i dekoracji do zdjęcia pokoju, przy zachowaniu spójności wszystkich elementów. Teraz każdy będzie mógł zostać architektem wnętrz i przekształcić (przynajmniej na komputerze) swoje mieszkanie w wymarzoną przestrzeń.

Czytaj też: NotebookLM zdobywa fantastyczną nowość. Teraz możesz się w nim zakochać

Gemini 2.5 Flash Nano Banana – dostępność i zabezpieczenia

Jeśli chcielibyście już wypróbować nowe rozwiązanie, to jest ono już dostępne w aplikacji Gemini oraz dla programistów przez Gemini API, Google AI Studio i Vertex AI. Firma nie ukrywa, że liczy na masową adopcję technologii i chce stworzyć swój własny „przełomowy moment kulturowy”. Cóż, nikogo nie zaskoczy, gdy napiszę, że gigant liczy na powtórzenia sukcesu ChatGPT, który zdobył niemal miliard użytkowników między innymi dzięki popularności obrazów w stylu Studio Ghibli. Ciekawe, czy precyzyjna edycja i wieloetapowe dopracowywanie będą dla użytkowników równie atrakcyjne.

Przy okazji warto też wspomnieć o kwestii zabezpieczeń, bo Google wprowadzi podwójny system dla obrazów generowanych przez Nano Banana. Wszystkie utworzone lub edytowane obrazy zawierają widoczny znak wodny oraz niewidzialny cyfrowy znacznik SynthID, który pozostaje wykrywalny nawet po modyfikacjach. Ma to zapobiegać złośliwemu wykorzystaniu technologii, która staje się coraz bardziej zaawansowana i trudna do odróżnienia od autentycznych fotografii. Miejmy nadzieję, że to trochę pomoże w walce z szerzącymi się na coraz większą skalę fake newsami.

Czytaj też: Claude wkracza do Chrome’a – ruszyły pierwsze testy agenta AI w przeglądarce

Rynek generatywnych aplikacji AI staje się polem zaciętej walki, w której generowanie obrazów odgrywa kluczową rolę. Elon Musk promuje zdolności Groka w tym zakresie, a ChatGPT zawdzięczał ogromny wzrost liczby użytkowników właśnie popularnym obrazom w stylu Studio Ghibli. Nowy model Google pokazuje, że firma poważnie podchodzi do tej rywalizacji i dąży do stworzenia narzędzia, które nie tylko będzie technicznie doskonałe, ale również znajdzie szerokie zastosowanie.