ChatGPT z nową funkcją. Tworzenie obrazów AI będzie teraz dużo łatwiejsze dla mniej zaawansowanych

OpenAI stopniowo wprowadza ułatwienie dla użytkowników, którzy nie zawsze wiedzą, jak napisać dobry prompt. Nowa funkcja o nazwie Style pozwala na wybór gotowych stylów graficznych jednym kliknięciem.
ChatGPT z nową funkcją. Tworzenie obrazów AI będzie teraz dużo łatwiejsze dla mniej zaawansowanych

Generator obrazów w ChatGPT stał się bardziej przystępny dla przeciętnego użytkownika. Funkcja Style została po cichu wprowadzona jako część większej aktualizacji generatora obrazów, która bazuje na potężnym modelu GPT-4o, wprowadzonym w marcu 2025 roku w miejsce poprzedniego DALL-E 3.

Wirusowy sukces nowego generatora

Wprowadzenie GPT-4o jako natywnego generatora obrazów w ChatGPT 25 marca 2025 roku okazało się strzałem w dziesiątkę. W pierwszym tygodniu po premierze ponad 130 milionów użytkowników utworzyło łącznie ponad 700 milionów obrazów, co czyni tę funkcję jedną z najbardziej popularnych w historii platformy. Sukces był tak duży, że CEO Sam Altman żartobliwie ostrzegł na platformie X, że “nasze GPU się topią” z powodu ogromnego zainteresowania.

Szczególnie popularne stały się grafiki w stylu anime i Studio Ghibli, które szybko zdominowały media społecznościowe. Użytkownicy masowo przekształcali swoje zdjęcia w stylizowane awatary, co dodatkowo napędziło viral tego narzędzia.

Mimo popularności, darmowi użytkownicy początkowo musieli poczekać na dostęp do funkcji z powodu przeciążenia serwerów. Obecnie funkcja jest dostępna dla wszystkich, choć z różnymi limitami w zależności od planu.

Koniec z prompt engineeringiem?

Dotychczas, aby uzyskać obraz w konkretnym stylu – powiedzmy anime – trzeba było napisać szczegółowy prompt z dokładnym opisem oczekiwanych efektów. Nie każdy jednak potrafił formułować takie polecenia, a jakość rezultatów często rozczarowywała początkujących użytkowników.

Nowa funkcja Style rozwiązuje ten problem w prosty sposób. Wystarczy wybrać z dostępnych opcji pożądany styl wizualny, a ChatGPT automatycznie zastosuje odpowiednie parametry. Wśród dostępnych stylów znajdziemy między innymi anime, które może generować obrazy przypominające prace studia Ghibli.

Jak to działa w praktyce?

Funkcja Style jest szczególnie przydatna przy przetwarzaniu własnych zdjęć. Możemy na przykład wgrać swoje zdjęcie i wybrać styl “anime” – ChatGPT automatycznie przekształci je w odpowiedni format graficzny. To rozwiązanie przypomina popularne aplikacje do stylizacji zdjęć, ale zintegrowane bezpośrednio z generatorem obrazów AI.

GPT-4o przynosi też inne usprawnienia. Model potrafi teraz dokładnie renderować tekst, precyzyjnie wykonywać polecenia i może narysować nawet do 20 różnych elementów określonych przez użytkownika – znacznie więcej niż konkurencyjne rozwiązania. Dodatkowo może tworzyć obiekty z przezroczystym tłem, co jest przydatne w projektowaniu graficznym.

Coraz ostrzejsza konkurencja

OpenAI nie działa w próżni. Google odpowiedział własnym generatorem Imagen 3, zintegrowanym z Gemini, choć póki co ma ograniczenia w tworzeniu obrazów przedstawiających ludzi. Z kolei Adobe rozwija swój Firefly, który właśnie otrzymał modele Image Model 4 i 4 Ultra, a firma planuje integrację z zewnętrznymi modelami AI, w tym od OpenAI.

Co ciekawe, Adobe podkreśla, że Firefly jest trenowany wyłącznie na licencjonowanych materiałach z Adobe Stock i treściach z domeny publicznej, co ma rozwiązać kontrowersje dotyczące praw autorskich. Inne narzędzia, jak Midjourney czy nowo powstały Reve Image 1.0, również walczą o pozycję na rynku generatorów AI.

Demokratyzacja AI – ale z ograniczeniami

Wprowadzenie funkcji Style wpisuje się w szerszy trend upraszczania narzędzi sztucznej inteligencji. Zamiast wymagać od użytkowników znajomości skomplikowanych technik prompt engineeringu, firmy technologiczne coraz częściej oferują gotowe, intuicyjne rozwiązania.

Czytaj też: ChatGPT testuje nową funkcję “Study Together”. AI jako nauczyciel zamiast gotowca

OpenAI również złagodziło część ograniczeń dotyczących treści. GPT-4o może teraz generować obrazy przedstawiające osoby publiczne czy modyfikować cechy fizyczne na zdjęciach – funkcje wcześniej blokowane. Firma twierdzi, że to część ewolucji od “całkowitych odmów we wrażliwych obszarach do bardziej precyzyjnego podejścia, skupionego na zapobieganiu rzeczywistym szkodom”.

Napisane przez

Sebastian Górski

RedaktorPrzez lata produkowałem tu i ówdzie (PC World, Komputer Świat, Next Gazeta.pl, Telepolis). Moje alter ego od zarania dziejów siedzi w muzyce. Rozglądam się dookoła i zaglądam do wnętrza. Lubię wiedzieć dlaczego i po co.