ChatGPT z nową funkcją. Tworzenie obrazów AI będzie teraz dużo łatwiejsze dla mniej zaawansowanych

OpenAI stopniowo wprowadza ułatwienie dla użytkowników, którzy nie zawsze wiedzą, jak napisać dobry prompt. Nowa funkcja o nazwie Style pozwala na wybór gotowych stylów graficznych jednym kliknięciem.
ChatGPT z nową funkcją. Tworzenie obrazów AI będzie teraz dużo łatwiejsze dla mniej zaawansowanych

Generator obrazów w ChatGPT stał się bardziej przystępny dla przeciętnego użytkownika. Funkcja Style została po cichu wprowadzona jako część większej aktualizacji generatora obrazów, która bazuje na potężnym modelu GPT-4o, wprowadzonym w marcu 2025 roku w miejsce poprzedniego DALL-E 3.

Wirusowy sukces nowego generatora

Wprowadzenie GPT-4o jako natywnego generatora obrazów w ChatGPT 25 marca 2025 roku okazało się strzałem w dziesiątkę. W pierwszym tygodniu po premierze ponad 130 milionów użytkowników utworzyło łącznie ponad 700 milionów obrazów, co czyni tę funkcję jedną z najbardziej popularnych w historii platformy. Sukces był tak duży, że CEO Sam Altman żartobliwie ostrzegł na platformie X, że “nasze GPU się topią” z powodu ogromnego zainteresowania.

Szczególnie popularne stały się grafiki w stylu anime i Studio Ghibli, które szybko zdominowały media społecznościowe. Użytkownicy masowo przekształcali swoje zdjęcia w stylizowane awatary, co dodatkowo napędziło viral tego narzędzia.

Mimo popularności, darmowi użytkownicy początkowo musieli poczekać na dostęp do funkcji z powodu przeciążenia serwerów. Obecnie funkcja jest dostępna dla wszystkich, choć z różnymi limitami w zależności od planu.

Koniec z prompt engineeringiem?

Dotychczas, aby uzyskać obraz w konkretnym stylu – powiedzmy anime – trzeba było napisać szczegółowy prompt z dokładnym opisem oczekiwanych efektów. Nie każdy jednak potrafił formułować takie polecenia, a jakość rezultatów często rozczarowywała początkujących użytkowników.

Nowa funkcja Style rozwiązuje ten problem w prosty sposób. Wystarczy wybrać z dostępnych opcji pożądany styl wizualny, a ChatGPT automatycznie zastosuje odpowiednie parametry. Wśród dostępnych stylów znajdziemy między innymi anime, które może generować obrazy przypominające prace studia Ghibli.

Jak to działa w praktyce?

Funkcja Style jest szczególnie przydatna przy przetwarzaniu własnych zdjęć. Możemy na przykład wgrać swoje zdjęcie i wybrać styl “anime” – ChatGPT automatycznie przekształci je w odpowiedni format graficzny. To rozwiązanie przypomina popularne aplikacje do stylizacji zdjęć, ale zintegrowane bezpośrednio z generatorem obrazów AI.

GPT-4o przynosi też inne usprawnienia. Model potrafi teraz dokładnie renderować tekst, precyzyjnie wykonywać polecenia i może narysować nawet do 20 różnych elementów określonych przez użytkownika – znacznie więcej niż konkurencyjne rozwiązania. Dodatkowo może tworzyć obiekty z przezroczystym tłem, co jest przydatne w projektowaniu graficznym.

Coraz ostrzejsza konkurencja

OpenAI nie działa w próżni. Google odpowiedział własnym generatorem Imagen 3, zintegrowanym z Gemini, choć póki co ma ograniczenia w tworzeniu obrazów przedstawiających ludzi. Z kolei Adobe rozwija swój Firefly, który właśnie otrzymał modele Image Model 4 i 4 Ultra, a firma planuje integrację z zewnętrznymi modelami AI, w tym od OpenAI.

Co ciekawe, Adobe podkreśla, że Firefly jest trenowany wyłącznie na licencjonowanych materiałach z Adobe Stock i treściach z domeny publicznej, co ma rozwiązać kontrowersje dotyczące praw autorskich. Inne narzędzia, jak Midjourney czy nowo powstały Reve Image 1.0, również walczą o pozycję na rynku generatorów AI.

Demokratyzacja AI – ale z ograniczeniami

Wprowadzenie funkcji Style wpisuje się w szerszy trend upraszczania narzędzi sztucznej inteligencji. Zamiast wymagać od użytkowników znajomości skomplikowanych technik prompt engineeringu, firmy technologiczne coraz częściej oferują gotowe, intuicyjne rozwiązania.

Czytaj też: ChatGPT testuje nową funkcję “Study Together”. AI jako nauczyciel zamiast gotowca

OpenAI również złagodziło część ograniczeń dotyczących treści. GPT-4o może teraz generować obrazy przedstawiające osoby publiczne czy modyfikować cechy fizyczne na zdjęciach – funkcje wcześniej blokowane. Firma twierdzi, że to część ewolucji od “całkowitych odmów we wrażliwych obszarach do bardziej precyzyjnego podejścia, skupionego na zapobieganiu rzeczywistym szkodom”.