Fidji Simo, dyrektor ds. aplikacji w OpenAI, zdradziła kierunek rozwoju chatbota. Nowe możliwości mają trafić do tych, którzy dotąd używali ChatGPT do dłuższych konwersacji, ale proste, codzienne pytania zadawali wyszukiwarce Google. Celem jest przekształcenie narzędzia w uniwersalnego asystenta, co oznacza gruntowną przebudowę doświadczenia użytkownika.

To nie są już tylko drobne poprawki – to próba przejęcia codziennych nawyków miliardów użytkowników sieci

Jednym z fundamentów tej zmiany jest nowy model generowania obrazów – GPT-Image-1.5. Nie chodzi tu tylko o tworzenie ładniejszych obrazków, choć model ten radzi sobie znacznie lepiej z zachowaniem oświetlenia, kompozycji czy podobieństwa obiektów między kolejnymi poleceniami. Kluczowe jest to, jak ChatGPT zacznie „widzieć” nasze pytania o świat rzeczywisty.

Do tej pory, gdy pytaliśmy ChatGPT o polecaną restaurację, dostawaliśmy suchy, choć zazwyczaj trafny opis. Teraz odpowiedzi będą wzbogacone o istotne obrazy wraz z wyraźnym oznaczeniem źródeł, z których pochodzą. Ale to dopiero początek:

Tappable Elements — system będzie wizualnie wyróżniać ważne osoby, miejsca czy produkty w tekście. Zamiast zadawać kolejne pytanie pomocnicze, po prostu klikniesz w wyróżnioną frazę, by dowiedzieć się więcej.

Eksploracja kontekstowa — będziesz mógł zaznaczyć dowolne słowo lub zwrot w odpowiedzi bota, aby natychmiast zgłębić dany temat bez opuszczania głównego wątku rozmowy.

Narzędzia wizualne — koniec z nudnymi liczbami przy przeliczaniu jednostek, walut czy stref czasowych. ChatGPT wprowadza interaktywne widżety, które pozwolą na łatwą zmianę wartości suwakami. Podobnie sprawa ma się z wynikami sportowymi – zamiast tekstu zobaczymy dedykowany, wizualny interfejs z wynikami na żywo.

ChatGPT jako Twoje biuro i centrum usług

OpenAI idzie o krok dalej, integrując bota z narzędziami, których używamy do pracy i załatwiania codziennych spraw. To już nie jest tylko okienko czatu, to system operacyjny, który ma nam ułatwić życie, zanim w ogóle pomyślimy o otwarciu innej aplikacji.

Dla osób używających ChatGPT do pisania tekstów, nadchodzą spore zmiany w interfejsie. Pojawi się możliwość edycji tekstu wewnątrz wiersza oraz przełączenia się na pełnoekranowy edytor. Gotowe raporty będzie można pobrać bezpośrednio jako pliki PDF lub Word, a wersje robocze maili czy wiadomości otworzymy jednym kliknięciem w dedykowanych aplikacjach pocztowych.

Prawdziwa rewolucja kryje się jednak w partnerstwach. Do grona aplikacji, z którymi ChatGPT może współpracować bezpośrednio (jak Spotify, Canva czy Expedia), dołączają giganci:

Narzędzia kreatywne i biurowe: Adobe, Airtable, Replit, Figma.

Biznes i usługi: Salesforce, OpenTable, Clay czy Lovable.

W praktyce oznacza to, że planując wieczór, nie tylko znajdziesz restaurację dzięki nowym funkcjom wizualnym, ale od razu zarezerwujesz w niej stolik przez OpenTable, nie wychodząc z rozmowy z AI.

Wszystkie te zapowiedzi układają się w logiczną całość: OpenAI chce, aby ChatGPT był pierwszym i ostatnim przystankiem podczas Twojej sesji w internecie. Choć dla wielu z nas Google wciąż pozostanie pierwszym odruchem przy szybkich pytaniach, integracja z zewnętrznymi usługami takimi jak Adobe czy OpenTable może sprawić, że wygoda po prostu wygra z przyzwyczajeniem. Ciekawe więc, jaki ruch w odpowiedzi wykona gigant z Mountain View, bo pewne jest, że nie będzie siedział bezczynnie.