Sora 2 od Open AI podnosi poprzeczkę w fizyce wirtualnych światów

Sora 2 to nie tylko lepsza rozdzielczość, ale przede wszystkim inteligencja kontekstowa. Poprzednie systemy generatywne często wpadały w pułapkę „fantazji”, ignorując podstawowe zasady rządzące światem. Koszykówka po niecelnym rzucie mogła się teleportować do kosza, a człowiek mógł biegać po wodzie. Sora 2 ma to zmienić.

Model został nauczony realistycznej dynamiki fizycznej. Potrafi generować złożone sekwencje ruchu:

Sport i grawitacja — od rutynowych ćwiczeń gimnastycznych na olimpiadzie po skomplikowane akrobacje na desce wiosłowej (paddleboarding backflips), które szanują siłę wyporu i sztywność materiałów. Nawet złożone potrójne axle w wykonaniu wirtualnych postaci są renderowane z niesamowitą wiernością.

Realizm awarii — jedną z kluczowych innowacji jest umiejętność dokładnego modelowania porażek, a nie tylko sukcesów. Oznacza to, że jeśli fizyka wskazuje, że coś się nie uda, wideo to pokaże, co jest ogromnym krokiem w kierunku realistycznej symulacji świata.

Dźwięk i kontrola — Sora 2 utrzymuje synchronizację dialogów i efektów dźwiękowych oraz oferuje większą sterowalność – jest w stanie realizować szczegółowe instrukcje wielokadrowe, zachowując przy tym spójność świata w całej sekwencji wideo.

System oferuje twórcom możliwość pracy w różnych konwencjach wizualnych – od fotorealizmu, przez styl filmowy, po estetykę anime. W praktyce oznacza to, że użytkownicy mogą precyzyjniej dostosowywać wygląd generowanych materiałów do swoich potrzeb. Firma dodała też jedną z najbardziej innowacyjnych i być może kontrowersyjnych funkcji jest możliwość dodawania do generowanych klipów elementów z prawdziwego świata za pomocą „cameos”. Użytkownicy mogą wgrać krótki materiał wideo i próbkę audio, aby umieścić cyfrowe reprezentacje siebie, znajomych lub obiektów w dowolnym wideo wygenerowanym przez Sorę.

Sora App, czyli TikTok, ale z filmikami AI

Wraz z premierą Sora 2, OpenAI udostępniło nową aplikację Sora na iOS. To mobilne centrum dowodzenia, które pozwala użytkownikom na tworzenie i remiksowanie wideo, a także wykorzystywanie „cameos” od innych osób. Aplikacja zawierać będzie kanał wideo z treściami generowanymi przez AI. To śmiałe posunięcie w kierunku platformy społecznościowej, jednak firma jest świadoma potencjalnych zagrożeń związanych z uzależnieniem, doomscrollingiem i algorytmami optymalizowanymi pod maksymalne zaangażowanie.

Algorytmy rekomendacyjne można dostosowywać za pomocą instrukcji w języku naturalnym, co teoretycznie daje użytkownikom większą kontrolę nad tym, co oglądają. System zabezpieczeń działa również na etapie generowania treści, co ma zapobiegać powstawaniu nieodpowiednich materiałów. Dla nastolatków wprowadzono domyślne limity czasowe, a rodzice mogą zarządzać ustawieniami przez kontrolę rodzicielską w ChatGPT. Moderacja obejmuje zarówno automatyczne skanowanie, jak i ludzki przegląd, plus możliwość zgłaszania treści przez użytkowników. To kompleksowe podejście i miejmy nadzieję, że okaże się skuteczne.

Obecnie aplikacja Sora jest dostępna do pobrania na iOS, gdzie można zapisać się na listę oczekujących. Pierwsi użytkownicy otrzymają dostęp do Sora 2 za darmo w ramach wczesnego wdrożenia, a subskrybenci ChatGPT Pro otrzymają dodatkowo dostęp do modelu wyższej jakości – Sora 2 Pro, obok już istniejącego modelu Sora 1 Turbo. Aplikacja wymaga iOS 18.0 lub nowszego, zajmuje około 187 MB i obsługuje język polski. Rating wiekowy 13+ odzwierciedla politykę bezpieczeństwa platformy.

Premiera Sora 2 i towarzyszącej aplikacji to niewątpliwie istotny krok w rozwoju technologii generowania wideo przez AI. Model podnosi standardy jakości i wprowadza nowe możliwości kontroli. Pytanie brzmi, czy użytkownicy przyjmą nowe podejście do tworzenia i konsumpcji treści, oraz jak szybko konkurencja zareaguje na ten ruch. Sukces platformy będzie zależał nie tylko od technologii, ale także od tego, na ile uda się zbudować społeczność wokół świadomego tworzenia.