Veo 2 to zaawansowany model do generowania wideo opracowany przez Google DeepMind, oficjalnie zaprezentowany w grudniu 2024 roku. Jest następcą oryginalnego modelu Veo i oferuje znacznie ulepszone możliwości w zakresie jakości, długości i realizmu tworzonych filmów. Może generować wideo w rozdzielczości do 4K (4096 x 2160 pikseli) o długości do 2 minut, co jest dużym postępem względem wcześniejszych modeli generujących krótsze i mniej szczegółowe klipy. Zaawansowane rozumienie fizyki i ruchu pozwala mu tworzyć naturalne, realistyczne animacje, np. odwzorowanie płynów, ruchów postaci czy interakcji z otoczeniem. Użytkownicy mogą definiować różne kąty, ruchy i efekty kamery, co umożliwia tworzenie profesjonalnie wyglądających ujęć i filmów o różnorodnych stylach kinematograficznych.

Na uwagę zasługuje wysoka jakość wizualna i redukcja artefaktów, dzięki czemu wygenerowane filmy wyglądają bardzo realistycznie i rzadko zawierają błędy, np. dodatkowe palce czy nienaturalne elementy. Model potrafi wiernie realizować zarówno proste, jak i złożone instrukcje tekstowe, co pozwala na szerokie zastosowania kreatywne, od animacji postaci po filmy o charakterze kinowym. Wykorzystanie zaawansowanego modelu Veo 2 ma zapewnić realistyczne i szczegółowe rezultaty, otwierając nowe możliwości kreatywne dla użytkowników bez specjalistycznej wiedzy. Użytkownicy Gemini Advanced mogą teraz generować 8-sekundowe klipy wideo w rozdzielczości 720p (format 16:9 w pliku MP4) poprzez wybranie modelu Veo 2 i opisanie sceny za pomocą promptu tekstowego.

Warto tu pamiętać, że im bardziej szczegółowy opis, tym większą mamy kontrolę nad ostatecznym rezultatem. Gemini umożliwia proste udostępnianie filmów na urządzeniach mobilnych (TikTok, YouTube) oraz w przeglądarce poprzez pobranie pliku lub wygenerowanie publicznego linku do umieszczenia na stronach internetowych, lub udostępnienia e-mailem. Funkcja generowania filmów jest obecnie wprowadzana dla subskrybentów Gemini Advanced na całym świecie w przeglądarce i na urządzeniach mobilnych. Proces ten potrwa kilka tygodni i jest dostępny we wszystkich językach obsługiwanych przez Gemini. Generowanie filmów w Gemini i Whisk jest częścią pakietu Google One AI Premium.

Google zapewnia, że podjęto wszelkie działania zapewniające bezpieczeństwo generowania wideo (przeprowadzono obszerne testy penetracyjne i oceny mające na celu zapobieganie tworzeniu treści naruszających zasady. Wszystkie wygenerowane filmy będą oznaczane cyfrowym znakiem wodnym SynthID, wskazującym na ich sztuczne pochodzenie. Aktualnie, dostęp do Gemini Advanced jest możliwy w ramach subskrypcji Google One AI Premium. Cena tej subskrypcji wynosi równowartość 20 dolarów miesięcznie. Poza dostępem do najbardziej zaawansowanego modelu AI od Google zyskujemy solidne 2 TB miejsca na dane w chmurze (w darmowej wersji raptem 15 GB) oraz integrację Gemini z Gmail, Dokumentami i innymi usługami Google.