Ten zaawansowany silnik jest zdolny do wygenerowania pełnowymiarowego, trzyminutowego utworu o złożonej strukturze. Gigant z Mountain View celuje w profesjonalnych deweloperów gier, twórców wideo, a także muzyków szukających inspiracji, dając im do ręki wirtualnego kompozytora, który rozumie różnicę między zwrotką a refrenem i potrafi dopasować nastrój utworu do przesłanego zdjęcia.
Lyria 3 Pro – studio nagraniowe w algorytmie
Największą i najbardziej wyczekiwaną zmianą w modelu Lyria 3 Pro jest wydłużenie czasu trwania generowanej ścieżki do 3 minut. To magiczna granica, która pozwala na stworzenie kompletnej piosenki z tradycyjnym układem, na który składa intro, zwrotki, refreny i mostek. Google chwali się, że model posiada teraz „profesjonalną świadomość strukturalną”, co oznacza, że utwór nie jest tylko losowym zbiorem dźwięków, ale spójną kompozycją zachowującą konsekwencję muzyczną od pierwszej do ostatniej nuty.
Użytkownicy zyskali niespotykaną dotąd precyzję w sterowaniu modelem za pomocą języka naturalnego. Możemy teraz określić nie tylko gatunek (od popu po funk czy Motown), ale również:
- Tempo — dokładne ustawienie rytmu (np. szybki, wolny), aby muzyka idealnie współgrała z dynamiką obrazu.
- Synchronizacja tekstu — możemy zaplanować progresję piosenki i precyzyjnie wskazać, w którym momencie mają zacząć się i skończyć poszczególne partie wokalne.
- Multimodalność — to prawdziwy hit, do modelu można przesłać zdjęcie, które posłuży za inspirację. AI przeanalizuje atmosferę fotografii i na tej podstawie dobierze styl oraz nastrój generowanej muzyki.
Dla deweloperów przygotowano dwa warianty – Lyria 3 Pro, stworzony do produkcji utworów jakości studyjnej, oraz Lyria 3 Clip, zoptymalizowany pod kątem szybkości, idealny do błyskawicznego tworzenia pętli tła (loopów) czy materiałów do mediów społecznościowych.
Gdzie można przetestować Lyrię 3 Pro?
Na szczęście, Google nie trzyma nowej technologii w zamkniętym laboratorium – model trafia właśnie do szerokiego wachlarza usług. Programiści mogą korzystać z niego w Google AI Studio oraz przez API w Vertex AI, co pozwoli na masowe tworzenie ścieżek dźwiękowych np. w branży gamingowej. Z kolei użytkownicy biznesowi znajdą model w usłudze Google Vids, gdzie dodawanie autorskiej muzyki do prezentacji i filmów firmowych stanie się kwestią kilku kliknięć.
Dla nas, „zwykłych” użytkowników subskrybujących pakiety AI Pro i Ultra, Lyria 3 Pro staje się dostępna bezpośrednio w aplikacji Gemini. Możemy tam eksperymentować z tworzeniem dłuższych utworów, a nawet wykorzystać AI do stworzenia spersonalizowanego budzika, który rano wyśpiewa nam prognozę pogody i plan dnia. Muzycy z kolei mogą sprawdzić model w narzędziu ProducerAI, które pomaga w iterowaniu pomysłów na piosenki.
Czytaj też: Koniec łatwego generowania filmów AI. OpenAI zamyka aplikację Sora
Ważnym aspektem, na który Google kładzie ogromny nacisk, jest etyka i transparentność. Każdy utwór wygenerowany przez Lyrię zawiera cyfrowy znak wodny SynthID. Jest on niesłyszalny dla ludzkiego ucha, ale pozwala na jednoznaczną identyfikację treści jako stworzonej przez AI, nawet jeśli plik został później poddany obróbce czy kompresji. To bardzo dobra wiadomość, która może przynajmniej trochę utrudnić życie osobom, które chciałyby prezentować te utwory jako dzieło własnego „głosu”.
Chociaż to na pewno wielki postęp i ułatwienie dla sporej grupy osób, ja mam trochę mieszane uczucia. Już teraz na Spotify czy innych serwisach streamingowych roi się od utworów generowanych przez AI, a w ten sposób będzie ich tylko przybywać. Do mnie samej to nie trafia, lubię „czuć” człowieka stojącego za muzyką (tak samo zresztą jak za grafikami czy tekstami), ale entuzjastów tego rodzaju piosenek nie brakuje. Cóż, tu już chyba zależy od własnych preferencji. Tak czy inaczej, Lyria 3 Pro na pewno przyczyni się do wzrostu dostępności muzyki AI, więc mam nadzieję, że przynajmniej platformy muzyczne zaczną dawać nam narzędzia, by ją filtrować i wyrzucać ze swoich miksów czy losowych list odtwarzania.
Źrodło: Google
