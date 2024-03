Generatywna SI potrafi zdziałać prawdziwe cuda. Wszyscy już przywykli do pisanych przez nią tekstów, a także generowanych grafik, a wkrótce pojawią się tworzone przez nią filmiki. Gdy raz otworzyły się możliwości, wszyscy zainteresowani próbują wykorzystać je w jak najlepszy sposób. Najnowsze osiągnięcia naprawdę robią wrażenie.

Sztuczna inteligencja pracuje szybciej niż światło

Generowanie grafik odbywa się za pomocą procesu określanego jako “dyfuzja” (diffusion). W dużym skrócie wygląda to tak, że wykonywanych jest kilka kolejnych kroków prowadzących do osiągnięcia efektu zdefiniowanego w komendzie podanej przez użytkownika, czyli prompcie. Naukowcom z MIT – we współpracy ze specjalistami z Adobe Research – udało się zredukować ilość czynności, które musi wykonać sztuczna inteligencja w celu przeprowadzenia całego procesu i przy zapewnieniu efektu jak podczas standardowego działania.

W efekcie udało się osiągnąć imponującą szybkość generowania obrazów – 20 na sekundę, czyli możemy w ciągu minuty stworzyć 1200 unikalnych grafik o tej samej treści! Jak zdradzono, dokonano tego poprzez wytrenowanie dwóch modeli dyfuzji. I wynik taki jest możliwy do osiągnięcia przy każdym współczesnym GPU.

Jak pokazuje powyższy klip wideo, model table Diffusion 1.5 potrzebuje na stworzenie grafiki 1,4 sekundy, podczas gdy model DMD w tym czasie generuje cały szereg grafik. Jest to kompromis pomiędzy szybkością działania a wydajnością, a efekty cieszą oko. A ponieważ nie ma żadnych ograniczeń co do tego, jakie słowa wpisywać do promptów, nic nie stoi na przeszkodzie, aby popuścić wodze wyobraźni.