Twórca Midjourney przyznaje bez cienia żenady: tak, kradniemy miliony obrazków z internetu i co z tego?

Kontrowersje związane z Midjourney i innymi generatorami obrazów działającymi w oparciu o uczenie maszynowe pojawiły się niemal natychmiast, gdy pierwsze z nich stały się dostępne dla użytkowników. Wraz ze wzrostem jakości uzyskiwanych dzięki AI grafik sytuacja nabiera jednak rumieńców.
Dennis Sylvester Hurd - Midjourney - Main Street in 1866

Dennis Sylvester Hurd – Midjourney – Main Street in 1866

Tak się bowiem składa, że uczenie maszynowe, by było skuteczne, musi mieć się na czym uczyć. By AI było w stanie stworzyć przekonujący obraz, należy wcześniej „nakarmić” go możliwie dużą bazą danych do analizy. Zdjęcia, prace graficzne, malarskie – im więcej, tym lepiej.

the portal
call me Kiss, „The Portal”

Kradniemy i się do tego przyznajemy

Jak wygląda w praktyce taki proces opisał w wywiadzie dla „Forbesa” CEO Midjourney, David Holz:

To po prostu wielki kawałek internetu. Korzystamy z publicznie dostępnych otwartych zbiorów danych i szkolimy (Midjourney) z ich pomocą. To coś, co każdy robi. Nie jesteśmy wybredni. Postęp naukowy powoduje, że potrzebujemy coraz mniej danych do uzyskania dobrych jakościowo modeli. Za kilka lat, kiedy naprawdę ogarniemy, jak to robić, będziemy mieć takie, które dobry efekt osiągną niemal z niczego

Szkolenie na materiałach pobranych jak leci z internetu rodzi oczywiście pytanie, czy ktokolwiek pokusił się o zapytanie o zgodę autorów prac lub posiadaczy praw autorskich do nich. David Holtz w tej kwestii powiedział:

Nie, nie ma sposoby, by pobrać setki milionów obrazów i wiedzieć, skąd one są. Byłoby oczywiście fajnie, gdyby zawierały zabudowane metadane o posiadaczu praw autorskich, ale to i tak nie pomoże: nie są zarejestrowane. A więc nie ma sposobu, by znaleźć grafikę w internecie, automatycznie odnaleźć jej właściciela i w jakikolwiek sposób potwierdzić jego prawa.

Krótko mówiąc, w Midjourney mamy pana zdjęcia i co pan nam zrobi? Z dalszych wypowiedzi wynika bowiem, że nie ma póki co sposobu by artysta mógł zastrzec, by jego prace nie były wykorzystywane w szkoleniu AI – najlepsze, co mogą osiągnąć teraz, to „sprawdzamy, czy jest to wykonalne”. A to zdecydowanie zbyt mało.

Midjourney: 25 variations of an industrial warehouse
Kevin Dooley, „Midjourney: 25 variations of an industrial warehouse”

Nie tylko Midjourney. Sprawa wbrew pozorom jest poważna

Nie chodzi bowiem o zabawę. Tylko początkowo obrazy generowane przez AI nadawały się wyłącznie do tego. Postęp spowodował jednak, że obecnie jakość sztucznie tworzonych przez Midjourney, Dall-E czy Stable Diffusion grafik nie odbiega poziomem od prac, które mógłby narysować, namalować czy sfotografować człowiek. Poważnym sygnałem ostrzegawczym jest pierwsza nagroda w dorocznym konkursie Colorado State Fair’s, którą w jednej z kategorii wygrała grafika Jasona Allena „Théâtre D’opéra Spatial” utworzona właśnie za pomocą Midjourney. Mimo podpisania jej tak, by nie budziło wątpliwości jak powstała i tak sprowadziła na głowę Allena serię oskarżeń o oszustwo.

Jason Allen - Théâtre D’opéra Spatial
Jason Allen – Théâtre D’opéra Spatial

Zaniepokojenie artystów jest oczywiste i zrozumiałe – także mój redakcyjny kolega Łukasz Kotkowski dał temu wyraz w swoim felietonie. Nieodległe mogą być bowiem czasy, w której algorytm utworzy potrzebną grafikę szybciej i taniej, niż opłacony grafik, który musiał poświęcić parę lat na nauczenie się swojej pracy. Kto by się wtedy przejmował, że powstała ona na bazie kradzionych prac innych ludzi? Skoro nie można wprost wskazać autora, którego prawa naruszono? Już dziś przecież duże serwisy stockowe akceptują grafiki wygenerowane przez AI.

Zdaję sobie oczywiście sprawę, że marudzę i czarnowidzę. Tak jak pojawienie się streamingu muzyki nie zabiło płyty CD i winylowej, a telewizja nie spowodowała odejścia w niebyt radia, tak zapewne i Midjourney et consortes nie zlikwidują zapotrzebowania na prace ludzi. Sądzę jednak, że jak najszybciej należałoby skończyć z wolną amerykanką i poddać temat niezbędnym regulacjom prawnym, jak zaczyna mieć to miejsce np. w Chinach. Póki twórcy AI nie uznają, że mają prawo do wszystkiego co stworzyliśmy i nie będzie za późno.