Robo DJ w słuchawkach obsługuje mikser i gramofon.

W szponach algorytmów

Fot. Piotr Sokołowski
Dziś z rana Deezer puścił mi kolejny utwór w wykonaniu Kuba Więcek Trio. Wieczorem Netflix podpowiada, że powinien mi się spodobać "Król Lew". Z pierwszą sugestią nie sposób się nie zgodzić, ale druga… Jak to wytłumaczyć? Błędem, czy tym, że oddałem swoje konto dzieciom? Te pytania skłoniły nas do przyjrzenia się, jak działają algorytmy stojące za systemami rekomendacji w popularnych serwisach muzycznych i filmowych.

Z ostatniego raportu Q3 Total Audience Report firmy badawczej Nielsen, analizującej konsumpcję mediów przez mieszkańców Stanów Zjednoczonych wynika, że na wybór tego, czego będziemy słuchać lub oglądać w serwisach strumieniowych wciąż największe wpływ mają propozycje przyjaciół i rodziny. Aż dwie trzecie ankietowanych przyznało, że opinie innych mają dla nich największe znaczenie. Jednak, czy opiniotwórczy znajomi naprawdę sami podejmują decyzję, czy ktoś lub coś im w tym pomaga? Może na przykład algorytm.

To ci się spodoba, czyli Netflix wie lepiej

Okazuje się, że równie duże wpływ na naciśnięcie wirtualnego klawisza play, mają mechanizmy kryjące się za serwisami, takimi jak Spotify, Netflix czy nieobecny u nas Hulu. Ponad połowa decyzji podejmowana jest pod wpływem przeglądania menu serwisów audio (52 proc.) i wideo (59 proc.). Poza tym, na około 48 proc. subskrybentów serwisów filmowych i 47 proc. usług muzycznych mają wpływ dostosowane do upodobań użytkownika propozycje dostarczane przez usługodawców. Co jeszcze ciekawsze,  34 proc. osób korzystających z mediów strumieniowych zaczyna słuchać czy oglądać pod wpływem reklamy.

Statystyki dowodzą więc, że za pozornie autonomicznymi decyzjami stoją zaawansowane algorytmy. Ufamy im dziś prawie tak jak przyjaciołom. I choć algorytmy te bywają ślepe, to z pewnością nie są głupie. Zaczniemy od anegdoty.

Reklama

W czerwcu ubiegłego roku australijska rozgłośnia radiowa Double J zapytała na Twitterze, czy zdarzyło się słuchaczom, że rekomendacje proponowane im przez Spotify okazały się w jakiś sposób zaskakujące. I czy np. puszczanie dzieciom przed snem usypiającego białego szumu lub piosenek dla najmłodszych spowodowało, że od teraz raczeni są przez Spotify głównie dziecięcymi piosenkami i nagraniami deszczu?

Okazało się, że właśnie tak jest. Częste słuchanie do snu „The Most Relaxing Playlist Ever”, puszczanie białego szumu, odgłosów oceanu czy odtwarzanie w samochodzie hitów, wybieranych przez odwożone do szkoły dzieci, skutecznie ogłupia algorytm. I dotyczy to nie tylko algorytmów Spotify. Osobiście się przekonałem, że oddając dzieciom we władanie „dorosłe” konto na Netflixie, widzę teraz głównie propozycje filmów animowanych. A jedynym krwawym filmem, który według Netflixa mógłbym obejrzeć, jest odcinek „Our planet”. A gdzie „Potrójna granica”? No cóż, dla Netflixa mam wyraźnie wyrobiony gust. Lubuję się w animowanych filmach o ludzikach Lego.

Wyraźnie więc widać, że wybory algorytmu zależą w istocie od tego, czym go nakarmimy. Z drugiej strony te kawałki cyfrowego kodu (czy raczej stojące za nimi firmy) chcą wpływać na nasz „kulturalny” gust i pokazywać nam muzykę i filmy, którą mamy polubić.

Problem w tym, że o ile wspomniane sytuacje można łatwo wytłumaczyć i naprawić (o czym piszemy na końcu tekstu), to systemom rekomendacji zdarzają się również pomyłki, na które nie mamy wpływu.

Pokazuje to dość dobitnie głośna w ostatnim tygodniu wpadka YouTube’a. Serwis Google’a pod relacjami nadawanymi na żywo podczas pożaru katedry Notre Dame w Paryżu przez stacje TV, pokazywał krótką informację z Encyklopedii Britannica na temat…. dramatycznych wydarzeń sprzed 18 lat, związanych z zamachem na World Trade Center.

Według wyjaśnień YouTube’a zawinił algorytm, który błędnie rozpoznał obraz z dwoma wieżami w płomieniach (więcej piszemy o tym tutaj). Wpadka pozostałaby tylko wpadką, ale takie feralne powiązanie mogło sugerować widzom, że pożar najsłynniejszego kościoła na świecie jest związany z atakiem terrorystycznym.

YouTube szybko zareagował i naprawił błąd, ale w przypadku niezgodności muzycznych gustów algorytmu i słuchacza musimy zadziałać sami. Dlatego spróbujemy dowiedzieć się, jak algorytm „myśli” i spróbować te myśli skierować na bardziej odpowiadające nam tory.

Zrozumieć algorytm

Serwisy streamingowe działają podobnie jak nasi przyjaciele czy znajomi, którzy polecają nam książki, muzykę czy serial. Wiedzę o tym, co robiliśmy w przeszłości, ale wiedzą też, tak jak internetowe sklepy, typu Amazon, co „kupili inni ludzie, którzy kupili to samo, co my”. To punkt wyjścia, na którym algorytmy bazujące na uczeniu maszynowym mogą określić nasz gust i polecać kolejne nowości do posłuchania czy zobaczenia. Niestety, twórcy algorytmów niechętnie dzielą się informacją o ich działaniu.

O tego typu mechanizmach w Apple Music (For You/ My Chill Mix) czy Deezerze (Flow) wiemy niewiele. Obydwie firmy, używając praktycznie tych samych słów, informują, że piosenki, jakie pojawiają się w proponowanych miksach, zależą od tego, jakiej muzyki z katalogu danego serwisu słuchamy, co lubimy (serduszka) lub czego nie lubimy i od tego, jakie gatunki oraz artystów wybraliśmy, kiedy zapisywaliśmy się do usługi. I to tyle na ten temat.

Prywatna ścieżka dźwiękowa – tak ją nazywa Deezer – na początku jest niczym tabula rasa. System rekomendacji potrzebuje czasu, by się nas „nauczyć”, czyli zbudować bibliotekę przesłuchanych utworów, na podstawie których algorytmy będą mogły szukać powiązanych z nimi gatunkowo innych piosenek. W najprostszym wydaniu oznacza to, że jeśli polubimy jakiś utwór lub wykonawcę albumu zaproponowany przez Flow to częściej usłyszymy kolejne pozycje z jego dyskografii. I w drugą stronę: trzy „odlubienia” piosenki albo artysty, oznaczają zaprzestanie ich odtwarzania w rekomendacjach (jedno „odlubienie” to „wyłączenie” na jeden dzień).

Netflix: „Everything is a recommendation”

Zupełnie inaczej jest w przypadku Netflixa. O stających za nim algorytmach można napisać osobny artykuł, bo tutaj wszystko jest rekomendacją. To nie żart – serwis, który w 1997 roku zaczął jako firma wypożyczająca pocztą filmy na DVD, dziś sama produkuje filmy i miewa związane z tym koszmary. Zgodnie z własnymi badaniami Netflix ma tylko 90 sekund, żeby zaoferować subskrybentowi jakiś serial czy film, zanim ten się znudzi i zacznie robić coś innego. Dlatego ta firma wręcz obsesyjnie stara się wszystko dopasować pod konkretnego odbiorcę.

Od lat wydaje na to niemałe pieniądze, czego przykładem może być ogłoszenie w 2006 konkursu Netflix Prize na stworzenie algorytmu przewidującego oceny filmów. Firma przeznaczyła milion dolarów dla zwycięzcy, który „znacznie [o 10 proc.] poprawi dokładność przewidywań co do tego, jak bardzo ktoś będzie się cieszył filmem w oparciu o jego preferencje”. Cel udało się zrealizować dopiero po trzech latach zespołowi BellKor’s Pragmatic Chaos, a serwis finalnie z niego w pełni nie skorzystał.

Dziś Netflix jest obsługiwany przez szereg algorytmów uczenia maszynowego, które sprawiają, że 75 proc. tego, co ludzie oglądają, pochodzi z jakiegoś rodzaju rekomendacji. Może to być spersonalizowany ranking, wygenerowana osobista strona główna, mechanizm wyszukiwania, system oceniający podobieństwa, oceny itp.

Personalizacja Netflixa to coś więcej niż sam system rekomendacji. Bo choć serwis przyznaje, że nie zbiera informacji o płci, wieku czy kolorze skóry widza, to gromadzi i analizuje dane o wszystkim innym. Firma wie, co oglądamy, kiedy oglądamy, gdzie oglądamy, w jakim dniu tygodnia, czego szukamy, co oglądają nasi „społecznościowi” znajomi, kiedy przewiniemy film, kiedy naciśniemy pauzę, na czym oglądamy itd.

Algorytmy serwisu równie dużo wiedzą o zamieszczonych w nich filmach. Z pozoru podzielone są one na każdemu znane kategorie, takie jak komedie, sensacja, filmy miłosne, dziecięce. Pod powierzchnią jednak kryje się, jak to obliczył Alexis C. Madrigal, 76 897 mikro gatunków (co powiecie na „wizualnie rewelacyjny nostalgiczny dramat zagraniczny”), które mają precyzyjnie dobrać film pod użytkownika.

W efekcie Netflix zaczyna podpowiadać nam, co mamy obejrzeć już na stronie głównej, na której rządkami układa tematycznie powiązane filmy. System nie tylko wybiera, jakie tytuły mają się tutaj znaleźć, ale także określa miejsce każdego tytułu w danym rzędzie i ustala kolejność ich wyświetlania. Bazując na zbieranych danych, lista rekomendacji może zupełnie inaczej wyglądać rano, a inaczej wieczorem. Inna również będzie na małym ekranie smartfona, a inna na telewizorze.

Na tym zabawa się nie kończy, bo każdy użytkownik może zobaczyć zupełnie inne miniaturki proponowanych wam filmów. Za tym również stoją algorytmy i poważne badania. Okazuje się, że na decyzję 80 proc. użytkowników największy wpływ mają… miniaturki filmów. Problem w tym, że Netflix ma tylko 1,8 sekundy, aby skłonić nas do kliknięcia i obejrzenia danego tytułu, bo tyle średnio tyle czasu poświęcają widzowie tym obrazkom.

Dopasowywanie okładek przez algorytmy doprowadziło nawet do małego skandalu. Jak podaje „Wall Street Journal”, podczas testu generowanych automatycznie miniaturek dla komediowego serialu „Grace i Frankie” okazało się, że więcej użytkowników kliknęło na zdjęcia bez Jane Fondy, jednej z gwiazd serialu. Z punku widzenia marketingu odpowiedź była prosta – należy usunąć Jane Fondę z zapowiedzi filmu. Tym bardziej, że ta komedia jest jedną z własnych produkcji Netflixa. Jednak dla utrzymania dobrych relacji z aktorką, miniaturki z Fondą w końcu wróciły na ekrany.

Tak w uproszczeniu dobierane są spersonalizowane okładki w zależności od tego co wcześniej oglądaliśmy. (fot. Netflix)

Na następnej stronie – Spotify robi to inaczej niż Netflix. To nie znaczy, że mniej skutecznie.

Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.