Robo DJ w słuchawkach obsługuje mikser i gramofon.

W szponach algorytmów

Fot. Piotr Sokołowski
Dziś z rana Deezer puścił mi kolejny utwór w wykonaniu Kuba Więcek Trio. Wieczorem Netflix podpowiada, że powinien mi się spodobać "Król Lew". Z pierwszą sugestią nie sposób się nie zgodzić, ale druga… Jak to wytłumaczyć? Błędem, czy tym, że oddałem swoje konto dzieciom? Te pytania skłoniły nas do przyjrzenia się, jak działają algorytmy stojące za systemami rekomendacji w popularnych serwisach muzycznych i filmowych.

Z ostatniego raportu Q3 Total Audience Report firmy badawczej Nielsen, analizującej konsumpcję mediów przez mieszkańców Stanów Zjednoczonych wynika, że na wybór tego, czego będziemy słuchać lub oglądać w serwisach strumieniowych wciąż największe wpływ mają propozycje przyjaciół i rodziny. Aż dwie trzecie ankietowanych przyznało, że opinie innych mają dla nich największe znaczenie. Jednak, czy opiniotwórczy znajomi naprawdę sami podejmują decyzję, czy ktoś lub coś im w tym pomaga? Może na przykład algorytm.

To ci się spodoba, czyli Netflix wie lepiej

Okazuje się, że równie duże wpływ na naciśnięcie wirtualnego klawisza play, mają mechanizmy kryjące się za serwisami, takimi jak Spotify, Netflix czy nieobecny u nas Hulu. Ponad połowa decyzji podejmowana jest pod wpływem przeglądania menu serwisów audio (52 proc.) i wideo (59 proc.). Poza tym, na około 48 proc. subskrybentów serwisów filmowych i 47 proc. usług muzycznych mają wpływ dostosowane do upodobań użytkownika propozycje dostarczane przez usługodawców. Co jeszcze ciekawsze,  34 proc. osób korzystających z mediów strumieniowych zaczyna słuchać czy oglądać pod wpływem reklamy.

Statystyki dowodzą więc, że za pozornie autonomicznymi decyzjami stoją zaawansowane algorytmy. Ufamy im dziś prawie tak jak przyjaciołom. I choć algorytmy te bywają ślepe, to z pewnością nie są głupie. Zaczniemy od anegdoty.

Reklama

W czerwcu ubiegłego roku australijska rozgłośnia radiowa Double J zapytała na Twitterze, czy zdarzyło się słuchaczom, że rekomendacje proponowane im przez Spotify okazały się w jakiś sposób zaskakujące. I czy np. puszczanie dzieciom przed snem usypiającego białego szumu lub piosenek dla najmłodszych spowodowało, że od teraz raczeni są przez Spotify głównie dziecięcymi piosenkami i nagraniami deszczu?

Okazało się, że właśnie tak jest. Częste słuchanie do snu „The Most Relaxing Playlist Ever”, puszczanie białego szumu, odgłosów oceanu czy odtwarzanie w samochodzie hitów, wybieranych przez odwożone do szkoły dzieci, skutecznie ogłupia algorytm. I dotyczy to nie tylko algorytmów Spotify. Osobiście się przekonałem, że oddając dzieciom we władanie „dorosłe” konto na Netflixie, widzę teraz głównie propozycje filmów animowanych. A jedynym krwawym filmem, który według Netflixa mógłbym obejrzeć, jest odcinek „Our planet”. A gdzie „Potrójna granica”? No cóż, dla Netflixa mam wyraźnie wyrobiony gust. Lubuję się w animowanych filmach o ludzikach Lego.

Wyraźnie więc widać, że wybory algorytmu zależą w istocie od tego, czym go nakarmimy. Z drugiej strony te kawałki cyfrowego kodu (czy raczej stojące za nimi firmy) chcą wpływać na nasz „kulturalny” gust i pokazywać nam muzykę i filmy, którą mamy polubić.

Problem w tym, że o ile wspomniane sytuacje można łatwo wytłumaczyć i naprawić (o czym piszemy na końcu tekstu), to systemom rekomendacji zdarzają się również pomyłki, na które nie mamy wpływu.

Pokazuje to dość dobitnie głośna w ostatnim tygodniu wpadka YouTube’a. Serwis Google’a pod relacjami nadawanymi na żywo podczas pożaru katedry Notre Dame w Paryżu przez stacje TV, pokazywał krótką informację z Encyklopedii Britannica na temat…. dramatycznych wydarzeń sprzed 18 lat, związanych z zamachem na World Trade Center.

Według wyjaśnień YouTube’a zawinił algorytm, który błędnie rozpoznał obraz z dwoma wieżami w płomieniach (więcej piszemy o tym tutaj). Wpadka pozostałaby tylko wpadką, ale takie feralne powiązanie mogło sugerować widzom, że pożar najsłynniejszego kościoła na świecie jest związany z atakiem terrorystycznym.

YouTube szybko zareagował i naprawił błąd, ale w przypadku niezgodności muzycznych gustów algorytmu i słuchacza musimy zadziałać sami. Dlatego spróbujemy dowiedzieć się, jak algorytm „myśli” i spróbować te myśli skierować na bardziej odpowiadające nam tory.

Zrozumieć algorytm

Serwisy streamingowe działają podobnie jak nasi przyjaciele czy znajomi, którzy polecają nam książki, muzykę czy serial. Wiedzę o tym, co robiliśmy w przeszłości, ale wiedzą też, tak jak internetowe sklepy, typu Amazon, co „kupili inni ludzie, którzy kupili to samo, co my”. To punkt wyjścia, na którym algorytmy bazujące na uczeniu maszynowym mogą określić nasz gust i polecać kolejne nowości do posłuchania czy zobaczenia. Niestety, twórcy algorytmów niechętnie dzielą się informacją o ich działaniu.

O tego typu mechanizmach w Apple Music (For You/ My Chill Mix) czy Deezerze (Flow) wiemy niewiele. Obydwie firmy, używając praktycznie tych samych słów, informują, że piosenki, jakie pojawiają się w proponowanych miksach, zależą od tego, jakiej muzyki z katalogu danego serwisu słuchamy, co lubimy (serduszka) lub czego nie lubimy i od tego, jakie gatunki oraz artystów wybraliśmy, kiedy zapisywaliśmy się do usługi. I to tyle na ten temat.

Prywatna ścieżka dźwiękowa – tak ją nazywa Deezer – na początku jest niczym tabula rasa. System rekomendacji potrzebuje czasu, by się nas „nauczyć”, czyli zbudować bibliotekę przesłuchanych utworów, na podstawie których algorytmy będą mogły szukać powiązanych z nimi gatunkowo innych piosenek. W najprostszym wydaniu oznacza to, że jeśli polubimy jakiś utwór lub wykonawcę albumu zaproponowany przez Flow to częściej usłyszymy kolejne pozycje z jego dyskografii. I w drugą stronę: trzy „odlubienia” piosenki albo artysty, oznaczają zaprzestanie ich odtwarzania w rekomendacjach (jedno „odlubienie” to „wyłączenie” na jeden dzień).

Netflix: „Everything is a recommendation”

Zupełnie inaczej jest w przypadku Netflixa. O stających za nim algorytmach można napisać osobny artykuł, bo tutaj wszystko jest rekomendacją. To nie żart – serwis, który w 1997 roku zaczął jako firma wypożyczająca pocztą filmy na DVD, dziś sama produkuje filmy i miewa związane z tym koszmary. Zgodnie z własnymi badaniami Netflix ma tylko 90 sekund, żeby zaoferować subskrybentowi jakiś serial czy film, zanim ten się znudzi i zacznie robić coś innego. Dlatego ta firma wręcz obsesyjnie stara się wszystko dopasować pod konkretnego odbiorcę.

Od lat wydaje na to niemałe pieniądze, czego przykładem może być ogłoszenie w 2006 konkursu Netflix Prize na stworzenie algorytmu przewidującego oceny filmów. Firma przeznaczyła milion dolarów dla zwycięzcy, który „znacznie [o 10 proc.] poprawi dokładność przewidywań co do tego, jak bardzo ktoś będzie się cieszył filmem w oparciu o jego preferencje”. Cel udało się zrealizować dopiero po trzech latach zespołowi BellKor’s Pragmatic Chaos, a serwis finalnie z niego w pełni nie skorzystał.

Dziś Netflix jest obsługiwany przez szereg algorytmów uczenia maszynowego, które sprawiają, że 75 proc. tego, co ludzie oglądają, pochodzi z jakiegoś rodzaju rekomendacji. Może to być spersonalizowany ranking, wygenerowana osobista strona główna, mechanizm wyszukiwania, system oceniający podobieństwa, oceny itp.

Personalizacja Netflixa to coś więcej niż sam system rekomendacji. Bo choć serwis przyznaje, że nie zbiera informacji o płci, wieku czy kolorze skóry widza, to gromadzi i analizuje dane o wszystkim innym. Firma wie, co oglądamy, kiedy oglądamy, gdzie oglądamy, w jakim dniu tygodnia, czego szukamy, co oglądają nasi „społecznościowi” znajomi, kiedy przewiniemy film, kiedy naciśniemy pauzę, na czym oglądamy itd.

Algorytmy serwisu równie dużo wiedzą o zamieszczonych w nich filmach. Z pozoru podzielone są one na każdemu znane kategorie, takie jak komedie, sensacja, filmy miłosne, dziecięce. Pod powierzchnią jednak kryje się, jak to obliczył Alexis C. Madrigal, 76 897 mikro gatunków (co powiecie na „wizualnie rewelacyjny nostalgiczny dramat zagraniczny”), które mają precyzyjnie dobrać film pod użytkownika.

W efekcie Netflix zaczyna podpowiadać nam, co mamy obejrzeć już na stronie głównej, na której rządkami układa tematycznie powiązane filmy. System nie tylko wybiera, jakie tytuły mają się tutaj znaleźć, ale także określa miejsce każdego tytułu w danym rzędzie i ustala kolejność ich wyświetlania. Bazując na zbieranych danych, lista rekomendacji może zupełnie inaczej wyglądać rano, a inaczej wieczorem. Inna również będzie na małym ekranie smartfona, a inna na telewizorze.

Na tym zabawa się nie kończy, bo każdy użytkownik może zobaczyć zupełnie inne miniaturki proponowanych wam filmów. Za tym również stoją algorytmy i poważne badania. Okazuje się, że na decyzję 80 proc. użytkowników największy wpływ mają… miniaturki filmów. Problem w tym, że Netflix ma tylko 1,8 sekundy, aby skłonić nas do kliknięcia i obejrzenia danego tytułu, bo tyle średnio tyle czasu poświęcają widzowie tym obrazkom.

Dopasowywanie okładek przez algorytmy doprowadziło nawet do małego skandalu. Jak podaje „Wall Street Journal”, podczas testu generowanych automatycznie miniaturek dla komediowego serialu „Grace i Frankie” okazało się, że więcej użytkowników kliknęło na zdjęcia bez Jane Fondy, jednej z gwiazd serialu. Z punku widzenia marketingu odpowiedź była prosta – należy usunąć Jane Fondę z zapowiedzi filmu. Tym bardziej, że ta komedia jest jedną z własnych produkcji Netflixa. Jednak dla utrzymania dobrych relacji z aktorką, miniaturki z Fondą w końcu wróciły na ekrany.

Tak w uproszczeniu dobierane są spersonalizowane okładki w zależności od tego co wcześniej oglądaliśmy. (fot. Netflix)

Spotify robi to jeszcze inaczej

Spotify, podobnie jak Netflix, korzysta z bardzo zaawansowanych narzędzi do tworzenia systemu rekomendacji, którego ukoronowaniem jest Odkryj w tym tygodniu – publikowana co poniedziałek lista 30 utworów wybranych dla każdego z milionów subskrybentów z osobna.

Przygotowanie tak dużej liczby pasujących każdemu słuchaczowi propozycji jest bardzo wymagającym zadaniem. Spotify, tak jak Netflix, bardzo szczegółowo bierze pod uwagę różne czynniki, np. historię tego, co odtwarzaliśmy, filtrowanie kolaboracyjne (czyli: „klient, który kupił ten przedmiot również kupił to i to…”) oraz przetwarzanie języka naturalnego, pomagające „zrozumieć” blogi muzyczne, bądź tytuły list odtwarzania, jakie wymyślili im użytkownicy.

Serwis wykorzystuje w tym celu wiedzę pozyskaną przez firmę Echo Nest (nieco więcej o niej w dalszej części), którą kupił w 2014 roku. Jednak tym, co wyróżnia serwis jest nowatorski sposób analizowania 3 miliardów playlist stworzonych przez użytkowników. Właśnie to rozwiązanie ma zapewnić przewagę nad konkurencją, która przecież sprzedaje dokładnie ten sam towar. W nieco jedynie innym opakowaniu.

Reklama

Według słów Matthew Ogle’a, który nadzoruje usługę Odkryj w tym tygodniu, serwis bierze pod uwagę dosłowne każdą listę odtwarzania. Poczynając od profesjonalnie przygotowanych playlist, takich jak RapCaviar, po składankę zrobioną na wiosennego grilla z przyjaciółmi. W zależności od popularności, playlisty otrzymują odpowiednie wagi i są porównywane z utworzonymi przez nas listami oraz naszym indywidualnym muzycznym gustem, ustalonym przez Echo Nest.

Najprościej mówiąc, jeśli algorytm zauważy, że nasze dwie ulubione piosenki pojawiają się na obcych listach odtwarzania wraz z trzecią piosenką, której jeszcze za jego pomocą nie słuchaliśmy, to oznacza, że warto ją dołączyć do kolejnej poniedziałkowej listy Odkryj w tym tygodniu.

Ogle zapewnia, że technologia stojąca za systemem rekomendacji Spotify wspierana dodatkowo 150-osobowym zespołem osób nadzorujących pracę algorytmów, ma zagwarantować każdemu muzyczną ucztę co tydzień. Słuchacz ma być zadowolony nawet wtedy, kiedy trafią mu się zupełnie niszowe kawałki. O ile znalazły się na playlistach choćby 20 innych subskrybentów.

Z punktu widzenia Spotify, Odkryj w tym tygodniu sprawdza się bardzo dobrze, bo użytkownicy, którzy z niego korzystają spędzają na odtwarzaniu muzyki 80% czasu, który poświęcają najbardziej hardcore’owi słuchacze. Więcej informacji o technikaliach stojących za co tygodniowymi propozycjami znajdziecie na poniższej prezentacji Chrisa Johnsona:

Idziemy na łatwiznę

Ludovic Hunter-Tilney z „Financial Times” zwraca uwagę, że utopijna, wydawałoby się, wizja biblioteki, w której można znaleźć wszystkie książki świata, przedstawiona przez Jorge Luisa Borgesa w opowiadaniu „Biblioteka Babel”, zaczyna się realizować w muzycznych serwisach streamingowych. To dzięki nim otrzymujemy dostęp do dziesiątek milionów utworów i wolność wyboru.

Teoretycznie, możemy słuchać hitów głównego nurtu, bądź wybierać niszowe produkcje, o ile tylko te trafiły do jakiegoś serwisu. W praktyce konieczność ciągłego podejmowania muzycznych wyborów doprowadziła do tego, że zdajemy się na inteligencję coraz sprawniejszych algorytmów. Idziemy na łatwiznę, co pokazują przytoczone wcześniej badania Nielsena i wygląda na to, że to daje nam satysfakcję. Tak przynajmniej wynika z niewielkiego badania studenta Johny’ego Sancheza z Texas Christian University, z którego wynika, że młodzi ludzie (12-23 lata) czują się bardziej usatysfakcjonowani im bardziej zadba o nich aplikacja.

Podobnie dzieje się teraz ze mną. Pisząc ten artykuł od kilku godzin słucham miłego jazzu. Jest mi przyjemnie, ale czy to rzeczywiście daje mi satysfakcję odkrywania nowej muzyki? Nie do końca, bo po pewnym czasie uświadamiam sobie, że poruszam się cały czas w tym samym „bezpiecznym” muzycznym sosie. Utwory mi się podobają, ale są czasem aż zbyt podobne. Mój jazz zamienia się w muzykę z windy czy restauracji.

Może być też zupełnie odwrotnie. Ktoś kto słucha pulsujących, zachęcających do ruchu hitów cały czas będzie napędzany podobną muzyką. Wolność wyboru przegrywa z lenistwem i super precyzyjnymi algorytmami do określania naszych muzycznych gustów, takimi jak Musical Genome Project.

Mechanizm stworzony w 2000 roku przez Pandorę – niedostępną w Polsce internetową osobistą stację radiową  – każdy utwór muzyczny opisuje niczym genom. Nadaje mu ponad 450 muzycznych atrybutów (od banalnych, takich jak tempo czy gatunek, po użyte w utworze instrumenty), by dopasować go do innych utworów i puścić jako następny.

Wspomniany już wcześniej, należący do Spotify, Echo Nest szczyci się, że posiada trylion punktów danych, pochodzących z 35 milionów piosenek i informacji o 2,5 milionach artystów, którymi może opisać nasze nawyki słuchania. Z kolei, Polyphonic HMI stworzył Hit Song Science – narzędzie, które ma przewidzieć sukces danego utworu poprzez porównanie go do poprzednich hitów.

Rezultatem tego wszystkiego jest zjawisko ochrzczone „brzmieniem Spotify”. Wszystkie serwisy streamingowe przy takim bogactwie utworów muszą walczyć o uwagę słuchacza i to bez względu na to, czy słuchamy (jak ja jazzu) czy lubimy Drake’a albo Eda Sheerana. Króluje tu prosta zasada: lubimy to, co już wcześniej słyszeliśmy. Dlatego algorytmy serwują nam podobnie brzmiące utwory, a producenci specjalnie pod nie realizują nowe utwory.

Brzmienie Spotify to z jednej strony krótki wstęp, który zmniejszył się z ponad 20 sekund w latach 80. do mniej niż 5 sekund. Wszystko po to, aby nas zatrzymać przy utworze na tyle długo, żeby platforma mogła go uznać za odtworzony i dodać do honorarium artysty. Z drugiej strony, w pierwszych sekundach utworu musi znaleźć się pożywka dla algorytmów. Jakiś mocny akcent, który zostanie wychwycony i skorelowany z innymi hitami, np. gościnny występ bardziej znanego artysty czy wybitny sampel.

Reklama

W efekcie hity brzmią bardzo podobnie, a spersonalizowane playlisty są coraz bardziej uładzone i chilloutowe. Przepis jak uciec od algorytmów podaje Kaitlyn Tiffany z The Verge, która poleca obserwować playlisty robione przez znających się na muzyce ludzi; czytać blogi muzyczne i słuchać przyjaciół.

A jest co odkrywać, bo w 2013 roku na samym tylko Spotify, 20 proc. utworów nie zostało nigdy odtworzonych! Wystarczy zajrzeć na stronę Forgotify i dać im szansę. Czekają miliardy dziewiczych brzmień!

Przepis jak poprawić nietrafione rekomendacje

Wpadki w działaniu algorytmów, takie jak ta z katedrą Notre Dame należą do wyjątków. Bałagan spowodowany przez ciągłe odtwarzanie kilku utworów czy wspólne korzystanie z jednego konta przez kilka osób jest na porządku dziennym. Winna temu jest nasza przeszłość. Jakby bowiem nie były wyrafinowane mechanizmy stojące za algorytmami to zawsze za nimi będzie stać nasza historia oglądania czy słuchania. Co zatem robić kiedy propozycje, które otrzymujemy zaczynają znacząco odbiegać od naszego gustu?

Polub albo nie
Problem w tym, że nie we wszystkich serwisach można sobie na taki radykalizm pozwolić. Ale są inne metody w Deezerze czy Apple Music, by wpływać na system rekomendacji (oczywiście poza tym co sami wybierzemy). Mamy przycisk, który sprawi, że serwisy nie będą (albo wręcz przeciwnie) polecać nam więcej tego typu utworów lub podobnych artystów.

Listę For You można jeszcze próbować poprawić, jak to sugeruje Andrew Orr z Mac Obsserver, łącząc się z Apple Music Connect. Jest to mikro sieć społecznościowa, która pozwala śledzić ulubionych artystów i otrzymywać aktualne informacje o tym, co robią, np. o nowych utworach czy koncertach. Jeszcze innym sposobem na For You jest zaprzestanie korzystania przez system rekomendacji z gromadzonej historii odtwarzania (Settings | Music | Use Listening History).

W Spotify Discover Weekly nietrafione rekomendacje można poprawić słuchając tego, co uważamy za miłe dla naszego ucha, a przeskakiwać (przed upływem 30 sekund) te utwory, które nam się nie podobają. Inną metodą jest dodawanie do listy muzyki, którą chcemy usłyszeć. Również utworzenie własnych list odtwarzania skupionych wokół tego co nas interesuje powinno dać algorytmom właściwe wskazówki.

Pozwól o sobie zapomnieć
W części serwisów można pozwolić algorytmom o sobie zapomnieć, czyli usunąć historię oglądania czy odtwarzania. W przypadku serwisów filmowych, takich jak Youtube (tu więcej konkretów jak to zrobić) czy Deezer (musicie wyczyścić całą pamięć cache), oznacza to jej kompletne wyczyszczenie. Pozbycie się tylko pojedynczych filmów czy zapytań jedynie ją nieznacznie zmodyfikuje, dlatego potrzeba radykalnych kroków, jeśli chcemy zacząć wszystko od nowa.

Pewnym sposobem na muzyczne poszukiwania może też być korzystanie z trybu prywatnego przeglądarki, który nie zapisze ciasteczek „upieczonych” przez nas podczas korzystania z serwisów straemingowych.

Skorzystaj z osobnego konta
Jednak najlepszym rozwiązaniem jest stworzenie zupełnie nowych kont dla nowych, czasem nawet wirtualnych, użytkowników. Pomogą w tym plany taryfowe pozwalające na założenie kilku kont czy planu rodzinnego. Pozwoli to również odseparować, np. konta dzieci od naszych.

Najłatwiej zrobić to w Netflixie, gdzie bez względu na wybraną ofertę możemy założyć kilka profili, które mogą być ograniczone wiekowo i oferować dostosowane do osoby propozycje filmów, seriali i programów.

Na YouTubie nie jest już tak prosto, bo musielibyśmy założyć nowe konto, używając innego adresu e-mail. Jeśli jednak dorosłe konto „psują” nam młodsze dzieci, to warto je skierować na przeznaczoną specjalnie dla nich platformę YouTube Kids.

Opisane „sposoby” na poprawę rekomendacji nie wyczerpują zagadnienia, chociażby dlatego, że nie powiedziałem tutaj o wszystkich serwisach. Jednak zawsze podstawowa zasada jest taka sama: za rekomendacje odpowiada wasza historia słuchania lub oglądania i to ją musicie zmienić albo poprawić. I pamiętajcie, lubimy to co znamy. Algorytmy serwisów streamingowych to doskonale wiedzą.| CHIP

0
Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.