Dzięki Nvidia Broadcast 1.4 możecie sprawiać wrażenie oddanych sprawie, nawet na najbardziej nudnych wideokonferencjach

Na początku stycznia Nvidia zapowiedziała ulepszenie swojej aplikacji Broadcast do wersji 1.4, która wprowadziła przede wszystkim funkcję Eye Contact do “fałszowania nagrań” w czasie rzeczywistym. Wkrótce później udostępniła ją wszystkim chętnym w ramach darmowej aktualizacji, obok której nie mogłem przejść obojętnie, jako że aplikacja od dawna przyciąga moją uwagę swoim potencjałem. Zwłaszcza że już wcześniej sprawdziłem na własnym głosie, jak sprawdza się oferowane przez Nvidia Broadcast usuwanie hałasów z otoczenia, które może zbierać nasz mikrofon i byłem tym wręcz zachwycony.

Tym razem Nvidia przygotowała coś specjalnego dla wszystkich twórców, którzy chcą nagrywać siebie podczas czytania notatek lub skryptu. Normalnie takie coś wygląda nieprofesjonalnie przez brak kontaktu na poziomie twórca-widz, ale jest konieczne, jeśli ktoś pragnie uniknąć licznych cięć w postprodukcji. Nvidia Broadcast w wersji 1.4 zapewnia na to lekarstwo, jako że jest w takich sytuacjach w stanie wygenerować wasze oczy w czasie rzeczywistym tak, jakby rzeczywiście patrzyły ciągle w obiektyw.

Aplikację pobierzecie tutaj, a sam proces jej konfiguracji jest banalnie prosty. Po jej uruchomieniu musicie wybrać odpowiednią kamerkę i dodać do niej efekt “kontaktu wzrokowego”, a następnie wybrać aplikację Nvidia Broadcast, jako źródło obrazu w ustawieniach Discorda, Skype czy Teams. To wystarczy, aby sztuczna inteligencja “dorabiała” wam skupione na obiektywie oczy tak dobrze, że odróżnienie tego “prawdziwego” wzroku od sztucznie wygenerowanego, będzie praktycznie niemożliwe przez rozmówców.

Nie liczcie jednak na to, że wasz stary laptop będzie kompatybilny z taką technologią. Wymagania systemowe dla Nvidia Broadcast nie są wprawdzie wysokie, ale obejmują stosunkowo nowe karty, bo te z przynajmniej 2019 roku i koniecznie z serii Nvidia GeForce RTX.

Kartę graficzną GeForce RTX 2060 (lub nowszą, ale koniecznie z serii RTX)

Przynajmniej 8 GB pamięci RAM

Procesor Core i5-8600 lub Ryzen 5 2600 (albo wydajniejsze)

Jak sprawdza się to w praktyce? Odpowiedź znajdziecie na poniższym nagraniu, a co ciekawe, proces konfiguracji nie wymaga żadnych skanów czy zdjęć twarzy, co jest wręcz nietypowe, jak na algorytm tego typu. Ciekawi mnie zresztą, czy kilka zdjęć nie byłoby czasem dla niego korzystne, ale panowie z Nvidii zapewne uznali, że nie chcą zaliczać się do tych samych firm, które wymagają wprowadzenia zestawu zdjęć przed rozpoczęciem pracy aplikacji.

Technologii do ideału zdecydowanie trochę brakuje, jeśli oczekujecie kompleksowego narzędzia do oszukiwania, że naprawdę zależy wam na nagraniu lub wideokonferencji. Możecie to zauważyć w momencie, w którym dezaktywuje i aktywuje ją na nowo, nie odrywając wzroku od końca przeczytanego wcześniej tekstu. W tym momencie aplikacja nie była w stanie “dorobić” mi oczu, a to głównie przez pozycję głowy, która podczas czytania była skierowana nieco bardziej w kierunku kamery. Na moje oko to jednak nie błąd, a przemyślana sytuacja, w której Nvidia Broadcast dezaktywuje automatycznie efekt, aby uniknąć generowania nierealistycznego wzroku i niepokojącego wręcz wrażenia, że ciągle wpatrujemy się w kamerę. Problemy mogły też wynikać z niewielkiego poziomu oświetlenia pomieszczenia.

W scenariuszach takich, jak ten powyższy (czytania fragmentu z ekranu, nad którym znajduje się kamerka), funkcja proponowana przez Nvidię ma sens. Jednak, jeśli liczycie na to, że będziecie mogli ruszać głową na lewo i prawo, a Eye Contact będzie ciągle dorabiać wam odpowiedni wzrok, nieco się zawiedziecie (patrz nagranie poniżej). Osobiście jednak uważam, że technologia nie została stworzona do takich scenariuszy, ale jeśli Nvidia zauważy, że tego oczekują od niej użytkownicy, zapewne postara się o jej rozszerzenie. Stąd zresztą oznaczenie funkcji jako testowej (beta) i proszenie pierwszych testerów o dzielenie się uwagami co do jej użyteczności.

W ogólnym rozrachunku mogę jednak ocenić nową funkcję w Nvidia Broadcast na wskroś pozytywnie. Radzi sobie z mruganiem, tylko okazjonalnie generuje oczy tak, jakby były dziełem średniozaawansowanej animacji, a w chwili rzeczywistego patrzenia bezpośrednio na obiektyw, nie zaczyna wariować. Jej użyteczność jest z kolei ogromna i wie o tym każdy uczeń czy student, który przy zdalnym nauczaniu był zmuszony patrzeć ciągle w kamerkę przy udzielaniu odpowiedzi.