Google przygotował ulepszenie dla funkcji Napisów na żywo, ale na razie nie każdy z niej skorzysta

Napisy na żywo na Androidzie to jedna z tych funkcji, która zdecydowanie może ułatwić wielu osobom życie. Jej zadaniem jest generowanie napisów do wyświetlanych na ekranie multimediów, niezależnie od tego, z jakiej aplikacji korzystamy. Funkcja dobrze radzi sobie ze zwykłą mową, ale wciąż ma ograniczenia, ponieważ nie jest w stanie oddać ekspresji wypowiadanych słów, emocji czy dodatkowych dźwięków. Na szczęście Google postanowił to naprawić, wprowadzając ulepszenie o nazwie Expressive Captions, oczywiście wykorzystujące sztuczną inteligencję.

Jej zadaniem jest uchwycenie intensywności emocji wypowiadanych słów, różnorodności dźwięków i ich wyświetlanie za pomocą tekstu. Funkcjonalność wykorzystuje AI do oddawania tonu, głośności, wskazówek środowiskowych i ludzkich dźwięków. Dla osób, które nie mają problemu ze słuchem, takie szczegóły mogą wydawać się zbyteczne, ale tak naprawdę odgrywają znaczącą rolę w przekazywaniu wiadomości. Dzięki stylizowanym podpisom i etykietom smartfon będzie w stanie lepiej oddać to, co dzieje się na ekranie.

Co dokładnie wprowadza Expressive Captions?

Napisy będą odzwierciedlać intensywność wypowiedzi przy pomocy wielkich liter, np. na filmiku ze składaniem życzeń, gdy jedna osoba będzie wyjątkowo entuzjastycznie krzyczeć swoje życzenia, jej słowa będą napisane „WSZYSTKIEGO NAJLEPSZEGO”, podczas gdy pozostałe wypowiedzi zostaną wyświetlone normalnie.

Napisy na żywo będą również rozpoznawać dodatkowe dźwięki wydawane przez ludzi, takie jak westchnienia, chrząkania czy łapanie oddechu.

Ponadto wychwytywane będą dźwięki otoczenia słyszalne na pierwszym planie i w tle. Funkcja oznaczy takie dźwięki, jak oklaski czy wiwaty, dając użytkownikowi pełny obraz tego, co dzieje się w otoczeniu.

Napisy na żywo, wzbogacone przez funkcję Expressive Captions, są generowane na żywo w aplikacjach na telefonie, co pozwala korzystać z nich podczas przeglądania postów w mediach społecznościowych, wiadomości wideo od znajomych czy oglądania transmisji na żywo. Co istotne, są generowane na urządzeniu, więc funkcja działa także w trybie samolotowym. Niestety na razie Google wdrożył ją jedynie w USA.