TalkBack jeszcze bardziej pomocny dzięki Gemini
Pierwszą nowością jest ulepszenie czytnika ekranu Androida, TalkBack, który w ubiegłym roku zyskał możliwości Gemini. Dzięki potędze sztucznej inteligencji Google’a, TalkBack zyskał wówczas zdolność do dostarczania bardziej precyzyjnych i szczegółowych opisów obrazów znalezionych online, nawet bez towarzyszącego im tekstu alternatywnego, co znacząco ułatwiło korzystanie z sieci osobom niewidomym i słabowidzącym.
Czytaj też: Google potwierdza — stabilny Android 16 zadebiutuje już w czerwcu




Teraz gigant poszedł o krok dalej, jeszcze bardziej rozwijając możliwości tej funkcji dzięki Gemini. Użytkownicy dostali bowiem opcję zadawania pytań o znalezione obrazy. Przykładowo, jeśli znajomy wyśle ci zdjęcie samochodu, będziesz mógł zapytać TalkBack o jego markę i model. Narzędzie potrafi teraz również odpowiadać na pytania dotyczące wszystkich elementów widocznych jednocześnie na ekranie urządzenia, to znaczące ułatwienie, które sprawi, że osoby niewidome i słabowidzące będą mogły w większym stopniu korzystać z funkcji dostępnych na ich telefonach oraz bardziej zagłębiać się w rzeczy dostępne w sieci.
Czytaj też: Koniec z handlem kradzionymi Androidami? Google idzie na wojnę
Ekspresyjne Napisy zyskują nową głębię
Na tym nie koniec, bo Google postanowił również zająć się inną funkcją sztucznej inteligencji, czyli Ekspresyjnymi Napisami, którą wprowadził w 2024 roku. Jak sama nazwa wskazuje, informuje ona użytkowników nie tylko o tym, co jest mówione na ekranie, ale także o tym, jak to jest mówione. Obejmuje to w pełni kapitalizowane słowa, identyfikację dźwięków werbalnych, takich jak westchnienia, jęki i wdechy, oraz opisy dźwięków otoczenia, np. wiwatów czy śpiewu ptaków.

W najnowszej aktualizacji Google dodał do Ekspresyjnych Napisów funkcję czasu trwania, która dostarcza jeszcze więcej kontekstu do wypowiedzi mówcy. Dzięki temu będzie wiadomo, kiedy komentator ogłasza “niesaaaaaaamowity strzał” lub „Gooooooooool!”. Dodatkowo, Google informuje, że Ekspresyjne Napisy będą zawierać więcej etykiet dźwiękowych, takich jak gwizdanie i chrząkanie. Dzięki temu osoby z niesłyszące lub niedosłyszące będą mogły bardziej wczuć się w to, co oglądają i lepiej odczuwać klimat oraz całą otoczkę, która przecież w filmach jest równie ważna co same dialogi.
Czytaj też: iOS 18.5 już dostępny. Na pokładzie nowe funkcje i ponad 30 kluczowych poprawek bezpieczeństwa
Najnowsza wersja Ekspresyjnych Napisów jest już wdrażana w języku angielskim w Stanach Zjednoczonych, Wielkiej Brytanii, Kanadzie i Australii dla urządzeń z systemem Android 15 i nowszymi. Mamy nadzieję, że z czasem oba ulepszenia zostaną rozszerzone na kolejne regiony. Dodając takie nowości w Androidzie, Google pokazuje swoje zaangażowanie w tworzenie bardziej dostępnego ekosystemu swojego oprogramowania. Nowości te, oparte na potędze sztucznej inteligencji, znacząco ułatwią korzystanie z urządzeń mobilnych osobom z różnymi niepełnosprawnościami, otwierając przed nimi nowe możliwości interakcji ze światem cyfrowym.