Giganci technologiczni łączą siły. Ich celem jest ulepszenie technologii rozpoznawania mowy

Rozwój technologii daje ogromne możliwości, także w kwestii większej dostępności dla osób niepełnosprawnych. Giganci technologiczni wciąż podejmują działania mające na celu sprawienie, by z ich produktów mogło korzystać jak najwięcej osób, co z kolei oznacza, że konieczne jest ich dostosowanie do osób z niepełnosprawnościami.
Giganci technologiczni łączą siły. Ich celem jest ulepszenie technologii rozpoznawania mowy
Giganci technologiczni łączą siły. Ich celem jest ulepszenie technologii rozpoznawania mowy

Microsoft, Apple, Google, Meta i Amazon pracują nad ulepszeniem technologii rozpoznawania mowy dla osób niepełnosprawnych

Tym razem giganci technologiczni połączyli siły z University of Illinois (UIUC) w ramach projektu dostępności mowy. Jego celem jest ulepszenie technologii rozpoznawania mowy tak, by mogły korzystać z nich także osoby, które z powodu chorób zmagają się z zaburzeniami mowy. W projekcie wymienia się np. chorobę Lou Gehriga, porażenie mózgowe, zespół Downa czy chorobę Parkinsona. To oczywiście nie wszystko, bo zaburzenia mowy mogą pojawić się również na skutek wypadków czy innych schorzeń.

Takie ulepszenia są niezwykle istotne, bo obecna technologia rozpoznawania głosu, np. w narzędziach do tłumaczenia, nadal nie radzi sobie w sytuacjach, gdy użytkownik ma inny wzorzec mowy, niż te stosowane do trenowania modeli uczenia maszynowego.

Czytaj też: Wibracje spod dna morza. Kabel internetowy wykrył podwodne sygnały

Oprócz wyżej wspomnianych gigantów technologicznych w projekcie biorą udział organizacje non-profit, takie jak Davis Phinney Foundations for Parkinson’s i Team Gleason. Jak stwierdził Mark Hasegawa-Johnson, profesor UIUC:

Interfejsy mowy powinny być dostępne dla wszystkich, także dla osób niepełnosprawnych. To zadanie było trudne, ponieważ wymaga dużej ilości infrastruktury, najlepiej takiej, którą mogą zapewnić wiodące firmy technologiczne, dlatego stworzyliśmy wyjątkowo interdyscyplinarny zespół z doświadczeniem w zakresie lingwistyki, mowy, sztucznej inteligencji, bezpieczeństwa i prywatności.

Czytaj też: Tak proton porusza się w wodzie. Rozwiązanie zagadki przyszło po ponad 200 latach

W ramach projektu zostaną pobrane próbki mowy od płatnych wolontariuszy z różnymi wzorcami lub zaburzeniami mowy. Na ich podstawie zostanie stworzony zestaw danych, na którym trenowane będą modele uczenia maszynowego. Na początku oczywiście wszystko będzie odbywać się w amerykańskim języku angielskim, jednak można się spodziewać, że w przyszłości technologia będzie rozwijana także pod kątem innych języków.