Symbol rozpoznawania mowy jest... rozpoznawalny

PeCet, mówię do ciebie!

Rozpoznawanie mowy niektórym użytkownikom kojarzy się przyszłością. Technologia ta jest jednak dostępna od dawna i powszechnie stosowana w codziennych rozwiązaniach.

Wszystko po to, by ułatwić kontakt, skrócić czas oczekiwania na obsługę czy stania w kolejce do bankowego okienka. Dlatego, by zaskarbić sobie szacunek klientów, coraz więcej firm decyduje się sięgnąć po usługi związane z rozpoznawaniem mowy. Dzięki temu najwięcej zyskuje na tym użytkownik końcowy.

Rozwiązania biznesowe

Firm, które zajmują się wdrażaniem kompleksowych rozwiązań biznesowych jest bardzo mało. Najbardziej znaną i o największym zasięgu jest Nuance. Spółka ma 35 oddziałów regionalnych, a jej oferta dociera do ponad 70 krajów na świecie. Dostarcza technologie dla sektora prywatnego, jak i biznesowego, a jego technologia obsługuje aktualnie 8 milionów połączeń telefonicznych rocznie. Oddział, który zajmuje się Polską wdraża projekty wyłącznie biznesowe.

O tym, jak duże i nieustannie rosnące jest zapotrzebowanie na tego rodzaju technologię świadczą przychody firmy. Jeszcze w 2005 roku wynosiły one 232 miliony USD. Rok później podwoiły się, a w 2009 roku wyniosły ponad miliard dolarów. Poniżej podajemy przykłady wykorzystania systemu rozpoznawania mowy w biznesie.

Dragon Dictation to jeden z lepszych programów do rozpoznawania mowy.

Dragon Dictation to jeden z lepszych programów do rozpoznawania mowy.

Deutshe Bank

Deutshe Bank to międzynarodowa firma, który pozostaje w czołówce niemieckiej i europejskiej, a ostatnio rozszerzyła też swoje usługi na Amerykę Północną i Azję.

Jeszcze w 1999 roku, centrala banku miała kilka numerów, każdy przeznaczony był do zgłoszenia innej sprawy. Oprócz pomocy konsultantów, niektóre usługi można było kontrolować wystukując odpowiednie cyfry na klawiaturze telefonu.

W 2002 roku wprowadzono obsługę głosową, dostępną pod jednym numerem telefonu. System prowadzi użytkownika przez ponad 230 różnych usług. Zaczyna wykonywać swoją pracę od zadania prostego pytania: „Jak mogę ci pomóc?”. Dzwoniący może opisać swój problem, a następnie system przekierowuje rozmowę. W ten sposób można porozmawiać z osobą odpowiedzialną, bądź wykonać daną operacje automatycznie również za pomocą głosu. Co ważne, zaimplementowany program odczytuje nie tylko pojedyncze słowa kluczowe, ale także poszczególne frazy i całe zdanie. Skuteczność tego rodzaju rozwiązania wynosi 87%.

Dubai Financial Market (DFM)

Dubai Financial Market to drugi, co do wielkości rynek na którym można inwestować, kupować papiery wartościowe i inne instrumenty finansowe. Liczba inwestorów od 2000 roku wzrosła o 200% i wynosi obecnie 150 000.

Aby zapewnić odpowiednią jakość usług tak dużej liczbie użytkowników, DFM wprowadził obsługę głosową. Szybko okazało się też, że skutkuje to także obniżeniem kosztów, ponieważ wyszkolenie i zatrudnienie dodatkowych pracowników call center kosztuje. DFM zaoszczędził więc 5 USD na każdym połączeniu.

Obecnie call center oparty na rozpoznawaniu mowy obsługuje 4,5 miliona dzwoniących i pozwala na zaoszczędzenie 500 000 USD w porównaniu do tradycyjnej obsługi. Oczywiście rozwiązań biznesowych, jak i firm jest dużo więcej i każdorazowo skutkuje to redukcją kosztów i wzrostem wydajności call center, co jest ważne nie tylko dla firmy, ale także i jej klientów.

Niczym Kapitan Kirk. Za pomocą głosu możemy wydawać polecania urządzeniom zainstalowanym na pokładzie naszego samochodu.

Niczym Kapitan Kirk. Za pomocą głosu możemy wydawać polecania urządzeniom zainstalowanym na pokładzie naszego samochodu.

Rozwiązania konsumenckie

Jednak nie tylko firmy ułatwiają życie swoim klientom. Oni sami też mogą je sobie ułatwić. System rozpoznawania mowy jest w tej chwili dostępny w kilkunastu urządzeniach. Zaczynając od samochodu, który rozpoznaje krótkie komendy, jak np. „włącz radio”, poprzez komputer aż do urządzeń mobilnych.

Rozpoznawanie mowy na PieCu

Microsoft zaimplementował funkcję rozpoznawania mowy w Windows. Począwszy od Windows Vista, możemy wydawać polecenia naszemu systemowi, dyktować treść dokumentów w Wordzie czy maili. Niestety pomimo dość dużego wyboru języka (Microsoft udostępnia pakiety językowe), nadal polski jest niedostępny.

Alternatywą jest program Dragon NaturallySpeaking, o ile chcecie używać któregoś z języków naszych zachodnich sąsiadów. Program jest dużo dokładniejszy i działa szybciej od jego Windowsowego odpowiednika, jednak za jakość trzeba niemało zapłacić.

Jedynym programem, który rozpoznaje naszą ojczystą mowę jest SkryBot doMowy. Program jest dość dokładny, trzeba jednak wyraźnie mówić. Wątpliwości budzi też szybkość jego pracy. W teorii im szybszy jest komputer, tym szybciej powinien konwertować mowę na tekst. W praktyce bywa różnie. Wersja darmowa pozwala na to na czym zależy użytkownikowi najbardziej, a więc konwertowaniu mowy na tekst. Wersja płatna jest dopiero w przygotowaniu, jednak planowane jest m.in. rozbudowanie jej o kolejne języki, większą dokładność i szybkość działania, konwertowanie na tekst nagranych plików z rozszerzeniem.wav czy ułatwienia w postaci czytania nagranego tekstu dla osób niepełnosprawnych.


<!–[endif]–>

Voice Actions na Androida jest dość dokładny. Google nie nauczyło go jednak języka polskiego.

Voice Actions na Androida jest dość dokładny. Google nie nauczyło go jednak języka polskiego.

Telefon mnie rozumie

Każdy wie, że obsługa smartfonów jest dość prosta, ale wciąż daleka od doskonałości. Oczywiście rozwiązania takie, jak dotykowy ekran, multitouch czy odpowiednie programy pozwalają na optymalną pracę. Coraz więcej producentów oferuje jednak opcję rozpoznawania mowy. Dzięki temu możemy przekształcić głos na tekst i ułatwić sobie tym samym wysyłanie SMS-ów czy e-maili. Ponadto używając krótkich komend, możemy dotrzeć do żądanej usługi, nie zagłębiając się w gąszcz opcji.

W większości telefonów funkcja rozpoznawania mowy jest wbudowana. Dla iPhone’a możemy ściągnąć aplikację zbudowaną na bazie wspomnianego Dragon Naturally Speaking. Dragon Dictation ma te same opcje, przeniesione na smartfona. Program zapamiętuje słowo mówione, które nie jest dłuższe niż 30 minut, a następnie konwertuje je na tekst. Możemy wysłać go dalej bądź skopiować do schowka.

Z naszych nieoficjalnych informacji wynika, że firma Nuance pracuje obecnie nad aplikacją przeznaczoną dla systemu Symbian ^3, która będzie potrafiła rozpoznawać język polski, a najsmakowitszą częścią jest pogłoska, jakoby aplikacja ta miała być dodawana za darmo do systemu, albo wręcz stanowić jego częśc! Na razie użytkownikom systemu Nokii, pozostaje tylko wieloplatformowy program Vlingo. Niestety również i on nie rozpoznaje naszej ojczystej mowy, a jego darmowa wersja jest dość ograniczona.

Android jest już wyposażony w program do rozpoznawania mowy, lecz w Markecie znaleźć można też aplikację Voice Actions, która rozszerza jego funkcje. Wymaga ona jednak systemu w wersji 2.2. Google zapowiada, że będzie systematycznie rozszerzał listę obsługiwanych języków.

Technologia jeszcze w powijakach?

Wydawać by się mogło, że technologia ta jest jeszcze w powijakach, jednak nie jest tak do końca. Wiele rzeczy musi być ulepszone, ale w znakomitej większości przypadków system rozpoznawania mowy rozpoznaje słowa prawidłowo. Coraz więcej producentów sprzętu interesuje się takimi rozwiązaniami, co w konsekwencji oznacza większą konkurencję i poszerzenie oferty. Oznacza to także lepszą skuteczność rozwiązań. Wszystko to doprowadzi szybszej i łatwiejszej obsługi.

Cieszy również coraz szersze zainteresowanie językiem polskim. W końcu „Polacy nie gęsi, swój język mają…”

0
Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.