Powiększ czcionkę

Krótki test programu do analizy i rozpoznawania mowy

Technologia komputerowego przetwarzania mowy wykorzystywana jest w coraz większej liczbie urządzeń, a obecnie zaczyna podbijać rynek komputerów osobistych. Jest wysoce prawdopodobne, że to właśnie mowa będzie, w nie tak odległej przyszłości, głównym sposobem komunikacji człowieka z komputerem. Już dzisiaj tacy potentaci, jak IBM, Philips czy Microsoft oferują produkty, dzięki którym za pomocą głosu można wydawać polecenia sterujące komputerem. Niewątpliwie liderem wśród producentów narzędzi tego typu jest amerykańska firma Dragon Systems. To właśnie ona jako pierwsza wprowadziła na rynek program do rozpoznawania mowy ciągłej NaturallySpeaking .

Do testów otrzymaliśmy pakiet NaturallySpeaking Preferred w wersji 3.52, dedykowany dla języka angielskiego, pracujący w środowisku Microsoft Windows 9x lub Windows NT 4.0. Dostępne są również wersje dla języka amerykańskiego oraz dwóch odmian angielskiego (Indian English oraz Southeast Asian English). Można również nabyć rozszerzoną wersję NaturallySpeaking Preferred, przystosowaną do pracy z najnowszym procesorem Intela – Pentium III, jednak koszt takiej wersji jest o około 100 USD większy od edycji przedstawionej w niniejszym teście. Wraz z programem producent dostarcza zestaw typu head-set, czyli połączenie słuchawek (w tym wypadku na jedno ucho) z dobrej jakości mikrofonem. Cały pakiet wraz z prostą, multimedialną prezentacją możliwości programu mieści się na jednym krążku CD-ROM.

Głównym zadaniem NaturallySpeaking jest umożliwienie użytkownikowi komputera PC dyktowania dowolnego tekstu, który zamieniany jest automatycznie na postać znakową. Podstawowy moduł pakietu to prosty edytor tekstu (podobny nieco do znanego wszystkim WordPada). W programie tym dyktujemy tekst po angielsku. Da się go także, przy użyciu komend głosowych, korygować i formatować. Można używać jednocześnie głosu i klawiatury (obie ręce są wolne), co znacznie podnosi efektywność pracy. Nieskomplikowany interfejs programu oraz zestaw dobrze przemyślanych klawiszy skrótów (np. do aktywacji/blokowania rozpoznawania) sprawiają, iż posługiwanie się programem jest wygodne i proste.

Dwoma dodatkowymi modułami wchodzącymi w skład pakietu są NaturallyText i NaturallyWord. Pierwszy z nich pozwala na dyktowanie w dowolnej aplikacji pod Windows, drugi zaś to wyspecjalizowany program wspierający wprowadzanie tekstu w „zewnętrznym” edytorze, takim jak Microsoft Word 97 lub Corel WordPerfect 8.0.

Ważną cechą testowanego przez nas pakietu jest kompatybilność ze standardem Microsoft Speech API. Standard ten określa zasady funkcjonowania syntezerów i analizatorów mowy w środowisku Windows. Dzięki kompatybilności ze Speech API Dragon NaturallySpeaking wykrywany jest jako jeden z aktywnych modułów rozpoznawania mowy ciągłej, co pozwala na zastosowanie tegoż programu w dowolnej aplikacji wykorzystującej rozpoznawanie mowy poprzez interfejs Speech API. Co prawda obecnie aplikacji takich nie ma zbyt wiele, jednak planowane dołączanie Speech API do systemu Microsoft Windows 2000 może tę sytuację zmienić.

w skrócie
Dragon NaturallySpeaking Preferred 3.52
Wymagania: PC Pentium 133 MHz, 32 MB RAM (Windows 9x); PC Pentium 166 MHz, 48 MB RAM (Windows NT); karta dźwiękowa kompatybilna z Sound Blaster; ok. 180 MB na dysku
plusdołączony do pakietu mikrofon dobrej jakości
pluswysoka jakość rozpoznawania
pluszgodność ze standardem Microsoft Speech API
plusmożliwość używania klawiatury w trakcie dyktowania
minusbrak wersji polskojęzycznej
minusmałe możliwości sterowania głosem różnych aplikacji
Producent: Dragon Systems, USA, http://www.dragonsys.com/
Cena: 199 USD

Jednym z elementów pakietu jest generator mowy syntetycznej, który służy do weryfikacji „na słuch” wprowadzonego głosem teksu. Po wydaniu polecenia Read this program ten odczytuje zaznaczony fragment syntetycznym głosem. Jakość generowanej mowy nie jest, niestety, zbyt dobra, a jej akcent przypomina nieco sposób mówienia żandarma z serialu „Allo, allo”. Po nieco wnikliwszym przyjrzeniu się syntezerowi wszystko staje się jasne – używany przez Dragona moduł syntezy mowy to produkt francuskiej firmy ELAN Informatique.

Jak dobrze radzi sobie z rozpoznawaniem mowy opisywana aplikacja? Przeprowadzony przez nas test potwierdził wcześniejsze przypuszczenia (porównaj testy z CHIP-a 9/98, s. 190), iż Dragon NaturallySpeaking to produkt ze ścisłej czołówki. Całkowity czas potrzebny do wprowadzenia kontrolnego tekstu nie był dłuższy niż 8 minut, co dało efektywną prędkość dyktowania przekraczającą 20 słów na minutę. Należy podkreślić, że rezultat ten został osiągnięty po niespełna 30-minutowym treningu. Z drugiej zaś strony test przeprowadzony był z wykorzystaniem pełnej konfiguracji NaturallySpeaking, a to z kolei wymagało użycia 96 MB pamięci RAM i komputera klasy Pentium II. Ponadto do posługiwania się NaturallySpeaking wymagana jest nienaganna znajomość języka angielskiego i naprawdę dobra dykcja, o czym należy pamiętać, planując zakup pakietu.

Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.