Wejście smoka

Krótki test programu analizującego i rozpoznającego mowę ludzką

D ragonDictate służy do rozpoznawania mowy ludzkiej i konwertowania jej na tekst lub komendy zrozumiałe dla systemu Windows. Aplikacja jest oferowana wyłącznie w wersji anglojęzycznej, można ją jednak w pewnym stopniu „zmusić” do pracy pod kontrolą polskich okien. W skład zestawu wchodzi obszerna, solidnie wykonana instrukcja obsługi, lista najczęściej używanych komend, tzw. „karta szybkiego startu” dla początkujących oraz mikrofon ze słuchawką. Do testów otrzymaliśmy wersję Power Edition, rozpoznającą ok. 60 000 słów, poszerzoną (w stosunku do Personal i Classic Edition ) modułem text-to-speech, przeznaczonym do generowania mowy (niestety wyłącznie angielskiej).

Dodatkowym atutem programu DragonDictate jest możliwość tworzenia własnych makr, reagujących na komendy głosowewejście smoka

Po zainstalowaniu oprogramowania należy podać informacje o użytkowniku: wysokość głosu (wysoki lub niski) oraz identyfikator. Następnie aplikacja sprawdza ustawienie czułości mikrofonu i przeprowadza wstępną naukę rozpoznawania mowy.

Kontrolę nad systemem Windows sprawować można praktycznie bez użycia klawiatury. DragonDictate potrafi m.in. uruchamiać programy poprzez podanie ich nazwy, poruszać kursorem i przesuwać wskaźnik myszki. Bez najmniejszego problemu wywołuje się także wszystkie klawisze funkcyjne oraz znaki specjalne. W słowniku aplikacji znajdują się również anglojęzyczne polecenia umożliwiające sterowanie popularnymi programami, takimi jak Word, Excel czy Netscape Navigator. Vocabulary Manager (osobna aplikacja) służy do zarządzania słownikiem. Dzięki niej użytkownik jest w stanie nauczyć DragonDictate’a „rozumieć” polskie słowa, ponieważ do słownika można dodawać nowe hasła oraz trenować rozpoznawanie już istniejących. Mniej więcej po godzinie pracy Windows zaczyna przyjmować polskie komendy sterujące myszką, kursorem oraz wywołujące podstawowe polecenia systemu. Ponieważ aplikacja przystosowana jest do pracy z angielskimi wersjami programów, w zdecydowanej większości przypadków należy zmienić sposób reakcji na komendę głosową (np. polecenie „file” należy zamienić na „plik” itp.).

Bardzo ważną cechą programu jest możliwość dyktowania tekstu. W trybie Dictate Mode aplikacja zamienia wypowiadane słowa na ich tekstowe odpowiedniki (także polskie, jeśli są obecne w słowniku i zostały wcześniej przetrenowane) oraz automatycznie wyświetla listę zawierającą hasła zbliżone do wypowiedzianego. Wybór któregoś z nich powoduje zastąpienie ostatnio rozpoznanego słowa wyrazem z wyspecyfikowanego pola.

DragonDictate Power Edition for Windows 2.5
Wymagania: PC 486-66; 16-bitowa karta muzyczna; 8 MB RAM; Windows 3.1x; ok. 40 MB na dysku
Producent: Dragon Systems, USA tel.: (0-01 617) 965 52 00, fax: 527 03 72 e-mail: [email protected]http://www.dragonsys.com/
Cena: ok. 595 USD (Personal Edition); ok. 995 USD (Classic Edition); ok. 2495 USD (Power Edition)
plusmożliwość maksymalnego dostosowania do wymagań użytkownika
plusprostota obsługi
plusbardzo poprawne rozpoznawanie poleceń
plusopcja dodawania haseł do słownika
minusniedostosowanie do potrzeb krajowych odbiorców
minuszmiana parametrów generowanej mowy tylko poprzez „ręczną” modyfikację pliku ddwin.ini
Więcej informacji:
WWW:http://www.chip.pl/software/kts/9_97/
CHIP-CD 10/97: CHIP-offline | CHIP 9/97 | Software

Interfejs użytkownika jest bardzo przejrzysty. Uruchomiony DragonDictate pozostaje na ekranie w postaci paska, na którym wyświetlane są informacje dotyczące stanu programu (np. aktualny tryb pracy oraz ostatnie rozpoznane polecenie). Możliwości konfiguracji pakietu są więcej niż zadowalające. W oknie Options ustawia się m.in. konfigurację startową programu, sposoby korekcji błędów, liczba spacji wstawianych za konkretnymi hasłami, liczbę słów zbliżonych do rozpoznanego (pojawiających się w oknie

Choice List

), wygląd paska programu, reakcję aplikacji na programy z nią współpracujące itd.

Praca z pakietem jest przyjemnością i uczucie to rośnie wraz z umiejętnościami użytkownika w zakresie jego obsługi. Producent pomyślał nawet o takich drobiazgach, jak potwierdzanie rozpoznania komendy mrugającą diodą klawisza [NumLock], czy też możliwość włączenia i wyłączenia aktywności mikrofonu. Obszerna pomoc i krótki program uczący dopełniają całości. Niestety, pakiet nie jest obecnie dostosowany do potrzeb krajowych odbiorców. Z tego powodu można go polecić przede wszystkim użytkownikom angielskich wersji programów wymienionych w artykule oraz tym, którzy często piszą teksty w tym języku.

0
Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.