Kliknij i mów

Krótki test aplikacji umożliwiającej sterowanie komputerem przy pomocy poleceń wydawanych głosem

Firma Dragon Systems, specjalizująca się w dostarczaniu programów do rozpoznawania mowy ciągłej, gości na naszych łamach już po raz drugi. W poprzednich numerach magazynu CHIP, w rubryce „Krótkie testy”, przedstawiliśmy naszym Czytelnikom dwa inne systemy tego typu – Philips FreeSpeech98 (CHIP 6/99) i Dragon NaturallySpeaking Preferred (CHIP 7/99). Point & Speak w porównaniu z bliźniaczym produktem firmy Dragon jest mniej złożony i ma mniejsze wymagania sprzętowe. Z prostoty aplikacji wynika jej niższa cena. Porównując oba produkty, odnosimy wrażenie, że producent „odchudził” pełną wersję NaturallySpeaking, pozostawiając w pakiecie wyłącznie główny moduł rozpoznawania mowy i w ten sposób przygotował względnie tanie i proste w obsłudze rozwiązanie dla każdego użytkownika PC.

Program pozwala na dyktowanie tekstu w dowolnej aplikacji (tu w MS Outlook 98). Wskaźnik na Pasku zadań informuje nas o aktywności modułu rozpoznawania mowy dyktowanie

Idea pracy z programem zawarta jest w jego nazwie – „Point & Speak”, czyli „kliknij i mów”. Po jego uruchomieniu i odbyciu obligatoryjnego, 30-minutowego treningu wystarczy wskazać kursorem miejsce w dowolnym dokumencie przygotowywanym za pomocą jakiejkolwiek aplikacji i zacząć mówić. Dragon Point & Speak automatycznie rozpoznaje naszą mowę, a zapis „mówionego” tekstu pojawia się w miejscu, gdzie ustawiony był kursor. W ten sposób możemy dyktować tekst w dowolnym edytorze, wprowadzać liczby do arkusza kalkulacyjnego czy też przedyktować wiadomość do kolegi w programie obsługującym pocztę elektroniczną. Aplikacja jest na tyle uniwersalna, że przy użyciu głosu można wypełniać nawet pola edycyjne w okienkach dialogowych programów.

O tym, czy w danym momencie mowa będzie rozpoznawana, czy też nie, informuje nas wskaźnik w postaci ikony umieszczonej na Pasku zadań. Aktywność rozpoznawania można przełączać za pomocą głosu (komendy Go to sleep i Wake up ) lub przy użyciu klawisza skrótu (standardowo jest to klawisz [+] na klawiaturze numerycznej).

W trakcie dyktowania można wydawać głosem proste polecenia edycyjne, np. Scratch that (czyli „usuń ostatnio rozpoznany tekst”) lub

Correct that — „skoryguj wynik ostatniego rozpoznawania”. Umiejętnie „udając” klawiaturę, Point & Speak jest w stanie poprawnie zareagować na takie komendy do momentu, gdy… nasz edytor nie wprowadza własnych poprawek do tekstu w trakcie wpisywania. Jeżeli np. używamy edytora Microsoft Word z włączoną opcją autokorekty, Point & Speak może się pogubić i wówczas głosowe komendy edycyjne przestają być wykonywane. Nie jest to jednak zbyt uciążliwe, zważywszy, że cały czas w trakcie dyktowania możemy jednocześnie używać klawiatury. W rezultacie komfort pracy z Point & Speak, podobnie jak z NaturallySpeaking, jest duży. Jednocześnie użytkownik potrzebuje bardzo niewiele czasu na to, by w pełni nauczyć się obsługi aplikacji.

parametry rozpoznawaniaParametry rozpoznawania oraz inne ustawienia programu zmieniamy w okienku dialogowym

Najważniejszą cechą programów takich jak opisywany jest jakość samego rozpoznawania. I tutaj czeka nas miłe zaskoczenie – w przypadku Point & Speak jest ona bardzo zbliżona do jakości oferowanej przez Dragon NaturallySpeaking Preferred, który do tej pory zaprezentował się najlepiej wśród wszystkich testowanych przez nas systemów. Po odbytym treningu całkowita prędkość rozpoznawania, wyznaczona dla testowego fragmentu tekstu, była bliska 19 słowom na minutę (dla porównania: dla FreeSpeech98 wynosiła 12,5 słów na minutę, dla Dragon NaturallySpeking 20 słów na minutę). Niewątpliwie na jakość (i w rezultacie prędkość) rozpoznawania duży wpływ ma klasa mikrofonu używanego podczas pracy z aplikacją – w tym przypadku użyliśmy standardowego mikrofonu typu head-set, dołączonego przez producenta do testowanego pakietu. Nie bez znaczenia jest również znajomość języka angielskiego i dobra dykcja.

w skrócie
dragon point & speak 3.52Dragon Point & Speak 3.52
Wymagania: PC Pentium; 16-bitowa karta dźwiękowa klasy Sound Blaster 16; 32 MB RAM (Windows 9x); 48 MB RAM (Windows NT); ok. 60 MB na dysku
plusdołączony do pakietu dobrej jakości mikrofon
plusdobra jakość rozpoznawania
plusdostępne komendy służące do formatowania tekstu
plusmożliwość dyktowania w dowolnej aplikacji
minusbrak wersji polskiej
minusbrak możliwości sterowania głosem różnych aplikacji
Producent: Dragon Systems, USA, http://www.dragonsys.com/
Cena: 59,95 USD

Niestety, zastosowanie Point & Speak do sterowania komputerem za pomocą głosu jest w praktyce niemożliwe. Pod tym względem opisywaną aplikację trudno w ogóle porównywać z jakimkolwiek programem rozpoznającym mowę (jak choćby ze wspominanymi już NaturallySpeaking czy FreeSpeech). W standardowej konfiguracji wydawać można tylko kilka komend głosowych aktywujących lub blokujących działanie Point & Speak. Nieco lepiej jest wówczas, gdy użytkownik zainstaluje oprogramowanie Microsoft Accessibility Option, jednak z takiego narzędzia nie zawsze można skorzystać. Jest ono niedostępne w wersji dla systemu operacyjnego Windows NT.

Close

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.