FINEzyjna maszynistka

Przepisywanie tekstu to zajęcie bardzo żmudne – wie o tym każdy, komu przyszło “wklepać” do edytora choćby kilka kartek maszynopisu. Nie dość, że czynność ta zajmuje sporo czasu, to na dodatek trudno uniknąć pomyłek. Dlaczego więc nie zaprzęgnąć do tego celu komputera? Wystarczy przecież skaner i odpowiedni program…

Wśród aplikacji do rozpoznawania tekstu, obsługujących język polski, od pewnego czasu prym wiodą produkty rosyjskiej firmy ABBYY (patrz: test programów OCR – CHIP 4/2000, s. 156). Do sklepów trafiła właśnie kolejna, piąta już wersja FineReadera .

Wbudowanie filtru eksportu do formatu HTML umożliwia szybką publikację dokumentu na stronie WWW bez znajomości HTML-a.

Już na pierwszy rzut oka łatwo dostrzec kosmetyczne zmiany w interfejsie użytkownika – teraz w miejscu ikon obrazujących rozpoznawane strony wyświetlane są ich miniatury, pozwalające szybko odszukać przetwarzany dokument. Bardzo pożyteczną zmianą jest umieszczenie w oknie skanowanej strony paska ikon umożliwiającego szybkie wykonanie podstawowych operacji (np. powiększanie/pomniejszanie). Na uwagę zasługuje także poprawiona ergonomia okna dialogowego modułu sprawdzania pisowni.

Jednak nie szata zdobi… o sile aplikacji OCR decyduje przede wszystkim skuteczność rozpoznawania tekstu. Aby przekonać się o możliwościach nowej wersji, przeprowadziliśmy w laboratorium minitest, polegający na przetworzeniu w FineReader 5.0 Pro plików z kwietniowego testu porównawczego. Zgodnie z przewidywaniami okazało się, że w tej dziedzinie nowa edycja jest lepsza od swoich poprzedniczek. Skuteczność działania programu wzrosła w odniesieniu do wszystkich rodzajów tekstu źródłowego – najwięcej w wypadku tekstu drukowanego na drukarce igłowej (prawidłowo rozpoznał 96,82% wyrazów).

Autorzy nie poprzestali na wymienionych zmianach i podwyższyli atrakcyjność swojego produktu, wyposażając go w dodatkowe funkcje. Zwiększono znacznie liczbę rozpoznawanych języków (w sumie 176). Oprócz języków narodowych FineReader rozpoznaje teraz dodatkowo języki formalne (np. C++, Java, Pascal) oraz znaki subskryptu. Rozpoznawanie ostatnich dwóch grup może być przydatne w wypadku konieczności “wklepywania” listingów aplikacji lub prostych formuł chemicznych. Należy jednak mieć na uwadze, że nawet drobne pomyłki w rozpoznawaniu programu mają wpływ na poprawność wykonywanego kodu – stąd FineReaderowi nie można bezgranicznie ufać, zwłaszcza w przypadku deklaracji zmiennych.

Nowe elementy interfejsu programu FineReader 5.0 poprawiają wygodę pracy.

Zauważalna jest również zmiana w sposobie segmentacji układu strony. Teraz program lepiej radzi sobie z podziałem na szpalty, a dodatkowo – co bardzo istotne – usunięcie bloku z przetwarzanej strony oznacza skasowanie odpowiadającej mu sekcji rozpoznanego tekstu. Ponadto wprowadzono nowy sposób zapisu przetwarzanych dokumentów (tzw. wiązek) oraz możliwość zachowania samej struktury strony, którą można wykorzystać w odniesieniu do wielu dokumentów.

Poprawiony został też filtr eksportu do Adobe Acrobat 4.0 (*.PDF) oraz dodano bardzo przydatną możliwość zapisywania rozpoznanego tekstu w formacie HTML z zachowaniem pełnego układu strony. Choć kod wygenerowanej strony WWW przyprawiłby o zawrót głowy każdego webmastera, to przyznać trzeba, że efekt wizualny jest piorunujący – w przeglądarce pojawia się “toczka w toczkę” kolorowa strona np. ilustrowanego magazynu.

Rosjanie podjęli też bardzo ciekawą próbę rozpoznawania kolorowego tekstu – jednak obiektywnie trzeba stwierdzić, że możliwości programu w tym zakresie są skromne. Daltonizm FineReadera objawia się przetwarzaniem np. niebieskiego tekstu na kolor czarny, pomarańczowego na czerwony. Z jasnymi kolorami (np. żółtym) na białym tle program nie radzi sobie w ogóle.

Podobnie jak poprzednie edycje, wersja Professional wyposażona jest w mechanizmy przeznaczone do rozpoznawania tabel. Bardzo użyteczna jest możliwość rozpoznawania pionowego tekstu tabeli lub potraktowania zawartości komórki jako obrazka – uprzednio jednak trzeba to zadeklarować “ręcznie” we właściwościach komórki.

FineReader 5.0 Pro jest udanym produktem firmy ABBYY. Usprawniono w nim najważniejsze funkcje oraz dodano nowe, zwiększając tym samym konkurencyjność aplikacji. Stała dążenie do poprawienia skuteczności rozpoznawania oraz implementowanie nowatorskich rozwiązań to cechy, dzięki którym Rosjanie są niewątpliwymi liderami rynku oprogramowania OCR.

FineReader 5.0 Pro
Wymagania: PC Pentium 133, 32 MB RAM, napęd CD-ROM 2x, WIndows 9x/NT 4.0/2000, ok. 124 MB na dysku
+ poprawiona skuteczność rozpoznawania tekstu i segmentacji strony
+ możliwość zapisania bezpośrednio w pliku HTML
+ rozpoznawanie 176 języków (w tym języków programowania)
+ rozpoznawanie pionowego tekstu w tabelach
– brak polskiej wersji
– problemy z kolorowym tekstem
Producent: ABBYY Software House, Rosja, http://www.finereader.com/
Dostarczył: Auto ID, Kraków
tel.: (0-12) 656 04 43
e-mail: [email protected]
http://www.autoid.pl/
Cena: ok.620 zł
Uaktualnienie: ok. 400 zł
W dziale Software | Nowe produkty znajduje się wersja demostracyjna programu FineReader 5.0 Pro
Więcej:bezcatnews