“Igła” rozpoznana?

Na wydanie nowej Recognity czekaliśmy niecałe pół roku. Z jednej strony dobrze, że firma ScanSoft stale podnosi jakość swojego produktu, z drugiej jednak, chcąc poprawić wydajność przetwarzania dokumentów do postaci tekstowej, musimy znowu sięgnąć do portfela. Czy warto?

Recognita OmniPage Pro 12
Wymagania: Windows 98 SE/Me/2000/XP/NT 4.0+SP 6.0, ok. 140 MB na dysku
+ poprawiona skuteczność rozpoznawania
+ moduł uczenia się i korekty
+ ulepszone przetwarzanie tabel
– wciąż niska skuteczność rozpoznawania tekstu z drukarki igłowej
Cena (z VAT-em): ok. 2300 zł
Uaktualnienie (z VAT-em): ok. 770 zł
Info:www.scansoft.com | www.veracomp.pl

W interfejsie użytkownika nie widać poważnych zmian: poprawiono wyświetlanie miniaturek i podgląd przetwarzanego tekstu oraz dodano okienko menedżera dokumentów ułatwiające pracę z “wiązkami”. Na szczęście zmiany w OmniPage Pro 12 nie sprowadzają się jedynie do kosmetyki interfejsu. Istotne jest zwiększenie skuteczności rozpoznawania tekstu – choć nadal z niektórymi rodzajami dokumentów program radzi sobie słabo (patrz: tabelka obok). Przy obróbce typowych materiałów (gazeta codzienna, książka) wzrost skuteczności jest niewielki (o ok. 1,6%) w stosunku do wersji 11. Dużo lepiej nowa Recognita “czyta” wydruki z drukarki atramentowej i maszynopis. Sporą poprawę (o ok. 23,5%) zauważyliśmy przy dokumentach z faksu. Istotnie poprawiła się skuteczność rozpoznawania wydruków z drukarki igłowej – poprzednio program nie radził sobie właściwie wcale z tego typu materiałami. Mimo że “dwunastka” poprawnie rozpoznała ok. 65,8% wyrazów, nadal daleko jej do głównego konkurenta – FineReadera – którego skuteczność wyniosła ok. 92,9%.

Wyniki minitestu
Rodzaj drukuSkuteczność rozpoznania
OmniPage 11OmniPage 12
Gazeta codzienna96,60%98,22%
Ilustrowany magazyn91,06%96,21%
Książka96,85%98,42%
Faks69,39%85,71%
Maszynopis84,75%92,45%
Tekst z posklejanymi literami86,48%94,91%
Wydruk z drukarki igłowej0% *65,86%
* – Rozpoznane zostały tylko szczątkowe fragmenty przetwarzanej strony.

Dokładność rozpoznawania pisma to jednak nie wszystko. Wymogiem coraz częściej stawianym programom OCR jest zachowywanie oryginalnego układu przetwarzanej strony. Recognita daje tu sobie radę nad wyraz dobrze. Nowością jest opcja zapisu “strona ciągła”, dzięki której otrzymujemy bardziej “naturalny” dokument (szpalty, tabele). Plusami OmniPage Pro 12 są obsługa formatu PDF oraz możliwość bezpośredniej współpracy z innymi aplikacjami (moduł Direct OCR). Sporym atutem nowej Recognity jest także moduł uczenia się i korekty. Dzięki tym opcjom przy przetwarzaniu dużej ilości podobnych dokumentów można znacznie zwiększyć skuteczność rozpoznawania.

Więcej:bezcatnews