Nowszy, lepszy OCR

W kwietniowym numerze naszego magazynu opublikowaliśmy test programów do rozpoznawania tekstu. Wśród wielu aplikacji wziął w nim udział pakiet Readiris. Kilka miesięcy później firma I.R.I.S wprowadziła na rynek następną, szóstą już wersję tego produktu. Aplikacja, która w naszej opinii jeszcze niedawno ustępowała liderom na rynku oprogramowania OCR, wyraźnie zmieniła się na lepsze. W porównaniu z […]

W kwietniowym numerze naszego magazynu opublikowaliśmy test programów do rozpoznawania tekstu. Wśród wielu aplikacji wziął w nim udział pakiet Readiris. Kilka miesięcy później firma I.R.I.S wprowadziła na rynek następną, szóstą już wersję tego produktu. Aplikacja, która w naszej opinii jeszcze niedawno ustępowała liderom na rynku oprogramowania OCR, wyraźnie zmieniła się na lepsze.

W porównaniu z poprzednim wydaniem Readiris Pro 6 zawiera kilka istotnych nowości, które znacząco rozszerzają jego funkcjonalność. Przede wszystkim umożliwiono przetwarzanie obrazów zeskanowanych w trybie kolorowym i w skali szarości. W związku z tym pojawiła się także opcja automatycznego zwiększania kontrastu między barwą tekstu i tła. Obecnie litery wydrukowane na kolorowym, nawet niejednolitym papierze są znacznie lepiej rozpoznawane, jeżeli dokument zapisany jest przy użyciu pełnej palety barw, a nie w trybie czarno-białym. Ponadto użytkownik może samodzielnie dobrać próg jasności obrazu, poniżej którego wszystkie elementy zostają zamienione na białe tło i pominięte w czasie rozpoznawania. Zazwyczaj próg dobierany jest automatycznie, ale czasami (np. gdy mamy do czynienia z żółtym tekstem na białym tle lub czarnym na szarym) warto poeksperymentować z tą opcją.

W przypadku dokumentów złej jakości dobre rezultaty daje eliminacja zabrudzeń o średnicy z przedziału od 1 do 20 punktów. Tę bardzo użyteczną funkcję należy jednak stosować z rozwagą, ponieważ przy okazji mogą zniknąć również kropki znad litery „i” oraz znaki interpunkcyjne.

Pod interfejsem dobrze znanym z poprzedniej wersji programu kryje się kilka ważnych nowinek, m.in. rozpoznawanie dokumentów kolorowych i wielostronicowych.

Osoby, które zamieniają na postać elektroniczną wiele stron tekstu dziennie, docenią możliwość współpracy Readirisa ze skanerem wyposażonym w podajnik ADF. Niestety, po wczytaniu kilkudziesięciu obrazów ze skanera lub dysku użytkownik zmuszony jest rozpoznawać je wszystkie naraz. Brakuje możliwości przetworzenia i zapisania tekstu tylko kilku wybranych stron.

Na tle konkurencyjnych aplikacji Readiris 6 zdecydowanie wyróżnia się umiejętnością odtworzenia w wynikowym dokumencie oryginalnego układu strony. Poprawnie zachowywane są m.in. kolorowe ilustracje, ich podpisy, wcięcia w tekście otaczającym nieregularne obszary, a także inicjały, czyli duże litery rozpoczynające akapit. Pod tym względem opisywany program radzi sobie nawet lepiej niż Fine- Reader, zwycięzca wspomnianego na wstępie testu porównawczego. Jedyny mankament to sposób, w jaki odwzorowany jest format strony po przesłaniu jej do Worda. Każda wyróżniająca się część tekstu, czyli szpalty, inicjały, śródtytuły itp., jest wstawiana w oddzielnym polu, co czasami utrudnia edycję tekstu.

Uzupełnieniem opisanych nowości jest funkcja przywracająca właściwą orientację strony zeskanowanej z kilkustopniowym skrzywieniem. Wprawdzie w poprzedniej wersji programu takie niedokładności nie wpływały na jakość rozpoznawania, ale bardzo utrudniały ręczną segmentację strony.

Oczywiście nie można dokonać pełnej oceny aplikacji klasy OCR bez sprawdzenia jakości rozpoznawania tekstu. Trzeba przyznać, że także pod tym względem Readiris 6 prezentuje się lepiej od swojego poprzednika, dobrze radząc sobie przede wszystkim z wyraźnymi, czytelnymi dokumentami. Jednak nadal najsłabszą stroną narzędzia są wyniki rozpoznawania tekstów gorszej jakości, tj. faksów, maszynopisów lub wydruków z drukarki igłowej. Bez wątpienia Readiris Pro 6 to duży krok naprzód w porównaniu z poprzednią edycją, ale jeszcze sporo zostało do poprawienia.

Readiris Pro 6
Wymagania: PC 486; 16 MB RAM; Windows 9x/NT 4.0/2000; ok. 55 MB na dysku,
+ przetwarzanie dokumentów kolorowych
+ wierne zachowanie oryginalnego układu strony w wynikowym dokumencie
– niezadowalające wyniki rozpoznawania dokumentów kiepskiej jakości
Producent: I.R.I.S., Belgia
http://www.irislink.com/
Dostarczył: Akon, Warszawa, tel./faks: (0-22) 632 08 56, e-mail: [email protected], http://www.akon.com.pl/
Cena: ok. 2000 zł
Uaktualnienie: ok. 750 zł
Na CHIP-CD w dziale Software | Nowe produkty znajduje się 30-dniowa wersja testowa programu Readiris Pro 6
0
Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.