Biurowy pstryk

Na świecie sprzedaje się coraz mniej skanerów i coraz więcej cyfraków. To zupełnie naturalna tendencja, ponieważ wciąż maleje liczba użytkowników przenoszących w warunkach domowych zdjęcia do komputera. Wygodniej jest uczynić to w labie, a następne fotki wykonywać już cyfrakiem. No tak, ale w domowym biurze skaner wciąż pozostaje niezastąpiony, kiedy trzeba wykonać obrazy dokumentów i “przepuścić” je przez aplikację do rozpoznawania pisma. Jeśli jednak zamiast skanera kupiliśmy aparat cyfrowy, możemy połączyć przyjemne z pożytecznym i użyć go również do takich właśnie celów biurowych. Niech się nie kurzy, kiedy akurat nie jesteśmy na wakacjach. Okazją do zajęcia się tym tematem może być też fakt, że na naszym krążku CD znajdziecie pełną wersję programu FineReader 5.0 Sprint, którego algorytmy rozpoznawania pisma należą do najlepszych na rynku.

Na pierwszy rzut oka wydaje się, że użycie aparatu do takiego zadania nie da dobrych efektów, ponieważ problemy z oświetleniem, poprawną geometrią zdjęcia i szumami matrycy uniemożliwią rozpoznanie znaków na fotografii. W warunkach domowych trudno jest uzyskać jednolite oświetlenie fotografowanego dokumentu, nie zawsze też uda się go sfotografować, zachowując kąty proste w rogach. Ale po kilku próbach okazuje się, że nawet zdjęcia wykonane cyfrakiem z ręki metodą stosowaną przez Hansa Klossa nadają się do obróbki FineReaderem, oczywiście pod warunkiem spełnienia kilku niezbyt trudnych wymagań technicznych. Nawiasem mówiąc, produkowane są skanery działające właśnie na zasadzie fotografowania oryginału urządzeniem podobnym do aparatu fotograficznego, oczywiście o jakości obrazu dużo lepszej niż w przeciętnym cyfraku.

Jak pstrykać

Aby FineReader mógł w ogóle rozpoznać tekst na zdjęciu, musi on być dla niego dobrze widoczny. Liczba pikseli przypadających na jeden znak powinna być wystarczająco duża, żeby dał się on odróżnić od innych. W praktyce nie wystarczy, że oko ludzkie potrafi bezproblemowo czytać tekst, ponieważ nasze zdolności adaptacyjne i umiejętność czytania całymi wyrazami, a nie pojedynczymi literami, sprawiają, że możemy odczytać nieco zamazany druk, z którym algorytm rozpoznający nie da sobie rady. Znaki muszą więc zawierać więcej pikseli niż niezbędne minimum, ale warunek ten jesteśmy w stanie spełnić bez większego problemu. W dalszych rozważaniach przyjmijmy, że interesuje nas rozpoznawanie tekstu drukowanego pismem co najmniej dziewięciopunktowym na papierze formatu A4, który powinien być sfotografowany za jednym razem, bez łączenia mniejszych kawałków w programie graficznym.

Oczywiście wszystko zaczyna się od cyfraka i to jego jakość decyduje, czy zdjęcie kwalifikuje się do rozpoznawania. Jeśli mamy do dyspozycji aparat o matrycy mniejszej niż 4 megapiksele, raczej nie będzie się on nadawał do naszych celów – na pojedynczy znak wypadnie zbyt mało pikseli (patrz: tabela na następnej stronie). Ważne są też jakość obiektywu oraz możliwość ustawienia różnych wartości przysłony. Słabe “szkła” najtańszych aparacików na pewno nie będą w stanie dać wystarczająco ostrego obrazu, często zresztą nie ma w takich kamerach żadnego układu autofokusa, a ostrość jest ustawiona na stałe w sam raz do fotografii rodzinnych na świeżym powietrzu. Często też zdarza się, że aparat nie może ustawić ostrości na przedmioty zbyt bliskie, a przecież nie będziemy fotografować dokumentów z daleka, bo nie da się tego zrobić po ustawieniu statywu na stole.

Dobre oparcie

No właśnie, statyw. Bez tego pożytecznego wynalazku raczej się nie obędzie, choć zdjęcia wykonane z ręki przy dobrym świetle mogą też w ostateczności dać się wykorzystać. Ale statyw zapewnia nam stałą odległość aparatu od dokumentu i stabilny kadr, gwarantuje brak poruszeń i pozwala używać dłuższych czasów naświetlania, zatem nie musimy rozglądać się za specjalnym oświetleniem – wystarczy zwykłe okno. Dobrze jest mieć statyw, który umożliwia wykonywanie zdjęć w dół z wykorzystaniem jednego z dwóch pokazanych obok sposobów: albo poprzez umieszczenie kolumny poziomo, albo włożenie jej w nogi od dołu i powieszenie aparatu obiektywem w dół. Statyw umieszczamy na stole w taki sposób, żeby nogi nie rzucały cienia na fotografowany dokument, a wysokość zawieszenia aparatu dobieramy tak, aby papier wypełniał całkowicie kadr przy zoomie ustawionym mniej więcej na połowę zakresu. Uważać też trzeba, żeby zwisające paski czy dekielek obiektywu nie znalazły się na zdjęciach.

Czas popstrykać

Właściwie można już rozpocząć fotografowanie. Jeśli udało się zainstalować aparat w systemie, FineReader sam zaimportuje plik zdjęcia przez kabel USB, co zupełnie uwolni nas od naciskania spustu (patrz: warsztat powyżej). W przeciwnym razie, ponieważ aparat jest stabilnie umocowany, wystarczy wyzwalać spust palcem, chociaż mile widziane są wszelkie wężyki spustowe czy piloty, zabezpieczające przed przypadkowym poruszeniem całego statywu dłonią. Można też używać samowyzwalacza. Unikajmy flesza wbudowanego w aparat – prawie na pewno pośrodku zdjęcia pojawi się biała plama, która uniemożliwi rozpoznanie tekstu. Parametry ekspozycji można ustalić automatycznie, ale jeśli fotografujemy białą kartkę z czarnym tekstem, dobrze jest skorygować pomiar o +2/3 do +1 EV, czyli użyć prawie dwukrotnie dłuższego czasu lub o jedną wartość bardziej otwartej przysłony, niż pokazuje światłomierz. Zapewni nam to czystszą biel papieru i podniesie kontrast zdjęcia, ułatwiając FineReaderowi zadanie. Najlepsza wartość przysłony to około połowa zakresu – zdjęcia wyjdą wówczas najostrzej. Przy pełnym jej otwarciu kontrast prawie na pewno spadnie.

W menu aparatu wybieramy zapis plików w formacie JPEG z możliwie dobrą jakością, ponieważ artefakty od zbyt dużej kompresji mogą wprowadzać algorytm w błąd. Nie używajmy formatu TIFF – zwykle cyfraki zapisują zdjęcia w tym formacie bardzo wolno, a poza tym FineReader go nie obsługuje.

Pozostałe czynności związane z rozpoznaniem i zapisaniem tekstu opisane są w ramce powyżej. Jeśli poprawnie wykonaliśmy zdjęcia, rozpoznawanie tekstu nie sprawi nam większego problemu.

Wielkość druku i megapiksele
Wielkość matrycy aparatuMinimalna rozpoznawalna wielkość znaków*
8 megapikseli5 punktów
6 megapikseli6 punktów
5 megapikseli7 punktów
4 megapiksele7 punktów
3 megapiksele8 punktów
* dla dokumentu A4 wypełniającego kadr; wartości w tabeli należy traktować orientacyjnie jako zmierzone w warunkach idealnych; sprawność rozpoznawania zależy też od jakości obiektywu, kroju pisma, oświetlenia i jakości papieru
Więcej:bezcatnews