Pecet uczy się czytać

Wyjaśnienie kilku podstawowych pojęć związanych z rozpoznawaniem tekstu

Programy do rozpoznawania tekstu nie tylko, w sposób podobny do człowieka, analizują odczytywane znaki za pomocą sztucznych sieci neuronowych, ale również samodzielnie prowadzą dyskusje naukowe. W trudniejszych przypadkach umieszczone w tych aplikacjach systemy ekspertowe dyskutują bowiem uzyskane przez siebie „wyniki badań”. Kontrolę nad przebiegiem takiej konferencji sprawuje jej najbardziej inteligentny uczestnik – logika rozmyta.

Mimo dynamicznego rozwoju publikacji elektronicznych i Internetu papier, wynaleziony przez Chińczyków prawie dwa tysiące lat temu, nadal jest najchętniej używanym medium do przekazywania „słowa pisanego”. Dlatego też od początku rozwoju techniki komputerowej pojawił się problem przenoszenia informacji z komputera na papier – drukowania, a także odczytywania informacji z papieru i przekładania jej na język zrozumiały dla przeciętnego peceta. Rozwiązywaniem drugiego z wymienionych zadań, czyli rozpoznawaniem tekstu, zajmują się systemy typu OCR (

Optical Character Recognition — optyczne rozpoznawanie znaków). W tej chwili systematycznie zastępują je młodsi bracia, tak zwane systemy ICR (ang. Intelligent Character Recognition – inteligentne rozpoznawanie znaków), których „inteligencja” polega na wykorzystywaniu algorytmów rozpoznawania wzorowanych na ludzkim sposobie percepcji.

Z całą pewnością żadnego użytkownika komputera nie trzeba dzisiaj zachęcać do używania drukarki, natomiast wykorzystywanie skanera i oprogramowania OCR nie jest jeszcze zjawiskiem powszechnym. Wyobraźmy sobie zatem taką sytuację: jest późne, piątkowe popołudnie, właśnie przygotowujemy się do wyjścia z biura, gdy nagle otrzymujemy od szefa polecenie natychmiastowego opracowania dziesięciostronicowej umowy (czy też cennika, oferty, artykułu, informacji prasowej itp.) dla jednego z kontrahentów. Jak to w życiu bywa, wzorcowy tekst umowy „wyparował” nam z komputera podczas ostatnich porządków na dysku twardym i pozostała jedynie jego papierowa wersja. Cóż więc możemy z tym fantem zrobić? Pierwsze rozwiązanie to wyjaśnienie szefowi problemów z wywiązaniem się z polecenia i sugestia, iż dopiero w przyszłym tygodniu sprawa zostanie załatwiona – jest to rozwiązanie nieeleganckie i na pewno nie wpłynie pozytywnie na naszą karierę zawodową. Drugi pomysł to ręczne „wklepanie” od początku całego tekstu. W tym wypadku sukces jest gwarantowany, umowa zostanie przygotowana, ale prawdopodobnie wyjdziemy z biura późnym wieczorem. Ponadto, przepisując tekst z kartki możemy popełnić wiele pomyłek, których korekta moźe potrwać długo. Najlepszym wyjściem jest rozwiązanie trzecie – jeżeli w biurze mamy skaner i program OCR, możemy szybko zeskanować wydruk umowy (skanowanie jednej strony A4 trwa, w zależności od skanera, ok. 20-40 sekund), a następnie automatycznie przekonwertować obraz strony na tekst i zapisać w formacie używanym przez nasz edytor. Proces konwersji, czyli rozpoznawania tekstu, w zależności od jakości wydruku, wielkości czcionki, typu komputera oraz oczywiście rodzaju oprogramowania OCR może zająć od 30 sekund do kilku minut na jedną stronę. Przy odrobinie wprawy całkowity czas wczytania umowy wraz z jej korektą i przygotowaniem poprawek dla szefa nie powinien, w naszym przypadku, przekroczyć godziny! Dziesięć stron tekstu to około 4500 wyrazów; w najgorszym przypadku daje to prędkość rozpoznawania i korekty równą 75 słowom na minutę, czego pozazdrościć nam może nawet bardzo wprawna maszynistka. W nagrodę mamy wolne całe piątkowe popołudnie i uznanie szefa…

0
Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.