Projekt Naptha pozwoli na bezproblemowe kopiowanie tekstu z… obrazków!

Projekt Naptha pozwoli na bezproblemowe kopiowanie tekstu z… obrazków!

Project Naptha to zaawansowane narzędzie OCR, wydane w postaci dodatku dla przeglądarki Google Chrome. Jeśli chodzi o funkcjonalność, to nie ustępuje on innym, darmowym silnikom wykorzystywanym w open-source’owych programach OCR i chociaż komercyjne rozwiązania oferują o wiele więcej, to przy codziennym kopiowaniu tekstu z obrazków Naptha nie ma sobie równych. Działa bezpośrednio w przeglądarce, przez co bardzo szybko zapominamy, że instalowaliśmy jakieś rozszerzenie.

Wystarczy najechać kursorem myszki na dowolną grafikę w Sieci, żeby Natpha rozpoczął poszukiwanie tekstu umieszczonego na obrazku. Algorytm wykorzystywany przez Naptha to projekt Microsoftu o nazwie Stroke with Transform. Przez to, że czcionki mają zazwyczaj dość podobne szerokości, są stosunkowo łatwe do wychwycenia przez algorytm Microsoftu.

Po zaznaczeniu interesującego nas bloku tekstu i wybraniu opcji jego skopiowania, bitmapa z której tekst ma być skopiowany przesyłana zostaje na serwer projektu, na którym działa OCR-owy silnik Ocrad. Po kilku sekundach otrzymujemy gotowy do skopiowania, przetworzony tekst. Jeśli silnik Ocrad nie spełnia naszych oczekiwań, w opcjach dodatku istnieje możliwość przełączenia się na silnik stworzony przez Google’a – Tesseract, który wydaje się znacznie lepiej radzić sobie z niektórymi czcionkami.

Dodatek pozwala również na wymazywanie tekstu z obrazka, lub jego tłumaczenie (język polski rzecz jasna nie jest obsługiwany i nie wiadomo, czy kiedykolwiek będzie). Naptha pobrać można stąd: http://projectnaptha.com/