Projekt Naptha pozwoli na bezproblemowe kopiowanie tekstu z… obrazków!

Projekt Naptha pozwoli na bezproblemowe kopiowanie tekstu z… obrazków!

Project Naptha to zaawansowane narzędzie OCR, wydane w postaci dodatku dla przeglądarki Google Chrome. Jeśli chodzi o funkcjonalność, to nie ustępuje on innym, darmowym silnikom wykorzystywanym w open-source’owych programach OCR i chociaż komercyjne rozwiązania oferują o wiele więcej, to przy codziennym kopiowaniu tekstu z obrazków Naptha nie ma sobie równych. Działa bezpośrednio w przeglądarce, przez co bardzo szybko zapominamy, że instalowaliśmy jakieś rozszerzenie.

Wystarczy najechać kursorem myszki na dowolną grafikę w Sieci, żeby Natpha rozpoczął poszukiwanie tekstu umieszczonego na obrazku. Algorytm wykorzystywany przez Naptha to projekt Microsoftu o nazwie Stroke with Transform. Przez to, że czcionki mają zazwyczaj dość podobne szerokości, są stosunkowo łatwe do wychwycenia przez algorytm Microsoftu.

Po zaznaczeniu interesującego nas bloku tekstu i wybraniu opcji jego skopiowania, bitmapa z której tekst ma być skopiowany przesyłana zostaje na serwer projektu, na którym działa OCR-owy silnik Ocrad. Po kilku sekundach otrzymujemy gotowy do skopiowania, przetworzony tekst. Jeśli silnik Ocrad nie spełnia naszych oczekiwań, w opcjach dodatku istnieje możliwość przełączenia się na silnik stworzony przez Google’a – Tesseract, który wydaje się znacznie lepiej radzić sobie z niektórymi czcionkami.

Dodatek pozwala również na wymazywanie tekstu z obrazka, lub jego tłumaczenie (język polski rzecz jasna nie jest obsługiwany i nie wiadomo, czy kiedykolwiek będzie). Naptha pobrać można stąd: http://projectnaptha.com/

Napisane przez

Tomasz Domanski

RedaktorNauka i nowe technologie, które pomagają nam ewoluować to mój konik. Oprócz tego interesuję się sprzętem audio, motoryzacją i robieniem zdjęć. W Chip.pl po raz pierwszy pojawiłem się w 2009 r. i... po 4 latach przerwy wracam ;)