Google Książki rozwinie się dzięki zakupowi mechanizmu CAPTCHA

CAPTCHA to skrót od Completely Automated Public Turing test to tell Computers and Humans Apart, czyli kompletnie zautomatyzowany test który potrafi odróżnić człowieka od maszyny. Działa on bardzo prosto: jeżeli autor witryny chce się upewnić, że udostępniony formularz ma zostać wypełniony przez człowieka, a nie automat, umieszcza obrazek na koniec ze zdeformowanymi literami, które są trudne do odczytania przez maszynę, a za to banalnie proste przez człowieka. Google zakupił tę technikę, by wpisywane przez nas ciągi znaków się do czegoś przysłużyły. A konkretnie do rozwoju usługi Google Książki.
Digitalizacja zbiorów będzie trwała aż do przetworzenia wszystkich zasobów bibliotecznych Pomorza, szacowanych na ponad 20 mln stron dokumentów
Digitalizacja zbiorów będzie trwała aż do przetworzenia wszystkich zasobów bibliotecznych Pomorza, szacowanych na ponad 20 mln stron dokumentów

Koncern z Moutain View, dzięki zakupowi firmy reCAPTCHA, autora mechanizmu, wykorzysta nas jako ludzkie maszyny OCR, które będą przy okazji testów CAPTCHA przepisywać fragmenty skanowanych książek, zamiast losowo wygenerowanych znaków. Część znaków widocznych jest już rozpoznana przez komputer, i to działa jako mechanizm weryfikacji mający nas odróżnić od maszyny. Drugą część przepisujemy sami, dzięki czemu wspieramy Google Książki. Naturalnie, nie wiadomo która część jest już rozpoznana, a którą odgadujemy my po raz pierwszy.

Google Książki to usługa dość kontrowersyjna z uwagi na prawa autorskie. Czytaj więcej.