Google z lepszym tłumaczeniem offline

Do tej pory w Tłumaczu Google mieliśmy do dyspozycji dwie techniki przekładu. Teraz w aplikacji dla iOS-a i Androida pojawi się offline'owy mechanizm NMT.

NMT to skrót od Neural Machine Translation (ang. tłumaczenie maszynowe z użyciem sieci neuronowej). By zrozumieć, dlaczego zmiana w oprogramowaniu Google’a jest tak ważna, należy przyjrzeć się temu, jak funkcjonowało ono dotychczas. Kiedy mieliśmy dostęp do sieci, korzystając z aplikacji Google Translate na iOS-a czy Androida, wykorzystywaliśmy sieć neuronową Google’a, pracującą wydajnie dzięki szybkim serwerom internetowego giganta. Kiedy zaś dostępu do sieci zabrakło, przechodziliśmy na metodę nazywaną PBMT (Phrase-Based Machine Translation, czyli tłumaczenie maszynowe bazujące na frazach). Oprogramowanie rozpoznawało konkretne słowa i tłumaczyło je niemal dosłownie. Efekt nie był jeszcze taki zły w przypadku, gdy tłumaczyliśmy między językami o podobnej gramatyce czy budowie zdania. Ale przekład choćby z niemieckiego na polski okazywał się być daleki od idealnego. A teraz mamy do dyspozycji nową metodę – On-device NMT.

Dotychczas bez dostępu do sieci dostępna była tylko pierwsza z metod oparta na starych mechanizmach (graf. TechCrunch)

Jak widać, efekty różnią się. I choć każde zdanie brzmi zrozumiale, PBMT jest nieco ułomne, a pełne, online’owe tłumaczenie zaproponowało właściwy przekład. On-device (offline) NMT proponuje podobną wersję co Online NMT, chociaż z błędem.

Wsparcie dla offline’owego NMT działa już dla 59 języków, w tym dla polskiego. Pełna lista obejmuje: afrykanerski, albański, arabski, białoruski, bengalski, bułgarski, kataloński, chiński, chorwacki, czeski, duński, holenderski, angielski, esperanto, estoński, filipiński, fiński, francuski, galicyjski, gruziński, niemiecki, grecki, gudźarati, haitański, kreolski, hebrajski, hindi, węgierski, islandzki, indonezyjski, irlandzki, włoski, japoński, kannada, koreański, łotewski, litewski, macedoński, malajski, maltański, norweski, perski, polski, portugalski, rumuński, rosyjski, słowacki, słoweński, hiszpański, swahili, szwedzki, tamilski, tajski, turecki, ukraiński, urdu, wietnamski oraz walijski.

Jeszcze niedawno podobne rozwiązanie na urządzeniach mobilnych nie byłoby możliwe z powodu zbyt niskiej wydajności procesorów. Dziś nie ma już tego problemu. | CHIP