Kaspersky Lab patentuje swoją technologię antyspamową

Filtry spamowe nie mają obecnie większych problemów z wykrywaniem spamowych wiadomości tekstowych. Dlatego spamerzy często stosują technologię ukrywania niechcianych wiadomości w obrazach w celu zamaskowania tekstu. Filtrowanie spamu graficznego jest o wiele trudniejsze – zanim filtr antyspamowy będzie mógł określić, czy zawarty w wiadomości tekst jest spamem, musi najpierw wykryć tekst w obrazie. Większość metod wykorzystywanych w celu wykrywania tekstu w obrazach opiera się na maszynowym rozpoznawaniu obrazów. Rozpoznawanie maszynowe wymaga jednak ujednolicenia rozmiaru, stylu i rozmieszczenia symboli. To ograniczenie wykorzystywane jest przez spamerów, którzy celowo zniekształcają i tworzą “szum” w grafice, aby utrudnić wykrywanie.

Technologia firmy Kaspersky Lab została zaprojektowana w celu zapewnienia skutecznego wykrywania tekstu i spamu w obrazach rastrowych bez konieczności stosowania maszynowego rozpoznawania obrazów. Podejście to zapewnia szybkie wykrywanie oraz możliwość rozpoznawania tekstu w prawie każdym języku. Nowa technologia antyspamowa firmy Kaspersky Lab została rozwinięta przez Jewgienija Smirnowa. Federalny Urząd ds. Własności Intelektualnej, Patentów i Znaków Handlowych przyznał jej patent 13 stycznia 2009 roku.

– Z jednej strony nasza nowa metoda całkiem dobrze radzi sobie w wykrywaniu obrazów, które zawierają tekst w niemal każdym języku – powiedział Jewgienij Smirnow, twórca technologii i menedżer ds. rozwoju technologii antyspamowych w Kaspersky Lab. – Z drugiej strony, nie próbujemy czytać tekstu przy użyciu rozpoznawania maszynowego, dlatego metoda ta ma wystarczająco niskie wymagania dotyczące zasobów, aby mogła być wykorzystana w wysoce wydajnym filtrze spamowym firmy Kaspersky Lab – dodał.

Nowa opatentowana przez Kaspersky Lab technologia opiera się na probabilistycznym i statystycznym podejściu. To, czy obraz zawiera tekst, określa rozmieszczenie graficznych wzorów słów i linii, jak również zawartość liter i słów w tych wzorach. Dzięki wyspecjalizowanym filtrom na system nie mają wpływu elementy “szumu” ani złamania tekstu w obrębie obrazów, natomiast wykorzystanie unikatowej metody wykrywania wierszy tekstu przeciwdziała stosowanym w spamie graficznym technikom zaciemniania, takim jak zniekształcanie obrazu i obracanie. Nowy system potrafi również skutecznie rozpoznać, czy wykryty tekst jest spamem poprzez porównanie jego sygnatury z zawartymi w bazach danych szablonami spamu.

– Wynalazek ten ma istotne znaczenie dla branży antyspamowej” – powiedział Nadieżda Kaszenko, menedżer ds. praw patentowych w firmie Kaspersky Lab. – Warto wspomnieć, że istnieje wiele różnych technologii wykrywania spamowych wiadomości tekstowych, ale bardzo niewiele rozwiązań rozpoznaje spamową wiadomość tekstową w obrazie. Rozwiązania te są bardzo skomplikowane i nieefektywne, ponieważ najpierw muszą znaleźć tekst w obrazie, a dopiero później zdecydować, czy to spam. Metoda Jewgienija Smirnowa jest unikatowa. Jest to technologia nowej generacji, dlatego mogliśmy wystąpić o przyznanie jej prawa patentowego – dodał.