Algorytm komputerowy pisze streszczenia

Gdybyśmy chcieli przeczytać każdy ciekawy artykuł z Facebooka czy Twittera, prawdopodobnie nie mielibyśmy czasu na nic innego. Amerykańska firma Salesforce opracowała algorytm, który logicznie skróci każdy tekst.
Dostęp do informacji mamy już wszędzie, ale co z czasem na ich przeczytanie? / fot. Unsplash

Dostęp do informacji mamy już wszędzie, ale co z czasem na ich przeczytanie? (fot. Unsplash)
Przeciążenie informacyjne. Dobrze to znamy – codziennie musimy czytać wiele tekstów, wiadomości i dokumentów. Nie zawsze dla przyjemności. Aby pomóc naukowcom, prawnikom i wszystkim innym zainteresowanym Salesforce stworzyło SI, która potrafi streścić każdy tekst.

Algorytm wykorzystuje jedną z metod uczenia maszynowego, tzw. uczenie przez wzmacnianie (ang. Reinforcement Learning). Jest to metoda wzorowana na pojęciu wzmocnienia, znanym z nauk behawioralnych w psychologii. System działa w nieznanym mu środowisku, a jedyną informacją, jaką otrzymuje, jest sygnał wzmocnienia – pozytywny w przypadku podejmowania trafnych decyzji (nagroda) lub negatywny w przypadku pomyłki (kara). Dzięki tej metodzie komputery są w stanie nauczyć się, jak grać w złożone gry, czy sterować robotami.

Algorytm skanuje tekst w poszukiwaniu najbardziej istotnych informacji / fot. Technologyreview.com

Algorytm skanuje tekst w poszukiwaniu najbardziej istotnych informacji (fot. technologyreview.com)

Algorytm Salesforce analizuje cały tekst, a następnie wyciąga z niego najistotniejsze dane. Nie robi tego może w sposób tak dobry, jak zrobiłby to człowiek, ale w dalszym ciągu tekst jest zrozumiały. Z artykułu News York Timesa, liczącego 400 słów, algorytm wydobył 47. Zamiast tekstu na 2500 znaków, mamy zatem trzy zdania, które stanowią esencję całości. Ich przeczytanie zajmuje tylko kilka sekund.

Choć do tej pory nie udało się stworzyć lepszego narzędzia do tworzenia podsumowań tekstów, przed rozwojem algorytmu jeszcze długa droga. Kristian Hammond, profesor z Northwestern University i założycielka firmy Narrative Science mówi, że badania Salesforce są dobrym pomysłem, ale pokazują także ograniczenia płynące z wciąż niewielkiej wiedzy maszyn z zakresu semantyki. Komputery muszą nauczyć się, jak budowa wyrazu określa jego znaczenie i jakie związki zachodzą między sformułowaniami. Wtedy efekt działania algorytmów będzie bardziej przypominał sposób budowania zdań przez ludzi.

Źródło: TechnologyReview
Close

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.