Sieci neuronowe funkcjonowały w niezrozumiały sposób. Pomogła metoda sprzed 200 lat

Kiedy sieci neuronowe – będącego produktem czasów współczesnych – funkcjonują w nie do końca wyjaśniony sposób, to jeden ze sposobów na ich zrozumienie wymaga cofnięcia się do poprzednich stuleci.
Sieci neuronowe funkcjonowały w niezrozumiały sposób. Pomogła metoda sprzed 200 lat

Zacznijmy od wyjaśnienia, czym w ogóle są owe systemy. Tego typu sieci naśladują funkcjonowanie układu nerwowego spotykanego u żywych organizmów, włącznie z ludźmi. Neurony odpowiadają za transport informacji, a ich współpraca pozwala na rozwiązywania wielu różnych zadań, takich jak na przykład rozpoznawanie twarzy. Kiedy warstw neuronów jest wiele, to mówimy wtedy o głębokich sieciach neuronowych.

Czytaj też: Czego pragnie sztuczna inteligencja? Bing jest z nami od niedawna, a już ma dość ludzi

Oczywiście takie technologie nadal są w fazie rozwoju. I choć już niejednokrotnie zachwycały nas swoimi możliwościami, to inżynierowie muszą mierzyć się z ich ograniczeniami. Jedną z niewiadomych pozostawało to, jak sieci neuronowe dochodzą do pewnych wniosków. Bo choć ostatecznie wykonywały to, o co je proszono, to nie były w stanie dostarczyć instrukcji wyjaśniających, jak tego dokonały.

Chcąc to zmienić naukowcy skorzystali z tzw. analizy Fouriera, skupiającej się na sposobie, w jaki ogólne funkcje mogą być reprezentowane lub przybliżane przez sumy prostszych funkcji trygonometrycznych. Jest ona powiązana z postacią Josepha Fouriera, francuskiego matematyka i fizyka, który zmarł w 1830 roku. Autorzy nowych badań w tej sprawie wykorzystali analizę Fouriera do identyfikacji wzorców w danych w przestrzeni i czasie.

Sieci neuronowe naśladują sposób funkcjonowania ludzkiego mózgu

O rezultatach swoich wysiłków piszą na łamach PNAS Nexus. Doniesienia w tej sprawie są istotne choćby ze względu na fakt, iż sieci neuronowe są powszechnie wykorzystywane, między innymi do analizowania ogromnych ilości danych czy rozpoznawania twarzy. W toku prowadzonych eksperymentów badacze wzięli pod uwagę turbulencje w atmosferze lub wodzie oceanicznej i postawili sobie za cel przewidywanie ich zmian. 

Co istotne, parametry niewyszkolonych sieci neuronowych mają zazwyczaj wartości losowe. Kiedy trwa szkolenie, są one modyfikowane i doskonalone – jest to pokłosiem postępów dokonujących się w obrębie trenowanej sieci. Niestety, panowało przekonanie, że sieci neuronowe zawierają zbyt wiele parametrów, które w wielu przypadkach nie miały żadnego sensu. Dzięki analizie Fouriera sytuacja się poprawia, a uzyskane korzyści dotyczą nie tylko turbulencji w wodzie i atmosferze, lecz również innych zagadnień, obejmujących zarówno Ziemię jak i inne planety. 

Czytaj też: Sztuczne neurony działają. Są niemal identyczne jak te, które występują w naszych mózgach

Dotychczasowe osiągnięcia powinny zaprocentować w kontekście ułatwienia sieciom neuronowym ekstrapolacji z jednego systemu na inny. Jest to tzw. uczenie się przez transfer. Metoda ta skupia się na przekwalifikowaniu niewielkiej liczby kluczowych neuronów w sieci neuronowej, aby pomóc jej w analizie innych systemów, a ostatnie postępy będą pomocne w identyfikacji najbardziej potrzebnych neuronów. W ramach dalszych badań naukowcy chcieliby lepiej zrozumieć, jak sieci neuronowe uczą się łączyć filtry w celu uzyskania pożądanych rezultatów.