Komputery które myślą światłem

Komputery, które myślą światłem

Rozpoznawanie twarzy, głosu, analiza obrazów w diagnostyce medycznej o dokładności znacznie przekraczającej ludzką percepcję - wszystko to nie istniałoby, gdyby nie algorytmy głębokiego uczenia maszynowego. Naukowcy z MIT we współpracy z badaczami z innych placówek poszli krok dalej, konstruując optyczną sieć neuronową zdolną do samouczenia się.

Największym wyzwaniem dla budowy coraz bardziej zaawansowanych systemów samouczących się metodą głębokiego uczenia maszynowego jest złożoność obliczeniowa. Naukowcy z MIT opracowali innowacyjną technikę obliczeniową, w której zamiast tradycyjnych obwodów elektronicznych wykorzystuje się światło. Szczegóły dotyczące nowego rozwiązania podnoszącego wydajność głębokiego uczenia maszynowego na zupełnie nowy poziom naukowcy opublikowali w najnowszym wydaniu „Nature Photonics”. Innymi słowy zbudowali oni fotoniczną sieć neuronową, w której sygnały przekazywane są nie za pomocą impulsów elektrycznych, lecz świetlnych.

Sztuczne sieci neuronowe generalnie są modelami obliczeniowymi wzorującymi się na przetwarzaniu sygnałów w sposób realizowany w mózgu. Modele te umożliwiają niezwykle wydajne przetwarzanie wielu zadań związanych z uczeniem maszynowym. Takich jak: rozpoznawanie obrazów, twarzy, rozpoznawanie mowy, analiza obrazów, inteligentne sortowanie i porządkowanie danych i wiele, wiele więcej. Niestety współczesne rozwiązania sprzętowe w zakresie przetwarzania danych są zbyt mało efektywne, by pozwalały na budowę niezwykle wydajnych sieci neuronowych. Generalnie wszystkie dzisiejsze komputery wciąż bazują na architekturze von Neumanna, w której dane są przechowywane wspólnie z instrukcjami i są kodowane w ten sam sposób. Generalnie nie byłoby w tym nic złego, gdyby nie fakt, że John von Neumann, wespół z Johnem Eckertem i Johnem W. Mauchlym opracowali tę architekturę w… 1945 roku.

Marin Soljačić, fizyk z MIT

Marin Soljačić, fizyk z MIT nie ma wątpliwości, że światło pozwoli budować znacznie wydajniejsze sieci neuronowe (fot. MIT News)

Zespół z MIT oraz współpracujących placówek badawczych proponuje alternatywę – w pełni optyczną architekturę sieci neuronowych, która w zamyśle twórców ma wyróżniać się niezwykle dużą wydajnością, możliwością konstruowania bardzo złożonych sieci neuronowych, a wszystko to przy jednoczesnej efektywności energetycznej daleko przekraczającej najlepsze osiągnięcia tradycyjnej elektroniki.

Praca naukowców nie jest tylko teorią. Badacze zaprezentowali swoją koncepcję wykorzystując eksperymentalny model procesora nanofotonicznego zbudowanego z macierzy 56. programowalnych interferometrów Macha-Zehndera, czyli jednego z typów interferometrów optycznych, należących do grupy interferometrów dwuzwiązkowych; sam interferometr jest urządzeniem pomiarowym, którego dokładność bazuje na zjawisku interferencji (nakładania się) fal. W przypadku interferometrów użytych przez badaczy z MIT chodzi oczywiście o fale świetlne.

Wyniki pracy eksperymentalnego systemu optycznego do rozpoznawania samogłosek

Eksperymentalny system optyczny uzyskał poprawność rozpoznawania samogłosek na poziomie 76,7%. Najlepsze systemy klasyczne osiągają 90%, ale tu badacze są dopiero na początku drogi do prawdziwie optycznych sieci neuronowych (fot. Nature.com)

Eksperymentalne rozwiązanie zostało wykorzystane do zademonstrowania funkcji rozpoznawania samogłosek, stanowiącej składnik szerszej dziedziny, jaką jest rozpoznawanie głosu. Efekty są imponujące, nawet biorąc pod uwagę wciąż wstępną fazę konstrukcji systemu, udało się uzyskać poziom dokładności wynoszący niemal 77 procent. Konwencjonalne, znacznie wolniejsze i zużywające znaczne ilości energii systemy rozpoznawania głosu dziś uzyskują dokładność na poziomie 90 procent, ale pracujemy nad nimi już od lat. W przypadku systemów optycznych jesteśmy tak naprawdę na początku drogi i już uzyskujemy obiecujące rezultaty.

Na obecnym etapie, naukowcy są w stanie już zbudować poszczególne elementy optycznego systemu obliczeniowego zasilającego sieć neuronową, ale nie można jeszcze mówić o w pełni gotowym rozwiązaniu. Jeden z badaczy – Marin Soljačić – stwierdza że „ten układ (optyczny – dop. CHIP), gdy zostanie odpowiednio zestrojony, jest w stanie wykonać mnożenie macierzy niemal natychmiast, i to przy praktycznie zerowym zużyciu energii”.

Marin Soljačić dodaje, że nawet zwykłe soczewki okularów dokonują skomplikowanych obliczeń takich jak transformacja Fouriera właśnie dzięki falom świetlnym przechodzącym przez nie. Sposób realizacji obliczeń za pomocą wiązek światła w nowych układach fotonicznych jest znacznie bardziej ogólny, ale opiera się na podobnej podstawowej zasadzie. Nowe podejście wykorzystuje wiele wiązek światła skierowanych w taki sposób, by oddziaływania fal tworzyły odpowiednie wzorce przekazujące wynik zaplanowanej operacji. W rezultacie otrzymane urządzenie jest czymś, co naukowcy określają jako programowalny procesor nanofotoniczny.

Z kolei Dirk Englund z zespołu badawczego pracującego nad opisywaną technologią, podkreśla że programowalny procesor nanofotoniczny może być również wykorzystywany do przetwarzania sygnału w celu transmisji danych. „Szybkie przetwarzanie analogowych sygnałów jest czymś naturalnym dla układu nanofotonicznego”. Dlaczego? Ponieważ światło jest również natywnym medium analogowym. A to oznacza szybsze podejście niż w przypadku konwencjonalnych rozwiązań wymagających przekształcenia sygnału w postać cyfrową.

O tym, jak bardzo przełomowe jest to odkrycie świadczy fakt, że układy optyczne wykorzystujące nowoopracowaną architekturę mogą w zasadzie przeprowadzać obliczenia realizowane w typowych algorytmach sztucznej inteligencji, ale czynią to niewyobrażalnie szybciej wykorzystując przy tym o kilka rzędów wielkości mniejszą energię. Celowo Soljačić podał przykład mnożenia macierzy, ponieważ jest to jedna z najbardziej czasochłonnych i zużywających energię operacji stanowiących część współczesnych algorytmów sztucznej inteligencji. I choć naukowcy podkreślają, że do uzyskania w pełni gotowego systemu nanofotonicznego jest jeszcze długa droga, to potencjał tego rozwiązania jest olbrzymi – może on znaleźć zastosowanie wszędzie tam, gdzie klasyczna elektronika musiałaby wykonać obliczenia trwające zbyt dużo czasu i generowałaby zbyt wielkie koszty. | CHIP