Superkomputer bez klasycznego kultu GPU. Wepchnęli się tam, gdzie gigantów zaboli

Mam wrażenie, że dziś dyskusja o komputerach wysokiej wydajności została brutalnie uproszczona. Jeśli coś ma liczyć szybciej, dokładniej i na większą skalę, to odruchowo szukamy w tej historii po prostu coraz bardziej zaawansowanych kart graficznych. W świecie sztucznej inteligencji taki kierunek jest dość zrozumiały. Więcej modeli, więcej parametrów, więcej danych i jeszcze więcej prądu. Proste? Proste. Jednak coraz trudniejsze do utrzymania i poniekąd krzywdzące z perspektywy superkomputerów, które wcale nie istnieją wyłącznie po to, żeby trenować kolejne modele językowe i obsługiwać modne usługi w chmurze. Ich najbardziej niewdzięczne zastosowania nadal leżą w fizyce, symulacjach materiałowych, aerodynamice, bezpieczeństwie energetycznym i modelowaniu zjawisk z ultrawysoką precyzją.

Właśnie dlatego przypadek Spectry, czyli nowego superkomputera z układami Maverick-2 od izraelskiego NextSilicon, jest dla mnie ciekawy, bo właśnie ktoś przeszedł test w miejscu, w którym tanie obietnice zwyczajnie nie wystarczają.

Spectra przeszedł przez sito Sandii, a to już coś wielkiego

Firma NextSilicon właśnie poinformowała, że jej superkomputer Spectra osiągnął pełną akceptację systemową w Sandia National Laboratories w ramach programu Vanguard. Dlaczego to takie ważne? Ano dlatego, że Spectra jest dopiero drugim systemem wdrożonym w ramach tego programu, który polega na sprawdzaniu nowych, nieoczywistych sprzętów obliczeniowych pod kątem zadań istotnych dla amerykańskich laboratoriów narodowych. Pierwszym był Astra, który w 2018 roku pokazał, że procesory Arm mogą skalować się w środowisku superkomputerowym. Co z tego wyniknęło? Otóż to, że dziś Arm w centrach danych nie brzmi już egzotycznie, ale wtedy był to eksperyment wysokiego ryzyka.

Czytaj też: Chińczycy w obliczeniowej ofensywie. Ich superkomputer robi w ciągu mikrosekund to, czego amerykański w ogóle nie potrafi

Sam komputer Spectra ma 64 węzły obliczeniowe i 128 akceleratorów Maverick-2 w konfiguracji dual-die. System powstał we współpracy Sandii, NextSilicon i Penguin Solutions, a jego zadaniem jest obsługa obciążeń związanych z programem Advanced Simulation and Computing, czyli tym obszarem, w którym liczy się przede wszystkim precyzja, stabilność i przewidywalność liczenia. Podczas testów Spectra uruchamiała między innymi HPCG, LAMMPS oraz SPARTA, czyli zestaw obciążeń znacznie bliższy rzeczywistej nauce i symulacjom niż syntetycznemu podbijaniu rekordów.

Maverick-2 nie jest jednocześnie klasycznym GPU, które dostaje zadanie i przepycha przez swoje zasoby ogromną falę obliczeń. NextSilicon opisuje tę architekturę jako układ zdolny do dostosowywania zasobów sprzętowych do aplikacji w czasie działania. Innymi słowy, zamiast traktować każdy problem tym samym młotkiem, Maverick-2 ma próbować przebudowywać sposób pracy pod konkretny kod. Takie podejście obiecuje większą wydajność przy mniejszym zużyciu energii, ale obiecywać w tej branży można wszystko. Dlatego właśnie test w laboratoriach tej klasy był tak ciekawy, bo sprawdza takie obietnice na konkretnych zadaniach.

Problem NVIDII nie polega na tym, że jest słaba

NVIDIA jest dziś gigantem nie tylko dlatego, że ma szybkie procesory, ale dlatego, że ma cały ekosystem – CUDA, biblioteki, narzędzia, gotowe platformy, sieci, serwery, partnerów i dziś nawet bezwładność rynku po swojej stronie. Widać to choćby przy Vera Rubin, gdzie skala planowanych systemów robi wrażenie nawet na tle obecnego Blackwella, czy przy DGX Spark, który sprowadza część tej infrastrukturalnej logiki na biurko i którego sprawdziłem zresztą w praktyce.

Czytaj też: Atomy zamiast anteny. Udowodnię Ci, że to nie komputer kwantowy może zmienić świat jako pierwszy

Problem jest subtelniejszy. Rynek sztucznej inteligencji ciągnie największych producentów w stronę obliczeń o niższej precyzji, bo trenowanie i inferencja modeli językowych mają inne priorytety niż klasyczne symulacje fizyczne. Dlatego laboratoria takie jak Sandia coraz uważniej patrzą na nowych dostawców, bo potrzebują mocy do wysokoprecyzyjnych obliczeń naukowych, a nie wyłącznie do tego, czym żyje dziś rynek AI. W takich zastosowaniach podwójna precyzja w obliczeniach nie jest żadną fanaberią. Ba, to warunek, żeby wynik nie rozjechał się przez błędy zaokrągleń tam, gdzie symulacja dotyczy zjawisk o ogromnej rozpiętości skali.

Dlatego NextSilicon wciska się w miejsce, które gigantów może zaboleć. Nie musi pokonać NVIDII w każdym zadaniu. Wystarczy, że pokaże wiarygodną alternatywę tam, gdzie GPU są zbyt drogie, prądożerne, trudne w dostępie albo coraz mocniej projektowane pod inne priorytety. Oczywiście dla laboratoriów narodowych sama możliwość dywersyfikacji dostawców ma też wartość strategiczną.

Prądożerność staje się drugim limitem superkomputerów

W ostatnich latach cały świat za często patrzył na moc obliczeniową tak, jakby jedynym ograniczeniem były pieniądze. Tyle że coraz częściej pierwszym problemem nie jest sam zakup sprzętu, tylko energia, chłodzenie i infrastruktura dookoła. Widać to przy zużyciu energii przez chipy AI i przy szerszym pytaniu o koszt środowiskowy usług takich jak ChatGPT. Centra danych stały się fizycznym problemem, a nie tylko cyfrową usługą działającą “gdzieś w chmurze”. Wspominam o tym dlatego, że NextSilicon twierdzi, że Maverick-2 może ograniczać zużycie energii przez lepsze dopasowanie sprzętu do kodu i zmniejszenie kosztu przesuwania danych między pamięcią a jednostkami obliczeniowymi.

Nie wierzyłbym jednak we wszystkie obietnice dotyczące tej przewagi Mavericka-2 nad GPU czy CPU, a przynajmniej dopóty, dopóki nie zobaczymy szerszych, niezależnych porównań na większej liczbie aplikacji. W HPC diabeł siedzi w szczegółach, bo w konkretnym solverze, profilu pamięciowym, komunikacji między węzłami, kompilatorze i bibliotekach.

Superkomputer z Maverick-2 uderza tam, gdzie boli najbardziej

Dla mnie najciekawszy aspekt Maverick-2 nie leży zresztą nawet w tym, czy układ jest cztery, dziesięć czy dwadzieścia razy lepszy w jakiejś wybranej metryce. Takie porównania bardzo łatwo dobrać pod siebie. Znacznie ważniejsze jest pytanie, czy taka nowa architektura potrafi wejść w istniejący świat kodu bez zmuszania naukowców do przepisywania aplikacji. NextSilicon akurat mocno podkreśla ten punkt, bo wedle zapewnień Maverick-2 ma obsługiwać popularne języki i modele programowania, a w tym C/C++, Fortran, OpenMP i Kokkos, a cała jego idea ma polegać na ograniczeniu bolesnego portowania.

Czytaj też: Sekret niesamowitej prędkości delfinów odkryty. Superkomputery ujawniły, co dzieje się pod wodą

Jeśli więc Maverick-2 dalej będzie przechodził kolejne etapy weryfikacji, NextSilicon może stać się czymś więcej niż ciekawym startupem. Może stać się jednym z tych graczy, którzy nie burzą rynku frontalnym atakiem, tylko wchodzą przez drzwi zostawione przez gigantów. Takie wejścia bywają dla rynku znacznie bardziej niewygodne. Przykład z konsumenckiego poletka? Procesory Ryzen od AMD, które rozbiły wieloletnią dominację (i stagnację) Intela.

Źródła: NextSilicon, Sandia LabNews, Reuters

Spectra przeszedł przez sito Sandii, a to już coś wielkiego

Problem NVIDII nie polega na tym, że jest słaba

Prądożerność staje się drugim limitem superkomputerów

Superkomputer z Maverick-2 uderza tam, gdzie boli najbardziej

Mateusz Łysoń