Potęga obliczeniowa bez czekania na Nvidię. USA miały uderzyć w Chiny, a wywołały coś odwrotnego

Chcesz czytać więcej treści jak „Potęga obliczeniowa bez czekania na Nvidię. USA miały uderzyć w Chiny, a wywołały coś odwrotnego"?Dodaj CHIP.pl do preferowanych źródeł w Google

Od kilku lat mam wrażenie, że cała rozmowa o sztucznej inteligencji została sprowadzona do jednego pytania. Tego, ile kart firmy NVIDIA udało się komuś wpiąć w centrum danych. Jest to oczywiście duże uproszczenie, ale pasuje do obecnej hierarchii rynku. NVIDIA daje bowiem dostęp do najlepszych akceleratorów, szybkiej pamięci, CUDA, gotowych bibliotek i sprawdzonego zaplecza serwerowego, więc z jej sprzętem można grać w pierwszej lidze. Nie masz? No to zaczynasz kombinować i to właśnie robi Alibaba, czyli gigant na chińskim rynku.

Alibaba nie pokazała tylko nowego procesora do AI

Alibaba zaprezentowała światu układ Zhenwu M890, czyli nowy akcelerator od swojego oddziału T-Head, który specjalizuje się w półprzewodnikach. Na pierwszy rzut oka można potraktować to jak kolejną odpowiedź Chin na amerykańskie restrykcje wobec Nvidii, ale dla mnie sprawa jest znacznie szersza. Ten chip nie został bowiem opisany wyłącznie jako sprzęt do klasycznego trenowania modeli językowych. Zhenwu M890 ma być w rzeczywistości układem projektowanym specjalnie pod długotrwałą pracę autonomicznych agentów AI, czyli systemów, które nie odpowiadają tylko na jedno pytanie, lecz potrafią wykonywać wieloetapowe zadania, utrzymywać kontekst i koordynować działania między modelami.

Czytaj też: Chiny chcą prądu z kosmosu. Energetyka przyszłości, czy wstęp do filmu katastroficznego?

Chatbot potrzebuje szybkiej odpowiedzi, ale agent potrzebuje pamięci, komunikacji, stabilności i zdolności do pracy przez długi czas w sposób spójny. Jest to więc zupełnie inna klasa obciążeń. Jeżeli model ma przez wiele godzin pisać kod, korzystać z narzędzi, analizować pliki, poprawiać własne błędy i współpracować z innymi agentami, to wtedy zaczyna liczyć się cały system. Dlatego też tuż obok M890 pojawił się Panjiu AL128, czyli serwerowy superwęzeł z 128 akceleratorami w jednej szafie. Według zapewnień producenta taka konstrukcja ma oferować przepustowość na poziomie petabajtów na sekundę w obrębie jednej szafy, a sam system jest już dostępny dla chińskich klientów przez platformę Bailian, znaną też jako Model Studio na rynku Chin.

Swoją drogą, Alibaba zapowiedziała wcześniej inwestycję ponad 380 mld juanów w chmurę i infrastrukturę AI w ciągu trzech lat. Mowa tutaj o aż około 204 miliardach złotych, więc sprzęt tego typu jest ewidentnie częścią wielkiego planu.

Specyfikacja Zhenwu M890 wygląda obiecująco, ale sam sprzęt nie wystarczy

Zhenwu M890 ma zapewniać trzykrotnie wyższą wydajność od poprzednika, czyli Zhenwu 810E. Dostaje 144 GB pamięci GPU, 800 GB/s przepustowości komunikacji między układami i obsługę formatów od FP32 do FP4. Zwłaszcza FP4 jest tutaj ważne, bo ten rodzaj obliczeń staje się dziś jedną z kluczowych ścieżek obniżania kosztu inferencji AI, a to szczególnie wtedy, gdy modele nie muszą liczyć wszystkiego z wysoką precyzją. Alibaba łączy to z własnym protokołem ICN, przełącznikiem ICN Switch 1.0 o 25,6 Tb/s przepustowości i oprogramowaniem T-Head SAIL.

Czytaj też: Ja programuje gry, a oni samą materię. Spytacie pewnie, kto jest szczęśliwy?

Oczywiście jednak sama specyfikacja nie mówi jeszcze, jak ten sprzęt zachowa się w porównaniu z ekosystemem Nvidii w prawdziwych wdrożeniach. Nvidia nie jest dziś potężna wyłącznie dlatego, że sprzedaje szybkie układy. Jej przewaga leży w tym, że dostarcza cały świat narzędzi, bibliotek, serwerów, sieci, integratorów i przyzwyczajeń programistów. CUDA jest tu niemal osobnym systemem operacyjnym dla rynku AI, więc przeskoczenie takiej przewagi wymaga lat rozwoju i współpracy z firmami nad ulepszaniem swojego ekosystemu. Tutaj właśnie wchodzi najciekawsza kwestia.

Wygląda na to, że Alibaba najwyraźniej rozumie ten problem i dlatego pokazała nie tylko sam kawałek krzemu, ale od razu mówi o modelu, chmurze, platformie usługowej, superwęźle, interkonekcie i stosie programowym. Wygląda więc na to, że tym razem nie jest to próba stworzenia ot “chińskiego GPU”. Jest to znacznie bardziej próba złożenia własnej infrastruktury, w której klient po prostu dostaje usługę w chmurze i nie obchodzi go, co siedzi wewnątrz niej, czyli w centrum danych.

Podobny kierunek opisywałem przy niedawnym superkomputerze bez klasycznego kultu GPU, gdzie ważniejsza od samego układu okazywała się zdolność wejścia w konkretne obciążenia bez ślepego kopiowania dominującego modelu na obecnym rynku. W przypadku Alibaby stawka jest jeszcze wyższa, bo chodzi tu nie tylko o naukę i HPC, ale o krajowy ekosystem usług AI w państwie, które dosłownie nie chce być zakładnikiem decyzji z Waszyngtonu.

Sankcje miały spowolnić Chiny, a teraz uczą je samowystarczalności

Nie da się odłączyć tej premiery od polityki. Stany Zjednoczone od 2022 roku ograniczają eksport najbardziej zaawansowanych układów AI do Chin, tłumacząc to między innymi ryzykiem wojskowego wykorzystania takich technologii. W 2025 roku restrykcje dotknęły również układu H20, czyli specjalnej wersji Nvidii tworzonej z myślą o chińskim rynku i wcześniejszych ograniczeniach. Dlatego właśnie Alibaba robi coś bardzo logicznego. Skoro dostęp do sprzętu Nvidii może być zależny od decyzji administracyjnej, licencji, negocjacji handlowych i politycznej temperatury między USA a Chinami, to największe chińskie firmy nie mogą budować przyszłości wyłącznie na imporcie.

Czytaj też: Superkomputer bez klasycznego kultu GPU. Wepchnęli się tam, gdzie gigantów zaboli

Warto tu przypomnieć, że chińskie firmy jeszcze niedawno zamawiały układy Nvidii na potęgę, próbując zdążyć przed kolejnymi ograniczeniami. Zhenwu M890 pokazuje więc poniekąd drugi etap tej samej historii – najpierw bowiem gromadzisz to, co możesz kupić, a potem budujesz to, czego kupować nie chcesz lub nie możesz. Oczywiście jednak Nvidia nadal ma potężny ekosystem, przewagę software’ową, globalne relacje z dostawcami chmur i pozycję, której nie da się zburzyć z dnia na dzień. Pewne jest więc, że Zhenwu M890 nie sprawi, że chińskie firmy jutro przestaną chcieć najwydajniejszych układów z USA. Gdyby mogły kupować wszystko bez ograniczeń, to zapewne kupowałyby dalej.

Źródła: Reuters, Alibaba Cloud

Alibaba nie pokazała tylko nowego procesora do AI

Specyfikacja Zhenwu M890 wygląda obiecująco, ale sam sprzęt nie wystarczy

Sankcje miały spowolnić Chiny, a teraz uczą je samowystarczalności

Mateusz Łysoń