Architektura łącząca siłę CPU i GPU
Konstrukcja superchipu Vera Rubin opiera się na trzech fundamentalnych komponentach: procesorze Vera CPU oraz dwóch układach graficznych Rubin GPU. Procesor Vera, zbudowany na bazie architektury ARM, dysponuje 88 specjalnie zaprojektowanymi rdzeniami, zdolnymi do jednoczesnej obsługi 176 wątków. Układ od początku tworzony był z myślą o wymagających zadaniach związanych z uczeniem maszynowym i obliczeniami wysokiej wydajności.

Każdy z procesorów graficznych otrzyma osiem modułów pamięci HBM4 najnowszej generacji. Cały system uzupełniają 32 banki pamięci systemowej LPDDR współpracujące z pamięcią HBM w ramach zunifikowanej struktury. Projekt płyty głównej zawiera rozbudowane obwody zasilające, otaczające każdy układ graficzny, a całość wykorzystuje dwie matryce GPU w rozmiarze Reticle. Takie rozwiązanie ma zapewnić ogromną moc obliczeniową bez nadmiernego wzrostu poboru energii.

Czytaj też: Pierwsza jazda nowymi Seat Ibiza 2026 i Arona 2026. Dojrzalsze i bardziej cyfrowe?
Platforma NVL144 – dla mniej wymagających
Pierwszy system bazujący na nowej architekturze, oznaczony jako NVIDIA Vera Rubin NVL144, ma pojawić się na rynku w drugiej połowie 2026 roku. Platforma wykorzystuje dwa układy Rubin, z których każdy składa się z dwóch pełnowymiarowych chipów Reticle. Pojedynczy układ osiągnie wydajność 50 petaflopów w precyzji FP4, dysponując przy tym 288 GB pamięci HBM4.
Łączna moc obliczeniowa platformy NVL144 sięgnie 3,6 eksaflopa w inferencji FP4 i 1,2 eksaflopa w FP8. To 3,3-krotny wzrost wydajności w porównaniu z obecnym GB300 NVL72. Przepustowość pamięci HBM4 osiągnie 13 TB/s, a system zaoferuje dostęp do 75 TB szybkiej pamięci – o 60% więcej niż jego poprzednik.

Połączenie procesora Vera CPU z GPU zapewni szyna NVLINK-C2C o przepustowości 1,8 TB/s – możliwości połączeń międzyukładowych również ulegną znaczącej poprawie – NVLINK osiągnie do 260 TB/s, a CX9 do 28,8 TB/s. To dwukrotny wzrost w stosunku do poprzedniej generacji.
Rubin Ultra NVL576 – tam, gdzie na kompromisy nie ma miejsca
NVIDIA planuje jeszcze bardziej zaawansowaną wersję systemu, która zadebiutuje w drugiej połowie 2027 roku. Rubin Ultra NVL576 czterokrotnie zwiększy liczbę GPU, wykorzystując cztery układy na jednostkę. Każdy chip Rubin Ultra zaoferuje do 100 petaflopów mocy w precyzji FP4 i otrzyma dostęp do 1 TB pamięci HBM4e rozmieszczonej w 16 modułach.

Wydajność platformy Ultra robi wrażenie nawet na tle NVL144. System zapewni 15 eksaflopów mocy w inferencji FP4 i 5 eksaflopów w FP8. To czternastokrotny wzrost w porównaniu z GB300 NVL72 – skok, który może radykalnie zmienić możliwości szkolenia największych modeli językowych i innych zaawansowanych aplikacji AI.
Przepustowość pamięci w Rubin Ultra NVL576 osiągnie 4,6 petabajtów na sekundę. Łączna szybkość połączeń NVLINK wzrośnie do 1,5 PB/s (dwunastokrotny wzrost), a CX9 do 115,2 TB/s (ośmiokrotny wzrost). System będzie miał dostęp do 365 TB szybkiej pamięci, co stanowi ośmiokrotny przyrost względem GB300.
Architektura Vera Rubin – może lepiej, że nie wiemy jeszcze, ile to będzie kosztowało
Architektura Vera Rubin to ewidentne szykowanie infrastruktury pod przyszłe generacje aplikacji sztucznej inteligencji. Możliwości obliczeniowe na poziomie eksaflopów otwierają drogę do trenowania modeli o rzędach wielkości większych niż obecne. Firmy pracujące nad AGI, systemami dla sieci 6G, zaawansowaną robotyką czy symulacjami biologicznymi zyskają narzędzia, które dotychczas pozostawały poza ich zasięgiem.
Sukces architektury Blackwell pokazał, że rynek wciąż potrzebuje większej mocy, a firma nie ma zamiaru zwalniać. Vera Rubin ma stać się podstawą centrów danych od 2026 roku, podczas gdy Rubin Ultra w 2027 roku może ustanowić nowe standardy wydajności. Fakt zaś, że pierwsze fizyczne egzemplarze już trafiły do laboratoriów Nvidii, sugeruje, że ambitny harmonogram jest całkiem realny, jeśli chodzi o realizacje. Jeśli produkcja masowa rzeczywiście ruszy pod koniec 2026 roku, pierwsze systemy mogą trafić do klientów na początku 2027 roku.