Oczko w głowie NVIDIA jeszcze wydajniejsze. Hopper H100 ulepszony

Ledwie dwa tygodnie przed oficjalną datą premiery firma NVIDIA zaktualizowała specyfikację Hopper H100, czyli swojego akceleratora graficznego z myślą o bazach danych. Jest to jednocześnie jedna z tych lepszych aktualizacji, bo dotycząca bezpośredniego zwiększenia możliwości układu.
Wyjątkowość nowego procesora graficznego NVIDIA, GPU Hopper, SI, sztuczna inteligencja
Wyjątkowość nowego procesora graficznego NVIDIA, GPU Hopper, SI, sztuczna inteligencja

NVIDIA ulepszyła akcelerator Hopper H100

Architektura NVIDIA Hopper pojawiała się w przeciekach od ponad dwóch lat, a premiery doczekała się w pierwszym kwartale bieżącego roku. Wtedy dowiedzieliśmy się, że napędzi akcelerator Hopper H100, którego procesor graficzny będzie wyjątkowy, bo sprowadzi się do układu wielokrzemowego wykonanego w ramach procesu TSMC 4N. Takie podejście MCM (Multi-Chip-Module) stosowane zarówno w przypadku CPU, jak i GPU, sprowadza się do umieszczenia na jednym układzie kilku połączonych ze sobą wzajemnie krzemowych matryc, które współpracują ze sobą w czasie rzeczywistym. W dniu premiery okazało się jednak, że NVIDIA nadal będzie wykorzystywać pojedynczy, monolityczny krzem w swoim GPU.

Czytaj też: Planujesz zakup zegarka Samsung z serii Galaxy Watch5? Możesz liczyć na cashback

GPU GH100 mierzy 814 mm2 i ma aż 80 miliardów tranzystorów. Dla przypomnienia, w 2016 roku zadebiutował układ Tesla P100 z GPU GP100, dzierżący ogromną jak na tamte czasy liczbę 15,3 miliarda tranzystorów w procesorze graficznym o wielkości 610 mm kwadratowych. W 2020 roku premierę zaliczył GA100 o wielkości 828 mm2, który miał już w sobie niebywałe, jak na tamte czasy 54,2 miliarda tranzystorów.

Czytaj też: Promocja Lenovo na laptopy z serii Yoga, IdeaPad i Legion. Czeka zwrot gotówki

Następne lata (pierwsze dostawy będą mieć miejsce w pierwszym kwartale 2023 roku) upłyną więc pod znakiem NVIDIA Hopper H100 w wersji na złącze PCIe (o TDP 350 W) oraz SXM (700 watów), które doczekały się właśnie aktualizacji swoich możliwości. Wydajność FP64 wzrosła z 30 do 34 TFLOPs, a FP32 z 60 do 67 TFLOPs względem wcześniejszych estymacji, podczas gdy wydajność w obliczeniach z udziałem rdzeni Tensor nieco spadła. W ogólnym rozrachunku oznacza to, że akcelerator z GPU o 16896 rdzeniach CUDA będzie cechował się wyższym taktowaniem GPU, niż wcześniej (nie 1775 MHz, a prawie 2000 MHz).