Akcelerator Habana Gaudi2 przebija wydajnością A100 firmy NVIDIA, ale Intel zapomniał o GPU GH100 nowej generacji
Najważniejszy punkt ogłoszenia, w którym Intel ujawnił oficjalnie światu akceleratory Habana Gaudi2 i Greco? Zdecydowanie wzmianka o tym, że ich wydajność jest nawet dwukrotnie wyższa od tego, co ma do zaoferowania akcelerator Ampere A100 z GPU GA100 firmy NVIDIA. Nie twierdzimy, że tak nie jest, ale warto wiedzieć, że “Zieloni” zapowiedzieli już znacznie potężniejsze akceleratory, wykorzystujące rdzenie graficzne GH100 zupełnie nowej generacji.
Czytaj też: Ciągłe spadki cen kart graficznych cieszą… tyle że to ciągle 1,5-letnie sprzęty
Jak pisaliśmy wcześniej:
W 2016 roku zadebiutował układ Tesla P100 z GPU GP100, dzierżący ogromną, jak na tamte czasy, liczbę 15,3 miliarda tranzystorów w procesorze graficznym o wielkości 610 mm kwadratowych. W 2020 roku premierę zaliczył GA100 o wielkości 828 mm2, który miał już w sobie niebywałe 54,2 miliarda tranzystorów. W marcu 2022 roku doczekaliśmy się nie dość, że mniejszego (mierzącego 814 mm2) to na dodatek bogatszego w tranzystory (ma ich aż 80 miliardów) rdzenia GH100, który stanowi podstawę akceleratorów H100 wyprodukowanyvh w technologii TSMC N4.
Akceleratory głębokiego uczenia się Habana Gaudi2 i Greco sięgnęły po rdzenie wykonane w technologii 7 nm, co nieco mąci. Dlaczego? Bo za tym procesem może kryć się proces TSMC N7, Intel 7 (10 nm), a nawet Intel 4 (odpowiednik 7nm), ale jeśli mamy obstawiać, najpewniej idzie o technologię Intel 7.
Czytaj też: Sankcje uderzają w rosyjskie procesory na bazie architektury ARM
W przypadku akceleratora Gaudi2 najważniejsze cechy obejmują:
- 24 jednostki TPC do dekodowania i przetwarzania mediów, które działają w formacie FP8
- 96 GB pamięci HBM2e o przepustowości 2,45 TB/s
- 48 MB pamięci SRAM.
- 24 przełączniki 100GbE
- TDP: 600 watów
To przekłada się na wydajność o 1,9 razy wyższą w porównaniu z NVIDIA A100 80 GB w treningu ResNet-50 oraz 2-razy wyższą w BERT. W ogólnym rozrachunku, ten nowy akcelerator oferuje oszczędności w kosztach szkolenia rzędu 75% w porównaniu z rozwiązaniami NVIDIA dostępnymi już teraz na rynku.
Intel ogłosił też Greco, czyli akcelerator głębokiego uczenia zaprojektowany z myślą o maksymalnej wydajności. Specyfikacja? 16 GB LPDDR5 o przepustowości 240 GB/s oraz dodatkowe 128 MB pamięci SRAM w układzie przy TDP na poziomie 75 watów.
Czytaj też: Pierwszy wewnętrzny dysk SSD ASUSa na horyzoncie. Co już wiadomo o Strix SQ7?
Jeśli idzie o dostępność, Gaudi2 jest dostępny do kupienia już teraz, a Greco będzie dostępny dla wybranych klientów w drugiej połowie 2022 roku.