Intel przyspiesza rozwój sztucznej inteligencji. Akcelerator Habana Gaudi2 uderza w ofertę NVIDIA

Akcelerator Habana Gaudi2 przebija wydajnością A100 firmy NVIDIA, ale Intel zapomniał o GPU GH100 nowej generacji

Najważniejszy punkt ogłoszenia, w którym Intel ujawnił oficjalnie światu akceleratory Habana Gaudi2 i Greco? Zdecydowanie wzmianka o tym, że ich wydajność jest nawet dwukrotnie wyższa od tego, co ma do zaoferowania akcelerator Ampere A100 z GPU GA100 firmy NVIDIA. Nie twierdzimy, że tak nie jest, ale warto wiedzieć, że “Zieloni” zapowiedzieli już znacznie potężniejsze akceleratory, wykorzystujące rdzenie graficzne GH100 zupełnie nowej generacji.

Czytaj też: Ciągłe spadki cen kart graficznych cieszą… tyle że to ciągle 1,5-letnie sprzęty

Jak pisaliśmy wcześniej:

W 2016 roku zadebiutował układ Tesla P100 z GPU GP100, dzierżący ogromną, jak na tamte czasy, liczbę 15,3 miliarda tranzystorów w procesorze graficznym o wielkości 610 mm kwadratowych. W 2020 roku premierę zaliczył GA100 o wielkości 828 mm², który miał już w sobie niebywałe 54,2 miliarda tranzystorów. W marcu 2022 roku doczekaliśmy się nie dość, że mniejszego (mierzącego 814 mm²) to na dodatek bogatszego w tranzystory (ma ich aż 80 miliardów) rdzenia GH100, który stanowi podstawę akceleratorów H100 wyprodukowanyvh w technologii TSMC N4.

Akceleratory głębokiego uczenia się Habana Gaudi2 i Greco sięgnęły po rdzenie wykonane w technologii 7 nm, co nieco mąci. Dlaczego? Bo za tym procesem może kryć się proces TSMC N7, Intel 7 (10 nm), a nawet Intel 4 (odpowiednik 7nm), ale jeśli mamy obstawiać, najpewniej idzie o technologię Intel 7.

Czytaj też: Sankcje uderzają w rosyjskie procesory na bazie architektury ARM

W przypadku akceleratora Gaudi2 najważniejsze cechy obejmują:

24 jednostki TPC do dekodowania i przetwarzania mediów, które działają w formacie FP8
96 GB pamięci HBM2e o przepustowości 2,45 TB/s
48 MB pamięci SRAM.
24 przełączniki 100GbE
TDP: 600 watów

To przekłada się na wydajność o 1,9 razy wyższą w porównaniu z NVIDIA A100 80 GB w treningu ResNet-50 oraz 2-razy wyższą w BERT. W ogólnym rozrachunku, ten nowy akcelerator oferuje oszczędności w kosztach szkolenia rzędu 75% w porównaniu z rozwiązaniami NVIDIA dostępnymi już teraz na rynku.

Intel ogłosił też Greco, czyli akcelerator głębokiego uczenia zaprojektowany z myślą o maksymalnej wydajności. Specyfikacja? 16 GB LPDDR5 o przepustowości 240 GB/s oraz dodatkowe 128 MB pamięci SRAM w układzie przy TDP na poziomie 75 watów.

Czytaj też: Pierwszy wewnętrzny dysk SSD ASUSa na horyzoncie. Co już wiadomo o Strix SQ7?

Jeśli idzie o dostępność, Gaudi2 jest dostępny do kupienia już teraz, a Greco będzie dostępny dla wybranych klientów w drugiej połowie 2022 roku.