Pogromcy mitów: im więcej rdzeni, tym lepiej

Pogromcy mitów: im więcej rdzeni, tym lepiej

MIT

Liczba rdzeni obliczeniowych w procesorze ciągle rośnie. To jasne, że pecet pracuje tym szybciej, im więcej mocy obliczeniowej ma w środku. Zawsze powinno się więc kupować CPU z wieloma rdzeniami.

PRAWDA

Kolejne rdzenie procesora zapewniają wzrost wydajności, jeśli w danym momencie używamy kilku programów równocześnie. Jeżeli natomiast pracuje tylko jeden program, to by wykorzystać drzemiącą w procesorze nadwyżkę mocy, potrzeba aplikacji zoptymalizowanych pod kątem działania na kilku rdzeniach – a to ciągle nie jest standardem. Przez długi czas programiści nie musieli kłopotać się wielordzeniowymi CPU. W roku 2005 producenci procesorów zakończyli wojnę o wzrost mocy obliczeniowej poprzez zwiększanie szybkości taktowania, zamiast tego zaczęli pakować do jednego procesora kilka rdzeni obliczeniowych. Teoretycznie powinno to zapewniać podwojenie wydajności, w praktyce doszło jednak do tzw. wielordzeniowego kryzysu.

Przed epoką wielordzeniową procesy zainicjowane przez programy były wykonywane sekwencyjnie: zawsze krok po kroku. Oprogramowanie stawało się szybsze dzięki wyższym prędkościom taktowania CPU, a nie za sprawą rdzeni wykonujących równolegle obliczenia. Zaprogramowane z myślą o sekwencyjnym działaniu narzędzia bardzo rzadko dają się automatycznie sparalelizować. Najczęściej programista musi na nowo, od podstaw zaplanować swoje oprogramowanie.

Z jednej strony istnieją rodzaje kodu, które bardzo łatwo dają się sparalelizować. Inne zostają szybko zakwalifikowane jako niemożliwe do paralelizacji, i jako takie pozostawione bez zmian. Najczęściej jednak programista staje przed zadaniem odnalezienia tych części swojego kodu programu, które mogą być wykonywane równolegle. Musi w związku z tym na przykład wiedzieć, które obliczenia bazują na sobie (te często nie mogą być wykonywane równocześnie), a które są niezależne. Jeśli dwie części programu mają korzystać z tych samych zasobów, to trzeba stworzyć precyzyjne reguły (tak zwane race conditions), bo w najgorszym przypadku dwie lub więcej części programu będą się wzajemnie blokować i aplikacja zawiesi się w połowie działania (tzw. deadlock). Te analizy zajmują sporo czasu i są pracochłonne. Dlatego do dziś nie wszystkie narzędzia są zoptymalizowane pod kątem pracy wielordzeniowej i nieprędko się to zmieni. A w naszym pececie będzie tkwić ośmiordzeniowa jednostka, która kosztowała dużo pieniędzy, pożera prąd, generuje ciepło i jest wykorzystywana tylko w niewielkiej części.

OBLICZENIE ŁATWE DO SPARALELIZOWANIA

Wiele obliczeń, na przykład mnożenie wielu czynników, można bardzo łatwo sparalelizować. Na każdym rdzeniu będą ze sobą mnożone dwie wartości, aż na końcu pojawi się wynik.

NIEŁATWE DO OBLICZEŃ RÓWNOLEGŁYCH

Na pierwszy rzut oka obliczenia bazujące na wynikach częściowych są nieparalelizowalne. Często jednak dokładniejsza analiza wykazuje, że program może odnieść korzyść z wielordzeniowości.

OBLICZENIA NIEPARALELIZOWALNE

Wiele obliczeń wymaga przetworzenia krok po kroku. Ze względu na matematyczną regułę “mnożenie przed odejmowaniem” nawet części poniższego działania znajdującej się w nawiasie kwadratowym nie da się obliczyć równolegle.