Walka z zegarami

W pogoni za wydajnością

Zabierając się do pisania tego artykułu, zapytałem mojego przyjaciela, ile pamięci RAM ma w swoim komputerze. Jego reakcja była tyle zaskakująca, co zabawna. Odpowiedział mi, że nieważne, ile pamięci tkwi w jego maszynie, ponieważ tej zawsze jest za mało. Dzisiaj standardem jest 256 MB, jednak w dobie szybko rosnących wymagań współczesnych procesorów oraz aplikacji taka wielkość wkrótce może okazać się niewystarczająca. Użytkownik znów stanie przed dylematem, ile pamięci kupić i jakie moduły wybrać. W laboratorium mieliśmy rzadką okazję bliżej przyjrzeć się 40 najpopularniejszym obecnie modułom pamięci DDR SDRAM różnych standardów, począwszy od PC2100, a skończywszy na niezatwierdzonych jeszcze przez JEDEC (międzynarodową organizację zajmującą się m.in. ustalaniem standardów pamięci) układach PC3700.

Na dwa zbocza

Pamięci typu DDR są bezpośrednim rozwinięciem koncepcji układów SDRAM. Do przesyłania danych wykorzystano tu pomysł polegający na transmisji danych przy obydwu zboczach sygnału taktującego. Oznacza to, że wewnętrznie kości DDR pracują z podwojoną częstotliwością, czyli w efekcie teoretycznie pozwalają na uzyskanie dwa razy większych niż w przypadku SDRAM transferów. Ze względu na wysoką częstotliwość pracy ulepszono mechanizm synchronizacji oraz buforowania sygnałów, dzięki czemu wymiana danych jest jeszcze bardziej efektywna. Krytyczny wpływ na wydajność mają opóźnienia w przesyłaniu informacji. Dlatego też do synchronizacji transmisji danych używana jest nie tylko częstotliwość systemowa. DDR-y udostępniają do tego celu dodatkowy sygnał o nazwie DQS (Data Strobe). Pozwala to obejść problem pojawiający się wraz z utratą synchronizacji na magistrali między chipsetem i pamięcią. Gdy pojawi się polecenie odczytu, DDR generuje sygnał DQS. Sterując nim w odpowiedni sposób, informuje chipset, kiedy na magistrali danych znajdują się dane związane z określonym natężeniem lub spadkiem sygnału. Zapis odbywa się w odwrotny sposób – chipset generuje sygnał DQS, dając pamięci znak, w którym momencie na magistrali znajdują się dane do przejęcia przez RAM. Zapisywane informacje muszą zostać wcześniej przygotowane do zapisu, tak aby już w momencie przeskoku sygnału DQS były gotowe do pobrania.

Prostota architektury DDR stanowi chyba jej największy atut. Moduły DDR różnią się od SDRAM-ów tylko interfejsem. Zarówno matryce pamięci, jak i logika synchronicznego zapisu i odczytu są praktycznie identyczne, a koszty produkcji osiągają taki sam poziom jak koszty wytwarzania SDRAM–ów o podobnej pojemności. Możemy się o tym pośrednio przekonać, zaglądając do cenników sklepów komputerowych. Obecnie pamięci DDR znajdują się na tym samym poziomie cenowym co SDRAM-y. Z kolei DDR-y są ponaddwukrotnie tańsze od RDRAM-ów.

Zaglądając do wnętrza

Strukturę RAM-u możemy sobie wyobrazić jako macierz komórek. Każdy element należy do określonej kolumny i wiersza. Tak zbudowane macierze grupowane są w banki. Zwykle pamięci DDR SDRAM mają cztery takie banki. Każda komórka pamięci ma swój unikatowy adres. Jednak zaadresowanie całej pamięci w jednym cyklu zegarowym wymagałoby poprowadzenia połączeń do każdego elementu. Z tego też powodu adresowanie podzielono na dwie raty – najpierw kolumny, później wiersze. Do “wydobycia” konkretnej informacji z takiego układu potrzebne są zatem zaledwie dwie linie adresowe – wiersz (Row Line) i kolumna (Column Line).

Ważnymi parametrami wpływającymi na wydajność pamięci DDR są, oprócz częstotliwości zegara taktującego, również tak zwane timingi, czyli opóźnienia określające liczbę taktów zegarowych pamięci pomiędzy wydaniem polecenia odczytu lub zapisu a jego wykonaniem. Pierwszym parametrem (timingiem) podawanym przez producentów w specyfikacji jest CAS Latency (przez niektórych określany jako CL). Określa on liczbę cykli zegara magistrali, jakie upływają od wydania przez procesor polecenia aktywacji wybierania kolumny do momentu przekazania danych do bufora w kontrolerze pamięci. Parametr ten ma dość duży wpływ na wydajność. W przypadku modułów DDR współczynnik ten można ustawić w zakresie od 2.0 do 3.0 (choć w niektórych płytach da się ustawić CL1.5). Kolejnym parametrem (timingiem) jest RAS to CAS Delay (RCD), czyli wartość przerwy czasowej wymaganej pomiędzy podaniem adresu wiersza i kolumny. Parametr RAS Precharge (RP) to czas trwania sygnału odświeżania pamięci. RAS (Row Address Strobe) specyfikuje natomiast liczbę cykli wymaganych do wykonania komendy aktywacji jednego z banków pamięci, zanim załadowanie adresu wiersza może zostać wykonane. Wszystkie cztery parametry podaje się zazwyczaj w postaci liczb oddzielonych myślnikami, np. 2,5-6-4-4.

“>”>www.sirius.pl/

“>”>www.action.pl/

“>”>www.wilk.com.pl/

“>”>www.sirius.pl/

“>”>www. geil. pl/

“>”>www.sirius.pl/

“>”>www.wilk.com.pl/

“>”>www.levi.cz/

“>”>www.geil.pl/

“>”>www.asbis.pl/

“>”>www.sirius.pl/

“>”>www.geil.pl/

“>”>www.pronox.com/

Produkt*

Infineon HYS64D32000GU-7-B

Kingston KVR266X64C25/512

Hynix HYMD232646B8R-J WD

Spectek P32M6448HHC-6A

Corsair CMX256A-2700C2PT

GeIL PC2700 333 MHz DDR SDRAM Value Series

TwinMOS Memory module PC2700 256MB

Kingston KHX2700/512

Kingmax MPXB62D-38KT3R

GeIL PC3200 Dual Channel Ultra Low Latency Series

PQI PMI DDR-400 512MB

Corsair CMX256A-3200C2

Mushkin PC3200 Level II 512MB

OCZ DDR PC-3700 Premier Dual Channel

GeIL PC3700 466MHz DDR Platinum Series

TwinMOS Memory module PC3700 512 MB

Cena (z VAT-em)

210 zł

390 zł

165 zł

205 zł

260 zł

230 zł

220 zł

580 zł

425 zł

670 zł

405 zł

300 zł

2 200 zł

1 100 zł

450 zł

580 zł

Opis

Markowe i nie za drogie moduły, doskonałe w overclokingu. Spokojnie pracowały jako DDR366, a pod P4 nawet jako DDR400.

Moduły o bardzo dużym zapasie mocy. Pracują jako DDR333 na platformie AMD. Pod P4 – rekordowy wynik deklasujący “wyższe” modele (480 MHz).

Jedne z tańszych pamięci 256 MB o dużych możliwościach podkręcania. Uzyskały prędkość powyżej 400 MHz na obydwu platformach.

Pamięci plasujące się w czołówce serii PC2700. Bardzo duże możliwości podkręcania – bez problemów pracują jako DDR433.

Dobre do overclocingu (433/480 MHz – Athlon/P4), niestety, nieco słabsze w normalnym trybie pracy, szczególnie pod P4.

Moduły, które doskonale się podkręcają – rekordowy wynik w klasie DDR333. W normalnym trybie pracy – średnie rezultaty.

Pamięci o przeciętnych wynikach przy nominalnych ustawieniach, doskonale się jednak podkręcające zarówno pod P4, jak i pod Athlonem.

Wyczynowe HyperX-y na nominalnych ustawieniach prześcignęły niektóre moduły DDR400, dość dobrze się też podkręcają, ale tylko pod P4.

Pamięci jednostronne o przeciętnych możliwościach podkręcania. Niestety, bardzo słabo wypadły przy ustawieniach nominalnych.

Dwumodułowy zestaw, rewelacyjny przy podkręcaniu. Jako jedyny pracował powyżej 466 MHz zarówno z procesorami Intela, jak i AMD!

Niedrogie moduły o średniej wydajności i równie przeciętnych możliwościach podkręcania.

Bardzo dobre pamięci z serii DDR400 pod względem możliwości overclockingu. Cechą charakterystyczną są niskie timingi.

Dwumodułowy zestaw przeznaczony dla overclockerów o “wyżyłowanych” timingach i równie “wyżyłowanej” cenie.

Zestaw dwumodułowy o maksymalnej wydajności gwarantowanej przez producenta. Niestety, cena bardzo wysoka.

Najwyższe w skali bezwględnej możliwości podkręcania pamięci pozwoliły uruchomić je z częstotliwością prawie 500 MHz. To rekordowa wartość.

Wcale nie najdroższe, a za to najwydajniesze przy nominalnych ustawieniach moduły o równie wysokich możliwościach podkręcania.

Dane techniczne (wg producenta)

Standard

PC2100/266 MHz

PC2700/333 MHz

PC3200/400MHz

PC3700/466MHz

Pojemno_ć

256 MB

512 MB

256 MB

512 MB

256 MB

512 MB (2×256 MB)

512 MB

256 MB

1024 MB (2×512 MB)

512 MB (2×256 MB)

256 MB

512 MB

Napięcia min.-maks.

2,3-2,7 V

2,25-2,75 V

2,3-2,7 V

2,5-2,6 V

2,5-2,7 V

2,3-2,7 V

2,5-2,7 V

2,3-2,7 V

2,5-2,9 V

2,5-2,7 V

2,5-2,6 V

2,5-2,75 V

2,6-3,1 V

2,5-3,1 V

2,4-2,8 V

Czas dostępu

7,0 ns

7,5 ns

6 ns

5 ns

6 ns

5 ns

4,5 ns

4 ns

4,3 ns

Timingi standardowe **)

2-7-3-3

2,5-6-3-3

2,5-7-3-3

2-6-3-3

2,5-6-3-2

2,5-7-3-3

2-5-2-2

2,5-7-3-3

2-6-3-3

2,5-7-3-3

2-7-3-3

2-6-2-2

3-8-4-4

2,5-7-3-3

2,5-8-3-3

Wyniki testu

Cachemem odczyt/zapis P4

2581,7/847 MB/s

2499,1/1231,4 MB/s

2636,6/942 MB/s

2634,7/966,4 MB/s

2633,6/1038,8 MB/s

2638,3/946,3 MB/s

2590,5/951,8 MB/s

2697,2/1482 MB/s

2805,1/1117,6 MB/s

2828/1248,2 MB/s

2762,7/1620,1 MB/s

2843,5/1242,3 MB/s

2839,6/1645,3 MB/s

3258,2/1919,8 MB/s

3203,7/1302,8 MB/s

3238/1887,1 MB/s

Cachemem odczyt/zapis Athlon

1228,3/963 MB/s

1227,4/959,4 MB/s

1592,7/1003,1 MB/s

1607,4/1010,5 MB/s

1581/1002 MB/s

1585,3/954,5 MB/s

1581,7/1002,1 MB/s

1655,5/1004,7 MB/s

1462,2/995,9 MB/s

1494/994,6 MB/s

1458,6/993 MB/s

1461,8/993,1 MB/s

1492,2/994,3 MB/s

1531/1041,6 MB/s

1541,9/1055,6 MB/s

1555,4/1056,6 MB/s

Dostawca [http://]

* – w tabeli zamiesciiśmy moduły najbardziej charakterytyczne dla danego producenta ** – timingi CL-RCD-RP-RAS (CAS Latency-RAS to CAS Delay-RAS Precharge-Row Address Strobe).

archiwum