Co więcej, optymalizacja wewnętrznej budowy Athlonów dawała znacznie lepsze rezultaty niż samo tylko manipulowanie zegarem. Z tej też przyczyny już podczas opracowywania nowej rodziny procesorów SledgeHammer (architektura AMD64) – znanych obecnie pod nazwą handlową Athlon 64 i Opteron – konstruktorzy z AMD przewidzieli możliwość wytwarzania układów dwu- i wielordzeniowych. Zastosowanie dwóch jąder pozwala bowiem wykonać teoretycznie to samo zadanie dwa razy szybciej, jeśli tylko aplikację zoptymalizowano do pracy wielowątkowej. Ta zapobiegliwość przy projektowaniu Athlona 64 pozwoliła firmie AMD wprowadzić bez większych problemów do sprzedaży w kwietniu br. pierwsze dwurdzeniowe Opterony i Athlony 64 X2.
Przyszła pora na Intela
Intel przez dłuższy czas nie chciał porzucić “ideologii megaherców” i nie ma się czemu dziwić. Architektura NetBurst, wykorzystywana we wszystkich układach Pentium 4, pozwala teoretycznie osiągnąć częstotliwość 10 GHz. Według planów Intela miało to nastąpić w 2009 roku. Rzeczywistość okazała się jednak inna i Intel stanął w obliczu tych samych problemów technicznych co wcześniej AMD.
Pierwszą zapowiedzią zbliżających się kłopotów była premiera układów Pentium 4 z ulepszonym jądrem Prescott. Układ ten m.in. dzięki wydłużeniu potoków wykonawczych z 20 do 31 etapów powinien bez problemu pracować z zegarami przekraczającymi 4 GHz. Następcy Prescotta – układ Tejas oraz serwerowy Jayhawk – miały zaś działać z częstotliwością 5 GHz. Okazało się jednak, że Prescott wydziela ponad 100 watów ciepła. Wymaga zatem lepszego chłodzenia i mocniejszych zasilaczy. W walce z nadmiarem ciepła nie pomogło nawet przejście na 90-nanometrowy wymiar technologiczny, na co przede wszystkim liczyli inżynierowie z Intela.
Obecnie najszybszy dostępny w sprzedaży Prescott – Pentium 4 670 3,8 GHz – pobiera 115 W. Wartość ta mieści się jeszcze w granicach rozsądku, ale prototypy Tejasa 4,5 GHz, wykonane w technologii 65 nanometrów i zajmujące dwukrotnie większą powierzchnię niż Prescott, potrzebowały już ponad 160 W! Dalsze zwiększanie prędkości pracy układu powodowałoby zatem coraz większe problemy z odprowadzaniem nadmiaru energii.
Wady i zalety procesorów dwurdzeniowych |
zwiększenie wydajności nawet do dwóch razy, jeśli tylko aplikacja potrafi wykorzystać potencjał dwóch rdzeni brak “zacięć” maszyny przy jednoczesnym uruchamianiu kilku zadań/programów możliwość łatwej instalacji w sporej części nowych płyt głównych współpraca z istniejącymi OS-ami przyspieszenie pracy w dużym stopniu zależy od systemu operacyjnego i optymalizacji programów program nieumiejący wykorzystać dwóch rdzeni może działać wolniej niż na procesorze jednordzeniowym obecnie nieco wyższy pobór mocy niż w układach jednordzeniowych |
Czas dwurdzeniowców
Intel, chcąc nie chcąc, musiał zatem zrezygnować z pierwotnych, “gigahercowych” planów. Projekty Tejasa i Jayhawka odłożone zostały na półkę, a ich miejsce zajął dwurdzeniowy Smithfield, sprzedawany obecnie w dwóch wersjach: Pentium D oraz Pentium Extreme Edition. Co ciekawe, procesory te trafiły do sklepów na dwa dni przed premierą dwurdzeniowych kości AMD (patrz: $(LC133173:Pracuje za dwóch)$ i $(LC138112:Krzemowe bliźniaki)$).
Prace nad Smithfieldem rozpoczęły się stosunkowo późno, bo pod koniec zeszłego roku. Niemal od razu pojawiły się głosy, że procesor ten przygotowywany jest naprędce, jako błyskawiczna odpowiedź na dwurdzeniowe Athlony 64 i Opterony. Intel po zawieszeniu programu Tejas nie mógł bowiem stracić pozycji technologicznego lidera. Opinie te nie są pozbawione podstaw. Jeśli się przyjrzymy architekturze Smithfielda, zobaczymy, że są to dwa sklejone ze sobą na jednym kawałku krzemu procesory z jądrem Prescott – każdy z własnym kontrolerem magistrali systemowej i jednomegabajtowym cache’em L2. Co więcej, oba jądra, w przeciwieństwie do dwurdzeniowych Athlonów, nie potrafią komunikować się ze sobą bezpośrednio – cała transmisja danych odbywa się za pośrednictwem chipsetu płyty głównej i 800-megahercowej magistrali. To niestety słaba strona jednostek centralnych Pentium D i Extreme Edition (patrz: $(LC133173:Pracuje za dwóch)$).
Procesory Smithfield składają się z 230 milionów tranzystorów umieszczonych na powierzchni 206 mm2
. Maksymalna moc cieplna wytwarzana przez oba rdzenie nie przekracza 130 W. Układ dysponuje techniką Enhanced SpeedStep pozwalającą spowolnić CPU, zmniejszając tym samym zużycie prądu i temperaturę. Nie zapomniano też o 64-bitowej liście rozkazów EM64T (patrz: $(LC116360:Śladami AMD)$) oraz zabezpieczającej przed atakami niektórych wirusów funkcji XD Bit. Przed nadmiernym przegrzaniem oba rdzenie chroni dioda termiczna spowalniająca jednocześnie szybkość pracy obu rdzeni. Procesory Pentium D i Extreme Edition różnią się jednym szczegółem. Pierwszy z nich nie obsługuje technologii Hyper-Threading (patrz: $(LC56467:Schizofrenia procesora)$), Pentium EE widoczny jest zaś jako wirtualny układ czteroprocesorowy.
Dwa rdzenie na poważnie
O tym, że firma Intel myślała już wcześniej o układach wielordzeniowych, a nie – jak twierdzą niektórzy komentatorzy – tylko “na szybko” ograniczyła się do sklejania ze sobą procesorów, świadczy zaprezentowany na wiosennej konferencji IDF (Intel Developer Forum) dwurdzeniowy Montecito. Układ ten to połączone ze sobą dwie 64-bitowe, wektorowe kości Itanium 2, komunikujące się ze sobą za pośrednictwem specjalnej wewnętrznej magistrali systemowej. Co więcej, dzięki technologii SoEMT (Switch on Event MultiThreading) jądra wymieniać się mogą bezpośrednio fragmentami przetwarzanych wątków w zależności od obciążenia poszczególnych jednostek wykonawczych. Dwurdzeniowe, 90-nanometrowe układy Itanium 2 (2 GHz) zadebiutują na rynku w marcu przyszłego roku. Ich następca – Montvale – wykonany w technologii 65 nm, pokaże się w 2006 roku. Rok później do sprzedaży wejdzie już czterordzeniowa Tukwila.
Wybrane dwurdzeniowe procesory firmy Intel, które będą produkowane w najbliższej przyszłości | ||||||||
Procesor | Yonah | Montecito | Presler | Dempsey | Paxville | Merom | Conroe | Woodcrest |
Typ procesora | Mobilny | Zaawansowany serwer | Desktop | Desktop/Serwerowy | Serwerowy | Mobilny | Desktop | Serwerowy |
Sposób połączenia rdzeni | wspólny krzem | wspólny krzem | wspólna obudowa | wspólna obudowa | wspólny krzem | wspólny krzem | wspólny krzem | wspólny krzem |
Architektura | IA32/PIII | IA64/EPIC | IA32e/NetBurst | IA32e/NetBurst | IA32e/NetBurst | IA32e/PIII+P4 | IA32e/PIII+P4 | IA32e/PIII+P4 |
Obsługa 64 bitów | n | t | t | t | t | t | t | t |
Instrukcje EM64T/AMD64 | n | n | t | t | t | t | t | t |
Technologia Hyper-Threading | n | n | n | t | t | bd. | bd. | bd. |
Komunikacja między rdzeniami | pośrednictwo pamięci cache L2 | bezpośrednia | pośrednictwo chipsetu | pośrednictwo chipsetu | wewnętrzna szyna systemowa | bezpośrednia | bezpośrednia | bezpośrednia |
Częstotliwość pracy | 1,67-2,16 GHz | 2 GHz | 2,8-3,8 GHz | 2,8-3,8 GHz | 2,8-3,2 GHz | bd. | bd. | bd. |
FSB | 667 MHz | 667 MHz | 1066 MHz | 1066 MHz | 800 MHz | 667 MHz | bd. | bd. |
Cache L2 | 2 MB (shared) | 2 x 1 MB oraz 2 x 12 MB L3 | 2 x 2 MB | 2 x 2 MB | 2 x 1 MB | 4 MB (shared) | 2 x 2 MB | 2 x 4 MB |
Liczba tranzystorów | 151 mln | 172 mld | bd. | bd. | bd. | bd. | bd. | bd. |
Powierzchnia krzemu | 90,3 mm2 | 580 mm2 | 2 x 140 mm2 | 2 x 140 mm2 | bd. | bd. | bd. | bd. |
Proces technologiczny | 65 nm | 90 nm | 65 nm | 65 nm | 90 nm | bd. | bd. | bd. |
Podstawka | Socket 478/479 | Socket 611 | LGA 775 | LGA 775 i LGA 771 | LGA 771 | Socket 478/479 | bd. | bd. |
t – tak; n – nie; bd. – brak danych |