Smok i smoczek

Wprowadzenie do sprzedaży układów GeForce4 to według nVidii wydarzenie przełomowe. Trudno się temu dziwić, zważywszy na szeroką ofertę procesorów graficznych i ich zróżnicowane możliwości.

Układ NV2A firmy nVidia zastosowany w konsoli Xbox był do niedawna najbardziej zaawansowanym produktem tego typu na rynku. Pod względem niektórych cech architektury (np. liczby jednostek Vertex Shader) przewyższał wszystkie dostępne na rynku pecetowe karty graficzne. Między innymi ten „szczegół” po swoim konsolowym protoplaście odziedziczył najnowszy procesor graficzny – GeForce4. Odziedziczył, choć nie do końca…

Rodzinna schizofrenia

Zaprezentowana siódmego lutego czwarta generacja układów GeForce dla komputerów stacjonarnych dzieli się na dwie rodziny: wydajnych chipów Ti oraz przeznaczonych dla mniej wymagających (i mniej zamożnych) użytkowników układów MX.

Obecnie mówi się o pięciu procesorach (układy Ti4400 i Ti4600 oraz MX420, MX440 i MX460), ale niewykluczone, że docelowo „tytanowe” chipy będą trzy – dojdzie kość Ti4200. Mimo podobnego nazewnictwa obie gałęzie GeForce’ów 4 noszą inne nazwy kodowe (Ti = NV25, MX = NV17), co budzi podejrzenia, że wchodzące w ich skład układy „spowinowacono na siłę”. Jak się okazuje, wątpliwości te są jak najbardziej na miejscu.

Nieskończoność do kwadratu

Bodaj najważniejszą cechą GeForce’a 3 były zastosowane w nim jednostki Vertex i Pixel Shader (patrz: CHIP 5/2001, str. 34). Całość ze względu na duże możliwości obu modułów – wierzchołkowego i pikselowego – określono mianem technologii nfiniteFX. W przypadku GeForce’a 4 Ti (nfiniteFX II) konstruktorzy poszli dalej, uzupełniając układ o drugą jednostkę przetwarzającą wierzchołki (podobnie jak ma to miejsce w Xboksie), dzięki czemu – jak twierdzi nVidia – trzykrotnie zwiększono wydajność operacji geometrycznych. Oba moduły Vertex Shader działają niezależnie, a realizowany przez procesor graficzny arbitraż zadań gwarantuje swego rodzaju wielowątkowość wykonywania operacji. Co ciekawe, powyższe zadania są zupełnie „przezroczyste” dla kodu programu, dzięki czemu z zalet nowej architektury skorzystają już istniejące aplikacje.

Wydajność karty wzrosła zresztą także z innego powodu – na podstawie dotychczasowych doświadczeń zoptymalizowano działanie obu jednostek, skracając w ten sposób czas wykonania poszczególnych rozkazów i zmniejszając opóźnienia wynikające z dostępu do przetwarzanych danych.

Moduł Pixel Shader przeszedł znacznie mniejsze modyfikacje. W gruncie rzeczy sprowadzają się one jedynie do niewielkich zmian w architekturze, które zapewniły mu zgodność z nowszymi specyfikacjami Pixel Shader 1.2 i 1.3. Niestety, na każdy z czterech potoków GeForce4 przypadają nadal tylko dwie jednostki teksturujące (w Radeonie 8500 są trzy), co uniemożliwiło zapewnienie zgodności ze specyfikacją 1.4. Usprawnienia te pozwoliły mimo wszystko na zwiększenie potencjału udostępnianych przez układ funkcji nowym typem bump mappingu – z-correct bump mapping.

Dogonić fotony

Piętą achillesową współczesnych układów 3D jest przepustowość podsystemu pamięci zainstalowanej na karcie graficznej. W przypadku NV25 udoskonalono znane z GeForce’a 3 metody, które noszą teraz nazwę Lightspeed Memory Architecture II. Jak twierdzi nVidia, przy tej samej częstotliwości zegara RAM karty „działa” teraz o 25% szybciej niż w przypadku GeForce3.

Niewątpliwym novum jest zestaw czterech buforów pamięci podręcznej (Quad Cache) pośredniczących w dostępie do danych opisujących wielokąty, wierzchołki, tekstury oraz przy zapisie pikseli wynikowych do pamięci obrazu. Wprowadzono również mechanizm automatycznego odświeżania RAM-u (Auto Pre-charge), który skraca czas dostępu do pamięci – NV25 „potrafi” wskazać, z którego banku pamięci będzie za chwilę korzystać, tak aby została ona odświeżona (elektrycznie).

Porównanie układów z serii GeForce4
ProcesorGeForce4 MX420GeForce4 MX440GeForce4 MX460GeForce4 Ti4200GeForce4 Ti4400GeForce4 Ti4600
Częstotliwość taktowania GPU [MHz]250270300225275300
Częstotliwość taktowania pamięci [MHz]166400550500550600
Maks. ilość obsługiwanej pamięci [MB]646464128128128
Przepustowość pamięci [MB/s]2656640088008000880010 400
Teoretyczny współczynnik fill rate [Mpiksel/s]50054060090011001200
Średnia sugerowana cena detaliczna kart [zł]41061073081012201630
0
Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.