Smok i smoczek

Rodzinna schizofrenia

Zaprezentowana siódmego lutego czwarta generacja układów GeForce dla komputerów stacjonarnych dzieli się na dwie rodziny: wydajnych chipów Ti oraz przeznaczonych dla mniej wymagających (i mniej zamożnych) użytkowników układów MX.

Obecnie mówi się o pięciu procesorach (układy Ti4400 i Ti4600 oraz MX420, MX440 i MX460), ale niewykluczone, że docelowo “tytanowe” chipy będą trzy – dojdzie kość Ti4200. Mimo podobnego nazewnictwa obie gałęzie GeForce’ów 4 noszą inne nazwy kodowe (Ti = NV25, MX = NV17), co budzi podejrzenia, że wchodzące w ich skład układy “spowinowacono na siłę”. Jak się okazuje, wątpliwości te są jak najbardziej na miejscu.

Nieskończoność do kwadratu

Bodaj najważniejszą cechą GeForce’a 3 były zastosowane w nim jednostki Vertex i Pixel Shader (patrz: CHIP 5/2001, str. 34). Całość ze względu na duże możliwości obu modułów – wierzchołkowego i pikselowego – określono mianem technologii nfiniteFX. W przypadku GeForce’a 4 Ti (nfiniteFX II) konstruktorzy poszli dalej, uzupełniając układ o drugą jednostkę przetwarzającą wierzchołki (podobnie jak ma to miejsce w Xboksie), dzięki czemu – jak twierdzi nVidia – trzykrotnie zwiększono wydajność operacji geometrycznych. Oba moduły Vertex Shader działają niezależnie, a realizowany przez procesor graficzny arbitraż zadań gwarantuje swego rodzaju wielowątkowość wykonywania operacji. Co ciekawe, powyższe zadania są zupełnie “przezroczyste” dla kodu programu, dzięki czemu z zalet nowej architektury skorzystają już istniejące aplikacje.

Wydajność karty wzrosła zresztą także z innego powodu – na podstawie dotychczasowych doświadczeń zoptymalizowano działanie obu jednostek, skracając w ten sposób czas wykonania poszczególnych rozkazów i zmniejszając opóźnienia wynikające z dostępu do przetwarzanych danych.

Moduł Pixel Shader przeszedł znacznie mniejsze modyfikacje. W gruncie rzeczy sprowadzają się one jedynie do niewielkich zmian w architekturze, które zapewniły mu zgodność z nowszymi specyfikacjami Pixel Shader 1.2 i 1.3. Niestety, na każdy z czterech potoków GeForce4 przypadają nadal tylko dwie jednostki teksturujące (w Radeonie 8500 są trzy), co uniemożliwiło zapewnienie zgodności ze specyfikacją 1.4. Usprawnienia te pozwoliły mimo wszystko na zwiększenie potencjału udostępnianych przez układ funkcji nowym typem bump mappingu – z-correct bump mapping.

Dogonić fotony

Piętą achillesową współczesnych układów 3D jest przepustowość podsystemu pamięci zainstalowanej na karcie graficznej. W przypadku NV25 udoskonalono znane z GeForce’a 3 metody, które noszą teraz nazwę Lightspeed Memory Architecture II. Jak twierdzi nVidia, przy tej samej częstotliwości zegara RAM karty “działa” teraz o 25% szybciej niż w przypadku GeForce3.

Niewątpliwym novum jest zestaw czterech buforów pamięci podręcznej (Quad Cache) pośredniczących w dostępie do danych opisujących wielokąty, wierzchołki, tekstury oraz przy zapisie pikseli wynikowych do pamięci obrazu. Wprowadzono również mechanizm automatycznego odświeżania RAM-u (Auto Pre-charge), który skraca czas dostępu do pamięci – NV25 “potrafi” wskazać, z którego banku pamięci będzie za chwilę korzystać, tak aby została ona odświeżona (elektrycznie).

Porównanie układów z serii GeForce4
Procesor	GeForce4 MX420	GeForce4 MX440	GeForce4 MX460	GeForce4 Ti4200	GeForce4 Ti4400	GeForce4 Ti4600
Częstotliwość taktowania GPU [MHz]	250	270	300	225	275	300
Częstotliwość taktowania pamięci [MHz]	166	400	550	500	550	600
Maks. ilość obsługiwanej pamięci [MB]	64	64	64	128	128	128
Przepustowość pamięci [MB/s]	2656	6400	8800	8000	8800	10 400
Teoretyczny współczynnik fill rate [Mpiksel/s]	500	540	600	900	1100	1200
Średnia sugerowana cena detaliczna kart [zł]	410	610	730	810	1220	1630