Rodzinna schizofrenia
Zaprezentowana siódmego lutego czwarta generacja układów GeForce dla komputerów stacjonarnych dzieli się na dwie rodziny: wydajnych chipów Ti oraz przeznaczonych dla mniej wymagających (i mniej zamożnych) użytkowników układów MX.
Obecnie mówi się o pięciu procesorach (układy Ti4400 i Ti4600 oraz MX420, MX440 i MX460), ale niewykluczone, że docelowo “tytanowe” chipy będą trzy – dojdzie kość Ti4200. Mimo podobnego nazewnictwa obie gałęzie GeForce’ów 4 noszą inne nazwy kodowe (Ti = NV25, MX = NV17), co budzi podejrzenia, że wchodzące w ich skład układy “spowinowacono na siłę”. Jak się okazuje, wątpliwości te są jak najbardziej na miejscu.
Nieskończoność do kwadratu
Bodaj najważniejszą cechą GeForce’a 3 były zastosowane w nim jednostki Vertex i Pixel Shader (patrz: CHIP 5/2001, str. 34). Całość ze względu na duże możliwości obu modułów – wierzchołkowego i pikselowego – określono mianem technologii nfiniteFX. W przypadku GeForce’a 4 Ti (nfiniteFX II) konstruktorzy poszli dalej, uzupełniając układ o drugą jednostkę przetwarzającą wierzchołki (podobnie jak ma to miejsce w Xboksie), dzięki czemu – jak twierdzi nVidia – trzykrotnie zwiększono wydajność operacji geometrycznych. Oba moduły Vertex Shader działają niezależnie, a realizowany przez procesor graficzny arbitraż zadań gwarantuje swego rodzaju wielowątkowość wykonywania operacji. Co ciekawe, powyższe zadania są zupełnie “przezroczyste” dla kodu programu, dzięki czemu z zalet nowej architektury skorzystają już istniejące aplikacje.
Wydajność karty wzrosła zresztą także z innego powodu – na podstawie dotychczasowych doświadczeń zoptymalizowano działanie obu jednostek, skracając w ten sposób czas wykonania poszczególnych rozkazów i zmniejszając opóźnienia wynikające z dostępu do przetwarzanych danych.
Moduł Pixel Shader przeszedł znacznie mniejsze modyfikacje. W gruncie rzeczy sprowadzają się one jedynie do niewielkich zmian w architekturze, które zapewniły mu zgodność z nowszymi specyfikacjami Pixel Shader 1.2 i 1.3. Niestety, na każdy z czterech potoków GeForce4 przypadają nadal tylko dwie jednostki teksturujące (w Radeonie 8500 są trzy), co uniemożliwiło zapewnienie zgodności ze specyfikacją 1.4. Usprawnienia te pozwoliły mimo wszystko na zwiększenie potencjału udostępnianych przez układ funkcji nowym typem bump mappingu – z-correct bump mapping.
Dogonić fotony
Piętą achillesową współczesnych układów 3D jest przepustowość podsystemu pamięci zainstalowanej na karcie graficznej. W przypadku NV25 udoskonalono znane z GeForce’a 3 metody, które noszą teraz nazwę Lightspeed Memory Architecture II. Jak twierdzi nVidia, przy tej samej częstotliwości zegara RAM karty “działa” teraz o 25% szybciej niż w przypadku GeForce3.
Niewątpliwym novum jest zestaw czterech buforów pamięci podręcznej (Quad Cache) pośredniczących w dostępie do danych opisujących wielokąty, wierzchołki, tekstury oraz przy zapisie pikseli wynikowych do pamięci obrazu. Wprowadzono również mechanizm automatycznego odświeżania RAM-u (Auto Pre-charge), który skraca czas dostępu do pamięci – NV25 “potrafi” wskazać, z którego banku pamięci będzie za chwilę korzystać, tak aby została ona odświeżona (elektrycznie).
Porównanie układów z serii GeForce4 | ||||||
Procesor | GeForce4 MX420 | GeForce4 MX440 | GeForce4 MX460 | GeForce4 Ti4200 | GeForce4 Ti4400 | GeForce4 Ti4600 |
Częstotliwość taktowania GPU [MHz] | 250 | 270 | 300 | 225 | 275 | 300 |
Częstotliwość taktowania pamięci [MHz] | 166 | 400 | 550 | 500 | 550 | 600 |
Maks. ilość obsługiwanej pamięci [MB] | 64 | 64 | 64 | 128 | 128 | 128 |
Przepustowość pamięci [MB/s] | 2656 | 6400 | 8800 | 8000 | 8800 | 10 400 |
Teoretyczny współczynnik fill rate [Mpiksel/s] | 500 | 540 | 600 | 900 | 1100 | 1200 |
Średnia sugerowana cena detaliczna kart [zł] | 410 | 610 | 730 | 810 | 1220 | 1630 |