80 milionów tranzystorów
Układ DeltaChrome wykonany jest w technologii 0,13 mikrona i ma zaledwie 80-90 milionów tranzystorów (firma S3 nie podała ich dokładnej liczby). Jest to znacznie mniej niż w przypadku Radeona 9700 i GeForce’a FX (ok. 130 mln). Układ S3 taktowany będzie, w zależności od wersji, z częstotliwością 300 lub 400 MHz.
Kość przystosowana została do współpracy z pamięciami DDR, a maksymalna pojemność graficznego RAM-u, który może znaleźć się na karcie, wynosi aż 256 megabajtów. Wymiana informacji z pamięcią pokładową odbywa się za pośrednictwem 128-bitowej szyny danych. W chipie firmy S3, podobnie jak w kości GeForce FX, zastosowano krzyżowy kontroler pamięci – cztery niezależne 64-bitowe moduły wysyłają lub pobierają potrzebne do generowania obrazu informacje. Przepustowość podsystemu pamięci wynosi 11,2 GB/s. Pod tym względem DeltaChrome plasuje się pomiędzy Radeonem 9500 (8,8 GB/s) a Radeonem 9700 (17,6 GB/s).
DeltaChrome i konkurencja |
S3 DeltaChrome Technologia: 0,13 mm Częst. rdzenia: 300 MHz RAMDAC: 400 MHz Typ pamięci: DDR Maks. RAM: 256 MB AGP: 8x DirectX: 9.0 Cena: nieustalona |
ATI Radeon 9500 Technologia: 0,15 mm Częst. rdzenia: 275 MHz RAMDAC: 400 MHz Typ pamięci: DDR Maks. RAM: 128 MB AGP: 8x DirectX: 9.0 Cena: ok. 850 zł |
nVidia NV31 Technologia: 0,13 mm Częst. rdzenia: nieznana RAMDAC: nieznany Typ pamięci: DDR II Maks. RAM: 128/256 MB AGP: 8x DirectX: 9.0 Cena: nieustalona |
Szesnaście tekstur w takcie
Architektura kości DeltaChrome podobna jest do układów graficznych innych producentów (patrz: 66). Akcelerator ma osiem potoków renderujących, a współczynnik fillrate wynosi 2,4 gigateksela/s (w przypadku Radeona 9700 Pro jest to 2,6 gigateksela/s). W jednym cyklu zegarowym możliwe jest nałożenie na generowaną scenę 3D do szesnastu tekstur.
Każdy z potoków renderujących ma do dyspozycji własną, operującą z 96-bitową precyzją jednostkę Pixel Shader, która pod względem możliwości technicznych przewyższa wymagania stawiane układom graficznym przez biblioteki DirectX 9.0 (patrz: tabela “Dane techniczne”). Więcej niż DX 9.0 potrafią również cztery 128-bitowe wektorowe moduły Vertex Shader, odpowiedzialne za przetwarzanie szkieletu trójwymiarowej sceny.
Eliminacja wielokątów
Zarówno jednostki Pixel, jak i Vertex Shader współdziałają z własną wydzieloną pamięcią podręczną. Oba bloki cache’u mogą przechowywać nie tylko kod programu i aktualnie przetwarzane dane, ale również informacje o położeniu obiektów zgromadzone w buforze Z oraz ich barwie (tzw. bufor kolorów). Takie podejście znacznie przyśpiesza eliminowanie z generowanej sceny niewidocznych dla obserwatora obiektów. Technologia ta, nazwana przez firmę S3 Advanced Deferred Rendering, pozwala też na pozbycie się już we wstępnej fazie ze szkieletu sceny niewidocznych trójkątów. Wówczas wykonywane są też obliczenia dotyczące oświetlenia i barwy.
W stosunku do rozwiązań firm ATI (Hyper Z III) i nVidii (Lightspeed Memory Architecture II) znacznie wcześniej następuje eliminowanie sporej części niewidocznych na końcowym obrazie obiektów. Aby zmniejszyć obciążenie magistrali pamięci, pozbywanie się obiektów za pomocą bufora Z realizowane jest najpierw na małych blokach danych (technologia Hierarchical Z). Generowana scena 3D dzielona jest na niewielkie fragmenty, które są wykluczane z dalszych obliczeń, jeśli żaden znajdujący się tam obiekt nie jest widoczny dla obserwatora. Technika ta przypomina kafelkowy rendering, stosowany w akceleratorach Kyro (patrz: CHIP 9/2000, 36). Po wstępnym usunięciu niewidocznych fragmentów obrazu w dalszym procesie generowania obrazu z bufora Z korzysta się już w klasyczny, znany z innych akceleratorów, sposób.