Trzeci gracz

Wielu twórców gier i programów 3D marzy o dużej elastyczności przetwarzania trójwymiarowych obrazów. Za sprawą graficznego procesora P10 ich sen zaczyna się ziszczać.

Po erze układów 3D i procesorów graficznych (GPU), takich jak GeForce 4 czy Radeon 8500, przyszedł czas na jednostki przetwarzania wizualnego (VPU – Visual Processing Unit) – właśnie jesteśmy świadkami kolejnego przełomu w technice grafiki komputerowej. Procesor wizualny jest bowiem w stanie generować obrazy o jeszcze wyższym stopniu realizmu niż dotychczasowe konstrukcje, a to dzięki zależnym już tylko wyłącznie od inwencji programisty efektom specjalnym czy technikom renderingu niezależnym od tradycyjnego sprzętowego przetwarzania grafiki.

Pierwszym seryjnym układem VPU jest procesor przetwarzania wizualnego o kodowej nazwie P10. Liczący 76 milionów tranzystorów i wykonany w technologii 0,15 mikrona P10 wyprodukowany został przez firmę 3Dlabs przejętą niedawno przez znaną z kart dźwiękowych korporację Creative Labs.

200 mikroprocesorów 

Prace nad innowacyjnym układem P10 trwały prawie dwa lata i pochłonęły ogromną sumę pieniędzy – prawie 22 miliony USD. Być może właśnie z tego powodu firma 3Dlabs została przejęta przez Creative’a. Tak duże pieniądze był w stanie wysupłać tylko potentat rynkowy.

Wydane fundusze najprawdopodobniej nie pójdą na marne. Wyspecjalizowane bloki logiczne, występujące w popularnych kartach 3D, w P10 zastąpiono zintegrowaną jednostką przetwarzania wizualnego, składającą się z 200 32-bitowych w pełni programowalnych mikroprocesorów SIMD, pogrupowanych w cztery potoki renderowania obrazu. Jednostki SIMD (Single Instruction Multiple Data) zajmują się potokowym przetwarzaniem geometrii, tekstur i pikseli. Ich łączna wydajność wynosi 170 gigaflopów i ponad 1,2 teraopa, czyli ponad 1,2 biliona (1,2×10

12

) graficznych operacji logicznych na sekundę. Rdzeń układu P10 współpracuje z 256-bitową pamięcią DDR o przepustowości 20 GB/s, prawie dwukrotnie większej od przepustowości pamięci na kartach z GeForce4 ze 128-bitową magistralą. To „prawie” bierze się z niższej częstotliwości pracy DDR SDRAM na P10, taktowanej zegarem 312,5 MHz (dla GeForce4 jest to 325 MHz). P10 stanowi próbę połączenia zalet tradycyjnych układów graficznych GPU (szybkość) i procesorów CPU (elastyczność, łatwość programowania).

Bardziej programowalny

Architektura wewnętrzna P10 jest bardzo podobna do struktury GeForce’a 4 czy Radeona 8500 (patrz: CHIP 1/2002, str. 94, i CHIP 5/2002, str. 60). Zasadnicza różnica pomiędzy układami nVidii, ATI i 3Dlabs polega na stopniu programowalności wspomnianych układów. W GeForce4 i Radeonie 8500 programować można jedynie przetwarzanie wierzchołków (funkcja Vertex Shaders) w ściśle wytyczonych przez twórców kości ramach. P10 dzięki swej elastyczności zapewnia możliwość programowania każdego etapu tworzenia sceny 3D. Co więcej, dodanie nowej funkcji obsługiwanej sprzętowo wymaga jedynie uaktualnienia BIOS-u i sterowników karty. Nie trzeba więc będzie wymieniać akceleratora, gdy pojawią się gry 3D wymagające nowych właściwości sprzętowych! Dzięki tej cesze przystosowanie kart z P10 na pokładzie do obsługi standardów DirectX 9.0 czy OpenGL 2.0 powinno się odbyć zaraz po opublikowaniu specyfikacji.

Wyniki profesjonalnego testu SPECViewperf 7.0

Pomiary cząstkowe [pkt.]

Karta graficznaUgs-01 Proe-01 Light-05 DX-07 DRV-08 3dsmax-01
Wildcat VP760 (P10)12,250 12,987 12,90 68,98 39,67 10,359
ATI Fire GL 8800 9,290 11,780 10,88 62,16 36,39 7,509
nVidia Quadro4 750XGL 9,406 11,974 12,26 68,01 40,358,402
Pomiary wykonano na maszynie z procesorem Pentium 4 2,4 GHz i systemem Windows XP Professional. Pojedyncze punkty oznaczają ok. 10-procentowy wzrost wydajności.
0
Zamknij

Choć staramy się je ograniczać, wykorzystujemy mechanizmy takie jak ciasteczka, które pozwalają naszym partnerom na śledzenie Twojego zachowania w sieci. Dowiedz się więcej.