Pierwszym seryjnym układem VPU jest procesor przetwarzania wizualnego o kodowej nazwie P10. Liczący 76 milionów tranzystorów i wykonany w technologii 0,15 mikrona P10 wyprodukowany został przez firmę 3Dlabs przejętą niedawno przez znaną z kart dźwiękowych korporację Creative Labs.
200 mikroprocesorów
Prace nad innowacyjnym układem P10 trwały prawie dwa lata i pochłonęły ogromną sumę pieniędzy – prawie 22 miliony USD. Być może właśnie z tego powodu firma 3Dlabs została przejęta przez Creative’a. Tak duże pieniądze był w stanie wysupłać tylko potentat rynkowy.
Wydane fundusze najprawdopodobniej nie pójdą na marne. Wyspecjalizowane bloki logiczne, występujące w popularnych kartach 3D, w P10 zastąpiono zintegrowaną jednostką przetwarzania wizualnego, składającą się z 200 32-bitowych w pełni programowalnych mikroprocesorów SIMD, pogrupowanych w cztery potoki renderowania obrazu. Jednostki SIMD (Single Instruction Multiple Data) zajmują się potokowym przetwarzaniem geometrii, tekstur i pikseli. Ich łączna wydajność wynosi 170 gigaflopów i ponad 1,2 teraopa, czyli ponad 1,2 biliona (1,2×10
12
) graficznych operacji logicznych na sekundę. Rdzeń układu P10 współpracuje z 256-bitową pamięcią DDR o przepustowości 20 GB/s, prawie dwukrotnie większej od przepustowości pamięci na kartach z GeForce4 ze 128-bitową magistralą. To “prawie” bierze się z niższej częstotliwości pracy DDR SDRAM na P10, taktowanej zegarem 312,5 MHz (dla GeForce4 jest to 325 MHz). P10 stanowi próbę połączenia zalet tradycyjnych układów graficznych GPU (szybkość) i procesorów CPU (elastyczność, łatwość programowania).
Bardziej programowalny
Architektura wewnętrzna P10 jest bardzo podobna do struktury GeForce’a 4 czy Radeona 8500 (patrz: CHIP 1/2002, str. 94, i CHIP 5/2002, str. 60). Zasadnicza różnica pomiędzy układami nVidii, ATI i 3Dlabs polega na stopniu programowalności wspomnianych układów. W GeForce4 i Radeonie 8500 programować można jedynie przetwarzanie wierzchołków (funkcja Vertex Shaders) w ściśle wytyczonych przez twórców kości ramach. P10 dzięki swej elastyczności zapewnia możliwość programowania każdego etapu tworzenia sceny 3D. Co więcej, dodanie nowej funkcji obsługiwanej sprzętowo wymaga jedynie uaktualnienia BIOS-u i sterowników karty. Nie trzeba więc będzie wymieniać akceleratora, gdy pojawią się gry 3D wymagające nowych właściwości sprzętowych! Dzięki tej cesze przystosowanie kart z P10 na pokładzie do obsługi standardów DirectX 9.0 czy OpenGL 2.0 powinno się odbyć zaraz po opublikowaniu specyfikacji.
Wyniki profesjonalnego testu SPECViewperf 7.0 | ||||||
Pomiary cząstkowe [pkt.] | ||||||
Karta graficzna | Ugs-01 | Proe-01 | Light-05 | DX-07 | DRV-08 | 3dsmax-01 |
Wildcat VP760 (P10) | 12,250 | 12,987 | 12,90 | 68,98 | 39,67 | 10,359 |
ATI Fire GL 8800 | 9,290 | 11,780 | 10,88 | 62,16 | 36,39 | 7,509 |
nVidia Quadro4 750XGL | 9,406 | 11,974 | 12,26 | 68,01 | 40,35 | 8,402 |
Pomiary wykonano na maszynie z procesorem Pentium 4 2,4 GHz i systemem Windows XP Professional. Pojedyncze punkty oznaczają ok. 10-procentowy wzrost wydajności. |