Niespodziewana konkurencja

Francusko-włoska firma STMicroelektronics, znana głównie z wytwarzania podzespołów elektronicznych, niespodziewanie dołączyła do grona producentów układów grafiki trójwymiarowej, prezentując procesor Kyro.

STMicroelektronics nie jest zupełnym nowicjuszem w dziedzinie wytwarzania chipów 3D. Część czytelników zapewne pamięta, że pierwsze kości Nvidii – Riva 128 i Riva ZX – pochodziły właśnie z fabryk tego europejskiego koncernu elektronicznego. Teraz układ Kyro, bo o nim mowa, powstał we współpracy z firmą Imagination Technologies, znaną z opracowania architektury PowerVR (obecnie w wersji trzeciej) – wykorzystaną m.in. w karcie VideoLogic Neon 250 (patrz: CHIP 1/2000, s. 48).

Składający się z 12 milionów tranzystorów Kyro wykonany został w technologii 0,25 mikrona. Zarówno rdzeń, jak i pamięć taktowane są zegarem 125 MHz. Kość może obsługiwać od 16 do 64 megabajtów pamięci typu SDRAM lub SGRAM, a szerokość szyny danych to 128 bitów. Umożliwia ona przesłanie do i z pamięci 2 GB/s informacji. Kyro zaopatrzony został w dwa 32-bitowe potoki renderujące. Przy renderingu 16-bitowym dane wewnątrz procesora przetwarzane są na 32 bitach. Dwupotokowa jednostka multiteksturująca umożliwia nakładanie do ośmiu warstw tekstur (4-, 8-, 16-, 24- lub 32-bitowych) w jednym cyklu zegarowym. Współczynnik fill rate równa się 250 megapikselom na sekundę (przy multiteksturowaniu – 750 megapikseli/s).

Prototypowe wersje kart z chipem Kyro firma STMicroelectronics przekazała do testów wszystkim największym amerykańskim serwisom internetowym.

Chip wyposażony w 32-bitowy wewnętrzny Z-bufor udostępnia szereg “modnych” operacji 3D. Zaimplementowano w nim m.in. pełnoekranowy antyaliasing FSAA (Full Screen AntiAliasing), działający w trybach skalowania 2× i 4×, teksturowanie anizotropowe, środowiskowe mapowanie wypukłości (Environment Mapped Bump Mapping) czy kompresje tekstur DXCT (DirectX Texture Compression). Konstruktorzy nie zapomnieli też o wsparciu odtwarzania filmów DVD w postaci kompensacji ruchu (Motion Compensation). Procesor graficzny firmy STMicroelectronics może współpracować z magistralą AGP 1×/2×/4× przy wykorzystaniu szybkiego trybu adresowania SBA (SideBand Addressing). Sterowniki systemowe do gotowej karty graficznej zapewniają wsparcie dla środowiska DirectX i OpenGL. Całości obrazu zastosowanych rozwiązań technologicznych dopełnia zintegrowany 270-megahercowy RAMDAC.

Przyglądając się przedstawionej tu specyfikacji, odnosi się wrażenie, że Kyro – oprócz zaimplementowania kilku nowoczesnych funkcji, takich jak np. FSAA czy kompensacja ruchu – jest układem zaprojektowanym na początku zeszłego roku. Brak tutaj bowiem wsparcia dla transformacji geometrycznych i kalkulacji oświetlenia (Transform and Lighting – T&L). Współczynnik fill rate zbliżony jest do osiągów kart z procesorem RivaTNT2, nie zachwyca też częstotliwość pracy jądra układu (np. w GeForce2 GTS wynosi ona 200 MHz). Całkowite pasmo dla przesyłania danych do i z pamięci jest ponaddwukrotnie niższe niż u konkurencji – np. 5,3 GB/s dla GeForce’a 2 GTS – a wewnętrzne obliczenia na 32-bitowych danych wykonują już od dawna takie kości, jak np. Matrox G400. W Kyro zabrakło również możliwości współpracy z wydajnymi pamięciami typu DDR SDRAM/SGRAM.

Oczywiście pod względem prędkości działania Kyro nie może dorównać najszybszym obecnie akceleratorom, ale jego bardzo duża wydajność w połączeniu z zapowiadaną niską ceną (na razie nie podano konkretnej kwoty) mogą spowodować dominację nowej kości na rynku tanich kart graficznych. Jaki zatem sekret kryje się za tak dużą wydajnością nowego procesora graficznego? Otóż, cechą odróżniającą chip firmy STMicroelectronics od pozostałych dostępnych na rynku układów jest zaimplementowany w technologii PowerVR odmienny sposób generowania obrazu. W tradycyjnym akceleratorze podczas renderingu każdy wielokąt tworzący scenę jest przeliczany niezależnie od pozostałych poligonów. Również proces cieniowania i nakładania tekstur odbywa się niezależnie dla każdego trójkąta. Oznacza to, że jeżeli kolejny element (lub jego fragment) generowanej sceny 3D przesłoni obliczony już wcześniej obiekt, cały poprzedni proces teksturowania został (przynajmniej w części) niepotrzebnie wykonany. Za ostateczną eliminację z gotowego już obrazu 3D niewidocznych dla obserwatora fragmentów odpowiada mechanizm tzw. Z-bufora (patrz: CHIP 4/99, s. 68).

Tradycyjne akceleratory przeliczają niezależnie każdy wielokąt tworzący trójwymiarową scenę. Oznacza to, że na każdy, nawet ukryty dla obserwatora element musi zostać nałożona tekstura. W układach wykorzystujących technologię PowerVR teksturowaniu poddaje się jedynie widoczne fragmenty obrazu.

W Kyro proces renderingu przebiega zupełnie inaczej. Cała trójwymiarowa scena podzielona zostaje najpierw na małe fragmenty (kafelki, z ang. “tile”) o wymiarach 20×20 pikseli. Następnie sprawdza się położenie wszystkich wielokątów (lub ich fragmentów) znajdujących się w obrębie takiego “dwudziestopunktowego” elementu. Ze względu na małą powierzchnię pojedynczego kafelka do eliminacji niewidocznych dla obserwatora fragmentów obrazu niepotrzebny jest Z-bufor. Operacja wykluczania zasłoniętych fragmentów trójwymiarowej sceny dla tak małej powierzchni kafelka jest wyjątkowo prosta. Dodatkowo dzięki wbudowanemu w układ Kyro niewielkiemu buforowi odwoływanie się do pamięci RAM karty graficznej podczas procesu usuwania trójkątów staje się całkowicie zbędne. Po zakończeniu obliczeń dla jednego kafelka chip graficzny rozpoczyna analizę zawartości kolejnego prostokątnego elementu. Proces ten powtarzany jest aż do ostatniego kafelka. Dopiero po zakończeniu obróbki całej sceny następuje cieniowanie i teksturowanie poligonów (tylko widocznych dla obserwatora fragmentów). Opisywana technologia nosi nazwę teksturowania z odroczonym przebiegiem (deferred texturing process) – patrz: rysunek.

Zastosowanie w układach PowerVR takiego podejścia do renderingu w oczywisty sposób wpływa na przyśpieszenie procesu generowania obrazu. Zmniejsza się też ilość informacji przesyłanych pomiędzy procesorem graficznym a pamięcią karty – dlatego układowi Kyro całkowicie wystarcza 2-gigabajtowa przepustowość szyny danych, pamięci SDRAM oraz niższe częstotliwości zegara.

Jak w praktyce zachowuje się wykorzystujący technologię PowerVR układ Kyro? Pierwsze opublikowane w Internecie testy dowodzą, że w niskich rozdzielczościach (640×480 i 800×600 pikseli – zarówno przy 16-, jak i 32–bitowym kolorze) jego wydajność jest ok. 20% mniejsza od kart Nvidii (GeForce2 i GeForce 256) i porównywalna do osiągów Voodoo5 5500. Natomiast w wyższych rozdzielczościach (1024×768 oraz 1600×1200 punktów) Kyro ustępuje wymienionym kartom w 16-bitowym kolorze o ok. 50%, lecz przy 32–bitowym renderingu działa równie szybko jak GeForce 256 z pamięciami DDR i o 20% wolniej od GeForce2 GTS i Voodoo5 5500. Jeżeli sprawdzi się prognoza, że koszt zakupu gotowych kart graficznych z układem Kyro będzie niski, wówczas rzeczywiście szykuje się nowa cenowo-trójwymiarowa rewolucja.

Info
Grupy dyskusyjne
Uwagi i komentarze do artykułu:
#
Pytania techniczne:
#
Internet
Strona producenta Kyro:
http://www.kyro.st.com/
Technologia PowerVR:
http://www.powervr.com/
Pierwsze testy w Internecie:
http://www.anandtech.com/
http://www.hardocp.com/
http://firingsquad.gamers.com/
Na CHIP-CD w dziale Aktualności| Tendencje znajduje się dokumentacja techniczna układu Kyro
Więcej:bezcatnews