Nowa generacja procesorów 3D
Tak działają najszybsze karty graficzne
Procesory graficzne nowej generacji stworzone przez ATI i Nvidię zapewniają niespotykany wcześniej poziom akceleracji 3D. Zgłębiamy tajniki budowy najwydajniejszych układów i pokazujemy różnice między konstrukcjami czołowych producentów.
|
Filmy w wysokiej rozdzielczości, skomplikowane obliczenia matematyczne i piękne, fotorealistyczne efekty trójwymiarowe. Współczesne karty graficzne mogą o wiele więcej, niż tylko przedstawiać działania bohaterów naszych ulubionych gier. Wydajność najnowszych urządzeń stworzonych przez Nvidię i ATI jest ogromna. Nowy układ Nvidii nosi nazwę GT200. Trafił do kart graficznych sygnowanych symbolami GTX260 oraz GTX 280. Topowy model ATI – oznaczony symbolem RV770 – znajdziemy w Radeonach HD 4850 i 4870. Przepaść dzieląca je od wcześniej produkowanych układów jest dobrze ilustrowana przez ranking procesorów graficznych na s76. W dalszej części tekstu przybliżymy szczegóły budowy nowych układów, wyjaśnimy pojęcia, takie jak shader, ROP czy jednostka teksturowania, i zademonstrujemy, dlaczego nowoczesne procesory graficzne w niektórych zastosowaniach deklasują najwydajniejsze procesory Intela i AMD. Podstawy: budowa karty graficznejWspółczesne karty graficzne zwykle składają się z pięciu komponentów: interfejsu systemowego, pamięci graficznej, procesora graficznego GPU (Graphics Processing Unit), bufora ramki i tzw. RAMDAC (Random Access Digital/Analog Converter). Interfejs systemowy znajduje się najbliżej płyty głównej. Obecnie stosuje się złącze PCI Express. Za jego pośrednictwem nieobrobione dane są ładowane do pamięci graficznej, w której przechowywane są wszelkie obiekty graficzne i tekstury. Jej pojemność waha się od 256 do nawet 2048 MB. Informacje są następnie odczytywane przez procesor graficzny, który przygotowuje do wyświetlenia na ekranie pozycje, ruchy i fakturę wszelkich obiektów widocznych w trójwymiarowej scenie. Po obróbce gotowy obraz jest umieszczany w buforze klatek i wędruje do RAMDAC – układu, który przetwarza cyfrowe obrazy, nadając im formę analogową, odpowiednią dla wyjścia VGA, lub przesyła je do cyfrowych wyjść DVI, HDMI lub DisplayPort. Potok graficzny: droga obrazuWiększość elementów karty graficznej odgrywa wyłącznie rolę pomocniczą. Najważniejszy jest procesor grafiki. Kiedy docierają do niego dane, rozpoczynają się obliczenia, których efekt możemy zobaczyć na monitorze. Potok graficzny, czyli droga, jaką pokonują dane w karcie graficznej: od interfejsu do bufora klatek, jest podobny we wszystkich nowoczesnych urządzeniach. Cała sekwencja powtarzana jest w wypadku każdej pojedynczej klatki. Aby wyświetlany ruch był płynny, ludzkie oko musi wychwycić co najmniej 25 klatek na sekundę. W nowoczesnych grach komputerowych największy realizm uzyskuje się dopiero przy 60 klatkach na sekundę – procesor graficzny ma więc dużo pracy. Pierwszy etap potoku graficznego to obliczenia wstępne i przekształcenie informacji przez procesor wstępny (tzw. Setup Engine lub Input Assembler). Ten ostatni rozpoznaje typ danych, tj. bada, czy ma do czynienia z wektorami, obrazami, czy też kodem programu, i odpowiednio przygotowuje informacje do dalszej obróbki. Jest też ustalane, czy grafika będzie przetwarzana przez układ cieniowania wierzchołków (Vertex Shader), geometrii (Geometric Shader) lub pikseli (Pixel Shader), czy też przez jednostkę teksturowania. Każdy obiekt trójwymiarowy składa się z trójkątów. Ich współrzędne są wykorzystywane przez układ cieniowania wierzchołków do tworzenia modeli przestrzennych przedstawianych brył. Są one ustawiane w odniesieniu do punktu widzenia wirtualnego obserwatora. Przyjęte pole widzenia określa się mianem bryły widzenia. Po uszeregowaniu struktur w przestrzeni sprawdza się, czy określony obiekt układu znajduje się w bryle widzenia, tzn. czy jest widoczny, czy też częściowo lub całkowicie zasłonięty przez inne obiekty. Aby uniknąć wykonywania niepotrzebnych obliczeń, niewidoczne elementy są ze sceny usuwane – proces ten nazywa się obcinaniem bryłowym. Z kolei jeśli obiekt jest usuwany, gdyż znajduje się zbyt daleko od obserwatora, by ten mógł go zauważyć, albo zbyt blisko niego czy za nim, mówimy o tzw. clippingu. Ostatnim etapem pracy układu cieniowania wierzchołkowego jest odpowiednie oświetlenie trójwymiarowej sceny. W tym celu w wymodelowanej przestrzeni umieszczone zostaje jedno lub więcej źródeł światła – bez tego utonęlibyśmy w ciemności. Vertex Shader może jedynie manipulować istniejącymi obiektami, nie ma natomiast możliwości dodawania nowych elementów, takich jak punkty, linie i trójkąty. W celu zaspokojenia takich potrzeb w wydanym w listopadzie 2006 roku pakiecie DirectX 10 znalazł się układ geometrii. Może on tworzyć zupełnie nowe formy geometryczne, dzięki czemu np. wirtualne drzewa będą rosnąć. Shader geometryczny uruchamiany jest po utworzeniu trójwymiarowej sceny. Kiedy obraz, który powinien być widziany przez obserwatora, jest przygotowany w formie siatki zawierającej źródła światła, powstaje jego dwuwymiarowe odwzorowanie, które może być wyświetlone na monitorze. Proces ten nazywamy renderowaniem albo rasteryzacją. Każdy punkt dowolnego obiektu trójwymiarowego, dotychczas zapisany w formie wektorowej, jest przekształcany w piksel. Następnie układ przechodzi do obliczeń związanych z cieniowaniem wykonanych przez shader pikseli. Nadaje on kolejnym punktom kolor oraz inne cechy, jak przezroczystość, odbijanie światła lub faktura. W ten sposób zostaje oddana barwa wyświetlanych elementów. Kolejne zadania wykonywane przez shadery można jeszcze raz prześledzić na infografice. |


Kup Najtaniej
sam art jest OK...
PZDR
tyle w temacie
jakie sa jego specyfikacje techniczne? nigdzie tego nie moglem znalesc
Zegar: 2,8GHz; 3,2GHz
cores: 1xPPC + 8xSPE
architektura 64-bitowa (jednostka wektorowa 128-bitowa)
wydajność dla 3,2GHz: ok. 14 GFlops DP, 204,8 GFlops SP
cena: poniżej 50USD
PowerXCell 8i (zwany GIGANTEM):
Zegar: 3,2GHz; 4,0GHz
cores: 1xPPC + 8xSPE (znacznie rozbudowana i wydajniejsza jednostka wektorowa w porównaniu do klasycznego CELLa)
architektura 64-bitowa (jednostka wektorowa 128-bitowa)
wydajność dla 4,0GHz: 128 GFlops DP, 256 GFlops SP
cena: szacuję, że nie więcej niż 100-150USD
200 milionow na projekt dalo efekt
tylko pytanie dlaczego nie wpakuja tego potworka do kart graficznych?
prawdopodobnie za nic nie dalo by sie zmusic cella do dzialania w normalnej karcie grafiki
Dobrze jest odświeżyć wiedzę i tak wgl. to good job
Niestety różnice w wydajności przedstawione na końcu sugerują ,że 260tka kasuje 4870 choć tak nie jest bo 933 TGLOPa ,a 12000TFLOPa
sugeruje odwrotny układ. I tak też je w wielu tytułach jak HAWX ,FALLOUT3, GRID gdzie przewaga sięga 10-12 fpsów. Wszytko jak widać zależy od wsparcia programujących dane architektury. Śmierć jaką zada MS DX11 obsługą nowych jednolitych operacji na shaederach dla technologii CUDA , a HAVOK przez OPENCL Physixowi - pokazuje ,że przewaga jąką NV uzyskała lepszym wsparciem programistów w grach niedługo stopnieje... To już jak DX10.1 zmasakrował 260tki w wynikach np , HAWX (kop o ponad 20fps) pokazuje tendencję. Ja się cieszę z DX11 bo skończą się czasy pisania gierek i naciągania benchmarków pod układy konkretnej firmy.
Wreszcie jak różnica mocy 1200TFLOP od 933TFLOP wyjdzie jak na dłoni w każdej nowej grze! GPGPU wreszcie w pełni odczujemy w grach i nie trzeba będzie płakać ,ze nie stać nas na lepszy CPU i pchać się w drogie 6 czy więcej rdzeni bo giera mimo dobrej grafy i tak działa cieniutko bo sobie z obliczeniami np. fizyki i AI cienki procek nie radzi. Ja tam zostaje przy RADKU. Rewelacyjne 5870tki już za miesiąc! No i ta zwykle niżasza cena niż NV... Tym bardziej ,że chodzą ploty ,że uzysk dobrych chipów z wafla przy GT300 jest na poziomie 2%. Mogą więc nowe karty NV w tym układzie nie być tańsze. :-)