Przejdź na skróty do treści. | Przejdź do nawigacji

Zapamiętaj mnie Przypomnij hasło Rejestracja
Wersja mobilna
Newsletter
Zgłoś uwagę
RSS

Karty graficzne

rozwiń
Strona główna Karty graficzne Artykuły Tak działają najszybsze karty graficzne

Nowa generacja procesorów 3D

Tak działają najszybsze karty graficzne

Procesory graficzne nowej generacji stworzone przez ATI i Nvidię zapewniają niespotykany wcześniej poziom akceleracji 3D. Zgłębiamy tajniki budowy najwydajniejszych układów i pokazujemy różnice między konstrukcjami czołowych producentów.

Filmy w wysokiej rozdzielczości, skomplikowane obliczenia matematyczne i piękne, fotorealistyczne efekty trójwymiarowe. Współczesne karty graficzne mogą o wiele więcej, niż tylko przedstawiać działania bohaterów naszych ulubionych gier. Wydajność najnowszych urządzeń stworzonych przez Nvidię i ATI jest ogromna. Nowy układ Nvidii nosi nazwę GT200. Trafił do kart graficznych sygnowanych symbolami GTX260 oraz GTX 280. Topowy model ATI – oznaczony symbolem RV770 – znajdziemy w Radeonach HD 4850 i 4870. Przepaść dzieląca je od wcześniej produkowanych układów jest dobrze ilustrowana przez ranking procesorów graficznych na s76.

W dalszej części tekstu przybliżymy szczegóły budowy nowych układów, wyjaśnimy pojęcia, takie jak shader, ROP czy jednostka teksturowania, i zademonstrujemy, dlaczego nowoczesne procesory graficzne w niektórych zastosowaniach deklasują najwydajniejsze procesory Intela i AMD.

Podstawy: budowa karty graficznej

Współczesne karty graficzne zwykle składają się z pięciu komponentów: interfejsu systemowego, pamięci graficznej, procesora graficznego GPU (Graphics Processing Unit), bufora ramki i tzw. RAMDAC (Random Access Digital/Analog Converter).

Interfejs systemowy znajduje się najbliżej płyty głównej. Obecnie stosuje się złącze PCI Express. Za jego pośrednictwem nieobrobione dane są ładowane do pamięci graficznej, w której przechowywane są wszelkie obiekty graficzne i tekstury. Jej pojemność waha się od 256 do nawet 2048 MB. Informacje są następnie odczytywane przez procesor graficzny, który przygotowuje do wyświetlenia na ekranie pozycje, ruchy i fakturę wszelkich obiektów widocznych w trójwymiarowej scenie. Po obróbce gotowy obraz jest umieszczany w buforze klatek i wędruje do RAMDAC – układu, który przetwarza cyfrowe obrazy, nadając im formę analogową, odpowiednią dla wyjścia VGA, lub przesyła je do cyfrowych wyjść DVI, HDMI lub DisplayPort.

Potok graficzny: droga obrazu

Większość elementów karty graficznej odgrywa wyłącznie rolę pomocniczą. Najważniejszy jest procesor grafiki. Kiedy docierają do niego dane, rozpoczynają się obliczenia, których efekt możemy zobaczyć na monitorze. Potok graficzny, czyli droga, jaką pokonują dane w karcie graficznej: od interfejsu do bufora klatek, jest podobny we wszystkich nowoczesnych urządzeniach.

Cała sekwencja powtarzana jest w wypadku każdej pojedynczej klatki. Aby wyświetlany ruch był płynny, ludzkie oko musi wychwycić co najmniej 25 klatek na sekundę. W nowoczesnych grach komputerowych największy realizm uzyskuje się dopiero przy 60 klatkach na sekundę – procesor graficzny ma więc dużo pracy.

Pierwszy etap potoku graficznego to obliczenia wstępne i przekształcenie informacji przez procesor wstępny (tzw. Setup Engine lub Input Assembler). Ten ostatni rozpoznaje typ danych, tj. bada, czy ma do czynienia z wektorami, obrazami, czy też kodem programu, i odpowiednio przygotowuje informacje do dalszej obróbki. Jest też ustalane, czy grafika będzie przetwarzana przez układ cieniowania wierzchołków (Vertex Shader), geometrii (Geometric Shader) lub pikseli (Pixel Shader), czy też przez jednostkę teksturowania.

Każdy obiekt trójwymiarowy składa się z trójkątów. Ich współrzędne są wykorzystywane przez układ cieniowania wierzchołków do tworzenia modeli przestrzennych przedstawianych brył. Są one ustawiane w odniesieniu do punktu widzenia wirtualnego obserwatora. Przyjęte pole widzenia określa się mianem bryły widzenia. Po uszeregowaniu struktur w przestrzeni sprawdza się, czy określony obiekt układu znajduje się w bryle widzenia, tzn. czy jest widoczny, czy też częściowo lub całkowicie zasłonięty przez inne obiekty. Aby uniknąć wykonywania niepotrzebnych obliczeń, niewidoczne elementy są ze sceny usuwane – proces ten nazywa się obcinaniem bryłowym. Z kolei jeśli obiekt jest usuwany, gdyż znajduje się zbyt daleko od obserwatora, by ten mógł go zauważyć, albo zbyt blisko niego czy za nim, mówimy o tzw. clippingu.

Ostatnim etapem pracy układu cieniowania wierzchołkowego jest odpowiednie oświetlenie trójwymiarowej sceny. W tym celu w wymodelowanej przestrzeni umieszczone zostaje jedno lub więcej źródeł światła – bez tego utonęlibyśmy w ciemności.

Vertex Shader może jedynie manipulować istniejącymi obiektami, nie ma natomiast możliwości dodawania nowych elementów, takich jak punkty, linie i trójkąty. W celu zaspokojenia takich potrzeb w wydanym w listopadzie 2006 roku pakiecie DirectX 10 znalazł się układ geometrii. Może on tworzyć zupełnie nowe formy geometryczne, dzięki czemu np. wirtualne drzewa będą rosnąć. Shader geometryczny uruchamiany jest po utworzeniu trójwymiarowej sceny.

Kiedy obraz, który powinien być widziany przez obserwatora, jest przygotowany w formie siatki zawierającej źródła światła, powstaje jego dwuwymiarowe odwzorowanie, które może być wyświetlone na monitorze. Proces ten nazywamy renderowaniem albo rasteryzacją. Każdy punkt dowolnego obiektu trójwymiarowego, dotychczas zapisany w formie wektorowej, jest przekształcany w piksel. Następnie układ przechodzi do obliczeń związanych z cieniowaniem wykonanych przez shader pikseli. Nadaje on kolejnym punktom kolor oraz inne cechy, jak przezroczystość, odbijanie światła lub faktura. W ten sposób zostaje oddana barwa wyświetlanych elementów. Kolejne zadania wykonywane przez shadery można jeszcze raz prześledzić na infografice.

Dodaj komentarz 17 komentarzy
markii
markii 2009.01.08 13:40
To są super karty graficzne
kruper11
kruper11 2009.01.08 13:40
wiele się Pan napisał tylko nie bardzo rozumiem po co?? każdy kto siętrochęmocniej interesuje tą tematyką raczej już te rzeczy wie i je zna... a kazdy laik pana artu nie przeczyta, bo mu sie nie bedzie chciało...

sam art jest OK...

PZDR
szok_i_niedowierzanie
szok_i_niedowierzanie 2009.01.08 13:45
gpu jest przereklamowane. procesory CELL deklasują je w złożonych obliczeniach.

tyle w temacie
bzz
bzz 2009.01.08 14:35
apropo procesora CELL
jakie sa jego specyfikacje techniczne? nigdzie tego nie moglem znalesc
szok_i_niedowierzanie
szok_i_niedowierzanie 2009.01.08 15:20
CELL (classic):

Zegar: 2,8GHz; 3,2GHz
cores: 1xPPC + 8xSPE
architektura 64-bitowa (jednostka wektorowa 128-bitowa)
wydajność dla 3,2GHz: ok. 14 GFlops DP, 204,8 GFlops SP
cena: poniżej 50USD


PowerXCell 8i (zwany GIGANTEM):

Zegar: 3,2GHz; 4,0GHz
cores: 1xPPC + 8xSPE (znacznie rozbudowana i wydajniejsza jednostka wektorowa w porównaniu do klasycznego CELLa)
architektura 64-bitowa (jednostka wektorowa 128-bitowa)
wydajność dla 4,0GHz: 128 GFlops DP, 256 GFlops SP
cena: szacuję, że nie więcej niż 100-150USD
matox
matox 2009.01.08 16:05
Świetne teraz będo gry i filmy z fajna grafiką.
bzz
bzz 2009.01.08 18:21
no niezla specyfikacja cella
200 milionow na projekt dalo efekt
tylko pytanie dlaczego nie wpakuja tego potworka do kart graficznych?
prawdopodobnie za nic nie dalo by sie zmusic cella do dzialania w normalnej karcie grafiki
master072
master072 2009.01.09 14:19
świetne sa te karty full wypas hhe
broxmar
broxmar 2009.01.10 22:14
dużo dowiedziałem się o budowie układów graficznych z tego artykułu
joekid
joekid 2009.01.13 01:01
Ciekawostka CELLa jest brak cachu dla jednostek SPE, oraz fakt, ze komunikuja sie one z pamiecia asynchronicznie:) Dzieki temu szybkosc na sieci polaczeniowej (pierscien) siega 300 gb/s!!!:)
joekid
joekid 2009.01.13 01:03
btw. Chetnie bym przeczytal jakis szerszy artkul a CUDA. Do nie dawna programwonie kard bylo karkolomnym wyczynem, a to jest mala rewolucja:)
funky5
funky5 2009.01.19 20:18
czekamy aż będą dostępne dla domowych użytkowników...
M4r14N
M4r14N 2009.01.31 21:54
Bardzo dobry art. Zupełnie zgodny z profilem pisma - to przecież nie musi być superfachowe (wtedy ktoś powie, że "bełkot pseudofachowy"), a w sam raz nawet dla trochę obeznanych (reszta już nie musi czytać takich pism ;P). I też jestem ciekaw, co to za CUDA przygotowała nvidia (na ich stronie "bełkot..." /ironia/)
Piotrek
Piotrek 2009.02.05 22:10
art spoko, tylko mógłby być ciut krótszy (ale to moja opinia)
Klakiers
Klakiers 2009.02.14 00:26
Fajnie się czytało :)
Dobrze jest odświeżyć wiedzę i tak wgl. to good job :)
Pudel
Pudel 2009.03.08 14:50
Gratulacje za artykuł, rzadko ktoś potrafi się tak rozpisać i nie zanudzić czytelnika.
rwitos
rwitos 2009.09.17 15:31
Świetna robota- jasno i przejrzyście wyjaśnione co trzeba.
Niestety różnice w wydajności przedstawione na końcu sugerują ,że 260tka kasuje 4870 choć tak nie jest bo 933 TGLOPa ,a 12000TFLOPa
sugeruje odwrotny układ. I tak też je w wielu tytułach jak HAWX ,FALLOUT3, GRID gdzie przewaga sięga 10-12 fpsów. Wszytko jak widać zależy od wsparcia programujących dane architektury. Śmierć jaką zada MS DX11 obsługą nowych jednolitych operacji na shaederach dla technologii CUDA , a HAVOK przez OPENCL Physixowi - pokazuje ,że przewaga jąką NV uzyskała lepszym wsparciem programistów w grach niedługo stopnieje... To już jak DX10.1 zmasakrował 260tki w wynikach np , HAWX (kop o ponad 20fps) pokazuje tendencję. Ja się cieszę z DX11 bo skończą się czasy pisania gierek i naciągania benchmarków pod układy konkretnej firmy.
Wreszcie jak różnica mocy 1200TFLOP od 933TFLOP wyjdzie jak na dłoni w każdej nowej grze! GPGPU wreszcie w pełni odczujemy w grach i nie trzeba będzie płakać ,ze nie stać nas na lepszy CPU i pchać się w drogie 6 czy więcej rdzeni bo giera mimo dobrej grafy i tak działa cieniutko bo sobie z obliczeniami np. fizyki i AI cienki procek nie radzi. Ja tam zostaje przy RADKU. Rewelacyjne 5870tki już za miesiąc! No i ta zwykle niżasza cena niż NV... Tym bardziej ,że chodzą ploty ,że uzysk dobrych chipów z wafla przy GT300 jest na poziomie 2%. Mogą więc nowe karty NV w tym układzie nie być tańsze. :-)
AUTOR: piotr lisowski
DODANO: 08.01.2009
Tagi producenckie: nvidia
LICZBA WYŚWIETLEŃ: 8477

Co:
Gdzie:
Kraj:
praca IT Polska njobs IT praca
vacatures IT Netherlands njobs IT vacatures
arbeit IT Deutschland njobs IT arbeit
work IT United Kingdom njobs IT jobs
Lavoro IT Italia njobs IT lavoro
Emploi IT France njobs IT emploi
trabajo IT Espana njobs IT trabajo

Video
nowe filmy

CENEO Kup Najtaniej
ASUS VE228T 21.5" ASUS VE228T 21.5"
Dostępny w 57 sklepach
Sprawdź CENY tego produktu
Anycom RS-232B (CC-BT232B) Anycom RS-232B (CC-BT232B)
Dostępny w 4 sklepach
Sprawdź CENY tego produktu
UBIQUITI UBNT AIRGRID-M2 20dBi 2,4GHz 20dBm UBIQUITI UBNT AIRGRID-M2 20dBi 2,4GHz 20dBm
Dostępny w 1 sklepach
Sprawdź CENY tego produktu
Sony VGP-AC19V30 Sony VGP-AC19V30
Dostępny w 3 sklepach
Sprawdź CENY tego produktu