Technické údaje grafických kariet
Na nasledujúcej stránke máme porovnané technické parametre jednotlivých grafických kariet a ich príslušné teoretické peak hodnoty. Radeon HD 4850 dosahuje napriek nižšej pracovnej frekvencii jadra vyššie viaceré teoretické hodnoty ako HD 3850/3870, nakoľko má jadro RV770 v prorovnaní s RV670 viac výpočtových jednotiek.
            Radeon HD 3850 | 
            
            Radeon HD 3870 | 
            
            Radeon HD 4850
             | 
            
            Radeon HD 4850 Toxic
             | 
        |
|  Jadro: | 
            RV670 | RV670 | RV770 | RV770 | 
|  Výrobný proces: | 
            55nm | 55nm | 55nm | 55nm | 
|  Veľkosť jadra: | 
            ~192 mm^2 | ~192 mm^2 | ~256mm^2  | 
            ~256mm^2 | 
|  Počet tranzistorov: | 
            ~666 miliónov | ~666 miliónov | ~956 miliónov | 
            ~956 miliónov | 
        
|  Frekvencia jadra: | 
            670 MHz | 
            775 MHz | 625 MHz | 
            675 MHz | 
        
|  Frekvencia pamäte: | 
            830 MHz | 1125 MHz | 
            999 MHz | 
            1150 MHz | 
        
|  Kapacita, typ pamäte: | 
            512MiB, GDDR3 | 512MiB, GDDR4 | 
            512MiB, GDDR3 | 512MiB, GDDR3 | 
|  Frekvencia shadercore: | 
             670 MHz | 
             775 MHz | 
            625 MHz | 
            675 MHz | 
        
|  Počet TFUs: | 
            16 | 16 | 40 | 
            40 | 
        
|  Počet TAUs: | 
            32 | 32 | 40 | 
            40 | 
        
|  Počet ALUs: | 
            64x Vec5 (320 SPs) | 
            64x Vec5 (320 SPs) | 
            160x Vec5 (800 SPs) | 
            160x Vec5 (800 SPs) | 
        
|  Počet ROPs | 
            16 | 16 | 16 | 
            16 | 
        
| Podpora D3D: | 10.1 | 10.1 | 10.1 | 10.1 | 
|  Pixel fillrate: | 
            10 720 Mpixels/s | 12 400 Mpixels/s | 10 000 Mpixels/s | 
            10 800 Mpixels/s | 
        
|  Bilinear texelfillrate: | 
            10 720 Mtexels/s | 12 400 Mpixels/s | 25 000 Mtexels/s | 
            27 000 Mtexels/s | 
        
| Bilinear FP-16 texel fillrate:  | 
            10 720 Mtexels/s | 12 400 Mtexels/s | 12 500 Mtexels/s | 
            13 500 Mtexels/s | 
        
|  Z-sample rate: | 
            21 440 Msamples/s | 24 800 Msamples/s | 40 000 Msamples/s | 
            43 200 Msamples/s | 
        
| AA-sample rate: | 42 880 Msamples/s | 49 600 Msamples/s | 80 000 Msamples/s | 
            86 400 Msamples/s | 
        
| Aritmetický výkon: | 428,8 GFlop/s | 496 GFlops/ | 1000 GFlop/s | 
            1080 GFlop/s | 
        
| Geometry rate: | 670 Mtriangles/s | 775 Mtriangles/s | 625 Mtriangles/s | 
            675 Mtriangles/s | 
        
|  Šírka zbernice: | 
            256 bit | 256 bit |  256 bit | 
             256 bit | 
        
| Priepustnosť pamäte: | 53,1 GB/s | 72 GB/s | 63,5 GB/s | 
            73,6 GB/s | 
        

            GeForce 8800 GT | 
            
            GeForce 8800 GTX | 
            
            GeForce 9800 GTX | 
            
            GeForce 9800 GTX+ | 
        |
|  Jadro: | 
            G92 | G80 | G92 | G92b | 
|  Výrobný proces: | 
            65nm | 90nm | 65nm | 55nm | 
|  Veľkosť jadra: | 
            ~325 mm^2 | ~484 mm^2 | ~325 mm^2 | ~276 mm^2 | 
|  Počet tranzistorov: | 
            ~754 miliónov | ~681 miliónov | ~754 miliónov | ~754 miliónov | 
|  Frekvencia jadra: | 
            600 MHz | 575 MHz | 675 MHz | 738 MHz | 
|  Frekvencia pamäte: | 
            900 MHz | 900 MHz | 1100 MHz | 1100 MHz | 
|  Kapacita, typ pamäte: | 
            512MiB, GDDR3 | 768MiB, GDDR3 | 512MiB, GDDR3 | 512MiB, GDDR3 | 
|  Frekvencia shadercore: | 
            1512 MHz | 1350 MHz | 1688 MHz | 1836 MHz | 
|  Počet TFUs: | 
            56 | 64 | 64 | 64 | 
|  Počet TAUs: | 
            56 | 32 | 64 | 64 | 
|  Počet ALUs: | 
            7x Vec16 (112 SPs) | 8x Vec16 (128 SPs) | 8x Vec16 (128 SPs) | 8x Vec16 (128 SPs) | 
|  Počet ROPs | 
            16 | 24 | 16 | 16 | 
| Podpora D3D: | 10 | 10 | 10 | 10 | 
|  Pixel fillrate: | 
            9600 Mpixels/s | 13 800 Mpixels/s | 10 800 Mpixels/s | 11 808 Mpixels/s | 
|  Bilinear texelfillrate: | 
            33 600 Mtexels/s | 18 400 Mtexels/s | 43 200 Mtexels/s | 47 232 Mtexels/s | 
| Bilinear FP-16 texel fillrate:  | 
            16 800 Mtexels/s | 18 400 Mtexels/s | 21 600 Mtexels/s | 23 616 Mtexels/s | 
|  Z-sample rate: | 
            38 400 Msamples/s | 55 200 Msamples/s | 43 200 Msamples/s | 47 232 Msamples/s | 
| AA-sample rate: | 76 800 Msamples/s | 110 400 Msamples/s | 86 400 Msamples/s | 94 464 Msamples/s | 
| Aritmetický výkon: | 508 GFlop/s | 518,4 GFlop/s | 648,2 GFlop/s | 705 GFlop/s | 
| Geometry rate: | 600 Mtriangles/s | 575 Mtriangles/s | 675 | 738 | 
|  Šírka zbernice: | 
            256 bit | 384 bit | 256 bit | 256 bit | 
| Priepustnosť pamäte: | 57,6 GB/s | 86,4 GB/s | 70,4 GB/s | 70,4 GB/s | 
Každá TMU = textúrovacia jednotka sa skladá z TFUs = filtrovacích a TAUs = adresovacích subjednotiek. Rozhodli sme sa zaradiť do tabuľky aj Bilinear FP-16 texelfillrate okrem "čistej" bilinear texelfillrate, lebo má vyššiu výpovednú hodnotu. V hrách asi už len málokto nevyužíva trilineárny či anizotropný filter - dvojnásobne to platí pri high-end kartách a architektúre silnej na texelfillrate ako je G8x/G9x. Pure fillrate má G92/94 vyššiu ako G80, kvôli väčšiemu počtu adresovacích jednotiek (TAUs) v sampler array. GeForce 8800GTX má na rozdiel od toho viac filtrovacích jednotiek (TFUs), ktoré dokáže využiť napr. až pri trilieárnom, anizotropnom alebo bilinearnom FP-16 filtrovaní. Jej texelfillrate so zapnutím bilinear 2x anizotropného filtra neklesne. G92/G94, áno. Možno z toho dôvodu hovoriť o trilineárnych TMUs v prípade G8x a o bilineárnych TMUs v prípade G9x.
Aritmetický výkon sme u GeForce grafických kartách počítali s 3 FLOPs (MAD + MUL) za takt ako udáva nVidia, aj napriek tomu, že MUL sub-ALU, ktorá dodáva tretiu FLOPs je často využívaná na korektúru perspektív, interpoláciu a SFUs. Od grafického ovládača ForceWare 158.19 je ju možné využiť z časti - 15% na general shading, ako MAD jednotky. Dôvod prečo sme takto počítali je v konkurencii. Reálny aritmetický výkon RV670/RV770 je taktiež nižší, lebo Vec5 ALUs dokážu za takt spracovať len vtedy 5 komponentov, pokiaľ nie sú na sebe závislé a 5. sub-ALU = tá väčšia, sa stará takisto o SFUs. G8x/G9x má oproti R(V)6x0 výhodu v lepšom vyťažení shadercore, lebo jej ALUs sa tvária ako "skalárne" vďaka riadiacej logike (v skutočnosti sú to Vec ALUs) a superskalárna architektúra R(V)6xx využívajúca VLIW je závislá na compileri, assembleri.
Pre viac detailov ohľade jednotlivých architektúr odporúčam prečítať technické články zaoberajúce sa čipom RV770, RV670, G80 a R600:
    
SUBOSVK
SimonB
M1ch4l
Memnon
crux2005
M1ch4l
Memnon
MichiGen
crux2005
lkuzman
crux2005
SUBOSVK