On continue avec la 7é génération sous les GeForce 1000 et les Radeon RX-400.
Nvidia commence le bal avec les GTX 1080 et GTX 1070 animées par la GP104. L’architecture se nomme PASCAL. Gravée en 16nmFF, elle abrite 7.2 milliards de transistors sous une surface de 314 mm². Son architecture est basée sur MAXWELL, peu de choses ont changés. On a toujours affaire à des SM de 128 shaders, hormis qu’on en a 20 (au lieu de 16 des GM204), ce qui nous fait 2560 shaders et 160 TMU.
Le nombre de ROP reste à 64 unités, reliées à 4 contrôleurs VRAM de 64-bits, et un cache L2 de 2048 Ko.
Donc une question se pose: En quoi PASCAL est différent de MAXWELL? Bon on peut déjà dire que la gravure améliore beaucoup les choses: baisse de la consommation, plus d’unités shaders…mais sans plus. PASCAL est en soit une sorte de MAXWELL-REFRESH, mise à jour au niveau de la gravure. Nvidia semble se concentrer sur le ratio des fréquences. En effet, les puces PASCAL ont une fréquences très hautes: Plus de 1700 Mhz, et pouvant s’overclocker facilement à 2000 Mhz. Autant dire que PASCAL est de la force brute par la fréquence plutôt que par l’architecture en elle-même. On peut toutefois noter l’apparition du FP16 comme chez AMD (à partir des GCN3), mais à un débit très bas: 1/64 du FP32.
Peu après, on a la GP102 qui est tout simplement la GM200 boostée aux hormones: 30 SM (au lieu de 24) et fréquences à plus de 1500 Mhz au lieu de 1070 Mhz.
Les GeForce 1000 gèrent la nouvelle mémoire GDDR5X, plus rapide que la GDDR5 et à moindre coût face au HBM. Elle est cependant employée que pour les modèles haut de gamme.
La seule nouveauté qu’on peut constater est la GP100, disponible que chez les pros. Animée par une architecture bien différente des autres, car se basant sur des SM de 64 unités, et disposant de mémoire cache plus volumineux, comme le cache L2 à 4096 Ko. La GP100 dispose du FP16 à 2x la vitesse du FP32, et le FP64 à la moitié du FP32. N’oublions pas que la GP100 utilise la nouvelle mémoire HBM2 en 4096-bits pour presque 800 Go/s .
Du coté d’AMD, on a pour le moment que la gamme moyenne incarnée par les POLARIS, ou plutôt les AMD GCN4. La Radeon RX 480 utilise la POLARIS 10 plutôt nommée la ELLESMERE. Gravée en 14nmFF, elle abrite 5.7 milliards de transistors sous une surface de 232 mm². Son architecture se base beaucoup sur les acquis des GCN3, et aussi, peu de choses ont changés. AMD se concentrant sur la rapport perf/watt, ce qui est en soit réussi avec seulement 150 Watts de TDP pour des perfs identiques aux R9 290X qui pointaient à 290 Watts.
ELLESMERE dispose de 36 CU de 64 unités pour 2304 shaders au total et 144 TMU. Le nombre de ROP reste à 32 unités, mais elles ont été bien améliorés, à en juger les perfs 3D face aux HAWAII qui avaient 64 de ces unités.
Les modifications notables sont au niveau de la VRAM et du cache L2. Au lieu de contrôleurs de 64-bits, on a affaire à des 32-bits, au nombre de 8 pour faire 256-bits. Le cache L2 a été augmenté à 2048 Ko, bien au dessus des 512 Ko des AMD TONGA.
On a toujours les calculs FP16 à vitesse égale au FP32, et les unités asynchrones HWS modifiables pour les pros.
Les modèles concernés sont les Radeon RX 480 et 470. La petite POLARIS 11 (ou BAFFIN) anime l’unique Radeon RX 460.
Elles seront mises à jour avec les RX 580/570/560, avec une petite nouvelle, la RX 550 animée par la POLARIS 12 (ou LEXO).
0_1492096544502_GeForce 1000.jpg
0_1492096550787_Radeon R400.jpg
0_1492096556951_INT-FP8.jpg
A la prochaine 🙂