Inside : Vega 20

0
1956

Ce mini-dossier est consacré sur le GPU Vega 20. Pour  bien comprendre, il est important d’avoir au-préalable lu le Quicky expliquant l’organisation d’un GPU.

Le GPU VEGA 20:

La Vega 20 représente la derniére génération de l’architecture GCN (Plus précisément sa 5ème itération). Elle anime la nouvelle Radeon VII pour le public, et les Radeon Instinct Mi60 et Mi50 pour le secteur pro du calcul.

Premier GPU gravé en 7nm de chez TSMC, elle abrite 13.23 milliards de transistors sous un die de 331 mm², ce qui est forte diminution par rapport à la Vega 10 et ses 486 mm². Elle devient même la puce GCN haut de gamme le plus petit produit (Jusque la, c’était la Tahiti et ses 352 mm²). Pour ce qui est de son enveloppe thermique, elle est annoncée à 295 W, ce qui reste inchangé par rapport à la RX Vega 64, mais avec des performances améliorées bien évidement.

L’organisation du GPU:

L’architecture est toujours du GCN (Graphic Core Next) dans sa 5ème version (Apparue avec la Vega 10). Donc, nous avons toujours affaire à 4 shaders engine abritant chacun 16 CU (Computes Units) pour 64 CU au total. Chaque CU abrite 64 shaders et 4 TMU. Le total se porte à 4096 shaders et 256 TMU.

Chaque Shader Engine abrite également un Raster Engine et un Geometry Engine. Mais ce n’est pas tout : sur chaque Shader Engine, il y a également 4 ACE et 2 HWS.

Pour rappel, les ACE permettent d’alimenter en threads les CU. Chaque ACE peuvent effectuer 8 queues (ou threads) par cycle. Ce sont ces unités qui permettent les gros gains de performances sous Vulkan et DirectX 12, et sont à l’origine des calculs asynchrones.

Les HWS sont pareils que les ACE, hormis qu’ils ont la fonction bonus de décharger le CPU en gérant la planification des files d’attente utilisateur / pilote sur les emplacements de file d’attente disponibles. De plus, les HWS sont programmables via un micro-code.

Pour les unités ROPs, on est toujours à 64 unités, séparés en 16 groupes (4 par Shader Engine).

Les nouveautés:

En effet, Vega 20 inaugure le Infinity Fabric Link, qui est la réponse d’AMD face au NVLink de Nvidia présent chez les Turing et Volta. Elle permet la communication en peer-to-peer jusqu’à 8 cartes Radeon Instinct avec un débit 200 Go/s. Parallèlement, le PCI-e évolue à la norme 4.0. Étant en priorité des technologies professionnelles, il est normal que le IFL ne soit pas présent chez le public. Pour ce qui est du PCI-e 4.0, AMD semble le réserver pour sa génération Navi.

Pour les calculs liés au Deep Learning et Inférence, la Vega 20 s’ajoute le support du INT4 (Entiers à 4-bits de précision) qui fonctionne à un débit 8x supérieure au FP32, soit pas loin des 110 TIOPs !!!

Pour le HPC (Calculs Haute Performance), la Vega 20 se présente comme digne successeur de la puce Hawaii avec un ratio de 1:2 seulement. On atteint plus de 7 TFLOPs de puissance, ce qui la met à égalité même avec la Volta GV100 de Nvidia. En ce qui concerne la version public, AMD donne exceptionnellement une certaine puissance avec un ratio de 1:4 pour 3.36 TFLOPs. Ce ratio est très bon comparé au 1:16 des Vega gen1.

Specs techniques:

 

Récapitulatif Vega 20

Poster un Commentaire

avatar
  S’abonner  
Notifier de