Inside : la GTX 960 (GM206)

2
4770

Voici la première édition d’un nouveau type de dossiers : les Inside. Ces mini-dossier sont là pour les passionnés de GPU que veulent analyser en profondeur les GPU des nouvelles cartes qui sortent.

Attention, certains passages peuvent être assez velus, et par conséquent il faut quelques bases sur la compréhension des GPU. Et ca tombe bien, puisque nous avons également fait deux Quicky qui vous permettrons d’avoir les notions nécessaires à la compréhension des Inside.

Voici la partie 1 : « Quelles sont les unités de base d’un GPU ?« , et la partie 2 : « Comment est organisé un GPU ?« 

Et ici, nous parlerons de la grosse sortie de la semaine : la GTX 960, que nous testons à cette adresse.

Maxwell GTX 960

GPU :

Attardons nous sur ce nouveau GPU, le GM206. Comparé au GM-204 des GTX 970/980, NVidia a fait quelques changements, notamment au sein de son architecture SMM. Pour rappel, un SMM est un bloc d’unité d’une architecture Maxwell (chez Kepler, on les appelle les SMX qui sont structurés différemment).

Nvidia a coupé littéralement en deux le Core du GM204 (équipant la GTX 970 et 980). En effet, de 16 SMM pour la GTX 980 et de 13 pour la GTX 970, on passe ici à 8. A raison de 128 Cuda Core et 8 TMU par SMM, on arrive ici à un total de 1024 Cuda Core et 64 TMU, soit deux fois moins que la GTX 980. C’est le « principe du 50 % », vous comprendrez par la suite.

Pour voir mieux un SMM ainsi que ses 128 Cuda Core (« core ») et ses 8 TMU (« Tex »), cliquez sur l’image ci-dessous.

GeForce_GTX_960_SM_Diagram_FINAL

Le GM206 garde la même structure que le GM204. De ce fait, 4 SMM se partagent un Raster Engine. Et comme on a 8 SMM, cela fait deux super-blocs (les GPC, pour Graphic Processing Cluster) ayant chacun un Raster Engine. Comme vous le savez, le nombre de GPC influe énormément sur la capacité de la carte à créer des polygones (ici des triangles). En l’occurrence, le GM206 peut donc calculer 2 triangles par cycles (car 2 unités de Rasterisation), ce qui amène à 2,24 GTriangles/s (pour une fréquence de 1120 MHz). C’est bien moins que les 2.58 GTriangle/s atteint par la GTX 660 grâce à ses 2.5 Triangles/cycle. Pour ces notions là, n’oubliez pas de lire ce Quicky.

En résumé, la GTX 960 (GM206) est, comme on le disait, 50 % d’une GTX 980 (GM204) sur tous les points que nous avons évoqué : le fameux « principe du 50 % ». Pour faire l’analogie avec Kepler, la GTX 660 (GK106) était 62.5 % d’une GTX 680 (GK104). Ainsi, Nvidia a bien plus sacrifié sur ce GM206 qu’il ne l’avait fait pour le GK106 de la GTX 660. Dommage.

Regardez sur l’image ci-dessous le GPU au complet, composé de ses 8 SMM. Vous pouvez voir également les 32 ROPs en ligne (juste au dessus du L2 cache)

GeForce_GTX_960_Block_Diagram_FINAL

Le côté « moitié de GTX 980 est alors frappant, quand on regarde effectivement le GPU de la GTX 980 à côté :

GPU GM204 GTX 980

La moitié basse de la GTX 980 est alors amputée.

Parlons maintenant de la cache, également importante pour une carte graphique :  chaque SMM du GM206 se voit dédier 96KB de mémoire partagée, et 48 KB de mémoire cache L1/Texture (2 paires de 24KB). Il y a toujours les 512 Ko de mémoire L2 par contrôleur mémoire, soit un Total de 1 Mo (contre 2 Mo pour ses grandes soeurs)

A titre de comparaison, la génération Kepler n’avait accès qu’à 64KB de mémoire par SMX, partagé avec le cache L1, ce qui faisait par exemple 320 Ko pour la GTX 660 et 512 Ko pour la GTX 680. Donc Maxwell, de manière générale, propose une évolution très intéressante sur ce point là, ce qui lui permet de proposer de bonnes performances avec un nombre de Cuda Cores plus réduit. C’est un point sur lequel Nvidia insistait : même si un SMM de Maxwell est bien moins conséquent qu’un SMX Kepler, les performances ne sont pas si éloignées que ca.

Ainsi, chaque CUDA Core du GM206 est capable, selon Nvidia, de délivrer 1.4x plus de puissance brute que le GK106, et aurait un rapport performance/consommation 2x plus intéressant d’après Nvidia. Ce que bien sûr, nous tâcherons de vérifier.

Système mémoire :

Au niveau de l’interface mémoire, Nvidia a continué avec son « principe du 50 % » en proposant 32 ROP, contre 64 pour la GTX 980 et surtout un bus de 128 bits contre 256 pour sa grande sœur. Si vous avez du mal, vous pouvez lire ce Quicky expliquant ce qu’est la bande passante d’une carte graphique.

Sur l’interface mémoire, le GK106 était « 75 % d’un GK104 », avec par exemple 24 ROP pour la GTX 660 et 32 pour la GTX 680, et un bus de 192 bits, contre 256 bits. Là aussi Nvidia a coupé son GPU de manière bien plus franche sur cette génération, ce qui est décevant.

Mais, une carte milieu de gamme comme cette GTX 960 peut-elle se contenter d’un bus de 128 bits ? Nvidia assure que oui, car Maxwell inaugure une nouvelle technologie. En effet ils ont intégré une nouvelle méthode de compression en temps réel des données lors des accès, ce qui permet de moins saturer le bus mémoire, et donc a priori de se contenter d’une interface mémoire plus faible.

Ainsi, le GM206 diminue de 25% la quantité de mémoire utilisée pour le rendu d’une image, toujours en comparaison avec l’ancienne génération Kepler. Concrètement, le GM206 serait capable d’avoir un équivalent d’une bande passante effective 33% supérieure (donc de 148.8 Go/s), tout en ayant réellement qu’une bande passante réelle de 112 Go/s. Pour illustrer cela, Nvidia a introduit une nouvelle ambiguité au niveau de sa mémoire, en parlant de mémoire à 9.3 GHz (alors qu’elle fait en réalité 7 GHz). L’écart de 2.3 GHz est issu des 33% d’efficacité supplémentaires sur la bande passante mémoire.

Nous trouvons que cette information n’est pas très pertinente (la compression atteint-elle toujours 25 % ? Nous en doutons). Malgré tout, elle met en avant le fait que les 112 Go/s réels de la GTX 960 sont malgré tout légèrement plus efficaces que les 144.2 Go/s de la GTX 660. Si ces informations sont exactes, cela ne change pas le fait que la bande passante a besoin d’évoluer autant que la puissance de calcul. Or, ici dans le meilleur des cas, on est à peu près au même niveau que la GTX 660 ! Décevant donc.

Voilà le GPU de la GTX 660 à titre de comparaison :

GK106 GTX 660

Pour en revenir aux ROP, le grand nombre présent sur les GM204 (64 ROP !) permettait aux GTX 980 et 970 de combler en partie leur déficit au niveau de l’interface mémoire. mais comme la GTX 960 coupe également le nombre de ROP en deux (« principe du 50% »), cet avantage devient bien moins vrai pour cette carte.

Au final, on voit que Nvidia a également énormément bridé la GTX 960 sur l’interface mémoire par rapport à sa grande soeur la GTX 980. Les compromis étaient encore une fois bien moins importants à l’époque de Kepler et du GK104.

Les points faibles inhérents au GM204 (manque de bande passante mémoire malgré l’algorithme de compression) le restent ici aussi.

Et la quantité de mémoire ? La aussi, la quantité de mémoire est celle de la GTX 980 divisée par deux, donc 2 Go. Mais 2 Go pour une carte milieu de gamme en 2015 commence à faire un peu juste quand on voit des jeux qui peuvent utiliser jusqu’à 4 Go en 1080p ! Dommage qu’Nvidia n’ait pas mis plus de mémoire. Mais nous le comprenons, car avec un tel bus, la seule solution aurait été le passage à 4 Go, ce qui peut paraître disproportionné par rapport au GPU, sans parler du surcoût tarifaire.

Dans tous les cas, les faits sont là, pas un Mo de mémoire en plus par rapport à la GTX 660, alors que nous avons maintenant des jeux bien plus gourmand en mémoire graphique qu’il y a deux ans et demi, au moment où la GTX 660 sortait.

En fait, en y regardant de plus près, on se rend compte que cette GTX 960 est l’équivalent Maxwell non pas de la GTX 660, mais de la GTX 650 Ti ! Eh oui, comparé à la GTX 680, la GTX 650 Ti avait un bus deux fois plus petit (128 bits), deux fois moins de SMX (4 contre 8), deux fois moins de ROP (16 contre 32) et deux fois moins de RAM (1 Go contre 2 Go). En d’autres termes, la GTX 650 Ti était « 50 % d’une GTX 680 » : la règle des 50 % que l’on retrouve sur notre GTX 960.

Regardez le GPU de la GTX 650 Ti pour vous en convaincre. En effet, le GPC tout à droite est désactivé, ainsi que le troisième bloc de ROP (petits blocs bleu en bas) portant leur nombre à 16, ainsi que le troisième contrôleur mémoire, faisant passer le bus à 128 bits.

GK106 GTX 650 Ti

Oserons-nous dire que la GTX 960 aurait du s’appeler GTX 950 Ti, et être vendue le même prix que la GTX 650 Ti à sa sortie ? Oui pour la première question, non pour la deuxième. En effet, il faut prendre en compte une chose : c’est que à l’époque de la GTX 650 Ti, la lutte était intense contre AMD (notamment sa HD 7770 et sa HD 7850). Ici la concurrence est bien moins importante, donc Nvidia sacrifie moins sur le tarif. C’est la loi de la concurrence. Le fait qu’elle soit vendue 200 € n’est pas si choquant, bien que un tantinet cher pour un tel GPU.

Et la GTX 760 dans tout ca ?

Il faut prendre en compte un autre point : nous avons comparé la GTX 960 tout le long avec la GTX 660, voir même la GTX 650 Ti, car la GTX 960 est le pendant architectural de la GTX 650 Ti. Malgré tout, si on regarde le monde extérieur, on constate que la GTX 660 n’est plus en vente depuis un bon moment ! En effet, elle a disparu au profit de la GTX 760, la remplaçant sur sa zone tarifaire, mais équipée d’un GPU plus gros (un GK104 bridé). De ce fait, même si architecturalement parlant, la GTX 960 est comparable à la GTX 650 Ti/660, il faut en réalité la comparer à la GTX 760, car c’est elle qu’elle va remplacer dans les magasins.

C’est à ce moment là que le constat, alors pas très joyeux, devient caustique : le grand nombre de ROP (un des gros avantage de Maxwell) n’est plus, car la GTX 760 en propose autant, mais sur un bus deux fois plus large.

Voilà le GPU de la GTX 760 à titre d’appui visuel.

GTX104 GTX 760

Du côté du GPU, le constat n’est pas meilleur : la GTX 760 propose 3 GPC contre 2 pour la GTX 960, ce qui implique une génération de triangle 50 % supérieure à fréquence égale. De même pour les TMU : 96 pour la GTX 760 contre 64 pour la 960, donc une génération de Texel là aussi 50 % supérieure à fréquence égale.

Et puis, la GTX 760 est mieux équipée que la GTX 660 contre laquelle on comparait la GTX 960 plus haut. En effet elle possède 6 SMX contre 5 pour la GTX 660. Ainsi, la GTX 760 possède quasiment autant de SMX que la GTX 960 possède de SMM. Sauf qu’un SMX Kepler possède 192 Cuda Core et 16 TMU, contre 128 Cuda Core et 8 TMU pour les SMM Maxwell. Bref, la GTX 760 possède plus d’unité de calcul. Heureusement que le cache L2 reste plus important sur la GTX 960, ce qui permet de combler en partie de déficit.

Conclusion de l’architecture de la GTX 960 :

Si sur le point architectural la GTX 960 est le pendant de la GTX 660, elle remplacera la GTX 760 dans les étals. Et si le constat était correct comparé à la GTX 660, celui-ci s’avère l’être bien moins une fois comparée à la GTX 760, bien mieux armée sur le papier.

Le problème est que Nvidia a trop sévèrement bridé son GM206 : 50 % de coupé sur la partie GPU et 50 % sur la partie mémoire. Cette coupe franche paraît vraiment énorme quand on les compare à la coupe de 37.5 % sur la partie GPU et 33 % sur la partie mémoire du GK106 par rapport au GK104. En clair, en gardant un nommage équivalent à la série 600, la GTX 960 aurait du s’appeler GTX 950 Ti (avec le positionnement tarifaire en conséquence). Il y a une nuance quand même : lors de la sortie de la GTX 650 Ti, AMD dominait le terrain en dégainant sa gamme bien avant les verts, ce qui n’est pas le cas ici. Nvidia en a donc profité pour proposer des tarifs bien moins agressifs.

Au final, cette coupe est bien trop sévère à notre goût. En résulte une carte étriquée sur le plan architectural pour cette gamme de prix : seulement 64 TMU (contre 96 pour la GTX 760 par exemple), bande passante mémoire de 112/148.8 Go/s (contre 192 pour la GTX 760), aucune augmentation de la quantité de mémoire par rapport à la GTX 760 et même par rapport à la GTX 660, pourtant sortie il y a 2ans et demi…

Nous finissons par un petit tableau récapitulant les caractéristiques et performances théoriques de la GTX 960 par rapport à la GTX 660 et la GTX 760. Comme cela, vous pourrez vous même comparer.

GTX 660 vs GTX 760 vs GTX 960

Bref, elle n’arrive pas très bien armée pour supplanter son aînée, tournant il est vrai sur une architecture plus ancienne. Sera-t’elle sa digne héritière ?

Réponse dans notre test !

2
Poster un Commentaire

avatar
2 Fils de commentaires
0 Réponses de fil
0 Abonnés
 
Commentaire avec le plus de réactions
Le plus populaire des commentaires
2 Auteurs du commentaire
MaximeTrinitas Auteurs de commentaires récents
  S’abonner  
plus récent plus ancien Le plus populaire
Notifier de
xN0LiiFE
Membre
xN0LiiFE

Assez bonne carte graphique pour le prix, mais un peu plus de perfs serait bien

Trinitas
Membre

Généralement, une personne qui se procure une GTX 960 n’a pas vraiment l’intention de jouer au maximum, et son écran ne devrai pas dépasser les 1080p. De ce coté, la GM206 peut se montrer largement suffisante. La GM206 représente l’équilibre, pas de grande prétention de la part du client. Si il veut plus, la GM204 est à coté…