mercredi, 21 février 2024

Très cher : Premières réactions sur les RTX 4090, RTX 4080, DLSS 3 et plus de Nvidia

L’énorme image : Nvidia a enfin retiré les couvertures de ses cartes graphiques de la série GeForce 40 de nouvelle génération, ce qui donne l’impression que cela fait longtemps compte tenu de toutes les fuites et rumeurs sur le en 2015 ou deux. Nous avons en fait passé beaucoup de temps à examiner la discussion de Nvidia pour donner notre avis sur les nouveaux GPU des séries RTX 4090 et RTX 4080 et pour décomposer certaines des performances compliquées de Nvidia qui masquent les détails les plus importants.

Au sommet, nous avons la GeForce RTX 4090, basée sur la nouvelle architecture Ada Lovelace développée sur une version personnalisée du nœud N4 de TSMC. Ce GPU est un peu un monstre en termes de matériel, contenant 16384 cœurs CUDA et 24 Go de mémoire GDDR6X sur un bus 384 bits, ainsi que des vitesses d’horloge accrues pour le GPU d’environ 2,52 GHz. Comme prévu, il s’agit d’une carte gourmande en énergie avec un TGP nominal de 450W. Il sera facilement disponible le 12 octobre pour 1 600 $.

Ensuite, nous avons la GeForce RTX 4080 16 Go, qui charge 9728 cœurs CUDA, une réduction substantielle du RTX 4090. Elle comprend des horloges boost jusqu’à 2,51 GHz, plus 16 Go de mémoire GDDR6X sur un bus 256 bits et un TGP de 320 W. Les prix sont fixés à 1 200 $, qui seront proposés un peu plus tard sans date définie.

Il y a aussi la GeForce RTX 4080 12 Go, qui réduit la quantité de mémoire à 12 Go GDDR6X mais de même bande passante mémoire d’une diminution à une interface utilisateur de mémoire 192 bits. Cette conception de 12 Go arbore moins de cœurs CUDA à 7680, cadencés à environ 2,61 GHz. Un TGP de 285 W et un prix de 900 $.

En plus des toutes nouvelles conceptions de cartes, Nvidia a dévoilé tout un tas de fonctionnalités associées à la nouvelle architecture Ada Lovelace, sur lesquelles nous donnerons notre avis plus tard, composé de DLSS 3, mais pour l’instant, discutons de quelques-unes des réponses clés concernant les GPU eux-mêmes.

Une grande apparente est que nous avons 2 GPU GeForce RTX 4080 avec des spécifications très différentes. Cela apparaît comme un choix mauvais et déroutant, en pensant à la pléthore d’options de nommage que Nvidia a à sa disposition avec des nombres et des suffixes comme Ti. Il n’y a aucune raison de donner à ces GPU un nom aussi comparable à moins que Nvidia ne veuille tromper les clients d’une manière ou d’une autre.

La façon dont Nvidia a discuté de la série RTX 4080 met en évidence les distinctions dans la mémoire, 16 Go contre 12 Go, ce qui donne l’impression que c’est la principale différence pour laquelle vous payez. À première vue, cela ferait apparaître le RTX 4080 12 Go comme un bien meilleur rapport qualité-prix, il coûte 300 $ de moins et offre sinon la même efficacité, n’est-ce pas ? Eh bien, ce n’est que lorsque vous regardez la fiche technique que vous découvrez que ce n’est pas du tout le cas, avec la conception de 12 Go contenant 21 % de systèmes de shader en moins et une bande passante mémoire réduite. Ce ne sont pas du tout les mêmes GPU avec les propres informations de Nvidia suggérant que le modèle 16 Go pourrait être jusqu’à 25 % plus rapide. Ce serait la plus grande différence de performances entre 2 cartes nommées en faisant cela en mémoire. Vous pouvez parier quotidiennement que les clients non enthousiastes qui ne connaissent pas grand-chose aux GPU finiront par acquérir la pire carte de 12 Go anticipant l’expérience RTX 4080 complète – quelque chose qui aurait pu être évité avec une identification appropriée.

Une théorie qui circule dans le plus grand quartier est que le RTX 4080 12 Go est en fait ce qui était / aurait dû être le RTX 4070, rebaptisé en 4080 pour atténuer le coup du taux de demande élevé (900 $ contre 500 $ pour le RTX 3070) .

Cela est possible à condition que le nombre de personnes se laisse prendre à comparer des séries à des séries à travers les générations et qu’un tel saut de taux substantiel pour la série x070 causerait beaucoup d’insatisfaction . Cette théorie est encore renforcée par le fait que le RTX 4080 12 Go semble offrir des performances similaires à celles du RTX 3090, et Nvidia a fréquemment fourni des performances de haut niveau de la génération précédente dans la carte à 70 niveaux de la prochaine génération.

Pour être sincère, ce qui compte le plus, c’est le rapport prix / performances. Si le RTX 4070 était massivement plus rapide que le RTX 3070 et coûtait également beaucoup plus cher, il pourrait toujours être judicieux que le gain d’efficacité dépasse l’augmentation des prix. Il faudrait un remaniement et des choix d’entrée de gamme supplémentaires, et les consommateurs devraient s’habituer au tout nouveau système d’identification, mais finalement parce que le nom n’aurait pas vraiment d’importance – c’est le matériel et le coût qui compte, par rapport aux concurrents et aux modèles précédents.

Mais lorsque vous avez deux cartes qui apparaîtront dans les listes de produits comme presque le même GPU, toutes deux avec l’identification RTX 4080, je ne pense pas qu’il soit raisonnable d’avoir une incohérence substantielle des performances.

Parlons maintenant des performances supposées de ces GPU. Nvidia a tendance à offrir les variétés de performances les plus obscurcies des 3 grands fournisseurs de matériel, et le moins de tests d’efficacité lorsqu’il s’agit de produits flambant neufs. La vérification est généralement effectuée en comparant des cartes flambant neuves à des correspondances étranges de la génération précédente, ou avec des fonctions exclusives sur les nouvelles cartes qui ont permis (qui ne se trouvent que dans une variété extrêmement limitée de jeux) d’améliorer encore la distinction d’efficacité apparente . C’est certainement le cas avec ces tableaux de performances qui ont des trucs comme DLSS 3 rendu possible pour … plus à ce sujet plus tard.

Lorsque je regarde l’exigence de 3  » Pour les jeux fournis par Nvidia, le RTX 4090 semble environ 60 à 70 % plus rapide que le RTX 3090 Ti. Cela peut être porté à 2x ou plus lorsque des fonctionnalités Ada supplémentaires sont prises en charge dans le jeu vidéo, mais je m’attendrais à ce que le gain de performances dans de nombreux titres soit comparable à ces 3 jeux vidéo. C’est un peu plus bas que le matériel ne le suggère, car le RTX 4090 a 52% de cœurs de shader en plus et jusqu’à 34% de fréquence de boost en plus, néanmoins le TGP de 450 W peut limiter cela dans une certaine mesure car c’est exactement la même chose que le 3090 Ti.

Il s’agit d’une excellente amélioration de l’efficacité d’une génération à l’autre pour le modèle phare, l’un des gains de performances les plus importants que nous ayons vus. Par exemple, avec la mise à niveau de Turing à Ampere, la conception phare nous a offert environ 50 % d’efficacité en plus. Si certains titres finissent par offrir deux fois plus d’efficacité, ce serait vraiment impressionnant.

En ce qui concerne la valeur, il y a 2 façons de l’examiner… Le RTX 4090 est bien meilleur rapport qualité-prix que le prix de lancement du RTX 3090 Ti de 2 000 $, il est moins cher et beaucoup plus rapide. Il se compare également favorablement au PDSF du RTX 3090, offrant une grande amélioration des performances pour seulement 100 $ de plus. Cependant, le PDSF n’est plus approprié sur le marché actuel. Sur les tarifs existants (réduits en prévision de ce lancement et du crash crypto), le RTX 3090 Ti est disponible pour 1030 $, tandis que le RTX 3090 le moins cher est de 960 $. Cela donnerait au RTX 4090 un prix comparable à l’efficacité du RTX 3090 en tenant compte de sa forte augmentation de débit, ce qui n’est pas trop mal étant donné que vous payez généralement une prime pour des performances de haut niveau.

Pour le GeForce RTX 4080 16 Go, nous semblons obtenir environ 25% de performances en plus que le RTX 3090 Ti dans les jeux de base – encore une fois plutôt une bonne affaire par rapport au PDSF de la série 30. Le 4080 16 Go est plus abordable que le 3090 et similaire en débit au RTX 3080 Ti. Nvidia revendique des performances 2 à 4 fois plus rapides que le 3080 Ti, mais cela semble être basé sur les immunités diplomatiques plutôt que sur l’efficacité générale.

Sur la base du marché actuel, ce serait un prix similaire à l’efficacité par rapport au RTX 3090, et même le RTX 3080 Ti, qui est actuellement disponible pour 800 $. Pas une grosse offre de développement là-bas, et ce serait aux fonctionnalités de le faire passer.

Situation similaire avec le RTX 4080 12 Go. Nvidia affiche des performances légèrement inférieures au RTX 3090 Ti, ou comparables au RTX 3090, à 900 $. Cette carte s’intègre essentiellement dans la structure existante des prix aux performances de la gamme de la série 30 de Nvidia, le RTX 3080 10 Go a à voir avec 740 $ de nos jours, donc toujours au-dessus de son PDSF de 700 $ et étant donné qu’il n’est qu’un peu plus lent que le RTX 3090 ce tout nouveau RTX La 4080 12 Go pourrait en fait finir par offrir moins d’efficacité par dollar que la série 3080 d’Ampère au-delà des titres boostés par Ada Lovelace.

Mes premières idées sont que les cartes sont extrêmement coûteuses, bien que ce ne soit pas trop surprenant. Nvidia a découvert que les gens paieraient des sommes gonflées dans le haut de gamme, de plus nous sommes toujours dans la phase de reprise d’une flambée des prix et il y a des pressions inflationnistes dans le monde entier. Cependant, il est difficile de passer un appel définitif sans voir les références, et je ne fais que partir de ce que Nvidia a révélé lors de leur discussion.

Les préoccupations concernant la dénomination et les prix ont éclipsé certaines les progrès techniques que Nvidia apporte à cette génération, du moins pour le moment. En particulier, DLSS 3 apparaît comme une innovation très intéressante et cool, prenant encore plus de DLSS pour fournir une génération de trame améliorée par l’IA, similaire aux technologies d’interpolation de trame que nous avons vues dans les téléviseurs et autres matériels depuis un certain temps, mais développées spécifiquement pour jeux et matériel GPU. Le concept est que DLSS 3 utiliserait les informations des images actuelles et futures pour générer des parties importantes d’images (jusqu’à 7/8 des pixels affichés selon Nvidia). Ce processus utilise le flux optique et l’accélérateur de circulation optique présent sur le matériel GPU Nvidia.

Alors que DLSS 3 est disponible en octobre et sera proposé dans plus de 35 jeux vidéo à un moment donné , il sera exclusif au matériel de la série RTX 40. L’idée est que cela nécessite l’accélérateur de circulation optique boosté dans l’architecture Ada Lovelace. Bien que cet accélérateur soit proposé dans les générations précédentes, il n’est évidemment pas assez bon ou rapide pour cette technologie, il est donc limité à la toute nouvelle génération de cartes. Avec une sorte de surcharge de performances à exécuter, il est également incertain de l’accélération possible au-dessus d’une fréquence d’images particulière, car la plupart des exemples révélés par Nvidia exécutaient des jeux à une fréquence d’images de base faible.

Nvidia a en fait montré démonstrations de la technologie, mais il faudra une analyse complète de la qualité visuelle pour voir comment elle apparaît dans la vie réelle. Je pense certainement qu’il est possible d’utiliser l’interpolation de l’IA dans cette méthode pour les jeux, mais avec autant de pixels reconstruits, cela pourrait avoir des implications sur la qualité visuelle – comme ce que nous voyons en utilisant le mode DLSS Ultra Efficiency, qui semble généralement mauvais en mouvement. Heureusement, DLSS 2 est par ailleurs plutôt bon, donc avec des recherches et des améliorations supplémentaires, j’ai vraiment hâte de voir à quoi cela ressemble en action.

Un autre avantage clé d’Ada Lovelace est améliorations apportées aux noyaux de traçage de rayons. Il s’agit d’une offre énorme alors que nous nous dirigeons davantage vers l’ère du lancer de rayons et que les exigences de performances augmentent considérablement. Les cœurs de traçage de rayons de troisième génération de Nvidia sont plus efficaces et prennent en charge de nouvelles capacités d’accélération matérielle telles que les moteurs de micro-maillage et les moteurs de micro-carte d’opacité. En particulier, Nvidia déclare que ces cœurs RT peuvent créer des BVH de traçage de rayons 10 fois plus rapidement en utilisant 20 fois moins de VRAM grâce à l’utilisation de micro-maillages déplacés, alors qu’il y a également deux fois le débit d’intersection rayon-triangle

Au total, Nvidia déclare 191 RT-TFLOPS de performances sur le RTX 4090, contre 78 pour le RTX 3090 Ti, ce qui représente une amélioration de 2,4 x (Nvidia déclare également jusqu’à 2,8 x, ce qui peut faire référence à un autre couplage GPU). Dans tous les cas, cela dépasserait l’amélioration de l’efficacité de la rastérisation brute : si le RTX 4090 est d’environ 1,7 x amélioré par rapport au RTX 3090 Ti, mais que l’efficacité du lancer de rayons augmente de 2,4 x, cela réduirait l’impact sur les performances du lancer de rayons dans les jeux vidéo ou permettent d’utiliser davantage d’impacts de lancer de rayons. Il est important que les cartes de nouvelle génération comme celle-ci aient une efficacité de lancer de rayons supérieure à la rastérisation afin de réduire les dépenses liées à l’utilisation du lancer de rayons.

Ada se compose également de cœurs de tenseur de 4e génération, bien qu’en dehors de DLSS, il n’y ait pas Il n’y a pas de nombreux cas d’utilisation spécifiques au jeu pour ces accélérateurs matériels. Il existe un tout nouveau moteur de point de dérive 8 bits qui offre plus d’efficacité, mais cela sera surtout bénéfique pour les utilisateurs de stations de travail.

Un autre ajout essentiel sont les doubles encodeurs AV1 du tout nouveau moteur NVENC de huitième génération. Le décodage AV1 était pris en charge dans l’architecture précédente de Nvidia, mais l’encodage AV1 n’était pas possible jusqu’à présent. Il est clair maintenant qu’AV1 sera le principal adepte de H. 264 pour la lecture et le streaming vidéo, donc avoir des fonctionnalités comme l’encodage AV1 est crucial pour l’avenir. OBS prendra en charge l’encodage AV1 dans une mise à jour d’octobre et Discord l’intégrera également plus tard cette année.

Nous avons une réorganisation de l’exécution des shaders, qui est une amélioration particulière de l’architecture Ada qui restructure charges de travail de shader inefficaces en un flux efficace censé améliorer les performances jusqu’à 25 % dans les jeux vidéo. Cette fonctionnalité associée à DLSS 3 est la raison pour laquelle Nvidia a en fait révélé certains titres offrant des améliorations d’efficacité massives sur les GPU de la série RTX 40 par rapport à Ampere, tandis que d’autres titres n’en bénéficieront pas autant. Nous avons pu voir une vaste gamme de chiffres de performances lorsque nous avons comparé ces cartes.

En ce qui concerne les conceptions Founders Edition, les RTX 4090 et RTX 4080 16 Go semblent obtenir des cartes FE, avec un style comparable à la série RTX 30. Ces GPU utilisent des ports PCIe 5.0 à 16 broches pour l’alimentation, que l’on trouve sur les produits d’alimentation ATX 3.0. Néanmoins, Nvidia emballera un adaptateur dans la boîte à utiliser avec les blocs d’alimentation existants dotés de connecteurs à 8 broches.

Remarquablement, ces cartes ne présentent aucune amélioration pour afficher la connexion de sortie ou le bus PCIe. Il semble que PCIe 4.0 soit toujours utilisé, alors que nous obtenons HDMI 2.1 et DisplayPort 1.4 – pas de mise à niveau pour DisplayPort 2.0. Ni PCIe 5.0 ni DP 2.0 ne seront trop essentiels cette génération, bien qu’il soit possible que d’autres fournisseurs de GPU utilisent ces fonctionnalités avant que Nvidia ne le fasse.

Dans l’ensemble, j’ai des sensations mitigées sur le RTX de Nvidia 40 révéler. Le matériel lui-même a l’air excellent avec une augmentation substantielle des performances, l’une des plus importantes que nous ayons jamais vues en comparant les conceptions phares. Il y a également quelques fonctionnalités intéressantes qu’il sera intéressant de découvrir, telles que DLSS 3 et des améliorations des performances de lancer de rayons au-delà de ce que nous anticipons pour les jeux pixellisés de base.

Les tarifs de ces tout nouveaux GPU sont préoccupants et il ne semble pas y avoir d’action substantielle en avant dans le rapport prix / performances par rapport au marché existant. Il y a encore beaucoup de GPU plus anciens à vendre à partir de la série RTX 30, en plus de nombreux GPU utilisés qui arriveront bientôt sur le marché. Cela pourrait exercer une pression supplémentaire sur les coûts de la série RTX 40 dès le départ.

En fin de compte, tout dépendra de la façon dont ces cartes se comparent, et j’espère que nous ne verrons plus de prix gonflés. Il est prévu que ces conceptions se vendent pratiquement instantanément, mais la période cruciale est généralement d’environ un mois après le lancement, lorsque nous prévoyons que Nvidia aura des cartes facilement disponibles au PDSF – sinon notre compteur BS sera entièrement activé.

En attendant, je suggère fortement d’attendre et de voir comment AMD réagit avec ses produits RDNA 3, qui seront dévoilés le 3 novembre et, espérons-le, lancés avant la fin de l’année. Nous anticipons des concurrents puissants et avec un si bref écart entre les lancements de Nvidia et d’AMD, cela vaut peut-être la peine d’attendre de voir où en sont les deux fabricants de GPU pour cette génération.

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici