L’architecture graphique RDNA 4
AMD précise que RDNA 4 est le fruit d’un long parcours multigénérationnel avec RDNA en se concentrant sur plusieurs objectifs dont celui de répondre aux tendances d’aujourd’hui tout en préparant l’avenir afin de pouvoir s’immerger dans les titres des prochaines années. Le focus avec ces Radeon RX 9070 series est de s’attaquer au marché des cartes à des prix publics conseillés sous la barre des 600 $.
RDNA 4 promet d’améliorer les performances dans de nombreux domaines clés. Pour y parvenir, les unités de calculs ( CUs alias Compute Units) profitent d’optimisations et des accélérateurs Ray Tracing de 3ème génération accompagnent des accélérateurs IA de 2ème génération. Le GPU embarque également un moteur multimédia amélioré et les fréquences boost se rapprochent des 3 GHz.
Compute Units
RDNA 4 promet d’améliorer les charges de travail générales (raster) et de calcul. Même si nous assistons progressivement à l’utilisation de nouvelles techniques de rendu, ces charges de travail fondamentales restent toujours au cœur de la plupart des expériences de rendu en temps réel.
Le travail apporté à l’unité de calcul RDNA 4 améliore le sous-système de mémoire et les unités scalaires tout en permettant une allocation dynamique de registres, le tout avec des fréquences beaucoup plus élevées par rapport à RDNA 3. Collectivement, tout ceci booste les performances par CU, permettant aux Radeon RX 9070 Series d’offrir des bilans comparables aux Radeon RX 7900 malgré un nombre total de CU inférieur.
Accélérateurs Ray Tracing de troisième génération
C’est probablement la partie ayant le plus évoluée avec cette génération afin de combler un retard évident face aux solutions Nvidia. Ces accélérateurs RT de 3e génération promettent d’offrir 2 fois les capacités de Ray Tracing de RDNA 3. En Ray Tracing, un des éléments importants associé à de fortes charges de travail est la construction de la structure de données BVH, contraction de Bounding Volume Hierarchy.
Son rôle est d’améliorer les performances du rendu en réduisant le nombre de tests de collision nécessaires entre les rayons et les objets de la scène. Lorsqu’une carte graphique exécute un algorithme de Ray Tracing, elle doit déterminer quels objets sont touchés par un rayon lumineux. Vérifier chaque objet individuellement serait extrêmement coûteux en calcul et donc en performance, surtout dans une scène contenant des millions de triangles. Le BVH organise alors ces objets sous forme d’une hiérarchie de boîtes englobantes (Bounding Volumes) qui permettent d’éliminer rapidement de grandes portions de la scène sans avoir à tester chaque triangle.
Lorsqu’un rayon est lancé dans la scène, il traverse cet arbre BVH de manière hiérarchique. Si un rayon ne touche pas une boîte englobante, alors tous les objets à l’intérieur de cette boîte sont ignorés, ce qui évite des calculs inutiles. En revanche, si un rayon traverse une boîte, l’algorithme descend dans la hiérarchie pour tester les boîtes plus petites jusqu’à atteindre des objets concrets.
Les cartes graphiques d’AMD ayant des Ray Accelerators disposent d’unités dédiées à l’accélération du BVH. Ces unités permettent de construire et de parcourir efficacement la hiérarchie pour améliorer le rendu en temps réel.
Pour revenir à RDNA 4, AMD introduit une approche particulière de BVH appelée “Oriented Bounding Boxes”. Elle œuvre à réduire la taille et la complexité des données BVH. Ces changements améliorent le traitement du Ray Tracing tout en réduisant les besoins en VRAM.
Un deuxième moteur d’intersection de rayon est introduit au cœur des accélérateurs RT ce qui double les performances pour les tests Ray/Box et Ray/Triangle. En parallèle, un bloc de transformation de rayons dédié est implanté afin d’augmenter les performances lorsque les rayons sont traversés dans les niveaux inférieurs de l’arbre BVH.
Accelerateurs IA de 2ème génération
Les accélérateurs d’IA de 2ème génération de RDNA 4 promettent de traiter plus efficacement les modèles d’IA avancés grâce à une combinaison de différents changements, améliorations, ajouts et optimisations. Par exemple, AMD ajoute plus de pipelines mathématiques pour les calculs d’IA, accroit les capacités de l’accélérateur pour prendre en charge de nouveaux types de données tels que FP8 et techniques d’optimisation de l’inférence telles que le Strutured sparsity. Cette technique aide les GPU à calculer plus vite en supprimant de manière intelligente certaines valeurs inutiles dans les réseaux de neurones, tout en gardant des performances de précision acceptables.
Elle diminue le nombre de calculs sachant qu’une partie des multiplications sont supprimées ce qui permet aux opérations de s’exécuter plus rapidement tout en soulageant les ressources mémoire. Stocker des matrices plus légères permet d’économiser de la bande passante mémoire et de manière plus globale de garantir de meilleures performances d’inférence. Par exemple dans les tâches comme la reconnaissance d’images ou le traitement du langage, cela permet de traiter plus de requêtes par seconde.
Moteur multimédia
Concernant le moteur média, les améliorations se concentrent sur la qualité de l’encodage lors de l’enregistrement et de la diffusion en continu à travers tous les principaux codecs tels que les H.264, HEVC et AV1. Ainsi RDNA 4 prend en charge:
- Décodage > VP9 – 4K210 / 8K48 / (4:2:0 8/10b), H.264 – 4K330 / (4:2:0 8b), H.265 – 4K210 / 8K48 / (4:2:0 8/10b), AV1 – 4K240 / 8K60 / (4:2:0 8/10/12b).
- Décodage > H.264 – 4K180 / (4 :2 :0 8b), H.265 – 4K180 / 8K48 / (4:2:0 8/10b), AV1 – 4K240 / 8K60 / (4:2:0 8/10b).
FSR 4
Le FidelityFX Super Resolution 4 (FSR 4) est une technologie de mise à l’échelle basée sur l’apprentissage automatique (ML), conçue pour transformer des images de basse définition en sortie haute définition. Contrairement aux versions précédentes, qui reposaient principalement sur des algorithmes classiques, le FSR 4 utilise un modèle d’IA avancée pour améliorer la qualité de l’image et optimiser les performances.
Le processus commence avec des entrées basse résolution et des données de scène critiques, telles que la profondeur, les couleurs et les vecteurs de mouvement. Ces informations permettent à l’algorithme de mieux comprendre le positionnement des objets, l’éclairage et les mouvements dans la scène. Avec ces données, l’algorithme de mise à l’échelle FSR 4 applique un traitement IA accéléré par les accélérateurs d’IA de RDNA 4. Cette approche permet à FSR 4 de fonctionner en temps réel même avec des taux de rafraîchissement élevés, ce qui est essentiel pour les jeux compétitifs et les expériences immersives.
Il est alors promis une mise à l’échelle en haute définition, offrant des détails plus précis, une meilleure netteté et une réduction des artefacts visuels. Le FSR 4 peut être couplé à des technologies de génération d’images avancée qui insèrent des images supplémentaires pour fluidifier l’expérience tout en tentant de garantir une qualité visuelle élevée.
Comme vous l’avez deviné, le FSR 4 nécessite un GPU RDNA 4 doté d’accélérateurs IA dédiés, ce qui limite son accessibilité aux cartes Radeon RX 9000 et aux jeux prenant en charge le FSR 3.1 ou plus récent. Malgré cette contrainte, cette avancée rapproche AMD des solutions comme le DLSS de NVIDIA, qui exploitent également l’IA pour améliorer le rendu en temps réel.
Super test ! AMD tape là ou ça fait mal pour Nvidia l’argent. 3 à 4% de perf en moins en Rasterisation et mois de 10% en Ray Tracing pour un prix abaisser de 18%. La conclusion est évidente, bye bye Nvidia