DirectX Ray Tracing : Microsoft prépare un Ray Tracing plus rapide et plus intelligent
la géométrie en cluster et les TLAS partitionnés
Microsoft a publié une nouvelle version des spécifications de la technologie DirectX Raytracing. Elle apporte des précisions sur l’évolution de son pipeline Ray Tracing.
Après avoir défini les bases du Ray Tracing dans un premier document, cette nouvelle itération s’intéresse davantage à l’optimisation des performances et de la “scalabilité”. Pour y parvenir, le travail est porté sur la géométrie en cluster, les TLAS partitionnés et les opérations de structures d’accélération indirectes.
La géométrie en cluster : traiter des groupes plutôt que des triangles
Dans les moteurs 3D actuels, tout repose sur les triangles. Chaque objet est décomposé en milliers, voire millions de triangles que le GPU doit traiter individuellement. Avec la géométrie en cluster, DXR change d’approche. Au lieu de manipuler chaque triangle séparément, le système regroupe les triangles proches en clusters, traités comme des blocs uniques. La démarche réduire le nombre d’appels GPU, simplifie la gestion des objets complexes et optimisr la mémoire et la bande passante.
Concrètement en jeu cela permet à des éléments comme le feuillage, les foules et les objets répétitifs d’étre générés qu’une seule fois puis déplacés ou instanciés facilement, sans duplication coûteuse.
TLAS partitionné : Du Ray Tracing plus intelligent

Nous retrouvons aussi le top-level acceleration structures (TLAS) partitionné. Dans un moteur DXR classique, le GPU doit souvent recalculer toute la scène pour le Ray Tracing, ce qui est extrêmement coûteux, surtout dans les jeux en monde ouvert. Avec le TLAS partitionné, la scène est découpée en plusieurs blocs indépendants. Le GPU peut alors traiter que les zones nécessaires tandis que les mises à jour sont localisées. Tout ceci devrait permetre d’améliorer de manière importante les performances.

Enfin la troisième avancée concerne les opérations indirectes des structures d’accélération. Traditionnellement, de nombreuses opérations dans DirectX 12 passent par le processeur avant d’être exécutées par le GPU (processeur de la carte graphique). Ce schéma crée un potentiel goulot d’étranglement car le GPU peut se retrouver à attendre que le processeur termine ses tâches. Avec cette nouvelle approche, plusieurs opérations critiques sont directement exécutées par le GPU. Cela peut concerner par exemple la construction des structures, le déplacement et l’instanciation ou encore la gestion des modèles.
En usage il est possible de réduire la latence, d’augmenter le parallélisme et de manière plus globale de booster les performances




[ Ce schéma crée un potentiel goulot d’étranglement ]
Heureusement que Satya Nadella veille au grain pour cette pratique
haram… 😀