La famille de modèles DeepSeek-R1 marque une avancée dans le domaine des modèles de raisonnement, permettant aux développeurs d’exécuter des IA capables de résoudre des problèmes complexes en local, directement sur leur PC.
GeForce RTX 50 series, Nvidia domine ?
Nvidia annonce qu’avec la puissance de traitement des GPU RTX série 50 il est possible de profiter d’une exécution ultra-rapide de ces modèles surpassant ainsi tout ce qui existe actuellement sur le marché des PC personnels. Il est intéressant de noter que cette intervention arrive après celle d’AMD annonçant que les RTX 40 series sont accables de suivre les RX 7000 series dans ce domaine.
Voici les performance selon Nvidia

Les modèles de raisonnement représentent une nouvelle génération de LLM qui allouent dynamiquement plus de temps et de calcul à une tâche, améliorant ainsi la qualité des résultats, notamment en mathématiques, en programmation et en analyse avancée. Le principe fondamental est que tout problème peut être résolu avec une réflexion profonde, un raisonnement et du temps, tout comme les humains abordent les problèmes. En consacrant plus de temps, et donc de calcul, à un problème, le LLM peut donner de meilleurs résultats.
DeepSeek-R1, avec ses 671 milliards de paramètres, repose sur un modèle MoE (Mixture of Experts), qui divise le travail en plusieurs sous-tâches traitées par des “experts” spécialisés. Grâce à une technique de distillation, cette architecture permet la création d’une famille de modèles plus légers, allant de 1,5 à 70 milliards de paramètres, optimisés pour fonctionner en local sur des PC.
L’un des atouts de cette nouvelle approche réside dans la vitesse d’inférence, un élément clé pour des modèles de raisonnement efficaces.
Notons que Nvidia a bien pris soin de ne pas choisir le backend le plus performant pour AMD (Rocm).
Une comparaison honnête aurait été de soit utiliser le meilleur backend pour chaque carte (Cuda vs Rocm), ou Vulkan pour les deux.
MAis peut-être que le résultat n’aurait pas été dans le sens du discours de Nvidia.
Entièrement d’accord, l’honnêteté et Nvidia ça fait deux. Je suis personnellement passé du coté des Radeon et je n’ai aucun regret. Ce que j’aime c’est la liberté et non des merdes de techn comme le DLSS propriétaire et verrouillée. Ces RTX 50 series, une vaste fumisterie….