AMD a publié un guide détaillé expliquant comment exploiter les modèles DeepSeek R1 Distill avec ses cartes graphiques Radeon RX 7000 series et ses processeurs Ryzen AI. Ce document confirme plusieurs spécifications clés.
En effet nous savons désormais que le nouveau Ryzen AI Max +395 “Strix Halo” sera équipé de 32 Go, 64 Go ou 128 Go de mémoire LPCAMM2, excluant toute option de 16 Go pour les fabricants d’ordinateurs portables.
Pour revenir à DeepSeek AMD explique les ordinateurs portables équipés de 64 Go ou 128 Go (Ryzen AI Max+ 395) pourront exécuter DeepSeek-R1-Distill-Llama-70B, tandis que les modèles 32 Go supporteront DeepSeek-R1-Distill-Qwen-32B. Les puces Strix Point (Ryzen AI HX370 et 365 24 et 32 Go) pourront gérer DeepSeek-R1-Distill-Qwen-14B et Llama-14B, tandis que les anciennes architectures Phoenix Point et Hawk Point (Ryzen 8040 et Ryzen 7040 32Go) seront limitées à Llama-14B.
APUs
Processeur | DeepSeek R1 Distill (Max Supported) |
Ryzen AI Max+ 395 32GB, 64 GB and 128 GB | DeepSeek-R1-Distill-Llama-70B (64GB and 128GB only), DeepSeek-R1-Distill-Qwen-32B |
Ryzen AI HX 370 and 365 24GB and 32 GB | DeepSeek-R1-Distill-Qwen-14B |
Ryzen 8040 and Ryzen 7040 32 GB | DeepSeek-R1-Distill-Llama-14B |
Cartes graphiques
Carte graphique | DeepSeek R1 Distill (Max Supported1) |
Radeon RX 7900 XTX | DeepSeek-R1-Distill-Qwen-32B |
Radeon RX 7900 XT | DeepSeek-R1-Distill-Qwen-14B |
Radeon RX 7900 GRE | DeepSeek-R1-Distill-Qwen-14B |
Radeon RX 7800 XT | DeepSeek-R1-Distill-Qwen-14B |
Radeon RX 7700 XT | DeepSeek-R1-Distill-Qwen-14B |
Radeon RX 7600 XT | DeepSeek-R1-Distill-Qwen-14B |
Radeon RX 7600 | DeepSeek-R1-Distill-Llama-8B |
Sur le segment des cartes graphiques dédiées, AMD recommande exclusivement ses Radeon RX 7000, qui intègrent des accélérateurs IA. La Radeon RX 7900 XTX est conseillée pour DeepSeek-R1-Distill-Qwen-32B, tandis que les modèles dotés de 12 à 20 Go de VRAM (RX 7600 XT, RX 7700 XT, RX 7800 XT, RX 7900 GRE et RX 7900 XT) sont adaptés à DeepSeek-R1-Distill-Qwen-14B. La RX 7600 classique, avec ses 8 Go de VRAM, se limite à DeepSeek-R1-Distill-Llama-8B.
DeepSeek R1 Distill, Nvidia s’incline

Côté performances, AMD compare la Radeon RX 7900 XTX aux GeForce RTX 4080 SUPER et RTX 4090 sous LM Studio 0.3.8. La GeForce RTX 4080 est dépassée de 34 % sur Qwen-7B, de 27 % sur Llama-8B et de 22 % sur Qwen-14B. Face à la RTX 4090, la Radeon RX 7900 XTX domine sur trois modèles : +13 % sur Qwen-7B, +11 % sur Llama-8B, et +2 % sur Qwen-14B, mais reste 4 % derrière sur Qwen-32B.
Pour tester ces modèles sur du matériel AMD, il est nécessaire d’utiliser LM Studio 0.3.8 et les pilotes Radeon Software Adrenalin 25.1.1 bêta ou plus récents.
Source : Community AMD
Honnêtement, pour autre chose que s’amuser, la version minimum en local est à 70 milliards de paramètres, et elle tourne correctement sur mon PC sous Linux avec une RTX 3090. Enfin, pour une entreprise, il faut la version à plusieurs centaines de milliards de paramètres et là les configurations explosent.