DeepSeek dévoile un nouveau modèle d'IA spécialement conçu pour les puces Huawei, alors que la Chine s'efforce de renforcer son autonomie technologique information fournie par Reuters 24/04/2026 à 19:45
((Traduction automatisée par Reuters à l'aide de l'apprentissage automatique et de l'IA générative, veuillez vous référer à l'avertissement suivant: https://bit.ly/rtrsauto))
* DeepSeek affirme que le V4 surpasse les autres modèles open source
* La collaboration étroite avec Huawei contraste avec la dépendance antérieure vis-à-vis des puces Nvidia
* DeepSeek affirme que le V4 est particulièrement adapté au travail des agents IA
(Ajout de commentaires sur le V4 et l'évolution des cours boursiers aux paragraphes 8, 9, 15, 20 et 21) par Eduardo Baptista, Ethan Wang et Che Pan
DeepSeek, la start-up chinoise dont le modèle d'IA à faible coût a stupéfié le monde l'année dernière, a dévoilé vendredi un aperçu d'un nouveau modèle très attendu, adapté à la technologie des puces Huawei, soulignant ainsi l'autonomie croissante de la Chine dans ce secteur.
La version Pro du nouveau modèle surpasse les autres modèles open source dans les benchmarks de connaissance du monde, n'étant devancée que par le modèle closed-source Gemini-Pro-3.1 de Google GOOGL.O , a déclaré DeepSeek. La collaboration étroite avec Huawei HWT.UL sur le nouveau modèle, le V4, contraste avec la dépendance passée de DeepSeek vis-à-vis des puces d'IA de Nvidia NVDA.O . Huawei a déclaré que ses puces avaient été utilisées dans une partie du processus d'entraînement du V4 .
« C'est un événement majeur pour l'industrie chinoise de l'IA », a déclaré He Hui, directeur de la recherche sur les semi-conducteurs au sein du cabinet de conseil Omdia.
« Les puces Ascend de Huawei constituent la meilleure alternative nationale à Nvidia, et le fait de prendre en charge DeepSeek V4 montre que les meilleurs modèles d'IA chinois peuvent désormais fonctionner sur du matériel chinois. » La plupart des principaux modèles d’IA sont entraînés et fonctionnent sur des puces fabriquées par Nvidia. Et le virage de DeepSeek vers Huawei souligne les inquiétudes soulevées par le directeur général de Nvidia, Jensen Huang, selon lesquelles l’entreprise américaine risque de perdre son écosystème de développeurs en Chine en raison des contrôles à l’exportation américains et de la volonté de Pékin de parvenir à l’autosuffisance.
« Le jour où DeepSeek sortira d’abord sur Huawei, ce sera un résultat catastrophique pour notre pays », a déclaré Jensen Huang dans un podcast ce mois-ci.
Le V4 est le modèle le plus rapide à se hisser en tête du classement sur Hugging Face, un forum de développeurs populaire dédié au partage et à l’exécution de modèles d’apprentissage automatique, a déclaré Lewis Tunstall, ingénieur en apprentissage automatique chez Hugging Face.
Il est performant pour traiter des tâches textuelles extrêmement longues et complexes, et ce à un coût bien moindre que les meilleurs modèles concurrents, mais il présente certaines limites. Par exemple, il ne prend pas en charge plusieurs modalités telles que les images et la vidéo, a précisé Lewis Tunstall.
LA COLLABORATION ÉTROITE ENTRE HUAWEI ET DEEPSEEK DeepSeek a essuyé des critiques de la part de Washington et de ses concurrents américains, qui lui reprochent de devoir en grande partie son succès à une utilisation abusive du savoir-faire américain.
De son côté, DeepSeek a reconnu utiliser des puces Nvidia, mais n'a pas précisé si ces puces faisaient l'objet d'interdictions d'exportation. L'entreprise a également déclaré ne pas avoir utilisé intentionnellement de données synthétiques générées par OpenAI. Le lancement de vendredi intervient au lendemain de l'accusation portée par la Maison Blanche contre la Chine de vol à l'échelle industrielle de la propriété intellectuelle des laboratoires américains d'IA, et avantla visite du président américain Donald Trump à Pékin le mois prochain pour rencontrer le dirigeant chinois Xi Jinping.
En janvier, l'administration Trump a donné son feu vert à la vente en Chine des puissantes puces H200 de Nvidia, mais selon certaines sources, les livraisons auraient été bloquées par des désaccords sur les conditions de vente tant en Chine qu'aux États-Unis.
Les fabricants de puces chinois ont rebondi grâce aux anticipations d'une utilisation plus large des puces locales, Huahong Semiconductor 1347.HK et SMIC 0981.HK bondissant respectivement de 15 % et 10 %.
L'action Nvidia a également progressé grâce aux prévisions d'Intel annonçant un chiffre d'affaires et un bénéfice étonnamment élevés, renforçant ainsi la conviction que le boom de l'IA ne montrait aucun signe de ralentissement.
DEEPSEEK FAIT DÉSORMAIS FACE À DE NOMBREUX CONCURRENTS
De nombreux gouvernements occidentaux et certains gouvernements asiatiques ont interdit à leurs institutions et à leurs fonctionnaires d'utiliser DeepSeek, invoquant des préoccupations liées à la confidentialité des données. Néanmoins, les modèles de DeepSeek ont toujours figuré parmi les plus utilisés sur les plateformes internationales hébergeant des modèles open source. En Chine, bien qu'il ait atteint le statut de champion national il y a un an, son avance s'est évaporée face à une multitude d'offres concurrentes proposées par des concurrents nationaux. La sortie de la version V4 a fait chuter les actions de ses concurrents , Zhipu AI 2513.HK et MiniMax 0100.HK perdant tous les deux 9 %.
DeepSeek a déclaré vendredi que le V4 serait particulièrement adapté au travail des agents IA, qui peuvent exécuter des tâches plus complexes que les chatbots mais nécessitent une plus grande puissance de calcul.
Reste à voir quel sera son succès.
« Mon avis initial est que l'aperçu de DeepSeek V4 semble prometteur, mais je resterais prudent quant à prendre les résultats des tests de performance au pied de la lettre tant qu'il n'y aura pas d'évaluations indépendantes et davantage de tests par des développeurs en conditions réelles », a déclaré Daniel Dewhurst, un ingénieur en IA qui a testé le V4 après sa sortie.
Il a toutefois souligné que le V4 montre que les modèles ouverts, que les utilisateurs peuvent utiliser et exécuter eux-mêmes, semblent réduire encore davantage l'écart avec les modèles fermés, notamment en termes de coût, de contexte long et de codage.
Il peut traiter plus d’un million de tokens – ce qui le place au même niveau que les fenêtres de contexte du GPT-5.4 d’OpenAI et du Claude Opus 4.6 d’Anthropic – mais ne nécessite qu’une fraction de la puissance de calcul pour y parvenir.
Le V4 est également disponible en version Flash, moins coûteuse. Les versions préliminaires permettent à l'entreprise d'intégrer les retours d'expérience du monde réel et d'apporter des modifications avant le lancement du produit final. DeepSeek n'a pas communiqué de calendrier concernant la date à laquelle le modèle devrait être finalisé.
Détenue par la société chinoise High-Flyer Capital Management, DeepSeek vise à lever des fonds pour une valorisation dépassant les 20 milliards de dollars, selon un article publié ce mois-ci par The Information, qui indiquait également que les géants technologiques Alibaba 9988.HK et Tencent 0700.HK étaient en pourparlers pour prendre des participations.