
Le logo de la société d'intelligence artificielle chinoise Deepseek. (Crédits: Adobe Stock)
Le lancement par la start-up chinoise DeepSeek de ses derniers modèles d'intelligence artificielle, qui, selon elle, sont au moins aussi performants que les principaux modèles américains à un prix nettement inférieur, menace de bouleverser le secteur technologique.
L'entreprise attire l'attention de l'industrie après avoir affirmé dans un article publié le mois dernier que l'entraînement de son modèle DeepSeek-V3 nécessitait moins de 6 millions de dollars de puissance de calcul provenant des puces H800 du géant américain Nvidia NVDA.O .
L'assistant d'IA de DeepSeek, basé sur DeepSeek-V3, a déjà dépassé son rival américain ChatGPT pour devenir l'application gratuite la mieux notée dans l'App Store américain d'Apple.
Cela a eu pour effet de susciter des doutes quant aux décisions de certaines entreprises technologiques américaines d'investir des milliards de dollars dans l'IA, une remise en question qui pèse lourdement lundi sur les actions de plusieurs grandes entreprises technologiques, dont Nvidia elle-même.
Voici quelques données sur le phénomène qui bouleverse le secteur de l'IA dans le monde entier.
Pourquoi toute cette agitation ?
Le lancement de ChatGPT par la start-up américaine OpenAI fin 2022 a eu l'effet d'un électrochoc pour les entreprises technologiques chinoises qui ont créé à leur tour leurs propres chatbots basés sur l'IA.
La publication du premier équivalent chinois de ChatGPT, créé par Baidu 9888.HK , a toutefois suscité une grande déception face à l'écart entre les capacités d'intelligence artificielle des entreprises américaines et chinoises.
La qualité et la rentabilité des outils lancés par DeepSeek renversent la situation puisque, selon la start-up chinoise, les deux modèles plébiscités par les cadres de la Silicon Valley et des ingénieurs des entreprises technologiques américaines, DeepSeek-V3 et DeepSeek-R1, sont comparables aux modèles les plus avancés d'OpenAI et de Meta.
Ils sont également moins chers. DeepSeek-R1, lancé la semaine dernière, est entre 20 et 50 fois moins cher que le modèle o1 d'OpenAI, en fonction de la tâche, selon un post publié sur le compte WeChat de la start-up chinoise.
Mais face à l'enthousiasme, certains ont également exprimé publiquement leur scepticisme.
Le directeur général de Scale AI, Alexandr Wang, a affirmé dans une interview accordée jeudi à la chaîne américaine CNBC que DeepSeek possédait 50.000 puces Nvidia H100, une information qui, selon lui, n'a pas été divulguée parce que cela violerait les contrôles à l'exportation de Washington sur les ventes de ce type de puces à des entreprises chinoises. Il n'a apporté aucune preuve.
DeepSeek n'avait pas répondu dans l'immédiat à une demande de commentaire sur cette allégation.
Une note publiée lundi par Bernstein souligne que les coûts d'entraînement totaux de DeepSeek pour son modèle V3 sont inconnus, mais qu'ils sont bien plus élevés que les 5,58 millions de dollars que la start-up a déclaré avoir dépensés en puissance de calcul.
Les analystes ont également précisé que les coûts d'entraînement du modèle R1, tout aussi acclamé, n'ont pas été divulgués.
Qui est derrière DeepSeek ?
DeepSeek est une start-up basée à Hangzhou dont l'actionnaire majoritaire est Liang Wenfeng, cofondateur du fonds spéculatif quantitatif High-Flyer, d'après les registres d'entreprises chinois.
En mars 2023, le fonds de Liang Wenfeng a annoncé sur son compte officiel WeChat qu'il "repartait à zéro", abandonnant le trading pour concentrer ses ressources sur la création d'un "nouveau groupe de recherche indépendant, afin d'explorer l'essence de l'IAG" (intelligence artificielle générale).
DeepSeek a été créée la même année.
Selon l'OpenAI, l'IAG est un système autonome capable de surpasser les humains dans la plupart des tâches à valeur économique.
Le montant investi par High-Flyer dans DeepSeek n'est pas établi. Le fonds possède des bureaux dans le même bâtiment que DeepSeek, ainsi que des brevets liés à des clusters de puces utilisées pour entraîner des modèles d'IA, selon les registres d'entreprises chinois.
En juillet 2022, la division de High-Flyer spécialisée dans l'IA déclarait sur son compte WeChat qu'elle possédait et exploitait un cluster de 10.000 puces A100.
Qu'en penses le gouvernement chinois ?
Le succès de DeepSeek n'est pas passé inaperçu dans les principaux cercles politiques chinois. Selon l'agence de presse Chine nouvelle, le 20 janvier, le jour où le modèle DeepSeek-R1 a été rendu public, Liang Wenfeng a participé à un symposium à huis clos pour les entrepreneurs et les experts organisé par le Premier ministre chinois Li Qiang.
La présence de l'actionnaire est un signe possible que le succès de DeepSeek pourrait servir l'objectif de Pékin de surmonter les contrôles à l'exportation de Washington et d'atteindre l'autosuffisance dans des industries stratégiques telles que l'IA.
Robin Li, directeur général de Baidu, avait participé à un symposium similaire l'année dernière.
(Reportage Eduardo Baptista, version française Diana Mandiá, édité par Sophie Louet)
2 commentaires
Vous devez être membre pour ajouter un commentaire.
Vous êtes déjà membre ? Connectez-vous
Pas encore membre ? Devenez membre gratuitement
Signaler le commentaire
Fermer