Aller au contenu principal Activer le contraste adaptéDésactiver le contraste adapté
Fermer

La start-up chinoise DeepSeek pousse ses concurrents américains avec la mise à jour du modèle R1
information fournie par Reuters 29/05/2025 à 17:32

((Traduction automatisée par Reuters à l'aide de l'apprentissage automatique et de l'IA générative, veuillez vous référer à l'avertissement suivant: https://bit.ly/rtrsauto))

*

DeepSeek publie une mise à jour du modèle de raisonnement à succès R1

*

Le succès mondial de R1 en janvier a touché les actions des entreprises technologiques en dehors de la Chine

*

L'IA de DeepSeek est louée pour ses performances et moins chère que ses concurrents américains

*

La mise à jour crée moins de faux résultats et améliore le raisonnement complexe

(Ajout de points de résumé du texte et de contexte dans les paragraphes 4 à 12) par Brenda Goh et Eduardo Baptista

29 mai - La startup chinoise d'intelligence artificielle DeepSeek a publié la première mise à jour de son modèle de raisonnement R1 aux premières heures de jeudi, intensifiant ainsi la concurrence avec ses rivaux américains tels qu'OpenAI.

DeepSeek a déclaré via la plateforme de développement Hugging Face que R1-0528 était une mise à jour mineure de R1 qui améliorait néanmoins de manière significative la profondeur de ses capacités de raisonnement et d'inférence, y compris une meilleure gestion des tâches complexes, rapprochant ses performances des modèles de raisonnement o3 d'OpenAI et de Gemini 2.5 Pro de Google GOOGL.O .

Le lancement de R1 en janvier est devenu mondialement viral, a fait chuter les actions technologiques en dehors de la Chine et a remis en question le point de vue selon lequel la mise à l'échelle de l'IA nécessite une puissance de calcul et des investissements considérables. Depuis le lancement de R1, des géants chinois de la technologie comme Alibaba 9988.HK et Tencent 0700.HK ont sorti des modèles prétendant surpasser ceux de DeepSeek.

La mise à jour de jeudi était initialement peu détaillée, contrairement au lancement de R1 en janvier, qui était accompagné d'un article académique rédigé par plusieurs auteurs, que la communauté de l'IA du monde entier a analysé pour comprendre les stratégies de l'entreprise.

L'entreprise basée à Hangzhou a indiqué plus tard dans un court message sur X que R1-0528 présentait des performances améliorées. Dans un message plus long sur WeChat, DeepSeek a déclaré que le taux d'"hallucinations", c'est-à-dire de résultats faux ou trompeurs, avait été réduit d'environ 45 à 50 % dans des scénarios tels que la réécriture et le résumé.

La mise à jour permet également de rédiger de manière créative des essais, des romans et d'autres genres, et d'améliorer les capacités dans des domaines tels que la génération de codes frontaux et les jeux de rôle.

"Le modèle a démontré des performances exceptionnelles dans diverses évaluations de référence, notamment en mathématiques, en programmation et en logique générale", a déclaré DeepSeek.

Le succès de DeepSeek a mis fin aux croyances selon lesquelles les contrôles américains à l'exportation freinaient les progrès de la Chine en matière d'IA, après que la société a mis sur le marché des modèles d'IA équivalents ou supérieurs aux modèles américains de pointe, pour une fraction du prix.

La startup a ajouté jeudi qu'une variante de sa mise à jour a été créée en prenant leprocessus de raisonnement utilisé par le modèle R1-0528, puis en améliorant le modèle Qwen 3 8B Base du géant technologique chinois Alibaba, un processus connu sous le nom de distillation. Le résultat est une performance qui dépasse de plus de 10 % le modèle Qwen 3 original.

"Nous pensons que la chaîne de pensée de DeepSeek-R1-0528 aura une importance significative pour la recherche universitaire sur les modèles de raisonnement et le développement industriel axé sur les modèles à petite échelle", a ajouté DeepSeek.

Bloomberg a fait état de cette mise à jour mercredi. Un représentant de DeepSeek a indiqué à un groupe WeChat que la société avait terminé ce qu'elle a décrit comme une "mise à jour d'essai mineure" et que les utilisateurs pouvaient commencer à la tester.

En réponse à la concurrence de DeepSeek, Gemini de Google a introduit des niveaux d'accès à prix réduit, tandis qu'OpenAI a baissé ses prix et lancé un modèle o3 Mini qui repose sur une puissance de calcul moindre.

On s'attend toujours à ce que DeepSeek lance R2, le successeur de R1. Reuters a rapporté en mars, en citant des sources, que la sortie de R2 était initialement prévue pour le mois de mai. DeepSeek a également publié en mars une mise à jour de son grand modèle linguistique V3.

Valeurs associées

12,458 EUR Tradegate -3,43%
14,2479 USD OTCBB -4,27%
171,7400 USD NASDAQ -0,07%
55,400 EUR Tradegate -2,12%

1 commentaire

  • 29 mai 17:45

    Et un super outil d’espionnage pour la chine ...


Signaler le commentaire

Fermer

A lire aussi

Mes listes

Cette liste ne contient aucune valeur.