Aller au contenu principal Activer le contraste adaptéDésactiver le contraste adapté
Fermer

Le chatbot de DeepSeek atteint une précision de 17 % et devance ses concurrents occidentaux dans l'audit de NewsGuard
information fournie par Reuters 29/01/2025 à 15:41

((Traduction automatisée par Reuters, veuillez consulter la clause de non-responsabilité https://bit.ly/rtrsauto))

Le chatbot de la startup chinoise DeepSeek n'a atteint qu'une précision de 17 % dans la diffusion d'actualités et d'informations lors d'un audit de NewsGuard qui l'a classé dixième sur onze par rapport à ses concurrents occidentaux, notamment ChatGPT d'OpenAI et Google Gemini.

Le chatbot a répété de fausses affirmations 30 % du temps et a donné des réponses vagues ou inutiles 53 % du temps en réponse à des questions liées à l'actualité, ce qui lui a valu un taux d'échec de 83 %, selon un rapport publié mercredi par le service d'évaluation de la fiabilité NewsGuard.

Ce taux est inférieur au taux d'échec moyen de 62 % de ses rivaux occidentaux et soulève des doutes quant à la technologie d'IA dont DeepSeek affirme qu'elle est aussi performante, voire plus, que l'OpenAI soutenu par Microsoft, et ce pour une fraction du prix.

Quelques jours après son lancement, le chatbot de DeepSeek est devenu l'application la plus téléchargée de l'App Store d'Apple

AAPL.O , suscitant des inquiétudes quant à l'avance des États-Unis dans le domaine de l'IA et déclenchant une déroute du marché qui a fait disparaître environ 1 000 milliards de dollars d'actions américaines dans le secteur de la technologie.

La startup chinoise n'a pas répondu immédiatement à une demande de commentaire.

NewsGuard a déclaré avoir appliqué à DeepSeek les mêmes 300 questions que celles utilisées pour évaluer ses homologues occidentaux, dont 30 questions basées sur 10 fausses affirmations diffusées en ligne.

Parmi les sujets abordés figuraient l'assassinat, le mois dernier, de Brian Thompson, cadre de UnitedHealthcare, et l'abattage du vol 8243 d'Azerbaijan Airlines.

L'audit de NewsGuard a également montré que dans trois des dix questions, DeepSeek a réitéré la position du gouvernement chinois sur le sujet sans qu'aucune question relative à la Chine ne lui ait été posée.

Sur des questions relatives à l'accident de l'avion d'Azerbaïdjan - des questions sans rapport avec la Chine - DeepSeek a répondu en reprenant la position de Pékin sur le sujet, a déclaré NewsGuard.

"L'importance de la percée de DeepSeek ne réside pas dans le fait de répondre avec précision à des questions liées à l'actualité chinoise, mais dans le fait qu'il peut répondre à n'importe quelle question pour 1/30e du coût des modèles d'IA comparables", a déclaré Gil Luria, analyste chez D.A. Davidson.

Comme d'autres modèles d'IA, DeepSeek était plus vulnérable à la répétition de fausses affirmations lorsqu'il répondait à des invites utilisées par des personnes cherchant à utiliser des modèles d'IA pour créer et diffuser de fausses affirmations, a ajouté NewsGuard.

Valeurs associées

156,3500 USD NASDAQ -2,38%
180,7150 USD NASDAQ -3,56%
210,1400 USD NASDAQ -0,51%
537,3000 USD NASDAQ -3,09%
388,3401 USD NASDAQ -1,45%

0 commentaire

Signaler le commentaire

Fermer

A lire aussi

  • Mouvement de grève des salariés de l'usine d'Opella à Lisieux, le 17 octobre 2024, contre la vente de cette filiale de Sanofi à un fonds américain ( AFP / LOU BENOIST )
    information fournie par AFP 30.04.2025 19:23 

    Doliprane, médicament le plus prescrit en France, passe officiellement sous pavillon américain, avec la finalisation mercredi de la cession par Sanofi au fonds d'investissement CD&R du contrôle de l'entreprise qui produit la populaire boîte jaune. "C'est officiel: ... Lire la suite

  • La salle de contrôle d'Euronext, société qui gère la Bourse de Paris ( AFP / ERIC PIERMONT )
    information fournie par AFP 30.04.2025 18:57 

    La Bourse de Paris a avancé de 0,50% mercredi, à l'issue d'une séance marquée par la publication du produit intérieur brut (PIB) américain au premier trimestre, en repli, et de celui de la zone euro pour la même période, en hausse. L'indice vedette CAC 40 a gagné ... Lire la suite

  • ( AFP / FOCKE STRANGMANN )
    information fournie par Boursorama avec AFP 30.04.2025 18:53 

    Fort de ses bonnes performances financières, l'avionneur européen Airbus a maintenu mercredi ses prévisions pour 2025, qui excluent l'impact des droits de douane américains, le groupe estimant qu'il était "trop tôt" pour les évaluer. Totalisant 793 millions d'euros ... Lire la suite

  • airbus groupe A220 air baltic a220 au ciel (Crédit:  / crédit photo airbus groupe)
    information fournie par Reuters 30.04.2025 18:52 

    (Actualisé avec citations du DG sur les droits de douane) La direction de l'avionneur européen Airbus AIR.PA a appelé au retour d'un accord datant de 1979 entre plus de 30 pays qui assurait des exemptions de droit de douane pour l'aviation civile, jusqu'à la récente ... Lire la suite

Mes listes

Cette liste ne contient aucune valeur.