((Traduction automatisée par Reuters, veuillez consulter la clause de non-responsabilité https://bit.ly/rtrsauto))
Le chatbot de la startup chinoise DeepSeek n'a atteint qu'une précision de 17 % dans la diffusion d'actualités et d'informations lors d'un audit de NewsGuard qui l'a classé dixième sur onze par rapport à ses concurrents occidentaux, notamment ChatGPT d'OpenAI et Google Gemini.
Le chatbot a répété de fausses affirmations 30 % du temps et a donné des réponses vagues ou inutiles 53 % du temps en réponse à des questions liées à l'actualité, ce qui lui a valu un taux d'échec de 83 %, selon un rapport publié mercredi par le service d'évaluation de la fiabilité NewsGuard.
Ce taux est inférieur au taux d'échec moyen de 62 % de ses rivaux occidentaux et soulève des doutes quant à la technologie d'IA dont DeepSeek affirme qu'elle est aussi performante, voire plus, que l'OpenAI soutenu par Microsoft, et ce pour une fraction du prix.
Quelques jours après son lancement, le chatbot de DeepSeek est devenu l'application la plus téléchargée de l'App Store d'Apple
AAPL.O , suscitant des inquiétudes quant à l'avance des États-Unis dans le domaine de l'IA et déclenchant une déroute du marché qui a fait disparaître environ 1 000 milliards de dollars d'actions américaines dans le secteur de la technologie.
La startup chinoise n'a pas répondu immédiatement à une demande de commentaire.
NewsGuard a déclaré avoir appliqué à DeepSeek les mêmes 300 questions que celles utilisées pour évaluer ses homologues occidentaux, dont 30 questions basées sur 10 fausses affirmations diffusées en ligne.
Parmi les sujets abordés figuraient l'assassinat, le mois dernier, de Brian Thompson, cadre de UnitedHealthcare, et l'abattage du vol 8243 d'Azerbaijan Airlines.
L'audit de NewsGuard a également montré que dans trois des dix questions, DeepSeek a réitéré la position du gouvernement chinois sur le sujet sans qu'aucune question relative à la Chine ne lui ait été posée.
Sur des questions relatives à l'accident de l'avion d'Azerbaïdjan - des questions sans rapport avec la Chine - DeepSeek a répondu en reprenant la position de Pékin sur le sujet, a déclaré NewsGuard.
"L'importance de la percée de DeepSeek ne réside pas dans le fait de répondre avec précision à des questions liées à l'actualité chinoise, mais dans le fait qu'il peut répondre à n'importe quelle question pour 1/30e du coût des modèles d'IA comparables", a déclaré Gil Luria, analyste chez D.A. Davidson.
Comme d'autres modèles d'IA, DeepSeek était plus vulnérable à la répétition de fausses affirmations lorsqu'il répondait à des invites utilisées par des personnes cherchant à utiliser des modèles d'IA pour créer et diffuser de fausses affirmations, a ajouté NewsGuard.
0 commentaire
Vous devez être membre pour ajouter un commentaire.
Vous êtes déjà membre ? Connectez-vous
Pas encore membre ? Devenez membre gratuitement
Signaler le commentaire
Fermer