Alibaba publie un modèle d'IA qui surpasserait DeepSeek-V3
information fournie par Reuters 29/01/2025 à 06:15

((Traduction automatisée par Reuters, veuillez consulter la clause de non-responsabilité https://bit.ly/rtrsauto)) par Eduardo Baptista

La société technologique chinoise Alibaba 9988.HK a publié mercredi une nouvelle version de son modèle d'intelligence artificielle Qwen 2.5 qui, selon elle, surpasse le très acclamé DeepSeek-V3.

Le moment inhabituel de la sortie de Qwen 2.5-Max, le premier jour du Nouvel An lunaire, alors que la plupart des Chinois sont en congé et en famille, montre la pression que l'ascension fulgurante de la startup chinoise d'intelligence artificielle DeepSeek au cours des trois dernières semaines a exercée non seulement sur ses rivaux étrangers, mais aussi sur ses concurrents nationaux.

"Qwen 2.5-Max surpasse... presque tous les modèles GPT-4o, DeepSeek-V3 et Llama-3.1-405B", a déclaré l'unité cloud d'Alibaba dans une annonce publiée sur son compte WeChat officiel, faisant référence aux modèles d'IA open-source les plus avancés d'OpenAI et de Meta.

La sortie le 10 janvier de l'assistant d'IA de DeepSeek, alimenté par le modèle DeepSeek-V3, ainsi que la sortie le 20 janvier de son modèle R1, ont choqué la Silicon Valley et fait plonger les actions des entreprises technologiques. Les coûts de développement et d'utilisation prétendument faibles de la startup chinoise ont incité les investisseurs à remettre en question les plans de dépenses considérables des principales entreprises d'IA aux États-Unis.

Mais le succès de DeepSeek a également conduit ses concurrents nationaux à se précipiter pour améliorer leurs propres modèles d'IA.

Deux jours après la publication de DeepSeek-R1, ByteDance, propriétaire de TikTok, a publié une mise à jour de son modèle d'IA phare , qui, selon elle, a surpassé le modèle o1 d'OpenAI, soutenu par Microsoft, dans AIME, un test de référence qui mesure la capacité des modèles d'IA à comprendre et à répondre à des instructions complexes.

Cela fait écho à l'affirmation de DeepSeek selon laquelle son modèle R1 rivalise avec le modèle o1 d'OpenAI sur plusieurs critères de performance.