Reddit poursuit Perplexity pour avoir récupéré des données afin d'entraîner un système d'IA
information fournie par Reuters 23/10/2025 à 00:10

((Traduction automatisée par Reuters à l'aide de l'apprentissage automatique et de l'IA générative, veuillez vous référer à l'avertissement suivant: https://bit.ly/rtrsauto))

(Ajout de la réponse de la société Oxylabs au paragraphe 8)

La plateforme de médias sociaux Reddit

RDDT.N a poursuivi la startup d'intelligence artificielle Perplexity devant le tribunal fédéral de New York mercredi, l'accusant, ainsi que trois autres sociétés, d'avoir illégalement récupéré ses données pour entraîner le moteur de recherche basé sur l'IA de Perplexity. Reddit a déclaré dans la plainte que les sociétés de récupération de données ont contourné ses mesures de protection des données afin de voler des données dont Perplexity a "désespérément besoin" pour alimenter son système de "moteur de réponse". Cette affaire est l'une des nombreuses plaintes déposées par des propriétaires de contenu contre des entreprises technologiques pour l'utilisation abusive présumée de leur matériel protégé par des droits d'auteur afin d'entraîner des systèmes d'intelligence artificielle. En juin, Reddit a intenté une plainte similaire contre la startup d'IA Anthropic, qui est toujours en cours.

"Notre approche reste fondée sur des principes et responsable, car nous fournissons des réponses factuelles avec une IA précise, et nous ne tolérerons pas les menaces contre l'ouverture et l'intérêt public", a déclaré Perplexity dans un communiqué.

"Les entreprises d'IA sont engagées dans une course à l'armement pour obtenir du contenu humain de qualité, et cette pression a alimenté une économie de "blanchiment de données" à l'échelle industrielle", a déclaré Ben Lee, directeur juridique de Reddit, dans un communiqué. Reddit, qui comprend des milliers de communautés internet "subreddit" basées sur les centres d'intérêt, a déclaré dans la plainte qu'il était la source la plus fréquemment citée pour les réponses générées par l'IA aux questions des utilisateurs. Il a concédé des licences sur son contenu à Google , OpenAI et à d'autres pour leur formation à l'IA.

Reddit a déclaré que les sociétés Oxylabs, basée en Lituanie, AWMProxy, basée en Russie, et SerpApi, basée au Texas, ont récupéré des données Reddit à partir de milliards de résultats de recherche sans autorisation et que Perplexity, qui n'a pas de licence pour utiliser le contenu de Reddit, a travaillé avec au moins l'une des sociétés de récupération de données pour obtenir le matériel de Reddit. "Nous ne sommes pas du tout d'accord avec les allégations de Reddit et nous avons l'intention de nous défendre vigoureusement devant les tribunaux", a déclaré un porte-parole de SerpApi. Oxylabs s'est déclarée "choquée et déçue par cette nouvelle, Reddit n'ayant pas tenté de nous parler directement", et a indiqué qu'elle se défendrait également contre ces allégations.

AWMProxy n'a pas pu être joint pour un commentaire.

Reddit a déclaré avoir envoyé à Perplexity une lettre de cessation et de désistement l'année dernière, après quoi l'entreprise a "multiplié par quarante le volume de ses citations sur Reddit"

Reddit a demandé au tribunal des dommages-intérêts non spécifiés et une ordonnance interdisant à Perplexity d'utiliser ses données.