L'OpenAI recherche des partenariats pour générer des données d'entraînement à l'IA information fournie par Reuters 09/11/2023 à 21:16
Le fabricant du ChatGPT, OpenAI, a annoncé jeudi son intention de collaborer avec des organisations pour produire des ensembles de données publiques et privées afin d'entraîner des modèles d'intelligence artificielle (AI).
Le populaire chatbot ChatGPT, qui peut générer des poèmes et de la prose à partir de simples invites, est basé sur de grands modèles de langage qui sont entièrement formés à partir de données libres disponibles sur l'internet.
Le dernier effort de l'entreprise pourrait l'aider à produire des données d'entraînement plus nuancées et d'un style plus conversationnel.
"Nous recherchons en particulier des données qui expriment l'intention humaine, dans toutes les langues, sur tous les sujets et dans tous les formats", a déclaré l'entreprise dans un billet de blog.
OpenAI a indiqué qu'elle recherchait des partenaires pour l'aider à créer un ensemble de données open-source pour l'entraînement des modèles de langage. Cet ensemble de données sera public et pourra être utilisé par tous pour l'entraînement des modèles d'IA.
L'entreprise a indiqué qu'elle préparait également des ensembles de données privés pour l'entraînement de modèles d'IA propriétaires.