Aller au contenu principal
Fermer

L'entreprise émiratie G42 lance un modèle d'IA en langue arabe à source ouverte
information fournie par Reuters 30/08/2023 à 17:45

(Mise à jour du dernier paragraphe avec des détails supplémentaires sur le partenariat G42-Cerebras et ajout d'une citation du directeur général de Cerebras) par Max A. Cherney

30 août (Reuters) - Un groupe d'ingénieurs, de chercheurs et une entreprise de puces basée dans la Silicon Valley ont collaboré pour mettre au point un logiciel de langue arabe avancé qui peut alimenter les applications d'IA générative .

Le nouveau modèle linguistique appelé Jais contient 13 milliards de paramètres qui ont été élaborés à partir d'un grand nombre de données combinant l'arabe et l'anglais, dont une partie provient du code informatique.

Le groupe, composé d'universitaires et d'ingénieurs, s'est lancé dans ce projet en partie parce qu'il existe peu de grands modèles de langage bilingues.

Nommé d'après le plus haut sommet des Émirats arabes unis, Jais est le fruit d'une collaboration entre Cerebras, l'université Mohamed bin Zayed d'intelligence artificielle et une filiale du conglomérat technologique G42, basé à Abou Dhabi, appelée Inception, qui se concentre sur l'IA.

Comme il n'y a pas assez de données en arabe pour entraîner un modèle de la taille de Jais, le code informatique contenu dans les données en anglais a permis d'entraîner la capacité de raisonnement du modèle, selon Timothy Baldwin, professeur à l'université Mohamed bin Zayed d'intelligence artificielle.

"Le code donne au modèle une longueur d'avance en termes de capacités de raisonnement, parce qu'il énonce les (étapes logiques) ", a déclaré M. Baldwin à Reuters.

Jais sera disponible sous une licence open source.

Le groupe a entraîné le modèle Jais sur un superordinateur Cerebras appelé Condor Galaxy, construit en partenariat avec G42. Cette année, Cerebras a annoncé qu'elle avait convenu de construire trois unités de ce type avec G42, la première devant arriver cette année et deux autres devant être livrées en 2024.

"Ce modèle a été formé, du début à la fin, à partir de 13 milliards de paramètres , en trois jours et demi", a déclaré Andrew Feldman, directeur général de Cerebras. "Mais il y a eu des mois de travail avant cela

Valeurs associées

182,4850 USD NASDAQ +0,31%

0 commentaire

Signaler le commentaire

Fermer

A lire aussi

Mes listes

Cette liste ne contient aucune valeur.
Chargement...