L'entreprise émiratie G42 lance un modèle d'IA en langue arabe à source ouverte information fournie par Reuters 30/08/2023 à 07:30
par Max A. Cherney
30 août (Reuters) - Un groupe d'ingénieurs, de chercheurs et une entreprise de puces basée dans la Silicon Valley ont collaboré à la publication d'un logiciel avancé de langue arabe qui peut alimenter les applications d'IA générative .
Le nouveau modèle linguistique appelé Jais contient 13 milliards de paramètres et a été élaboré à partir d'un grand nombre de données combinant l'arabe et l'anglais, dont une partie provient du code informatique. Le groupe, composé d'universitaires et d'ingénieurs, s'est lancé dans ce projet en partie parce qu'il existe peu de grands modèles de langage bilingues.
Nommé d'après le plus haut sommet des Émirats arabes unis, Jais est le fruit d'une collaboration entre Cerebras, l'université Mohamed bin Zayed d'intelligence artificielle et une filiale du conglomérat technologique G42, basé à Abou Dhabi, appelée Inception, qui se concentre sur l'IA.
Comme il n'y a pas assez de données en arabe pour entraîner un modèle de la taille de Jais, le code informatique contenu dans les données en anglais a permis d'entraîner la capacité de raisonnement du modèle, selon Timothy Baldwin, professeur à l'université d'intelligence artificielle Mohamed bin Zayed.
"Le code donne au modèle une longueur d'avance en termes de capacités de raisonnement, parce qu'il énonce les (étapes logiques) ", a déclaré M. Baldwin à Reuters.
Jais sera disponible sous une licence open source.
Le groupe a entraîné le modèle Jais sur un superordinateur de Cerebras appelé Condor Galaxy. Cette année, Cerebras a annoncé qu'elle avait vendu trois unités de ce type à G42, la première devant arriver cette année et les autres devant être livrées en 2024.