Aller au contenu principal
Fermer

Meta lance un modèle d'IA pour la traduction de la parole entre des dizaines de langues
information fournie par Reuters 22/08/2023 à 15:30

par Katie Paul

NEW YORK, 22 août (Reuters) - Meta Platforms META.O , la société mère de Facebook, a publié mardi un modèle d'IA capable de traduire et de transcrire la parole dans des dizaines de langues, un élément de base potentiel pour des outils permettant une communication en temps réel au-delà des barrières linguistiques.

L'entreprise a indiqué dans un billet de blog que son modèle SeamlessM4T pouvait prendre en charge des traductions entre le texte et la parole dans près de 100 langues, ainsi qu'une traduction complète de la parole à la parole dans 35 langues, en combinant des technologies qui n'étaient auparavant disponibles que dans des modèles distincts.

Le directeur général Mark Zuckerberg a déclaré qu'il envisageait que de tels outils facilitent les interactions entre les utilisateurs du monde entier dans le métavers, l'ensemble des mondes virtuels interconnectés sur lesquels il parie l'avenir de l'entreprise.

Meta met le modèle à la disposition du public pour une utilisation non commerciale, selon le billet de blog.

La plus grande entreprise de médias sociaux au monde a publié cette année une multitude de modèles d'IA, pour la plupart gratuits, dont un grand modèle de langage appelé Llama qui pose un sérieux défi aux modèles propriétaires vendus par

MSFT.O OpenAI, soutenu par Microsoft, et GOOGL.O Google, propriété d'Alphabet.

Zuckerberg affirme qu'un écosystème d'IA ouvert est à l'avantage de Meta, car l'entreprise a plus à gagner en faisant appel à la foule pour la création d'outils destinés aux consommateurs pour ses plateformes sociales qu'en faisant payer l'accès aux modèles.

Néanmoins, Meta est confrontée aux mêmes questions juridiques que le reste de l'industrie en ce qui concerne les données d'entraînement ingérées pour créer ses modèles.

En juillet, la comédienne Sarah Silverman et deux autres auteurs ont intenté un procès pour violation des droits d'auteur contre Meta et OpenAI, les accusant d'avoir utilisé leurs livres comme données d'entraînement sans autorisation.

Pour le modèle SeamlessM4T, les chercheurs de Meta ont déclaré dans un document de recherche qu'ils avaient recueilli des données d'entraînement audio à partir de 4 millions d'heures de "son brut provenant d'un référentiel public de données web explorées", sans préciser de quel référentiel il s'agissait.

Un porte-parole de Meta n'a pas répondu aux questions concernant la provenance des données audio.

Les données textuelles provenaient d'ensembles de données créés l'année dernière qui extrayaient le contenu de Wikipédia et des sites web associés, selon le document de recherche.

Valeurs associées

304,8700 USD NASDAQ +1,29%
606,7100 USD NASDAQ +2,20%
384,3900 USD NASDAQ +0,66%

0 commentaire

Signaler le commentaire

Fermer

A lire aussi

Mes listes

Cette liste ne contient aucune valeur.
Chargement...