Aller au contenu principal Activer le contraste adaptéDésactiver le contraste adapté
Fermer

Mistral lance des modèles d'IA centrés sur l'audio
information fournie par Boursorama avec AFP 15/07/2025 à 17:50

Mistral, start-up française d'intelligence artificielle (IA), a lancé mardi ses premiers modèles centrés sur la reconnaissance vocale et la transcription dans plusieurs langues.

( AFP / SEBASTIEN BOZON )

( AFP / SEBASTIEN BOZON )

"La voix sera cruciale dans l'avenir des interactions homme-machine et jouera un rôle critique dans l'adoption de l'intelligence artificielle", a expliqué à l'AFP l'entreprise.

Baptisé Voxtral, ce modèle permet de transcrire des contenus audio, en direct ou à partir de fichiers importés, en plusieurs langues allant de l'anglais au hindi, reconnues automatiquement.

Voxtral peut aussi faire des résumés et répondre à des requêtes posées à l'oral. Mistral compte ajouter prochainement d'autres fonctionnalités, comme la reconnaissance de plusieurs interlocuteurs et de leurs caractéristiques (âge, sexe) mais aussi de leurs émotions, selon un communiqué.

Ce modèle est disponible en deux versions (petite et miniature) et en source ouverte, ce qui signifie que les développeurs ont accès à son code informatique.

Voxtral est notamment destiné à améliorer les systèmes vocaux d'entreprises pour répondre à leurs clients par téléphone, a indiqué la start-up.

La société française développe par ailleurs avec le constructeur automobile Stellantis un système permettant aux conducteurs d'interagir à l'oral avec un assistant IA embarqué dans leur véhicule.

Le mastodonte américain OpenAI avait présenté dès l'année dernière un mode vocal pour son modèle GPT-4o, capable de "raisonner" en temps réel via l'audio, la vision et le texte.

Cette version de ChatGPT peut notamment lire les émotions des utilisateurs sur les visages via la caméra d'un smartphone.

Le laboratoire français de recherche en intelligence artificielle Kyutai, fondé par Xavier Niel, propriétaire du groupe Iliad, et Rodolphe Saadé, PDG du transporteur maritime CMA CGM, avait dévoilé en février un modèle de traduction simultanée.

Baptisée Hibiki ("écho" en japonais), cette IA traduit les propos d'un utilisateur en temps réel du français vers l'anglais, comme le ferait un interprète.

Mistral a conclu un partenariat avec l'AFP lui permettant d'intégrer les dépêches de l'agence de presse dans les réponses aux questions posées à son agent conversationnel.

Valeurs associées

8,530 EUR MIL +1,14%

0 commentaire

Signaler le commentaire

Fermer

A lire aussi

Mes listes

Cette liste ne contient aucune valeur.
Chargement...