LightOn démontre la flexibilité de son modèle d’OCR en l'adaptant à la langue arabe via entraînement ciblé
information fournie par Boursorama CP 12/06/2026 à 18:03

LightOn démontre la flexibilité de son modèle d’OCR en l'adaptant à la langue arabe via entraînement ciblé
Paris, le 12 juin 2026 – LightOn démontre la flexibilité de LightOnOCR-2, son modèle de compréhension documentaire, en l'adaptant à l'arabe par fine-tuning. Cette extension repose sur un pipeline interne de génération de données synthétiques, conçu pour couvrir des langues encore peu représentées dans les outils OCR du marché.

Cette démonstration repose sur un jeu de données composé de 12 000 pages synthétiques et de leurs transcriptions de référence, produit à l’aide d’une version modifiée du générateur de documents synthétiques de LightOn.