Twitter : dis-moi ce que tu écris, je te dirai quel est ton sexe

le
0
Des chercheurs canadiens ont mené des études sur la science du langage du Twitter, qui permet de différencier les utilisateurs hommes et femmes.
Des chercheurs canadiens ont mené des études sur la science du langage du Twitter, qui permet de différencier les utilisateurs hommes et femmes.

La syntaxe française est un régal pour les annonceurs publicitaires. Une équipe de chercheurs de l'université McGill au Canada a mis au point des algorithmes permettant de déterminer le sexe des utilisateurs de Twitter. De quoi permettre aux annonceurs de cibler leur auditoire. Et les résultats sur les contenus français sont très probants. La précision de l'outil atteint 90 %, quand elle n'est que de 80 à 85 % sur les contenus anglais. La raison ? Les adjectifs et les participes passés français ont quasiment tous une forme masculine et féminine (beau/belle, choisi/choisie...) alors que la distinction n'existe pas forcément en anglais. Même chose pour les déterminants (un/une) qui se traduisent indistinctement par "a" ou "one" en anglais.Tous les tweets commençant par "je suis", et qui sont suivis d'un participe passé ou d'un adjectif, permettent donc d'identifier le genre de l'auteur. Exemple : "I went" se traduit par "je suis allé" ou "je suis allée", de même que "I'm happy" deviendra "je suis heureux/je suis heureuse" en français. Des filtres ont dû être intégrés à l'algorithme, car il arrive que les Français n'orthographient pas bien leurs phrases. Les erreurs sont fréquentes lorsque les phrases, au masculin ou au féminin, se prononcent de la même façon. Et les contractions qu'on utilise sur Internet (langage SMS), comme "j'suis", "jm suis", "jnsuis pas" ont également dû être prises en compte. Un catalogue de ces expressions familières...

Lire la suite sur Le Point.fr

Vous devez être membre pour ajouter des commentaires.
Devenez membre, ou connectez-vous.
Aucun commentaire n'est disponible pour l'instant