A gauche: colonnes des échanges dans "Les Liaisons dangereuses" de Laclos ; à droite : diagramme alluvial des échanges épistolaires du roman réalisé avec l'outil Rawgraphs

Présentation et intérêt pédagogique

Mettre en données un texte, c'est en extraire des données organisées : un nombre de mots dans une phrase, dans le corpus; les occurrences d'un mot; la liste des mots les plus présents dans le texte (index); le nombre de mots de telle catégorie grammaticale; un compte d'interactions entre tel et tel personnage; le nombre d'occurrences d'un mot à côté d'un autre, etc.

Ces données textuelles peuvent alors être compilées dans des tableaux et comparées, analysées, représentées graphiquement avec des outils de visualisation de données.

En classe, cette approche permet d'analyser un grand volume de texte, de dépasser les capacités de lecture. La méthode s'appuie également sur des visualisations : elles mettent en évidence des aspects du corpus, étayent une argumentation. Les données textuelles peuvent ainsi ouvrir de nouvelles pistes sur le corpus ou asseoir une théorie.

Exemples de textes mis en données : tableur des échanges épistolaires dans "Les Liaisons dangereuses" ; index des mots et informations sur le corpus "Les Misérables"