Up Previous Next Title Page Index Contents

Constitution des données relatives au dictionnaire de lemmatisation

Les données relatives au dictionnaire de lemmatisation ont été fournies par Pillet. Le dictionnaire est adapté au travail sur des textes de génétique, car il a été complété manuellement par Pillet pour lemmatiser intégralement les textes issus de Flybase qui font partie de son échantillon d’étude.
Les données ont été importées à partir d’un fichier texte formaté comme ceci : "forme fléchie en minuscule","forme lemmatisée en majuscule". Les données ont été dédoublées de façon à ce qu’une forme fléchie ne renvoie qu’à une seule forme lemmatisée. Cette opération est un préalable à la mise en forme relationnelle. Pour des raisons d’encombrement, seule la partie du dictionnaire qui concerne les termes spécifiques de l’interaction a été conservée dans la base de données.

Up Previous Next Title Page Index Contents