Constitution des
données relatives au dictionnaire de lemmatisation
Les données relatives au dictionnaire de
lemmatisation ont été fournies par Pillet. Le dictionnaire est
adapté au travail sur des textes de génétique, car il a
été complété manuellement par Pillet pour lemmatiser
intégralement les textes issus de Flybase qui font partie de son
échantillon d’étude.
Les données ont été
importées à partir d’un fichier texte formaté comme
ceci : "forme fléchie en minuscule","forme lemmatisée en
majuscule". Les données ont été dédoublées de
façon à ce qu’une forme fléchie ne renvoie
qu’à une seule forme lemmatisée. Cette opération est
un préalable à la mise en forme relationnelle. Pour des raisons
d’encombrement, seule la partie du dictionnaire qui concerne les termes
spécifiques de l’interaction a été conservée
dans la base de données.