b. Validation des
définitions par l’analyse des textes
La validation des définitions consiste
à vérifier si la définition est crédible ou ne
l’est pas. Elle est faite automatiquement et par l’analyse des
textes. Cette validation des définitions a été faite
uniquement sur les définitions variantes. Elle pourrait cependant
être généralisée avec quelques
adaptations.
Les définitions variantes ne sont pas
utilisables telle quelles. En effet, il arrive fréquemment qu’elles
introduisent de nouvelles difficultés, car les labels obtenus par
transformation des labels existants ont toutes les chances de désigner
autre chose que le gène qu’ils sont censés
définir.
Il s’agit donc de faire le tri entre les bonnes
et les mauvaises définitions variantes. Ceci est rendu possible par
l’utilisation du contexte, comme nous l’avons présenté
dans la section Chapitre 1 I.F.4.
Cette opération se fait après avoir
lancé le processus d’identification automatique des gènes
dans les textes. Les définitions variantes, qui ne sont jamais
confirmées dans aucun résumé, sont alors
caractérisées de non confirmé. Cette information est
consignée dans le champ confiance de la table des
définitions. Ceci est fait à l’aide de la requête
intitulé CD=non confirmé.