b. Interactions reconnues
plusieurs fois au cours du processus
nG
Le corpus de phrases qui sert à
l’analyse est le même que pour le processus nG. Le graphe
correspondant se trouve figure 14 et les
données pour la série nGr dans le
Figure 14 Comparaison des
interactions extraites avec ou sans critère sur le nombre de
reconnaissances associées
Les deux séries de données sont presque
sur une même ligne. Cette fois-ci, la séries nGr n’est
pas en dessous de la série nG. Elle parait même être
au-dessus pour les points à l’extrême gauche du graphique,
mais comme nous l’avons expliqué dans la section A ci-dessus, ces données sont entachées
d’une grande incertitude en raison des faibles effectifs
associés.
Ainsi, par rapport au cas précédent, la
répétition est un critère de qualité
légèrement supérieur. C’est un résultat
attendu dans la mesure ou la technique d’extraction d’information
nG donne plus de faux positifs que la technique 2G. Il est donc
naturel de penser qu’un critère basé sur
l’auto-confirmation des données extraites est plus profitable dans
le cas de nG.