A. Explications communes
à tous les graphiques
Nous donnons ici quelques indications valables sur
l’ensemble des graphiques présents dans cette section. Le premier
exemple de graphique est donné figure 6
(ci-après). Les données correspondantes sont données dans
le tableau 88.
La première colonne donne le seuil
appliqué à l’IVI de la phrase. Le test sur
l’IVI consiste à rejeter la reconnaissance extraite si
l’IVI de la phrase est inférieur au seuil fixé. La
première valeur du seuil, qui est -2, correspond en réalité
à une extraction d’information qui ne prend pas en compte
l’IVI. En effet, l’IVI ne peut par définition
être inférieur à -1. Le point correspondant sur le graphique
se trouve à l’extrémité droite. Il est souvent un peu
en retrait par rapport aux autre points qui se trouvent eux globalement sur une
ligne. Cela traduit le fait que c’est un cas limite.
A l’opposé les dernières valeurs
du seuil correspondent à une sélection drastique des
données à extraire. Les points correspondants se trouvent à
l’extrémité gauche sur les graphiques. Les effectifs
associés sont faibles. Les quotients rappel et précisions sont
donc moins significatifs pour ces points. C’est ce qui explique la
dispersion plus grande des valeurs à l’extrême gauche des
graphiques. Les données qui correspondent à des effectifs
inférieurs à dix ont été supprimés car elles
ne sont pas significatives.
La deuxième colonne donne l’effectif des
données qui ont été extraites automatiquement. La colonne
suivante donne l’effectif des données extraites par l’expert
qui a annoté les textes. Il s’agit donc de la
référence. La colonne confirmé donne
l’effectif des données extraites automatiquement qui se trouvent
aussi dans l’ensemble des données extraites par l’annotateur.
Le rappel et la précision sont calculés à partir de ces
trois dernières colonnes.
Des droites de régression ont
été tracées pour faciliter la lecture des graphiques en
donnant une tendance. Il ne s’agit ni de la vérification
d’une hypothèse statistique, ni d’une tentative
d’extrapolation.