Up Previous Next Title Page Index Contents

2. Calcul de l’IVI par la somme des spécificités
Une variante pour calculer l’IVI consiste à faire la somme à la place de la moyenne des spécificités, comme explicité ci-dessous.
Définition 4 Une variante pour la définition de l’IVI
PhD05.png
Cette formule a donné des résultats moins bons, comme illustré dans le tableau 3, où l’on voit qu’à précision égale, la méthode de la somme ne permet pas un aussi bon rappel.
Tableau 3 Prise en compte de la spécificité de chaque terme : somme ou moyenne
Le tableau donne la performance de la méthode d’extraction d’information. La performance est évaluée en terme de précision et de rappel. Deux méthodes existent pour prendre en compte la spécificité de chaque terme du texte pour obtenir chiffre global pour le texte considéré. La première consiste à faire la moyenne des spécificités, la seconde consiste à faire la somme.
Méthode
Précision
Rappel
Moyenne
81%
87%
Somme
81%
62%
Par ailleurs, la méthode de la somme a l’inconvénient de fournir un IVI qui n’est pas borné. En effet, la spécificité est comprise entre 0 et 1 ; quand on fait la moyenne, la quantité reste comprise entre ces deux bornes. En revanche si l’on fait la somme, on peut avoir des nombres beaucoup plus grands. Cela trahit le fait que l’IVI calculé par la méthode de la somme est une statistique, qui n’est pas indépendante de la taille du texte. En effet, si le texte est long, il comptera en moyenne plus de termes spécifiques que si le texte est court. Dans ce cas, l’IVI risque d’être plus grand. Cette non-indépendance de l’IVI par rapport à la taille du texte n’est pas pertinente car il n’y a pas lieu de penser que les grandes phrases ont plus de chance de décrire une interaction. Nous pensons que c’est la raison pour laquelle l’IVI calculé par la méthode de la somme donne de moins bons résultats.

Up Previous Next Title Page Index Contents