2. Calcul de
l’IVI par la somme des
spécificités
Une variante pour calculer l’IVI
consiste à faire la somme à la place de la moyenne des
spécificités, comme explicité ci-dessous.
Définition 4 Une variante pour la
définition de l’IVI
Cette formule a donné des résultats
moins bons, comme illustré dans le tableau
3, où l’on voit qu’à précision
égale, la méthode de la somme ne permet pas un aussi bon
rappel.
Tableau 3 Prise en compte de la
spécificité de chaque terme : somme ou
moyenne
Le tableau donne la performance de la méthode
d’extraction d’information. La performance est évaluée
en terme de précision et de rappel. Deux méthodes existent pour
prendre en compte la spécificité de chaque terme du texte pour
obtenir chiffre global pour le texte considéré. La première
consiste à faire la moyenne des spécificités, la seconde
consiste à faire la somme.
Méthode
|
Précision
|
Rappel
|
Moyenne
|
81%
|
87%
|
Somme
|
81%
|
62%
|
Par ailleurs, la méthode de la somme a
l’inconvénient de fournir un IVI qui n’est pas
borné. En effet, la spécificité est comprise entre 0 et
1 ; quand on fait la moyenne, la quantité reste comprise entre ces
deux bornes. En revanche si l’on fait la somme, on peut avoir des nombres
beaucoup plus grands. Cela trahit le fait que l’IVI calculé
par la méthode de la somme est une statistique, qui n’est pas
indépendante de la taille du texte. En effet, si le texte est long, il
comptera en moyenne plus de termes spécifiques que si le texte est court.
Dans ce cas, l’IVI risque d’être plus grand. Cette
non-indépendance de l’IVI par rapport à la taille du
texte n’est pas pertinente car il n’y a pas lieu de penser que
les grandes phrases ont plus de chance de décrire une interaction. Nous
pensons que c’est la raison pour laquelle l’IVI
calculé par la méthode de la somme donne de moins bons
résultats.