Up Previous Next Title Page Index Contents

b. Les variantes prévues
Il existe quatre types de relation de transformation qui sont prise en charge par le système.
Le type le plus important de relation de transformation est le type première lettre en majuscule. Les définitions qui sont concernés sont listées dans le tableau 20.
Tableau 20 Transformation de type première lettre en majuscule
Le label 1 était présent dans les définitions Flybase du gène, mais pas le label 2. Le label 2 a été utilisé au moins une fois pour désigner le gène.
Label 1
Transformation
Label 2
Gène
achaete
1ière lettre en majuscule
Achaete
achaete (ac)
armadillo
1ière lettre en majuscule
Armadillo
armadillo (arm)
bicoid
1ière lettre en majuscule
Bicoid
bicoid (bcd)
cactus
1ière lettre en majuscule
Cactus
cactus (cact)
daughterless
1ière lettre en majuscule
Daughterless
daughterless (da)
dorsal
1ière lettre en majuscule
Dorsal
dorsal (dl)
hb
1ière lettre en majuscule
Hb
hunchback (hb)
hunchback
1ière lettre en majuscule
Hunchback
hunchback (hb)
nos
1ière lettre en majuscule
Nos
nanos (nos)
pelle
1ière lettre en majuscule
Pelle
pelle (pll)
runt
1ière lettre en majuscule
Runt
runt (run)
scute
1ière lettre en majuscule
Scute
scute (sc)
sevenless
1ière lettre en majuscule
Sevenless
sevenless (sev)
sry delta
1ière lettre en majuscule
Sry delta
Serendipity delta (Sry-delta)
torso
1ière lettre en majuscule
Torso
torso (tor)
trithorax
1ière lettre en majuscule
Trithorax
trithorax (trx)
tube
1ière lettre en majuscule
Tube
tube (tub)
wingless
1ière lettre en majuscule
Wingless
wingless (wg)
Vient ensuite le cas de relation de transformation de type tout en majuscule. Le tableau 21 donne les définitions concernées effectivement reconnues par l’annotateur dans l’échantillon A.
Tableau 21 Transformation de type tout en majuscule
Le label 1 était présent dans les définitions Flybase du gène, mais pas le label 2. Le label 2 a été interprété au moins une fois comme une manifestation du gène par l’annotateur.
Label 1
Transformation
Label 2
Gène
Antp
Tout en majuscules
ANTP
Antennapedia (Antp)
Psi
Tout en majuscules
PSI
P-element somatic inhibitor (Psi)
tra
Tout en majuscules
TRA
transformer (tra)
UBx
Tout en majuscules
UBX
Ultrabithorax (Ubx)
Ubx
Tout en majuscules
UBX
Ultrabithorax (Ubx)
antp
Tout en majuscules
ANTP
Antennapedia (Antp)
dpp
Tout en majuscules
DPP
decapentaplegic (dpp)
scw
Tout en majuscules
SCW
screw (scw)
tolloid
Tout en majuscules
TOLLOID
tolloid (tld)
ubx
Tout en majuscules
UBX
Ultrabithorax (Ubx)
Notons que le label transformé correspond souvent à la protéine synthétisée par le gène. C’est la raison pour laquelle nous avons choisi de définir par défaut le type de ces définitions à protéine.
Vient ensuite le cas de relation de transformation de type espace transformé en tiret. Le tableau 22 donne les définitions concernées effectivement reconnues par l’annotateur dans l’échantillon A.
Tableau 22 Transformation de type espace transformé en tiret
Le label 1 était présent dans les définitions Flybase du gène, mais pas le label 2. Le label 2 a été interprété au moins une fois comme une manifestation du gène par l’annotateur.
Label 1
transformation
Label 2
Gène
Abdominal B
espace -> tiret
Abdominal-B
Abdominal B (Abd-B)
Bicaudal D
espace -> tiret
Bicaudal-D
Bicaudal D (BicD)
Sex lethal
espace -> tiret
Sex-lethal
Sex lethal (Sxl)
abdominal A
espace -> tiret
abdominal-A
abdominal A (abd-A)
even skipped
espace -> tiret
even-skipped
even skipped (eve)
gooseberry distal
espace -> tiret
gooseberry-distal
gooseberry distal (gsb-d)
gooseberry proximal
espace -> tiret
gooseberry-proximal
gooseberry proximal (gsb-p)
Vient enfin le cas de relation de transformation de type tout en minuscule ou tiret transformé en espace. Le tableau 23 donne les définitions concernées effectivement reconnues par l’annotateur dans l’échantillon A.
Tableau 23 Transformation de type tout en minuscule ou tiret transformé en espace
Le label 1 était présent dans les définitions Flybase du gène, mais pas le label 2. Le label 2 a été utilisé au moins une fois dans les textes annotés pour désigner le gène.
Label 1
transformation
Label 2
Gène
troponin-I
tiret -> espace
troponin I
wings up A (wupA)
Sry-delta
tiret -> espace
Sry delta
Serendipity delta (Sry-delta)
Phosrestin-II
tiret -> espace
Phosrestin II
Arrestin A (Arr1)
Serendipity delta
Tout en minusc.
serendipity delta
Serendipity delta (Sry-delta)
Adducin-like
Tout en minusc.
adducin-like
hu li tai shao (hts)
Bien sûr, en générant automatiquement de nouvelles définitions, on peut créer de nouvelles difficultés. En effet le label transformé peut être ambigu, c’est à dire qu’il se confond avec un terme souvent présent dans les textes mais qui n’a rien à voir avec un quelconque gène. Nous verrons à la section Partie 2 Chapitre 1 I.F comment cette difficulté peut être résolue par l’utilisation du contexte.
Par ailleurs, il est important de noter que les exemples donnés dans les sections précédentes et en particulier dans la section 4 qui traite de l’ambiguïté des labels, n’ont rien à voir avec ces nouvelles définitions. Autrement dit, les problèmes que nous avons illustrés précédemment n’ont pas été générés par l’introduction automatique de variantes sur les définitions. En effet, nous avons pris soin, dans ces exemples, de n’utiliser que des définitions, soit directement issues de Flybase, soit introduites manuellement par l’annotateur.
Pour évaluer l’importance relative de chaque type de relation de transformation nous proposons le tableau 24.
Tableau 24 Importance relative de chaque type de transformation
La colonne Effectif donne le nombre de reconnaissance faite par l’annotateur dans l’échantillon A.
Transformation
Effectif
1ière lettre en majuscule
65
Tout en majuscules
23
espace -> tiret
21
tiret -> espace
5
Tout en minuscules
4
c.

Up Previous Next Title Page Index Contents