a. Structure de
données pour les gènes ou objets
assimilés
- La table des gènes ou objets
assimilés
Les gènes
ainsi que les objets qui peuvent leurs être assimilés sont contenus
dans la table gènes et assimilés (GA) dont un
enregistrement est présenté dans le tableau 43.
Tableau 43 Table des
gènes ou objets assimilés
Le tableau donne un exemple d’enregistrement de
la table.
Champ
|
Contenu
|
Clef Gène
|
13
|
Objet
|
abdominal A (abd-A)
|
Symbole
|
abd-A
|
N° Flybase
|
14
|
Classe
|
Gène
|
Validation
|
Actif
|
Problème
|
|
Provenance
|
Flybase
|
Référant
|
abdominal A (abd-A)
|
Date
|
21/04/00 17:10:05
|
Le numéro du gène dans la base de
données Flybase est conservé mais ne constitue pas la clef
primaire. En effet, lors de l’introduction de nouveaux enregistrements, on
ne peut pas garantir facilement que l’on n’utilise pas des
numéros identiques à ceux que Flybase utilise pour ajouter
de son coté, de nouveaux enregistrements.
Le champ légendé objet permet de
donner un nom convivial à l’enregistrement. Au départ il est
créé à partir du nom complet et du symbole du
gène, mais il est librement modifiable par la suite.
Le champ symbole est une redite par rapport
à l’information qui se trouve dans la table des définitions
de gènes, mais sa présence est néanmoins utile car elle
évite de faire référence sans cesse à cette table,
ce qui aurait pour conséquence de ralentir l’affichage des
formulaires de consultation de la base de données. Il est rempli au
départ à partir des informations contenues dans la table des
définitions.
La classe permet de gérer les rubriques
du dictionnaire. Cette structure permet de traiter de la même façon
des objets qui ne sont pas des gènes mais qui jouent le même
rôle dans notre base de données.
Le champ référant permet de
faire référence au gène père dans la relation
d’allélisme. Un gène qui n’est l’allèle
d’aucun autre gène fera référence à
lui-même, comme c’est le cas dans l’exemple
présenté dans le tableau 43.
Le champ validation permet d’invalider
des enregistrements sans les supprimer de façon à permettre la
mise à jour des données avec la base de données
Flybase qui est la source des données. Seuls quelques
enregistrements ont été invalidés car ils formaient des
doublons.
- Les tables annexes à la table des
gènes
- Structure de données pour les rubriques du
dictionnaire
Le dictionnaire est
organisé en plusieurs rubriques selon la classe de l’objet
considéré. La table Entité Biologique (EB)
fait l’inventaire de toutes les modalités du champ
classe.
Le tableau 44 donne le contenu de cette table dans
son exhaustivité.
Tableau 44 Table des entités
biologiques
Les modalités du champ classe sont
données dans cette table.
Clef
|
Classe
|
1
|
Gène
|
2
|
Famille de protéines
|
3
|
Complexe de protéines
|
4
|
Complexe de gènes
|
5
|
Termes spécifiques
|
6
|
Famille
|
7
|
Allèle
|
9
|
Gène mammifères
|
- Structure de données pour la gestion de la
provenance du gène
Les
gènes ou objets assimilés sont pour la plupart issus de
Flybase mais un petit nombre d’entre eux ont été
introduits manuellement lors de l’annotation. La table Provenance des
Gènes ou objets Assimilés (PGA) dont le contenu est
donné dans le tableau 45 est prévue
à cet effet.
Tableau 45 Table Provenances des
gènes
La table est donnée ici dans son
intégralité.
Clef
|
Origine Gène
|
1
|
Flybase
|
2
|
Ajout
|
- Structure de données pour la gestion de la
filiation
Les nouvelles
entités biologiques que sont les complexes de gènes, les complexes
de protéines ou les familles de protéines sont liées aux
gènes déjà présents par une relation
d’appartenance. L’ensemble de ces liens est contenu dans la table
dite de filiation. Le tableau 46 donne un
extrait de cette table. Cette table est intitulée FGA pour
Filiation Gène ou Assimilé.
Tableau 46 Table des
filiations
La table complète compte 57 lignes. Nous en
présentons ici un extrait.
Clef Filiation
|
Objet fils
|
Objet père
|
Classe du père
|
4
|
abdominal A (abd-A)
|
bithorax complex (BXC)
|
Complexe de gènes
|
5
|
Abdominal B (Abd-B)
|
bithorax complex (BXC)
|
Complexe de gènes
|
6
|
Ultrabithorax (Ubx)
|
bithorax complex (BXC)
|
Complexe de gènes
|
95
|
sloppy paired 2 (slp2)
|
Sloppy paired (slp)
|
Complexe de gènes
|
94
|
sloppy paired 1 (slp1)
|
Sloppy paired (slp)
|
Complexe de gènes
|
133
|
Antennapedia (Antp)
|
Antennapedia complex (ANT-C)
|
Complexe de gènes
|
143
|
Polycomb (Pc)
|
Polycomb group (Pc-G)
|
Complexe de protéines
|
2
|
Actin 42A (Act42A)
|
Actin
|
Famille de protéines
|
20
|
Actin 88F (Act88F)
|
Actin
|
Famille de protéines
|
19
|
Actin 87E (Act87E)
|
Actin
|
Famille de protéines
|
18
|
Actin 79B (Act79B)
|
Actin
|
Famille de protéines
|
17
|
Actin 57B (Act57B)
|
Actin
|
Famille de protéines
|
1
|
Actin 5C (Act5C)
|
Actin
|
Famille de protéines
|
b.