c. Quelques principes sur
la structuration des données
- Les garanties d’intégrité des
données
Le gestionnaire de
base de données peut prendre en charge l’intégrité
des donnés, c’est à dire leurs cohérences. Il suffit
pour cela d’édicter des règles
d’intégrité des données. Le gestionnaire de base de
données va alors empêcher toute opération qui aboutirait
à une violation de ces règles. Voyons maintenant quelle sont les
principales règles.
- Garantir la présence des enregistrements
cités dans une table
Quand
une table fait référence à des enregistrements d’une
autre table, il est important que les enregistrements cités existent bel
et bien. Cette règle s’appelle
l’intégrité relationnelle. Cette règle
est mise en danger quand on supprime un enregistrement. Pour la garantir, le
système peut prendre l’initiative de supprimer en cascade les
enregistrements qui font référence à l’enregistrement
en question. C’est une règle que nous avons adoptée
systématiquement sauf dans le cas où cela pourrait être
dangereux pour un utilisateur non averti. En particulier nous ne l’avons
pas fait pour les liens vers des « petites » tables qui ne
font en fait que donner les quelques modalités, une douzaine au plus, qui
sont possibles pour la valeur d’un champ.
- Garantir l’absence de
doublons dans les
enregistrements
Les doublons sont
en général proscrits dans les bases de données
relationnelles. Un doublon est un enregistrement en double dans
une table. Dans certains cas, on ne considère que certains champs pour
juger de la présence de doublons. Pour garantir l’absence de
doublons dans une table, des index sont posés sur un ou plusieurs champs
de la table. Un index est une structure interne au système de gestion de
base de données qui donne pour chaque valeur du champ ou des couples de
champs qui définissent l’index, un accès direct aux
enregistrements qui utilisent cette valeur. Pour garantir l’absence de
doublons, on pose comme condition que l’index doit être sans
doublons. L’absence de doublons dans un champ est mise en péril par
l’ajout d’enregistrements. Le système, pour maintenir
l’intégrité des données, va donc ignorer les
tentatives d’ajouts d’enregistrements qui aboutiraient à la
création de doublons.
- Structure des données
pour permettre les mises à
jour.
Les données contenues
dans la base de données sont pour l’essentiel issues d’autres
bases de données, à savoir Medline et Flybase. Elles
ont été importées par des processus automatiques. La base
est conçue pour pouvoir permettre des "imports" successifs. Il est
important de faire en sorte que les données dont nous avons
décidé, pour une raison ou pour une autre, de ne pas tenir compte,
ne soient pas purement et simplement supprimées. En effet, si tel
était le cas, ces données risqueraient d’être
réintroduites par erreur dans la base lors de la prochaine mise à
jour de la base de données. Il est impératif de garder une trace
des données que nous avons souhaité de mettre "hors jeu", la
suppression n’étant pas une solution acceptable.
Pour permettre la mise à jour, nous avons
introduit à chaque fois que nécessaire, des champs de
d’activation ou d’inactivation. Par défaut, tous les
enregistrements sont actifs. Les enregistrements indésirables sont
inactivés grâce à ce champ.