Up Previous Next Title Page Index Contents

c. Quelques principes sur la structuration des données
  1. Les garanties d’intégrité des données
Le gestionnaire de base de données peut prendre en charge l’intégrité des donnés, c’est à dire leurs cohérences. Il suffit pour cela d’édicter des règles d’intégrité des données. Le gestionnaire de base de données va alors empêcher toute opération qui aboutirait à une violation de ces règles. Voyons maintenant quelle sont les principales règles.
  1. Garantir la présence des enregistrements cités dans une table
Quand une table fait référence à des enregistrements d’une autre table, il est important que les enregistrements cités existent bel et bien. Cette règle s’appelle l’intégrité relationnelle. Cette règle est mise en danger quand on supprime un enregistrement. Pour la garantir, le système peut prendre l’initiative de supprimer en cascade les enregistrements qui font référence à l’enregistrement en question. C’est une règle que nous avons adoptée systématiquement sauf dans le cas où cela pourrait être dangereux pour un utilisateur non averti. En particulier nous ne l’avons pas fait pour les liens vers des « petites » tables qui ne font en fait que donner les quelques modalités, une douzaine au plus, qui sont possibles pour la valeur d’un champ.
  1. Garantir l’absence de doublons dans les enregistrements
Les doublons sont en général proscrits dans les bases de données relationnelles. Un doublon est un enregistrement en double dans une table. Dans certains cas, on ne considère que certains champs pour juger de la présence de doublons. Pour garantir l’absence de doublons dans une table, des index sont posés sur un ou plusieurs champs de la table. Un index est une structure interne au système de gestion de base de données qui donne pour chaque valeur du champ ou des couples de champs qui définissent l’index, un accès direct aux enregistrements qui utilisent cette valeur. Pour garantir l’absence de doublons, on pose comme condition que l’index doit être sans doublons. L’absence de doublons dans un champ est mise en péril par l’ajout d’enregistrements. Le système, pour maintenir l’intégrité des données, va donc ignorer les tentatives d’ajouts d’enregistrements qui aboutiraient à la création de doublons.
  1. Structure des données pour permettre les mises à jour.
Les données contenues dans la base de données sont pour l’essentiel issues d’autres bases de données, à savoir Medline et Flybase. Elles ont été importées par des processus automatiques. La base est conçue pour pouvoir permettre des "imports" successifs. Il est important de faire en sorte que les données dont nous avons décidé, pour une raison ou pour une autre, de ne pas tenir compte, ne soient pas purement et simplement supprimées. En effet, si tel était le cas, ces données risqueraient d’être réintroduites par erreur dans la base lors de la prochaine mise à jour de la base de données. Il est impératif de garder une trace des données que nous avons souhaité de mettre "hors jeu", la suppression n’étant pas une solution acceptable.
Pour permettre la mise à jour, nous avons introduit à chaque fois que nécessaire, des champs de d’activation ou d’inactivation. Par défaut, tous les enregistrements sont actifs. Les enregistrements indésirables sont inactivés grâce à ce champ.

Up Previous Next Title Page Index Contents