c. Mise en forme
relationnelle
Les données importées ont
été retraitées pour se conformer au schéma
relationnel de la base. En effet, après l’import, les
données sont présentes dans une table unique. Ainsi des
informations hétérogènes se retrouvent mêlées
dans une structure unique. Par exemple, une table fraîchement
importée va pouvoir donner simultanément des informations sur les
gènes comme le numéro Flybase de chaque gène, et des
informations sur des définitions de gènes. Pourtant ces deux
informations doivent être placées dans des tables distinctes
d’après le schéma relationnel de la base tel que nous
l’avons défini. Un travail de structuration des données est
nécessaire pour mettre les données en conformité avec la
structure que nous avons choisie.
Le fichier qui sert à l’import est dit
plat. Cela signifie que dans ce fichier, les données
hétérogènes, que sont labels, gènes,
définitions etc., ne sont pas nettement séparées. A
l’opposé, dans un fichier de base de données relationnelle,
les données hétérogènes sont clairement
séparées car elles sont placées dans des tables
distinctes.
La mise en forme relationnelle
consiste à aller extraire de la table importée les informations
qui doivent être placées dans les différentes tables. Ceci
est réalisé par une succession de requêtes. Cette
opération n’a été faite qu’une seule fois. Nous
n’avons donc pas créé de procédure pour automatiser
cette tâche comme cela a été fait pour
l’identification des gènes.