B. Le
projet génome
Depuis la découverte de l’importance des
molécules d’ADN dans le stockage de l’information
génétique, les biologistes ont formé le projet d’en
connaître la séquence complète. Des actions de
séquençages du génome complet de plusieurs organismes ont
vu le jours. Le plus grand chantier, en terme de moyen mis en œuvre, est
celui qui concerne l’homme ; c’est ce que l’on a
appelé le projet génome.
Actuellement, plus de
trente-cinq génomes bactériens sont séquencés. On
compte aussi cinq génomes d’organismes plus évolués
(des eucaryotes), à savoir, la levure
Sacharomyces cerevisæ, le ver
Cænorhabditi elegans, la mouche Drosophila
melanogaster, la
plante Arabidopsis thaliana et enfin
l’Homme. Ce dernier n’est encore qu’un « premier
jet » mais renferme déjà une quantité
considérable d’informations nouvelles (The genome sequencing
consortium, 2001).
Avec l’apparition de grandes quantités
d’informations numérisées disponibles, est apparue une
nouvelle discipline scientifique : la bioinformatique. Cette
discipline utilise des connaissances issues de la biologie, de
l’informatique, des mathématiques et notamment des statistiques.
Andrade
et Sander (1997) définissent la bioinformatique comme un nouveau domaine
de recherche qui, à partir de données biologiques et par
l’utilisation de méthodes informatiques, permet de créer des
connaissances nouvelles dans le domaine de la biologie
elle-même.
Quand il s’agit d’exploiter des
informations sur le génome on parle alors de
génomique. Ce terme a été inventé par
Thomas H.
Roderick et al. en 1986 lors d’une
discussion sur le nom d’un nouveau journal. Ce journal, Genomics,
avait pour objet les données de séquences, la découverte de
nouveau gènes, la cartographie génétique et plus
généralement les nouvelles techniques en génétique.
Ces études de génétique se consacrent au génome pris
comme un tout, contrairement par exemple à l’analyse d’un ou
de quelques gènes impliqués dans tel ou tel mécanisme
biologique.
Au départ, la génomique s’est
consacrée principalement à l’analyse des données de
séquences. La détermination dans le génome des
séquences codantes, à savoir celles qui correspondent à des
gènes ou à des séquences régulatrices, est un
problème classique de la génomique.
Elle s’oriente désormais vers
l’étude de la fonction des gènes. Le terme de
génomique fonctionnelle a été formé
pour désigner cette nouvelle tendance
(Hieter
et al., 1997).
La relation entre la séquence et la fonction
est une chose très complexe. Il est difficile de prévoir la forme
d’une protéine à partir de sa seule séquence en
acides aminés. Or la structure spatiale est essentielle dans la
détermination de la fonction de la molécule. Ainsi, même
quand on se place dans le schéma simplifié qui affirme que
l’on peut lire la protéine dans la séquence
génétique, on voit que l’on ne peut pas prévoir la
fonction d’un gène à partir de l’étude de sa
seule séquence. C’est une des gageures de la bioinformatique que de
parvenir à comprendre le passage entre séquence
génétique et structure protéique pour enfin accéder
à la fonction (Attwood et al., 2000).