C. La
post-génomique
Le grand projet de séquençage des
génomes n’apparaît que comme une étape dans la
compréhension des phénomènes biologiques. Le terme de
post-génomique a été formé pour
désigner cette évolution.
Kanehisa
et al. (2000), proposent d’employer le terme de génomique
(genome informatics) pour désigner l’utilisation de
l’informatique pour gérer les grandes quantités
d’informations issues de l’étude des génomes, alors
que la post-génomique (post genome informatics) aura pour but
d’arriver à comprendre les phénomènes biologiques
sous-jacents à partir de l’analyse informatique des données
issues de l’analyse des génomes.
Pour analyser la fonction des gènes à
l’échelle du génome, il faut être capable de
comprendre les relations complexes qu’entretiennent les mondes des
ADN, des ARN et des protéines. Ne
s’intéresser qu’au génome n’est pas suffisant.
Les concepts de protéome et de
transcriptome
ont été forgés à cet effet.
Wilkins a créé le terme de
protéome en 1994 et l’a défini comme le complément
protéique exprimé par le génome (Wasinger, 1995). De la
même façon, le transcriptome se défini comme
l’ensemble des transcrits à l’échelle du
génome.
La protéomique est
l’étude de l’ensemble des protéines exprimées
dans une cellule à un instant donné dans le but d’obtenir
une vision globale des processus cellulaires
(Rocha
et al., 2000). Il s’agit en particulier de savoir avec quel substrat
(ARN , ADN, autre protéine, autre molécule) les
protéines exprimées interagissent. La protéomique
est un domaine de recherche très actif, mais le but poursuivi est
ambitieux car les expériences sont difficiles à mettre en
œuvre.
La protéomique structurale se
définit comme l’étude de la forme des protéines.
Cependant, le terme de
génomique
structurale est aussi
employé. Comme nous l’avons déjà signalé, il
est difficile de prévoir la structure d’une protéine
à partir de la séquence des acides aminés qui la compose.
L’étude expérimentale de la structure des protéines
à l’échelle du génome est donc un travail
nécessaire mais très ambitieux
(Wilkins et al., 1996).
Pour mieux comprendre les relations entre
génome et transcriptome, des études expérimentales à
grande échelle sont entreprises pour produire des données
d’expressions. On cherche par ces expériences à
réunir de grandes quantités d’informations sur les
ARNm
transcrits. Ces informations reflètent directement
l’activité d’expression des gènes selon le tissu
observé, le stade du développement, l’état normal ou
pathologique des cellules, etc. La technologie des puces à
ADN est
utilisée (The chipping forecast, 1999). La ‘puce’ est
constituée d’un support sur lequel sont greffées plusieurs
milliers à plusieurs dizaines de milliers de sondes. Chaque sonde va
être capable de reconnaître spécifiquement une substance
telle qu’une séquence donnée
d’ARNm. Les puces
à ADN permettent donc de réaliser simultanément
plusieurs dizaines de milliers d’expériences simultanément
sur une toute petite surface. La logique est donc encore celle d’une
production en masse de données, comme pour le
séquençage.
Pour l’étude des interactions entre
protéines, il existe aussi des techniques de production de données
en masse. La méthode dite du double hybride
(Fields
et al. ,1989), l’électrophorèse bidimensionnelle
sur gel et la
spectrométrie de
masse peuvent par
exemple être utilisées. La méthode du double hybride est
utilisée à l’échelle du protéome pour la
levure.
La post génomique se donne pour
objectif d’intégrer toutes ces données quantitatives
d’expressions des gènes (Chee et al., 1996). Il s’agit
par exemple d’intégrer des données d’expression avec
des informations sur les voies métaboliques (Nakao et al., 1999),
le but étant principalement de prévoir la fonctions des
protéines (Gerstein et al., 2000).
Les informations de séquence, même si
elles ne suffisent pas, sont très utilisées pour déterminer
la fonction des gènes comme nous allons le voir dans la section
suivante.