Up Previous Next Title Page Index Contents

C. La post-génomique

Le grand projet de séquençage des génomes n’apparaît que comme une étape dans la compréhension des phénomènes biologiques. Le terme de post-génomique a été formé pour désigner cette évolution. Kanehisa et al. (2000), proposent d’employer le terme de génomique (genome informatics) pour désigner l’utilisation de l’informatique pour gérer les grandes quantités d’informations issues de l’étude des génomes, alors que la post-génomique (post genome informatics) aura pour but d’arriver à comprendre les phénomènes biologiques sous-jacents à partir de l’analyse informatique des données issues de l’analyse des génomes.
Pour analyser la fonction des gènes à l’échelle du génome, il faut être capable de comprendre les relations complexes qu’entretiennent les mondes des ADN, des ARN et des protéines. Ne s’intéresser qu’au génome n’est pas suffisant. Les concepts de protéome et de transcriptome ont été forgés à cet effet. Wilkins a créé le terme de protéome en 1994 et l’a défini comme le complément protéique exprimé par le génome (Wasinger, 1995). De la même façon, le transcriptome se défini comme l’ensemble des transcrits à l’échelle du génome.
La protéomique est l’étude de l’ensemble des protéines exprimées dans une cellule à un instant donné dans le but d’obtenir une vision globale des processus cellulaires (Rocha et al., 2000). Il s’agit en particulier de savoir avec quel substrat (ARN , ADN, autre protéine, autre molécule) les protéines exprimées interagissent. La protéomique est un domaine de recherche très actif, mais le but poursuivi est ambitieux car les expériences sont difficiles à mettre en œuvre.
La protéomique structurale se définit comme l’étude de la forme des protéines. Cependant, le terme de génomique structurale est aussi employé. Comme nous l’avons déjà signalé, il est difficile de prévoir la structure d’une protéine à partir de la séquence des acides aminés qui la compose. L’étude expérimentale de la structure des protéines à l’échelle du génome est donc un travail nécessaire mais très ambitieux (Wilkins et al., 1996).
Pour mieux comprendre les relations entre génome et transcriptome, des études expérimentales à grande échelle sont entreprises pour produire des données d’expressions. On cherche par ces expériences à réunir de grandes quantités d’informations sur les ARNm transcrits. Ces informations reflètent directement l’activité d’expression des gènes selon le tissu observé, le stade du développement, l’état normal ou pathologique des cellules, etc. La technologie des puces à ADN est utilisée (The chipping forecast, 1999). La ‘puce’ est constituée d’un support sur lequel sont greffées plusieurs milliers à plusieurs dizaines de milliers de sondes. Chaque sonde va être capable de reconnaître spécifiquement une substance telle qu’une séquence donnée d’ARNm. Les puces à ADN permettent donc de réaliser simultanément plusieurs dizaines de milliers d’expériences simultanément sur une toute petite surface. La logique est donc encore celle d’une production en masse de données, comme pour le séquençage.
Pour l’étude des interactions entre protéines, il existe aussi des techniques de production de données en masse. La méthode dite du double hybride (Fields et al. ,1989), l’électrophorèse bidimensionnelle sur gel et la spectrométrie de masse peuvent par exemple être utilisées. La méthode du double hybride est utilisée à l’échelle du protéome pour la levure.
La post génomique se donne pour objectif d’intégrer toutes ces données quantitatives d’expressions des gènes (Chee et al., 1996). Il s’agit par exemple d’intégrer des données d’expression avec des informations sur les voies métaboliques (Nakao et al., 1999), le but étant principalement de prévoir la fonctions des protéines (Gerstein et al., 2000).
Les informations de séquence, même si elles ne suffisent pas, sont très utilisées pour déterminer la fonction des gènes comme nous allons le voir dans la section suivante.

Up Previous Next Title Page Index Contents