Qu'est-ce que l'Assemblée du génome?
L'assemblage du génome fait référence au processus consistant à prendre de nombreux petits morceaux de séquence génétique et à les fusionner en un tout cohérent qui représente le génome entier d'un organisme. Il s’agit d’un domaine prioritaire du domaine de la bioinformatique, et divers projets sur le génome ont été conçus à cette fin. L'assemblage du génome a été utilisé pour commencer à analyser les génomes de nombreuses espèces, y compris les humains, les plantes, les animaux et les bactéries.
L'analyse des gènes d'un organisme est un long processus et l'assemblage du génome est l'une des premières étapes. De nombreuses autres méthodes d'analyse reposent sur un assemblage réussi, et l'identification des gènes ne peut progresser sans elle. Même avant la découverte des gènes, un assemblage réussi du génome peut toujours générer de nombreuses informations utiles pour une analyse ultérieure, notamment la taille du génome, sa structure et sa composition générale.
Le processus d’assemblage du génome revient à assembler un puzzle sans avoir d’image ou de formes utiles comme guide. Lorsqu'ils sont confrontés aux premières pièces du génome, appelées lectures brutes, il y a rarement des indications sur la destination ou la direction d'une pièce en particulier. Chaque pièce est codée de manière similaire avec les quatre bases d'ADN, abrégées A, C, G et T. Le génome pourrait être compacté en un grand chromosome ou divisé en plusieurs. De plus, rien ne garantit que certaines des lectures brutes ne sont pas des doublons du même domaine du génome, ce qui signifierait qu'il existe moins d'informations uniques qu'il n'y paraît à première vue.
La connaissance générale de la structure du génome est inestimable lors du démarrage du processus d'assemblage. Bien que les génomes d’une espèce à l’autre soient très différents, il existe certaines règles que suivent certains types de génome, et celles-ci peuvent être appliquées lorsqu’on regroupe un autre génome de ce même type. Par exemple, si un certain type d'organisme a toujours un motif particulier à proximité où se trouvent des gènes, on peut raisonnablement supposer, lors de l'assemblage d'un autre organisme similaire, que la découverte d'un tel motif signalerait la présence d'un gène à proximité. À plus grande échelle, de nombreux génomes bactériens ont un chromosome circulaire. Il serait donc raisonnable de prévoir que toutes les lectures brutes d'une nouvelle bactérie s'emboiteraient d'une manière ou d'une autre sur un chromosome. L'application de connaissances génétiques générales de cette manière peut permettre à un chercheur de commencer à donner un sens à des centaines de milliers de données.
Il existe de nombreuses autres méthodes utilisables dans l'assemblage du génome, notamment les prédictions informatiques et les comparaisons manuelles. Quelle que soit la méthode employée, l'assemblage du génome est un travail volumineux qui prend souvent beaucoup de temps et est difficile. Comme il constitue la base de nombreuses analyses génétiques futures sur un organisme, il y a peu de marge d'erreur.