Qu'est-ce qu'une base de données sur le génome?
Un génome est une collection de tout le matériel génétique présent dans un organisme. Étant donné que la séquence et la structure de ce matériel génétique déterminent toute la vie biologique, les scientifiques sont très intéressés de savoir à quoi ils servent. Une base de données sur le génome est une collection d’informations croisées sur un ou plusieurs organismes. Un scientifique peut ainsi consulter toutes les informations génétiques disponibles pour l’aider dans ses recherches.
Les génomes sont extrêmement complexes et contiennent des milliards de bases dans la séquence d'informations. Les bases de données informatisées constituent donc le seul moyen pratique d’organiser les détails en un seul endroit. Généralement, ces bases de données sont disponibles en ligne pour la recherche scientifique. Un domaine scientifique relativement nouveau, appelé bioinformatique, a vu le jour afin de perfectionner la manière dont les données biologiques peuvent être interprétées par le biais de systèmes informatiques.
Les bases de données de génomes contiennent la séquence des gènes d'un organisme si la séquence entière est connue. Sinon, il peut contenir des séquences partielles. Les génomes de l'homme, de la souris et de la drosophile ont été séquencés, par exemple. Lorsque la séquence d'un génome est connue, les généticiens peuvent identifier des gènes particuliers dans le génome. Chaque gène est la fiche d'instructions d'un produit cellulaire particulier.
Si un gène a une mutation, sa séquence est différente de celle du gène normal, fonctionnel. Les mutations peuvent être bénéfiques et produire une caractéristique utile dans l'organisme muté. Ils peuvent également ne faire aucune différence avec le produit, ou ils peuvent nuire au fonctionnement normal de l'organisme. De nombreuses conditions médicales, par exemple, sont dues à des mutations dans un gène particulier.
Les mutations peuvent également être utilisées pour calculer à quel point une espèce particulière est liée à une autre, à mesure que de plus en plus de mutations s'accumulent au fil du temps. La séquence du génome peut également varier en fonction des individus, d’autant plus que de grandes parties du génome ne sont pas des gènes et ne codent aucun produit cellulaire essentiel. Une base de données sur le génome contient une séquence d'un organisme désigné comme standard, mais il y aura de nombreuses différences mineures entre le standard choisi arbitrairement et les autres individus d'une espèce.
Malgré la présence de nombreuses différences, les gènes sont reconnaissables par des séquences. Si les généticiens savent ce que fait un gène particulier dans un organisme, un gène de séquence similaire chez un autre animal remplira probablement la même fonction. Les généticiens peuvent utiliser une base de données sur le génome pour identifier un gène qu'ils étudient ou pour savoir ce qu'il fait.
Chaque base de données du génome est interrogeable. Habituellement, les scientifiques peuvent rechercher dans une base de données de plusieurs manières. Généralement, il peut saisir la séquence d'un gène qu'il a séquencé. Ensuite, la base de données trouve une ou plusieurs séquences similaires à comparer.
Une manière plus simple de rechercher dans la base de données consiste à rechercher un mot clé de gène, tel que le nom du gène. Des autorités telles que l'autorité nationale américaine d'information sur la biotechnologie (NCBI) peuvent attribuer à des séquences des numéros de référence distincts, et un généticien peut également effectuer des recherches dans une base de données du génome à l'aide de l'un de ces identificateurs. Il peut également affiner les résultats en utilisant davantage de paramètres de recherche. Les informations croisées sont une caractéristique de la plupart des bases de données génomiques, et un résultat de séquence unique fournira également à l'utilisateur de la base de données des liens utiles pour davantage d'informations génétiques. En plus des informations sur une séquence spécifique, de nombreuses bases de données fournissent une représentation visuelle de la séquence et des caractéristiques remarquables de cette zone.
Différents organismes peuvent avoir des bases de données sur le génome spécifiques, mais certaines grandes bases de données contiennent plus d'une espèce. Diverses autorités contrôlent les différentes bases de données disponibles, de sorte qu'elles peuvent toutes utiliser des formats et des capacités de recherche distincts. Parmi les exemples de ces autorités, citons le NCBI, l’Institut européen de bioinformatique et même des universités individuelles.