O que é um banco de dados genoma?
Um genoma é uma coleção de todo o material genético presente em um organismo. Como a sequência e a estrutura desse material genético impulsionam toda a vida biológica, os cientistas estão muito interessados em descobrir para que servem. Um banco de dados de genoma é uma coleção de informações cruzadas sobre um ou mais organismos, para que um cientista possa examinar toda a informação genética disponível para ajudá-lo na pesquisa.
Os genomas são altamente complexos e contêm bilhões de bases na sequência de informações. Bancos de dados computadorizados, portanto, são a única maneira prática de organizar os detalhes em um único local. Geralmente, eles estão disponíveis como bancos de dados on-line para pesquisa científica. Um campo da ciência relativamente novo, chamado bioinformática, surgiu para aperfeiçoar a maneira como os dados biológicos podem ser interpretados através de sistemas de computador.
Bancos de dados de genomas contêm a sequência dos genes de um organismo, se toda a sequência for conhecida. Caso contrário, ele pode conter seqüências parciais. Os genomas de humanos, camundongos e moscas de Drosophila foram sequenciados, por exemplo. Quando a sequência de um genoma é conhecida, os geneticistas podem identificar genes específicos no genoma. Cada gene é a folha de instruções para um produto celular específico.
Se um gene tem uma mutação, ele tem uma sequência diferente do gene funcional normal. As mutações podem ser benéficas e produzir uma característica útil no organismo mutado. Eles também não podem fazer diferença para o produto ou podem prejudicar o funcionamento normal do organismo. Muitas condições médicas, por exemplo, são causadas por mutações em um gene específico.
As mutações também podem ser usadas para calcular quão intimamente relacionada uma espécie específica está com outra, à medida que mais mutações se acumulam ao longo do tempo. Os indivíduos também podem variar na sequência do genoma, especialmente porque grandes partes do genoma não são genes e não codificam nenhum produto celular essencial. Um banco de dados de genoma mantém uma sequência de um organismo designado como padrão, mas haverá muitas pequenas diferenças entre o padrão escolhido arbitrariamente e os outros indivíduos de uma espécie.
Apesar da presença de muitas diferenças, os genes são reconhecíveis através de sequências. Se os geneticistas sabem o que um determinado gene faz em um organismo, um gene com uma sequência semelhante em outro animal provavelmente desempenha a mesma função. Os geneticistas podem usar um banco de dados de genoma para identificar um gene que estão estudando ou para descobrir o que o gene faz.
Cada banco de dados do genoma é pesquisável. Geralmente, os cientistas podem pesquisar em um banco de dados de uma de várias maneiras diferentes. Geralmente, ele ou ela pode inserir a sequência de um gene que ele ou ela sequenciou. Em seguida, o banco de dados encontra uma ou mais seqüências semelhantes para comparação.
Uma maneira mais simples de pesquisar no banco de dados envolve procurar uma palavra-chave do gene, como o nome do gene. Autoridades como a Autoridade Nacional dos EUA para Informações sobre Biotecnologia (NCBI) podem fornecer seqüências de números de referência distintos, e um geneticista também pode pesquisar um banco de dados de genoma usando um desses identificadores. Ele também pode restringir os resultados usando mais parâmetros de pesquisa. Informações com referência cruzada são um recurso da maioria dos bancos de dados genômicos, e um único resultado de sequência também fornecerá ao usuário do banco de dados links úteis para obter mais informações genéticas. Além de informações sobre uma sequência específica, muitos bancos de dados fornecem uma representação visual da sequência e dos recursos notáveis dessa área.
Organismos diferentes podem ter bancos de dados genômicos específicos, mas alguns bancos de dados maiores contêm mais de uma espécie. Várias autoridades controlam os diferentes bancos de dados disponíveis, para que todos possam usar formatos e recursos de pesquisa distintos. Alguns exemplos dessas autoridades incluem o NCBI, o Instituto Europeu de Bioinformática ou até universidades individuais.