¿Qué es una base de datos del genoma?
Un genoma es una colección de todo el material genético presente en un organismo. Como la secuencia y estructura de este material genético impulsa toda la vida biológica, los científicos están muy interesados en descubrir para qué sirven. Una base de datos del genoma es una recopilación de información con referencias cruzadas sobre uno o más organismos, por lo que un científico puede ver toda la información genética disponible para ayudarlo en la investigación.
Los genomas son altamente complejos y contienen miles de millones de bases en la secuencia de información. Las bases de datos computarizadas, por lo tanto, son la única forma práctica de organizar los detalles en un solo lugar. En general, estos están disponibles como bases de datos en línea para la investigación científica. Ha surgido un campo relativamente nuevo de la ciencia, llamado bioinformática, para perfeccionar la forma en que los datos biológicos se pueden interpretar a través de los sistemas informáticos.
Las bases de datos de genomas contienen la secuencia de los genes de un organismo si se conoce la secuencia completa. De lo contrario, puede contener secuencias parciales. Se han secuenciado, por ejemplo, los genomas de la mosca humana, del ratón y de Drosophila . Cuando se conoce la secuencia de un genoma, los genetistas pueden identificar genes particulares en el genoma. Cada gen es la hoja de instrucciones para un producto celular particular.
Si un gen tiene una mutación, tiene una secuencia diferente al gen funcional normal. Las mutaciones pueden ser beneficiosas y producir una característica útil en el organismo mutado. Tampoco pueden hacer ninguna diferencia en el producto, o pueden ser perjudiciales para el funcionamiento normal del organismo. Muchas condiciones médicas, por ejemplo, se deben a mutaciones en un gen particular.
Las mutaciones también se pueden usar para calcular cuán estrechamente relacionada está una especie particular con otra, a medida que se acumulan más mutaciones con el tiempo. Los individuos también pueden variar en la secuencia del genoma, especialmente porque grandes partes del genoma no son genes y no codifican ningún producto celular esencial. Una base de datos del genoma contiene una secuencia de un organismo que se designa como un estándar, pero habrá muchas diferencias menores entre el estándar elegido arbitrariamente y los otros individuos de una especie.
A pesar de la presencia de muchas diferencias, los genes son reconocibles a través de secuencias. Si los genetistas saben lo que hace un gen en particular en un organismo, entonces un gen con una secuencia similar en otro animal probablemente realiza la misma función. Los genetistas pueden utilizar una base de datos del genoma para identificar un gen que están estudiando o para averiguar qué hace el gen.
Cada base de datos del genoma se puede buscar. Por lo general, los científicos pueden buscar en una base de datos de varias maneras diferentes. Comúnmente, él o ella pueden ingresar la secuencia de un gen que él o ella ha secuenciado. Luego, la base de datos encuentra una o más secuencias similares para comparar.
Una forma más simple de buscar en la base de datos implica buscar una palabra clave del gen, como el nombre del gen. Autoridades como la Autoridad Nacional de Información Biotecnológica de los Estados Unidos (NCBI) pueden dar secuencias con números de referencia distintos, y un genetista también puede buscar en una base de datos del genoma utilizando uno de estos identificadores. Él o ella también pueden reducir los resultados utilizando más parámetros de búsqueda. La información con referencias cruzadas es una característica de la mayoría de las bases de datos del genoma, y un resultado de secuencia única también proporcionará al usuario de la base de datos enlaces útiles para obtener más información genética. Además de la información sobre una secuencia específica, muchas bases de datos proporcionan una representación visual de la secuencia y de las características notables de esa área.
Diferentes organismos pueden tener bases de datos genómicas específicas, pero algunas bases de datos más grandes contienen más de una especie. Varias autoridades controlan las diferentes bases de datos disponibles, por lo que todas las bases de datos pueden usar formatos distintos y capacidades de búsqueda. Algunos ejemplos de estas autoridades incluyen el NCBI, el Instituto Europeo de Bioinformática o incluso universidades individuales.