¿Qué es el ensamblaje del genoma?
El ensamblaje del genoma se refiere al proceso de tomar muchas piezas pequeñas de secuencia genética y fusionarlas en un todo coherente que representa el genoma completo de un organismo. Este es un enfoque principal del campo de la bioinformática, y existe una variedad de proyectos genómicos para este propósito. El ensamblaje del genoma se ha utilizado para comenzar a analizar los genomas de muchas especies, incluidos los humanos, las plantas, los animales y las bacterias.
Analizar los genes de un organismo es un proceso largo, y el ensamblaje del genoma es uno de los primeros pasos. Muchos otros métodos de análisis se basan en un ensamblaje exitoso, y la identificación de genes no puede progresar sin él. Incluso antes de que se encuentren los genes, un ensamblaje genómico exitoso puede generar mucha información útil para un análisis posterior, incluido el tamaño del genoma, su estructura y su composición general.
El proceso de ensamblaje del genoma es como armar un rompecabezas sin tener una imagen o formas útiles como guía. Cuando se confronta con las primeras piezas del genoma, llamadas lecturas crudas, rara vez hay indicaciones de dónde va una pieza en particular, o incluso cómo está orientada. Cada pieza está codificada de manera similar con las cuatro bases de ADN, abreviadas A, C, G y T. El genoma podría compactarse en un gran cromosoma o dividirse en muchos. Tampoco hay garantía de que algunas de las lecturas sin procesar no sean duplicados de la misma área del genoma, lo que significaría que existe menos información única de lo que parece a primera vista.
El conocimiento general de la estructura del genoma es invaluable al comenzar el proceso de ensamblaje. Aunque los genomas entre especies son marcadamente diferentes, existen ciertas reglas que siguen los tipos de genomas específicos, y estos se pueden aplicar al juntar otro genoma del mismo tipo. Por ejemplo, si un determinado tipo de organismo siempre tiene un patrón particular cerca de donde se encuentran los genes, se podría suponer razonablemente, al ensamblar otro organismo similar, que encontrar dicho patrón indicaría un gen cercano. A mayor escala, muchos genomas bacterianos tienen un cromosoma circular, por lo que sería razonable anticipar que todas las lecturas crudas de una nueva bacteria encajarían de alguna manera en un cromosoma. Aplicar el conocimiento genético general de esta manera puede permitirle a un investigador comenzar a entender potencialmente cientos de miles de datos.
Hay muchos otros métodos que se pueden usar en el ensamblaje del genoma, incluidas las predicciones computacionales y las comparaciones manuales. No importa el método, el ensamblaje del genoma es un trabajo grande que a menudo lleva mucho tiempo y es difícil. Dado que es la base para muchos análisis genéticos futuros en un organismo, hay poco margen de error.