Skip to main content

Что такое сборка генома?

Сборка генома относится к процессу взятия множества маленьких кусочков генетической последовательности и объединения их в единое целое, представляющее весь геном организма. Это основное направление в области биоинформатики, и для этой цели существует множество проектов генома. Сборка генома была использована для начала анализа геномов многих видов, включая людей, растения, животных и бактерии.

Анализ генов организма - длительный процесс, и сборка генома - один из первых шагов. Многие другие методы анализа построены на успешной сборке, и идентификация генов не может развиваться без нее. Даже до того, как гены будут найдены, успешная сборка генома может все еще генерировать много полезной информации для последующего анализа, включая размер генома, его структуру и его общий состав.

Процесс сборки генома подобен составлению мозаики без изображения или полезных фигур в качестве руководства. Когда мы сталкиваемся с первыми фрагментами генома, называемыми необработанными чтениями, редко бывают какие-либо указания на то, куда направляется конкретная часть или даже как она ориентирована. Каждый фрагмент кодируется аналогично четырем основам ДНК, сокращенно A, C, G и T. Геном может быть сжат в одну большую хромосому или разбит на множество. Также нет гарантии, что некоторые необработанные чтения не являются дубликатами одной и той же области генома, что будет означать, что существует меньше уникальной информации, чем кажется на первый взгляд.

Общие знания о структуре генома неоценимы при запуске процесса сборки. Хотя геномы между видами заметно различаются, существуют определенные правила, которым следуют определенные типы геномов, и они могут применяться при объединении другого генома того же типа. Например, если у определенного типа организмов всегда есть определенный образец поблизости, где находятся гены, можно разумно предположить, собирая другой организм, подобный ему, что обнаружение такого образца будет сигнализировать ген поблизости. В более широком масштабе многие бактериальные геномы имеют одну круговую хромосому, поэтому было бы разумно ожидать, что все исходные данные о новых бактериях каким-то образом будут совпадать на одной хромосоме. Применение общих генетических знаний таким способом может позволить исследователю разобраться в потенциально сотнях тысяч фрагментов данных.

Существует много других методов, которые можно использовать при сборке генома, включая компьютерные прогнозы и ручные сравнения. Независимо от метода, сборка генома - большая работа, которая часто отнимает много времени и трудна. Так как это основа для многих будущих генетических анализов организма, здесь мало места для ошибок.