게놈 어셈블리 란?
게놈 조립은 많은 작은 유전자 서열을 가지고 유기체의 전체 게놈을 나타내는 일관된 전체로 병합하는 과정을 말합니다. 이것은 생물 정보학 분야의 주요 초점이며,이를 위해 다양한 게놈 프로젝트가 존재합니다. 게놈 어셈블리는 인간, 식물, 동물 및 박테리아를 포함한 많은 종의 게놈 분석을 시작하는 데 사용되었습니다.
유기체의 유전자를 분석하는 것은 긴 과정이며, 게놈 조립은 첫 번째 단계 중 하나입니다. 다른 많은 분석 방법은 성공적인 조립을 기반으로하며 유전자 없이는 유전자를 식별 할 수 없습니다. 유전자가 발견되기 전에도 성공적인 게놈 어셈블리는 게놈의 크기, 구조 및 일반적인 구성을 포함하여 나중에 분석하기 위해 많은 유용한 정보를 생성 할 수 있습니다.
게놈 조립 과정은 그림이나 유용한 모양을 가지지 않고 직소 퍼즐을 맞추는 것과 같습니다. 원시 판독이라고하는 첫 번째 게놈 조각에 직면 할 때 특정 조각이 어디로 향하고 있는지, 심지어 방향을 나타내는 표시는 거의 없습니다. 모든 조각은 4 개의 DNA 염기 (A, C, G, T로 약칭)와 유사하게 코딩됩니다. 게놈은 하나의 큰 염색체로 압축되거나 다수로 분할 될 수 있습니다. 또한 원시 판독 중 일부가 동일한 게놈 영역의 복제본이 아니라는 보장이 없습니다. 이는 언뜻보기에 나타나는 것보다 덜 독특한 정보가 존재한다는 것을 의미합니다.
조립 과정을 시작할 때 게놈 구조에 대한 일반적인 지식은 매우 중요합니다. 종들 사이의 게놈은 현저히 다르지만 특정 게놈 유형이 따르는 특정 규칙이 있으며, 동일한 유형의 다른 게놈을 조합 할 때 적용 할 수 있습니다. 예를 들어, 특정 유형의 유기체가 항상 유전자가 발견되는 근처에 특정 패턴을 가지고 있다면, 다른 유기체를 조립할 때 그러한 패턴을 찾는 것이 근처에 유전자를 신호한다고 합리적으로 가정 할 수 있습니다. 더 큰 규모로, 많은 박테리아 게놈에는 하나의 원형 염색체가 있으므로, 새로운 박테리아의 모든 원시 판독 값이 어떻게 든 하나의 염색체에 맞춰질 것으로 예상하는 것이 합리적입니다. 이런 방식으로 일반적인 유전 지식을 적용하면 연구원은 잠재적으로 수십만 개의 데이터를 이해할 수 있습니다.
전산 예측 및 수동 비교를 포함하여 게놈 어셈블리에 사용할 수있는 다른 많은 방법이 있습니다. 방법에 상관없이 게놈 조립은 시간이 많이 걸리고 어려운 큰 일입니다. 그것은 유기체에 대한 많은 미래의 유전자 분석의 기초이기 때문에 오류의 여지가 거의 없습니다.