게놈 데이터베이스 란 무엇입니까?
게놈은 한 유기체에 존재하는 모든 유전 물질의 모음입니다. 이 유전 물질의 순서와 구조가 모든 생물학적 생명체를 이끌 기 때문에 과학자들은 자신이 무엇을 원하는지 찾는 데 매우 관심이 있습니다. 게놈 데이터베이스는 하나 이상의 유기체에 대한 상호 참조 정보 모음이므로 한 과학자가 사용 가능한 모든 유전 정보를 조사하여 연구에 도움을 줄 수 있습니다.
게놈은 매우 복잡하며 정보 순서에 수십억 개의 염기를 포함합니다. 따라서 컴퓨터 화 된 데이터베이스는 세부 정보를 한 곳에서 구성하는 유일한 실용적인 방법입니다. 일반적으로 이들은 과학 연구를위한 온라인 데이터베이스로 제공됩니다. 생물 정보학 (bioinformatics )이라고하는 비교적 새로운 과학 분야는 컴퓨터 시스템을 통해 생물학적 데이터를 해석 할 수있는 방법을 완성하기 위해 생겨났다.
게놈의 데이터베이스는 전체 서열이 알려진 경우 유기체의 유전자 서열을 포함합니다. 그렇지 않으면 부분 시퀀스를 포함 할 수 있습니다. 예를 들어, 인간, 마우스 및 초파리 파리 게놈이 시퀀싱되었다. 게놈의 서열이 알려지면, 유전 학자들은 게놈에서 특정 유전자를 식별 할 수 있습니다. 각 유전자는 하나의 특정 세포 제품에 대한 지침서입니다.
유전자에 돌연변이가 있으면 정상 기능성 유전자와 다른 서열을 갖습니다. 돌연변이는 유리할 수 있고 돌연변이 된 유기체에서 유용한 특성을 생성 할 수있다. 그들은 또한 제품에 영향을 미치지 않거나 유기체의 정상적인 작동에 해를 끼칠 수 있습니다. 예를 들어, 많은 의학적 상태는 특정 유전자의 돌연변이 때문입니다.
돌연변이는 시간이 지남에 따라 더 많은 돌연변이가 축적됨에 따라 특정 종이 다른 종과 얼마나 밀접한 관련이 있는지 계산하는 데 사용될 수 있습니다. 또한 게놈의 많은 부분이 유전자가 아니고 필수 세포 산물을 코딩하지 않기 때문에 개체는 게놈 순서가 다양 할 수 있습니다. 게놈 데이터베이스는 표준으로 지정된 유기체의 서열을 보유하지만, 임의로 선택된 표준과 종의 다른 개체 간에는 약간의 차이가 있습니다.
많은 차이가 있음에도 불구하고, 유전자는 서열을 통해 인식 될 수있다. 유전 학자들이 한 유기체에서 특정 유전자의 역할을 알고 있다면, 다른 동물에서 비슷한 서열을 가진 유전자는 아마도 같은 기능을 수행 할 것입니다. 유전학자는 게놈 데이터베이스를 사용하여 연구중인 유전자를 식별하거나 유전자의 기능을 알아낼 수 있습니다.
각 게놈 데이터베이스를 검색 할 수 있습니다. 일반적으로 과학자들은 여러 가지 방법 중 하나를 사용하여 데이터베이스를 검색 할 수 있습니다. 일반적으로, 그 또는 그녀는 자신이 시퀀싱 한 유전자의 서열을 입력 할 수있다. 그런 다음 데이터베이스는 비교할 하나 이상의 유사한 시퀀스를 찾습니다.
데이터베이스를 검색하는 간단한 방법은 유전자 이름과 같은 유전자 키워드를 찾는 것입니다. 미국 생명 공학 정보국 (NCBI)과 같은 기관은 서열에 고유 한 참조 번호를 부여 할 수 있으며, 유전학자는이 식별자 중 하나를 사용하여 게놈 데이터베이스를 검색 할 수도 있습니다. 또한 더 많은 검색 매개 변수를 사용하여 결과 범위를 좁힐 수 있습니다. 상호 참조 정보는 대부분의 게놈 데이터베이스의 특징이며 단일 서열 결과는 데이터베이스 사용자에게 더 많은 유전 정보에 대한 유용한 링크를 제공합니다. 특정 시퀀스에 대한 정보뿐만 아니라 많은 데이터베이스는 시퀀스와 해당 영역의 주목할만한 기능을 시각적으로 표시합니다.
다른 유기체에는 특정 게놈 데이터베이스가있을 수 있지만 일부 더 큰 데이터베이스에는 둘 이상의 종이 포함되어 있습니다. 다양한 기관이 사용 가능한 다른 데이터베이스를 제어하므로 데이터베이스는 모두 고유 한 형식과 검색 기능을 사용할 수 있습니다. 이러한 기관의 예로는 NCBI, 유럽 생물 정보학 연구소 또는 개별 대학 등이 있습니다.