ゲノムデータベースとは?
ゲノムは、1つの生物に存在するすべての遺伝物質のコレクションです。 この遺伝物質の配列と構造が生物学的生命のすべてを推進するので、科学者は彼らが何のためにあるのかを見つけることに非常に興味を持っています。 ゲノムデータベースは、1つまたは複数の生物に関する情報の相互参照コレクションであるため、1人の科学者は利用可能なすべての遺伝情報を調べて、研究に役立てることができます。
ゲノムは非常に複雑で、一連の情報の中に数十億の塩基が含まれています。 したがって、コンピュータ化されたデータベースは、1か所で詳細を整理する唯一の実用的な方法です。 一般的に、これらは科学研究用のオンラインデータベースとして利用できます。 バイオインフォマティクスと呼ばれる比較的新しい科学分野が誕生し、コンピューターシステムを介した生物学的データの解釈方法が完璧になりました。
ゲノムのデータベースには、配列全体がわかっている場合、生物の遺伝子の配列が含まれています。 それ以外の場合、部分シーケンスを含めることができます。 例えば、ヒト、マウス、 ショウジョウバエのゲノムは配列決定されています。 ゲノムの配列がわかっている場合、遺伝学者はゲノム内の特定の遺伝子を特定できます。 各遺伝子は、特定の細胞製品の取扱説明書です。
遺伝子に変異がある場合、正常な機能遺伝子とは異なる配列を持っています。 変異は有益であり、変異した生物に有用な特性をもたらします。 また、製品に影響を与えたり、生物の通常の働きに悪影響を与える可能性があります。 たとえば、多くの病状は特定の遺伝子の変異によるものです。
突然変異は、時間の経過とともにより多くの突然変異が蓄積するため、特定の種が他の種とどれだけ密接に関連しているかを計算するためにも使用できます。 ゲノムの大部分は遺伝子ではなく、重要な細胞産物をコードしていないため、ゲノム配列も個人によって異なります。 ゲノムデータベースには、標準として指定された生物の配列が保持されますが、任意に選択された標準と種内の他の個体の間には多くの小さな違いがあります。
多くの違いがありますが、遺伝子は配列を通して認識できます。 遺伝学者が特定の遺伝子が1つの生物で何をしているのかを知っている場合、別の動物で同様の配列を持つ遺伝子はおそらく同じ機能を果たします。 遺伝学者はゲノムデータベースを使用して、研究している遺伝子を特定するか、遺伝子が何をするかを知ることができます。
各ゲノムデータベースは検索可能です。 通常、科学者はいくつかの異なる方法のいずれかでデータベースを検索できます。 通常、彼または彼女は、配列決定した遺伝子の配列を入力できます。 次に、データベースは比較のために1つ以上の類似したシーケンスを見つけます。
データベースを検索するより簡単な方法は、遺伝子の名前などの遺伝子キーワードを探すことです。 米国バイオテクノロジー情報局(NCBI)などの当局は、配列に異なる参照番号を付けることができ、遺伝学者はこれらの識別子のいずれかを使用してゲノムデータベースを検索することもできます。 また、より多くの検索パラメーターを使用して結果を絞り込むこともできます。 相互参照された情報は、ほとんどのゲノムデータベースの機能であり、単一のシーケンス結果は、データベースユーザーに、より多くの遺伝情報の有用なリンクを提供します。 特定のシーケンスに関する情報だけでなく、多くのデータベースは、シーケンスとその領域の注目すべき特徴の視覚的表現を提供します。
異なる生物は特定のゲノムデータベースを持つことができますが、いくつかのより大きなデータベースには複数の種が含まれています。 さまざまな機関が利用可能なさまざまなデータベースを制御しているため、データベースはすべて異なる形式と検索機能を使用できます。 これらの当局の例には、NCBI、欧州バイオインフォマティクス研究所、さらには個々の大学が含まれます。