Co je to genomová databáze?
Genom je kolekce veškerého genetického materiálu přítomného v jednom organismu. Protože posloupnost a struktura tohoto genetického materiálu řídí celý biologický život, vědci se velmi zajímají o to, k čemu jsou všichni. Databáze genomu je křížová sbírka informací o jednom nebo více organismech, takže jeden vědec se může podívat na všechny dostupné genetické informace, aby mu pomohl ve výzkumu.
Genomy jsou velmi složité a obsahují v posloupnosti informací miliardy bází. Počítačové databáze jsou tedy jediným praktickým způsobem uspořádání podrobností na jednom místě. Obecně jsou k dispozici jako online databáze pro vědecký výzkum. Poměrně nová oblast vědy, zvaná bioinformatika, se objevila, aby zdokonalila způsob, jakým lze biologická data interpretovat pomocí počítačových systémů.
Databáze genomů obsahují sekvenci genů organismu, je-li známa celá sekvence. Jinak může obsahovat částečné sekvence. Například lidské, myší a Drosophila mouchy genomů byly sekvenovány. Když je známa sekvence genomu, genetici mohou identifikovat konkrétní geny v genomu. Každý gen je instrukční list pro jeden konkrétní buněčný produkt.
Má-li gen mutaci, má jinou sekvenci než normální funkční gen. Mutace mohou být prospěšné a mohou produkovat užitečnou vlastnost mutovaného organismu. Mohou také nijak neovlivnit produkt, nebo mohou být škodlivé pro normální fungování organismu. Mnoho zdravotních stavů je například způsobeno mutacemi v určitém genu.
Mutace lze také použít k výpočtu, jak úzce souvisí určitý druh s jiným druhem, protože se v průběhu času hromadí více mutací. Jednotlivci se mohou také lišit v genomové sekvenci, zejména protože velké části genomu nejsou geny a nekódují žádný podstatný buněčný produkt. Databáze genomu obsahuje sekvenci z organismu, který je označen jako standard, ale mezi libovolně vybraným standardem a ostatními jedinci v druhu bude mnoho drobných rozdílů.
Přes přítomnost mnoha rozdílů jsou geny rozpoznatelné prostřednictvím sekvencí. Pokud genetici vědí, co konkrétní gen dělá v jednom organismu, pak gen s podobnou sekvencí u jiného zvířete s největší pravděpodobností plní stejnou funkci. Genetici mohou použít databázi genomu buď k identifikaci genu, který studují, nebo k nalezení toho, co gen dělá.
Každá databáze genomu je prohledávatelná. Vědci obvykle mohou prohledávat databázi jedním z několika různých způsobů. Obvykle může zadat sekvenci genu, který sekvenoval. Potom databáze najde jednu nebo více podobných sekvencí pro porovnání.
Zjednodušený způsob prohledávání databáze zahrnuje hledání klíčového slova genu, jako je název genu. Úřady, jako je americký národní úřad pro biotechnologické informace (NCBI), mohou dávat sekvencím různá referenční čísla a genetik může také prohledávat databázi genomu pomocí jednoho z těchto identifikátorů. Může také zúžit výsledky pomocí více parametrů vyhledávání. Křížové odkazy jsou rysem většiny genomových databází a výsledek jediné sekvence také poskytne uživateli databáze užitečné odkazy pro více genetických informací. Stejně jako informace o specifické sekvenci, mnoho databází poskytuje vizuální reprezentaci sekvence a významných rysů této oblasti.
Různé organismy mohou mít specifické databáze genomu, ale některé větší databáze obsahují více než jeden druh. Různé dostupné úřady řídí různé dostupné databáze, takže všechny databáze mohou používat odlišné formáty a možnosti vyhledávání. Mezi příklady těchto úřadů patří NCBI, Evropský institut bioinformatiky nebo dokonce jednotlivé univerzity.