Co to jest baza danych genomu?
Genom jest zbiorem wszystkich materiałów genetycznych obecnych w jednym organizmie. Gdy sekwencja i struktura tego materiału genetycznego napędzają całe życie biologiczne, naukowcy są bardzo zainteresowani ustaleniem, po co wszystkie są. Baza danych genomu to zbiór informacji o jednym lub większej liczbie organizmów, więc jeden naukowiec może spojrzeć na wszystkie dostępne informacje genetyczne, aby pomóc mu w badaniach.
Genomy są wysoce złożone i zawierają miliardy zasad w sekwencji informacji. Dlatego skomputeryzowane bazy danych są jedynym praktycznym sposobem uporządkowania szczegółów w jednym miejscu. Zasadniczo są one dostępne jako internetowe bazy danych do badań naukowych. Stosunkowo nowa dziedzina nauki, zwana bioinformatyką, pojawiła się w celu doskonalenia sposobu interpretacji danych biologicznych za pośrednictwem systemów komputerowych.
Bazy danych genomów zawierają sekwencję genów organizmu, jeśli cała sekwencja jest znana. W przeciwnym razie może zawierać PAsekwencje rtial. Na przykład zsekwencjonowano na przykład ludzkie, myszy i Drosophila . Gdy znana jest sekwencja genomu, genetycy mogą identyfikować określone geny w genomie. Każdy gen jest instrukcją dla jednego konkretnego produktu komórkowego.
Jeśli gen ma mutację, ma inną sekwencję niż normalny, funkcjonalny gen. Mutacje mogą być korzystne i tworzyć przydatną cechę w zmutowanym organizmie. Nie mogą również mieć znaczenia dla produktu lub mogą być szkodliwe dla normalnego działania organizmu. Na przykład wiele schorzeń jest spowodowane mutacjami w określonym genie.
Mutacjemożna również wykorzystać do obliczenia, jak ściśle powiązane jest konkretny gatunek z innym, ponieważ w czasie gromadzi się więcej mutacji. Osoby mogą również różnić się w sekwencji genomu, szczególnie ponieważ duże części genomu nie są genami i nie kodują flub dowolny niezbędny produkt komórkowy. Baza danych genomu zawiera sekwencję organizmu oznaczonego jako standard, ale będzie wiele niewielkich różnic między arbitralnie wybranym standardem i innymi osobami z gatunku.
Pomimo obecności wielu różnic geny są rozpoznawalne poprzez sekwencje. Jeśli genetycy wiedzą, co dany gen robi w jednym organizmie, gen z podobną sekwencją u innego zwierzęcia najprawdopodobniej wykonuje tę samą funkcję. Genetycy mogą użyć bazy danych genomu albo do zidentyfikowania genu, który badają, albo dowiedzieć się, co robi gen.
Każda baza danych genomu można wyszukiwać. Zazwyczaj naukowcy mogą przeszukiwać bazę danych jeden z kilku różnych sposobów. Zwykle może on wprowadzić sekwencję genu, który zsekwencjonował. Następnie baza danych znajduje jedną lub więcej podobnych sekwencji dla porównania.
Prostszy sposób wyszukiwania bazy danych polega na szukaniu słowa kluczowego genu, takiego jak nazwa genu. AUkłady, takie jak National Authority of Biotechnology Information (NCBI), mogą podawać sekwencje odrębne liczby referencyjne, a genetyk może również wyszukiwać bazę danych genomu przy użyciu jednego z tych identyfikatorów. On lub ona może również zawęzić wyniki przy użyciu większej liczby parametrów wyszukiwania. Informacje o odniesieniach są cechą większości baz danych genomu, a pojedynczy wynik sekwencji dostarczy również użytkownikowi bazy danych przydatnych linków do bardziej informacji genetycznych. Oprócz informacji o konkretnej sekwencji, wiele baz danych zapewnia wizualną reprezentację sekwencji i godnych uwagi cech tego obszaru.
Różne organizmy mogą mieć określone bazy danych genomu, ale niektóre większe bazy danych zawierają więcej niż jeden gatunek. Różne organy kontrolują różne dostępne bazy danych, dzięki czemu wszystkie bazy danych mogą korzystać z różnych formatów i możliwości wyszukiwania. Niektóre przykłady tych władz to NCBI, Europejski Instytut Bioinformatyki, a nawet indywidualne Universities.