Co to jest baza danych genomu?
Genom to zbiór wszystkich materiałów genetycznych obecnych w jednym organizmie. Ponieważ sekwencja i struktura tego materiału genetycznego napędza całe życie biologiczne, naukowcy są bardzo zainteresowani dowiedzeniem się, do czego służą. Baza danych genomów to zbiór informacji o jednym lub większej liczbie organizmów, więc jeden naukowiec może spojrzeć na wszystkie dostępne informacje genetyczne, aby pomóc mu w badaniach.
Genomy są bardzo złożone i zawierają miliardy zasad w sekwencji informacji. Skomputeryzowane bazy danych są zatem jedynym praktycznym sposobem organizowania szczegółów w jednym miejscu. Zasadniczo są one dostępne jako internetowe bazy danych do badań naukowych. Powstała stosunkowo nowa dziedzina nauki, zwana bioinformatyką, aby udoskonalić sposób interpretacji danych biologicznych za pomocą systemów komputerowych.
Bazy danych genomów zawierają sekwencję genów organizmu, jeśli cała sekwencja jest znana. W przeciwnym razie może zawierać częściowe sekwencje. Na przykład sekwencjonowano ludzkie, mysie i muchowe genomy Drosophila . Gdy znana jest sekwencja genomu, genetycy mogą zidentyfikować określone geny w genomie. Każdy gen jest instrukcją dla jednego konkretnego produktu komórkowego.
Jeśli gen ma mutację, ma inną sekwencję niż normalny, funkcjonalny gen. Mutacje mogą być korzystne i wytwarzać użyteczną cechę w zmutowanym organizmie. Mogą również nie mieć znaczenia dla produktu lub mogą być szkodliwe dla normalnego funkcjonowania organizmu. Na przykład wiele schorzeń jest spowodowanych mutacjami w określonym genie.
Mutacje można także wykorzystać do obliczenia, jak ściśle dany gatunek jest spokrewniony z innym gatunkiem, ponieważ wraz z upływem czasu gromadzi się więcej mutacji. Poszczególne osoby mogą również różnić się sekwencją genomu, zwłaszcza że duże części genomu nie są genami i nie kodują żadnego niezbędnego produktu komórkowego. Baza danych genomu zawiera sekwencję organizmu oznaczonego jako standard, ale będzie wiele drobnych różnic między arbitralnie wybranym standardem a innymi osobnikami w gatunku.
Pomimo obecności wielu różnic, geny są rozpoznawalne na podstawie sekwencji. Jeśli genetycy wiedzą, co konkretny gen robi w jednym organizmie, gen o podobnej sekwencji u innego zwierzęcia najprawdopodobniej pełni tę samą funkcję. Genetycy mogą korzystać z bazy danych genomu, aby zidentyfikować gen, który badają, lub dowiedzieć się, co robi gen.
Każdą bazę danych genomu można przeszukiwać. Zwykle naukowcy mogą przeszukiwać bazę danych na jeden z kilku różnych sposobów. Zwykle może on wprowadzić sekwencję genu, który zsekwencjonował. Następnie baza danych znajduje jedną lub więcej podobnych sekwencji do porównania.
Prostszy sposób przeszukiwania bazy danych polega na szukaniu słowa kluczowego genu, takiego jak nazwa genu. Władze, takie jak amerykański organ ds. Informacji biotechnologicznej (NCBI), mogą nadać sekwencjom różne numery referencyjne, a genetyk może również przeszukiwać bazę danych genomu przy użyciu jednego z tych identyfikatorów. Może on również zawęzić wyniki przy użyciu większej liczby parametrów wyszukiwania. Informacje odsyłające są cechą większości baz danych genomu, a wynik pojedynczej sekwencji zapewni również użytkownikowi bazy danych użyteczne łącza do uzyskania większej ilości informacji genetycznych. Oprócz informacji o konkretnej sekwencji, wiele baz danych zapewnia wizualną reprezentację sekwencji i znaczących cech tego obszaru.
Różne organizmy mogą mieć określone bazy danych genomu, ale niektóre większe bazy danych zawierają więcej niż jeden gatunek. Różne organy kontrolują różne dostępne bazy danych, więc bazy danych mogą korzystać z różnych formatów i możliwości wyszukiwania. Niektóre przykłady tych organów obejmują NCBI, Europejski Instytut Bioinformatyki, a nawet poszczególne uniwersytety.