Hva er en genomdatabase?

Et genom er en samling av alt arvestoffet som finnes i en organisme. Siden sekvensen og strukturen til dette genetiske materialet driver hele biologisk liv, er forskere veldig interessert i å finne ut hva de er alt for. En genomdatabase er en tverr referert samling av informasjon om en eller flere organismer, slik at en forsker kan se på all tilgjengelig genetisk informasjon for å hjelpe ham eller henne i forskningen.

Genene er svært sammensatte og inneholder milliarder av baser i informasjonssekvensen. Datastyrte databaser er derfor den eneste praktiske måten å organisere detaljene på ett sted. Generelt er disse tilgjengelige som online databaser for vitenskapelig forskning. Et relativt nytt vitenskapsfelt, kalt bioinformatikk, har dukket opp for å perfeksjonere måten biologiske data kan tolkes gjennom datasystemer.

Databaser over genom inneholder sekvensen for generene til en organisme hvis hele sekvensen er kjent. Ellers kan den inneholde delvise sekvenser. Menneskets, musen og Drosophila flugenomene er for eksempel blitt sekvensert. Når sekvensen til et genom er kjent, kan genetikere identifisere spesielle gener i genomet. Hvert gen er instruksjonsarket for ett bestemt celleprodukt.

Hvis et gen har en mutasjon, har det en annen sekvens enn det normale, funksjonelle genet. Mutasjoner kan være gunstige og gi en nyttig egenskap i den muterte organismen. De kan heller ikke gjøre noen forskjell for produktet, eller de kan være skadelige for den normale virkningen av organismen. Mange medisinske tilstander skyldes for eksempel mutasjoner i et bestemt gen.

Mutasjoner kan også brukes til å beregne hvor nær beslektet en bestemt art er til en annen, ettersom flere mutasjoner akkumuleres over tid. Enkeltpersoner kan også variere i genomsekvens, spesielt ettersom store deler av genomet ikke er gener og ikke koder for noe essensielt celleprodukt. En genomdatabase inneholder en sekvens fra en organisme som er utpekt som en standard, men det vil være mange mindre forskjeller mellom den vilkårlig valgte standarden og de andre individene i en art.

Til tross for tilstedeværelsen av mange forskjeller, er gener gjenkjennelige gjennom sekvenser. Hvis genetikere vet hva et bestemt gen gjør i en organisme, utfører sannsynligvis et gen med en lignende sekvens i et annet dyr den samme funksjonen. Genetikere kan bruke en genomdatabase enten for å identifisere et gen de studerer, eller for å finne ut hva genet gjør.

Hver genomdatabase er søkbar. Vanligvis kan forskere søke i en database på en av flere forskjellige måter. Vanligvis kan vedkommende legge inn sekvensen til et gen han eller hun har sekvensert. Deretter finner databasen en eller flere lignende sekvenser for sammenligning.

En enklere måte å søke i databasen innebærer å lete etter et gennøkkelord, for eksempel navnet på genet. Myndigheter som US National Authority for Biotechnology Information (NCBI) kan gi sekvenser distinkte referansenummer, og en genetiker kan også søke i en genomdatabase ved å bruke en av disse identifikatorene. Han eller hun kan også begrense resultatene ved å bruke flere søkeparametere. Krysshenvist informasjon er en funksjon i de fleste genomdatabaser, og et enkelt sekvensresultat vil også gi databasebrukeren nyttige koblinger for mer genetisk informasjon. I tillegg til informasjon om en spesifikk sekvens, gir mange databaser en visuell representasjon av sekvensen og de kjente funksjonene i dette området.

Ulike organismer kan ha spesifikke genomdatabaser, men noen større databaser inneholder mer enn én art. Ulike myndigheter kontrollerer de forskjellige databasene som er tilgjengelige, slik at databasene alle kan bruke forskjellige formater og søkefunksjoner. Noen eksempler på disse myndighetene inkluderer NCBI, European Bioinformatics Institute, eller til og med enkeltuniversiteter.

Hva er en genomdatabase?

Hjalp denne artikkelen deg?