Hvad er en genomdatabase?
Et genom er en samling af alt det genetiske materiale, der findes i en organisme. Da sekvensen og strukturen af dette genetiske materiale driver hele det biologiske liv, er forskere meget interesseret i at finde ud af, hvad de alle er til. En genomdatabase er en krydshenvist samling af oplysninger om en eller flere organismer, så en forsker kan se på alle tilgængelige genetiske oplysninger for at hjælpe ham eller hende i forskning.
Gener er meget komplekse og indeholder milliarder af baser i informationssekvensen. Computerstyrede databaser er derfor den eneste praktiske måde at organisere detaljerne ét sted på. Generelt er disse tilgængelige som online databaser til videnskabelig forskning. Et relativt nyt videnskabsområde, kaldet bioinformatik, er dukket op for at perfektionere den måde, biologiske data kan fortolkes gennem computersystemer.
Databaser over genomer indeholder sekvensen for generne af en organisme, hvis hele sekvensen er kendt. Ellers kan det indeholde delvise sekvenser. Humane, musen og Drosophila- fluegenomerne er for eksempel blevet sekventeret. Når sekvensen af et genom kendes, kan genetikere identificere bestemte gener i genomet. Hvert gen er instruktionsarket for et bestemt celleprodukt.
Hvis et gen har en mutation, har det en anden sekvens end det normale, funktionelle gen. Mutationer kan være fordelagtige og frembringe et nyttigt kendetegn i den muterede organisme. De kan heller ikke gøre nogen forskel for produktet, eller de kan være skadelige for den normale virkning af organismen. Mange medicinske tilstande skyldes for eksempel mutationer i et bestemt gen.
Mutationer kan også bruges til at beregne, hvor tæt beslægtet en bestemt art er med en anden, da flere mutationer ophobes over tid. Personer kan også variere i genomsekvens, især da store dele af genomet ikke er gener og ikke koder for noget essentielt celleprodukt. En genomdatabase indeholder en sekvens fra en organisme, der er udpeget som en standard, men der vil være mange mindre forskelle mellem den vilkårligt valgte standard og de andre individer i en art.
På trods af tilstedeværelsen af mange forskelle kan gener genkendes gennem sekvenser. Hvis genetikere ved, hvad et bestemt gen gør i en organisme, udfører et gen med en lignende sekvens i et andet dyr sandsynligvis den samme funktion. Genetikere kan bruge en genomdatabase enten til at identificere et gen, de studerer, eller for at finde ud af, hvad genet gør.
Hver genomdatabase kan søges. Normalt kan forskere søge i en database på flere forskellige måder. Almindeligvis kan han eller hun indtaste sekvensen for et gen, han eller hun har sekventeret. Derefter finder databasen en eller flere lignende sekvenser til sammenligning.
En enklere måde at søge i databasen indebærer at lede efter et gennøgleord, såsom navnet på genet. Myndigheder som US National Authority for Biotechnology Information (NCBI) kan give sekvenser forskellige referencenumre, og en genetiker kan også søge i en genomdatabase ved hjælp af en af disse identifikatorer. Han eller hun kan også indsnævre resultaterne ved hjælp af flere søgeparametre. Krydshenvist information er en funktion i de fleste genomdatabaser, og et enkelt sekvensresultat giver også databasebrugeren nyttige links til mere genetisk information. Ud over information om en bestemt sekvens giver mange databaser en visuel repræsentation af sekvensen og de bemærkelsesværdige funktioner i dette område.
Forskellige organismer kan have specifikke genomdatabaser, men nogle større databaser indeholder mere end en art. Forskellige myndigheder kontrollerer de forskellige tilgængelige databaser, så databaserne alle kan bruge forskellige formater og søgefunktioner. Nogle eksempler på disse myndigheder inkluderer NCBI, Det Europæiske Bioinformatikinstitut eller endda individuelle universiteter.