Vad är en genomdatabas?
Ett genom är en samling av allt genetiskt material som finns i en organisme. Eftersom sekvensen och strukturen för detta genetiska material driver hela det biologiska livet, är forskare mycket intresserade av att ta reda på vad de är alla för. En genomdatabas är en korshänvisad samling av information om en eller flera organismer, så en forskare kan titta på all tillgänglig genetisk information för att hjälpa honom eller henne i forskning.
Generna är mycket komplexa och innehåller miljarder baser i informationssekvensen. Datoriserade databaser är därför det enda praktiska sättet att organisera detaljerna på ett ställe. I allmänhet finns dessa tillgängliga som onlinedatabaser för vetenskaplig forskning. Ett relativt nytt vetenskapsområde, kallad bioinformatik, har dykt upp för att perfektionera hur biologisk data kan tolkas genom datorsystem.
Databaser över genom innehåller sekvensen för generna hos en organisme om hela sekvensen är känd. Annars kan den innehålla partiella sekvenser. Mänskliga, mus- och Drosophila- flugenomen har till exempel sekvenserats. När sekvensen för ett genom är känt kan genetiker identifiera specifika gener i genomet. Varje gen är instruktionsarket för en specifik cellprodukt.
Om en gen har en mutation har den en annan sekvens än den normala, funktionella genen. Mutationer kan vara fördelaktiga och ge en användbar egenskap i den muterade organismen. De kan inte göra någon skillnad för produkten, eller de kan vara skadliga för den normala funktionen hos organismen. Många medicinska tillstånd beror till exempel på mutationer i en viss gen.
Mutationer kan också användas för att beräkna hur nära besläktad en viss art är till en annan, eftersom fler mutationer samlas över tiden. Individer kan också variera i genomsekvens, särskilt eftersom stora delar av genomet inte är gener och inte kodar för någon väsentlig cellprodukt. En genomdatabas innehåller en sekvens från en organism som utses till en standard, men det kommer att finnas många mindre skillnader mellan den godtyckligt valda standarden och de andra individerna i en art.
Trots förekomsten av många skillnader kan gener kännas igenom genom sekvenser. Om genetiker vet vad en viss gen gör i en organisme, har en gen med en liknande sekvens i ett annat djur troligen samma funktion. Genetiker kan använda en genomdatabas antingen för att identifiera en gen som de studerar eller för att ta reda på vad genen gör.
Varje genomdatabas är sökbar. Vanligtvis kan forskare söka i en databas på flera olika sätt. Vanligtvis kan han eller hon mata in sekvensen för en gen som han eller hon har sekvenserat. Sedan hittar databasen en eller flera liknande sekvenser för jämförelse.
Ett enklare sätt att söka i databasen innebär att leta efter ett gennyckelord, till exempel namnet på genen. Myndigheter som US National Authority for Biotechnology Information (NCBI) kan ge sekvenser distinkta referensnummer, och en genetiker kan också söka i en genomdatabas med hjälp av en av dessa identifierare. Han eller hon kan också begränsa resultaten med fler sökparametrar. Korsreferensinformation är en funktion i de flesta genomdatabaser, och ett resultat med en enstaka sekvens ger också databasanvändaren användbara länkar för mer genetisk information. Förutom information om en specifik sekvens ger många databaser en visuell representation av sekvensen och de anmärkningsvärda funktionerna i det området.
Olika organismer kan ha specifika genomdatabaser, men vissa större databaser innehåller mer än en art. Olika myndigheter kontrollerar de olika tillgängliga databaserna, så alla databaser kan använda olika format och sökfunktioner. Några exempel på dessa myndigheter inkluderar NCBI, European Bioinformatics Institute eller till och med enskilda universitet.