Hva er genomsamling?
Genomsamling refererer til prosessen med å ta mange små biter av genetisk sekvens og slå dem sammen til en sammenhengende helhet som representerer en organisms hele genom. Dette er et hovedfokus på bioinformatikkfeltet, og det finnes en rekke genomprosjekter for dette formålet. Genomforsamling har blitt brukt til å begynne å analysere genomene til mange arter, inkludert mennesker, planter, dyr og bakterier.
Å analysere en organisms gener er en lang prosess, og genommontering er et av de første trinnene. Mange andre analysemetoder er bygget på vellykket montering, og identifisering av gener kan ikke komme videre uten det. Selv før gener er funnet, kan en vellykket genommontering fremdeles generere mye nyttig informasjon for senere analyse, inkludert størrelsen på genomet, dens struktur og dens generelle sammensetning.
Prosessen med genommontering er som å sette et puslespill sammen uten å ha et bilde eller nyttige former som guide. Når du blir konfrontert med FIR -eneT genomstykker, kalt Raw Reads, det er sjelden noen indikasjoner på hvor et bestemt stykke går, eller til og med hvordan det er orientert. Hvert stykke er kodet på samme måte med de fire DNA -basene, forkortet A, C, G og T. Genomet kan komprimeres til ett stort kromosom eller delt i mange. Det er heller ingen garanti for at noen av råavlesningene ikke er duplikater av det samme genomområdet, noe som vil bety at mindre unik informasjon eksisterer enn den ser ut ved første øyekast.
Generell kunnskap om genomstruktur er uvurderlig når du starter monteringsprosessen. Selv om genomer mellom arter er markant forskjellige, er det visse regler som spesifikke genomtyper følger, og disse kan brukes når du setter et annet genom av den samme typen sammen. For eksempel, hvis en viss type organisme alltid har et bestemt mønster i nærheten der gener blir funnet, kan man med rimelighet anta, når man montererEn annen organisme som ligner på den, at å finne et slikt mønster ville signalisere et gen i nærheten. I større skala har mange bakteriegenomer ett sirkulært kromosom, så det ville være rimelig å forutse at alle rå lesninger av en ny bakterie på en eller annen måte ville passe sammen på ett kromosom. Å bruke generell genetisk kunnskap på denne måten kan tillate en forsker å begynne å gi mening om potensielt hundretusener av data.
Det er mange andre metoder som kan brukes i genomsamling, inkludert beregningspådommer og manuelle sammenligninger. Uansett metode er genommontering en stor jobb som ofte er tidkrevende og vanskelig. Siden det er grunnlaget for mange fremtidige genetiske analyser på en organisme, er det lite rom for feil.