Wat is genoomassemblage?
Genoomassemblage verwijst naar het proces waarbij veel kleine stukjes genetische sequentie worden genomen en samengevoegd tot een samenhangend geheel dat het hele genoom van een organisme vertegenwoordigt. Dit is een belangrijke focus van het bioinformatica-veld, en hiervoor bestaan verschillende genoomprojecten. Genome assemblage is gebruikt om te beginnen met het analyseren van de genomen van vele soorten, waaronder mensen, planten, dieren en bacteriën.
Het analyseren van de genen van een organisme is een lang proces en assemblage van genoom is een van de eerste stappen. Veel andere analysemethoden zijn gebaseerd op succesvolle assemblage, en identificatie van genen kan niet verder zonder. Zelfs voordat genen worden gevonden, kan een succesvolle genoomassemblage nog veel nuttige informatie genereren voor latere analyse, waaronder de grootte van het genoom, de structuur en de algemene samenstelling.
Het proces van genoomassemblage is als het samenstellen van een puzzel zonder een afbeelding of nuttige vormen als gids. Wanneer we worden geconfronteerd met de eerste genoomstukken, raw reads genoemd, zijn er zelden aanwijzingen waar een bepaald stuk naartoe gaat, of zelfs hoe het is georiënteerd. Elk stuk wordt op dezelfde manier gecodeerd met de vier DNA-basen, afgekort A, C, G en T. Het genoom kan worden samengeperst in één groot chromosoom of in vele worden gesplitst. Er is ook geen garantie dat sommige onbewerkte gegevens geen duplicaten van hetzelfde genoomgebied zijn, wat zou betekenen dat er minder unieke informatie bestaat dan deze op het eerste gezicht lijkt.
Algemene kennis van genoomstructuur is van onschatbare waarde bij het starten van het assemblageproces. Hoewel genomen van soorten aanzienlijk verschillen, zijn er bepaalde regels waaraan specifieke genoomtypen voldoen, en deze kunnen worden toegepast bij het samenstellen van een ander genoom van hetzelfde type. Als bijvoorbeeld een bepaald type organisme altijd een bepaald patroon in de buurt heeft waar genen worden gevonden, zou men redelijkerwijs kunnen aannemen dat bij het samenstellen van een ander organisme dat op dat soort lijkt, het vinden van een dergelijk patroon een gen in de buurt zou signaleren. Op grotere schaal hebben veel bacteriële genomen één circulair chromosoom, dus het zou redelijk zijn om te anticiperen dat alle ruwe aflezingen van een nieuwe bacterie op de een of andere manier op één chromosoom zouden passen. Door op deze manier algemene genetische kennis toe te passen, kan een onderzoeker mogelijk honderdduizenden gegevens gaan begrijpen.
Er zijn veel andere methoden die kunnen worden gebruikt bij genoomassemblage, waaronder rekenvoorspellingen en handmatige vergelijkingen. Ongeacht de methode is genoomassemblage een grote klus die vaak tijdrovend en moeilijk is. Omdat het de basis is voor veel toekomstige genetische analyses op een organisme, is er weinig ruimte voor fouten.