Cos'è l'assemblea del genoma?
L'assemblea del genoma si riferisce al processo di assunzione di molti piccoli pezzi di sequenza genetica e fondendoli in un insieme coerente che rappresenta l'intero genoma di un organismo. Questo è uno dei principali obiettivi del campo bioinformatico e a tale scopo esistono una varietà di progetti di genoma. L'assemblaggio del genoma è stato usato per iniziare ad analizzare i genomi di molte specie, tra cui esseri umani, piante, animali e batteri.
L'analisi dei geni di un organismo è un lungo processo e l'assemblaggio del genoma è uno dei primi passi. Molti altri metodi di analisi sono basati su un assemblaggio di successo e l'identificazione dei geni non può progredire senza di essa. Anche prima che vengano trovati geni, un assemblaggio del genoma di successo può ancora generare molte informazioni utili per l'analisi successiva, tra cui la dimensione del genoma, la sua struttura e la sua composizione generale.
Il processo di assemblaggio del genoma è come mettere insieme un puzzle senza avere un'immagine o una forma utile come guida. Di fronte ai FIRST pezzi del genoma, chiamati letture grezze, raramente ci sono indicazioni in cui va un pezzo particolare o anche come è orientato. Ogni pezzo è codificato in modo simile con le quattro basi di DNA, abbreviate A, C, G e T. Il genoma potrebbe essere compatto in un grande cromosoma o diviso in molti. Non vi è inoltre alcuna garanzia che alcune delle letture grezze non siano duplicati della stessa area del genoma, il che significherebbe che esistono informazioni meno uniche di quanto appaia a prima vista.
La conoscenza generale della struttura del genoma è preziosa quando si avvia il processo di assemblaggio. Sebbene i genomi tra le specie siano notevolmente diversi, ci sono alcune regole che seguono specifici tipi di genoma e questi possono essere applicati quando si mettono insieme un altro genoma di quello stesso tipo. Ad esempio, se un certo tipo di organismo ha sempre un modello particolare nelle vicinanze in cui si trovano i geni, si potrebbe ragionevolmente supporre, quando si riunisceUn altro organismo simile ad esso, che trovare un simile modello segnalerebbe un gene nelle vicinanze. Su larga scala, molti genomi batterici hanno un cromosoma circolare, quindi sarebbe ragionevole anticipare che tutte le letture grezze di un nuovo batterio si adatterebbero in qualche modo su un cromosoma. L'applicazione della conoscenza genetica generale in questo modo può consentire a un ricercatore di iniziare a dare un senso a centinaia di migliaia di dati.
Esistono molti altri metodi che possono essere utilizzati nell'assemblaggio del genoma, tra cui previsioni computazionali e confronti manuali. Indipendentemente dal metodo, l'assemblaggio del genoma è un grande lavoro che spesso richiede tempo e difficile. Poiché è la base per molte future analisi genetiche su un organismo, c'è poco spazio per l'errore.