Che cos'è l'annotazione del genoma?
L'annotazione del genoma contrassegna le sezioni di un genoma con informazioni sui dati genetici in esso contenuti. Questo fa parte del processo dei progetti sul genoma, in cui l'obiettivo non è solo quello di sequenziare il DNA di un organismo bersaglio, ma di capire cosa fa e come funziona. I ricercatori possono condurre annotazioni nei loro laboratori e possono condividere dati con altri scienziati per mettere in comune risorse e informazioni. Sono disponibili database online aperti al pubblico e alcuni consentono anche ai membri del pubblico di inviare le proprie annotazioni.
Il primo passo nell'annotazione del genoma è il sequenziamento, in cui i ricercatori determinano l'ordine degli aminoacidi nel DNA di un organismo. Il sequenziamento di un intero genoma richiede molto tempo ed è normale che gli scienziati inizino ad annotare prima che il genoma sia stato decodificato. Con una sezione di DNA sequenziato in mano, un ricercatore può iniziare ad annotare. Gli scienziati possono notare dove i geni sembrano iniziare e arrestarsi, prestando attenzione alle stringhe distintive del DNA che contengono informazioni sulla funzione del genoma.
I computer sono in grado di eseguire da soli alcune annotazioni sul genoma. Possono cercare schemi noti, come stringhe di aminoacidi che compaiono all'inizio e alla fine dei geni. Nell'annotazione automatizzata, il computer può aggiungere note a diverse sezioni di una stringa di DNA per fornire informazioni al riguardo. È anche possibile confrontare segmenti di diversi organismi per cercare la varianza che potrebbe fornire informazioni importanti sulla specie nel suo insieme.
L'annotazione manuale del genoma comporta la revisione fisica del DNA. Molti ricercatori utilizzano i computer per visualizzare le informazioni e contrassegnarle, consentendo loro di inserirle nei database mentre lavorano. In alcuni casi, potrebbe essere necessaria una revisione manuale dopo l'annotazione automatica, per assicurarsi che il computer abbia ottenuto le informazioni corrette. Questo può essere un processo scrupoloso e si verificano errori, motivo per cui ai ricercatori piace mettere in comune i database. Se un'annotazione non corrisponde ad altri nella stessa sezione del DNA, le persone possono valutare le informazioni per determinare cosa è successo e correggere l'errore.
Non è sempre possibile determinare cosa fa un gene durante il processo di annotazione del genoma. Gli scienziati possono contrassegnare i geni e separarli da altri componenti del genoma, come il DNA non codificante come le ripetizioni. Queste informazioni possono essere utilizzate nella ricerca poiché le persone sviluppano teorie su diversi segmenti del genoma. Possono aggiungere alle annotazioni per notare la funzione di un gene.