Co to jest montaż genomu?
Składanie genomu odnosi się do procesu pobierania wielu małych fragmentów sekwencji genetycznej i łączenia ich w spójną całość, która reprezentuje cały genom organizmu. Jest to główny cel w dziedzinie bioinformatyki i do tego celu istnieje wiele projektów genomu. Zespół genomu został wykorzystany do rozpoczęcia analizy genomów wielu gatunków, w tym ludzi, roślin, zwierząt i bakterii.
Analiza genów organizmu jest długim procesem, a montaż genomu jest jednym z pierwszych kroków. Wiele innych metod analizy opiera się na udanym montażu, a identyfikacja genów nie może się bez nich rozwijać. Udane złożenie genomu jeszcze przed znalezieniem genów może wygenerować wiele użytecznych informacji do późniejszej analizy, w tym wielkość genomu, jego strukturę i ogólny skład.
Proces składania genomu jest jak układanie puzzli bez obrazka lub użytecznych kształtów jako przewodnika. W konfrontacji z pierwszymi fragmentami genomu, zwanymi surowymi odczytami, rzadko występują oznaki, gdzie idzie dany fragment, a nawet jak jest zorientowany. Każdy kawałek jest podobnie kodowany czterema zasadami DNA, w skrócie A, C, G i T. Genom może być zwarty w jeden duży chromosom lub podzielony na wiele. Nie ma również gwarancji, że niektóre surowe odczyty nie są duplikatami tego samego obszaru genomu, co oznaczałoby, że istnieje mniej unikalnych informacji, niż się wydaje na pierwszy rzut oka.
Ogólna wiedza na temat struktury genomu jest nieoceniona przy rozpoczynaniu procesu składania. Chociaż genomy między gatunkami są wyraźnie różne, istnieją pewne zasady, które przestrzegają określonych typów genomu, i można je zastosować, łącząc kolejny genom tego samego typu razem. Na przykład, jeśli pewien rodzaj organizmu zawsze ma określony wzorzec w pobliżu, w którym znajdują się geny, można rozsądnie założyć, składając inny podobny organizm, że znalezienie takiego wzorca sygnalizowałoby gen w pobliżu. Na większą skalę wiele genomów bakteryjnych ma jeden okrągły chromosom, więc uzasadnione byłoby przewidywanie, że wszystkie surowe odczyty nowej bakterii w jakiś sposób pasują do siebie na jednym chromosomie. Zastosowanie ogólnej wiedzy genetycznej w ten sposób może pozwolić badaczowi na zrozumienie potencjalnie setek tysięcy danych.
Istnieje wiele innych metod, które można zastosować w składaniu genomu, w tym przewidywania obliczeniowe i porównania ręczne. Bez względu na metodę, montaż genomu jest dużym zadaniem, które często jest czasochłonne i trudne. Ponieważ jest to podstawa wielu przyszłych analiz genetycznych na organizmie, nie ma miejsca na błędy.