ชุดจีโนมคืออะไร?

การประกอบจีโนมหมายถึงกระบวนการของการเรียงลำดับทางพันธุกรรมขนาดเล็กจำนวนมากและรวมเข้าด้วยกันเป็นส่วนที่สอดคล้องกันซึ่งแสดงถึงจีโนมทั้งหมดของสิ่งมีชีวิต นี่เป็นจุดสนใจหลักของเขตข้อมูลชีวสารสนเทศศาสตร์และมีโครงการจีโนมที่หลากหลายเพื่อจุดประสงค์นี้ การประกอบจีโนมถูกใช้เพื่อเริ่มการวิเคราะห์จีโนมของสปีชีส์หลายชนิดรวมถึงมนุษย์พืชสัตว์และแบคทีเรีย

การวิเคราะห์ยีนของสิ่งมีชีวิตเป็นกระบวนการที่ยาวนานและการประกอบจีโนมเป็นหนึ่งในขั้นตอนแรก วิธีการวิเคราะห์อื่น ๆ อีกมากมายถูกสร้างขึ้นจากการชุมนุมที่ประสบความสำเร็จและการระบุยีนไม่สามารถดำเนินการได้หากไม่มีมัน ก่อนที่จะพบว่ายีนที่ประสบความสำเร็จนั้นสามารถสร้างข้อมูลจำนวนมากที่เป็นประโยชน์สำหรับการวิเคราะห์ในภายหลังรวมถึงขนาดของจีโนมโครงสร้างและองค์ประกอบทั่วไป

กระบวนการของการประกอบจีโนมก็เหมือนกับการนำตัวต่อจิ๊กซอว์มารวมกันโดยไม่ต้องมีรูปภาพหรือรูปร่างที่มีประโยชน์เป็นแนวทาง เมื่อเผชิญหน้ากับจีโนมชิ้นแรกที่เรียกว่าการอ่านแบบดิบนั้นแทบจะไม่มีข้อบ่งชี้ว่าชิ้นส่วนใดที่จะไป ทุกชิ้นมีรหัสคล้ายกันกับฐานดีเอ็นเอสี่ตัวย่อ A, C, G และ T จีโนมสามารถอัดเป็นโครโมโซมขนาดใหญ่หนึ่งหรือแบ่งออกเป็นหลาย ๆ นอกจากนี้ยังไม่มีการรับประกันว่าการอ่านแบบดิบบางส่วนจะไม่ซ้ำกับพื้นที่จีโนมเดียวกันซึ่งหมายความว่ามีข้อมูลที่ไม่ซ้ำกันน้อยกว่าที่ปรากฏในแวบแรก

ความรู้ทั่วไปเกี่ยวกับโครงสร้างจีโนมมีค่ามากเมื่อเริ่มกระบวนการประกอบ แม้ว่าจีโนมระหว่างสปีชีส์จะแตกต่างกันอย่างเห็นได้ชัด แต่ก็มีกฎบางอย่างที่จีโนมชนิดเฉพาะติดตามและสามารถนำไปใช้เมื่อใส่จีโนมชนิดเดียวกันอีกชนิดเข้าด้วยกัน ตัวอย่างเช่นถ้าสิ่งมีชีวิตบางประเภทมักมีรูปแบบเฉพาะใกล้เคียงที่พบยีนใคร ๆ ก็พอจะสันนิษฐานได้ว่าเมื่อประกอบสิ่งมีชีวิตอื่น ๆ ที่คล้ายกันกับมัน จีโนมของแบคทีเรียจำนวนมากมีโครโมโซมวงกลมหนึ่งอันดังนั้นจึงมีเหตุผลที่จะคาดการณ์ว่าการอ่านดิบของแบคทีเรียใหม่ทั้งหมดจะเข้ากันได้กับโครโมโซมเดียว การใช้ความรู้ทางพันธุกรรมทั่วไปด้วยวิธีนี้จะช่วยให้นักวิจัยเริ่มทำความเข้าใจกับข้อมูลที่มีศักยภาพหลายแสนชิ้น

มีวิธีการอื่น ๆ อีกมากมายที่สามารถใช้ในการชุมนุมจีโนมรวมถึงการทำนายการคำนวณและการเปรียบเทียบด้วยตนเอง ไม่ว่าจะใช้วิธีการใดการประกอบจีโนมเป็นงานที่ใหญ่ซึ่งใช้เวลานานและยาก เนื่องจากเป็นพื้นฐานสำหรับการวิเคราะห์ทางพันธุกรรมในอนาคตเกี่ยวกับสิ่งมีชีวิตจึงมีช่องว่างเล็กน้อยสำหรับความผิดพลาด