Skip to main content

การรวมข้อมูลคืออะไร?

การรวมข้อมูลเป็นการรวมแหล่งข้อมูลหลายแหล่งเข้ากับแหล่งข้อมูลเดียวการปฏิบัตินี้มักจะใช้เวลานานและมีส่วนร่วมมากเนื่องจากแหล่งข้อมูลที่แตกต่างกันมีแนวโน้มที่จะเข้ากันไม่ได้สิ่งที่ง่ายเหมือนชื่อคอลัมน์ที่แตกต่างกันในสเปรดชีตนั้นเพียงพอที่จะต้องมีการจัดรูปแบบวันที่ใหม่กระบวนการนี้พบได้บ่อยที่สุดในสถานการณ์ที่สองกลุ่มเริ่มต้นโดยไม่มีการเชื่อมต่อ แต่ถูกรวมเข้าด้วยกันหลังจากที่พวกเขาทำงานอย่างอิสระการรวมข้อมูลได้กลายเป็นหัวข้อที่สำคัญกว่าเนื่องจากความชุกของแหล่งข้อมูลฟรีและฐานข้อมูลออนไลน์

ส่วนข้อมูลของการรวมข้อมูลสามารถเกือบทุกอย่างตราบใดที่มันถูกเก็บไว้ในระบบคอมพิวเตอร์เนื้อหาจริงของข้อมูลไม่ค่อยมีความสำคัญเท่ากับวิธีการจัดเก็บข้อมูลส่วนใหญ่ข้อมูลจะถูกเก็บไว้ในฐานข้อมูลระบบการจัดระเบียบของข้อมูลระบบเหล่านี้มีรายการและฟิลด์ที่ไม่ซ้ำกันที่อนุญาตให้ผู้ใช้ค้นหาข้อมูลได้อย่างรวดเร็ว

อุปสรรค์ที่ใหญ่ที่สุดสำหรับกระบวนการรวมข้อมูลใด ๆ คือข้อมูลของตัวเองในหลายกรณีเมื่อมีการตั้งค่าข้อมูลครั้งแรกไม่มีความตั้งใจที่จะรวมชุดข้อมูลกับอีกชุดหนึ่งซึ่งหมายความว่าแม้ว่าชุดข้อมูลสองชุดอาจอ้างถึงสิ่งเดียวกัน แต่ก็ไม่เข้ากันโดยสิ้นเชิง

เกือบทุกอย่างจะทำให้ฐานข้อมูลเข้ากันไม่ได้สิ่งที่ง่ายเหมือนความแตกต่างในการนำเสนอเช่นลำดับภาคสนามหรือความกว้างของคอลัมน์อาจเพียงพอที่จะป้องกันการควบรวมกิจการได้ง่ายเมื่อข้อมูลแตกต่างกันอย่างมีนัยสำคัญเช่นฐานข้อมูลเดียวที่มีข้อมูลมากหรือน้อยการรวมนั้นยากกว่ามาก

สถานการณ์ทั้งสองที่เรียกร้องให้มีการรวมข้อมูลมากกว่าที่อื่น ๆ อยู่ในธุรกิจและสาขาการวิจัยในโลกธุรกิจการรวมแผนกหรือ บริษัท ต้องรวมข้อมูลที่แยกจากกันก่อนหน้านี้เข้ากับโครงสร้างเดียวโดยทั่วไปรูปแบบของการรวมนี้เป็นเรื่องยากมากเว้นแต่กลุ่มดั้งเดิมใช้ซอฟต์แวร์ที่คล้ายกันและมีเป้าหมายข้อมูลที่คล้ายกัน

เมื่อดำเนินการรวมข้อมูลเพื่อวัตถุประสงค์ในการวิจัยโดยทั่วไปจะราบรื่นขึ้นมากเมื่อนักวิจัยคนหนึ่งให้การเข้าถึงข้อมูลของเขาไปยังอีกฝ่ายหนึ่งโดยทั่วไปทั้งสองฝ่ายจะมองหากระบวนการเดียวกันซึ่งหมายความว่าพวกเขาจะใช้วิธีการที่คล้ายกันในการจัดเก็บและจัดเก็บข้อมูลของพวกเขา

ในอดีตการรวมข้อมูลเป็นพื้นที่ที่ค่อนข้างน้อยของการศึกษาข้อมูล แต่สิ่งนี้เปลี่ยนไปตั้งแต่ต้นศตวรรษที่ 21ด้วยฐานข้อมูลออนไลน์ฟรีที่ได้รับความนิยมและถูกต้องมากขึ้น บริษัท ต่าง ๆ กำลังดิ้นรนเพื่อรับข้อมูลในรูปแบบที่แบ่งปันได้สิ่งนี้ช่วยให้พวกเขาสามารถเปิดเผยข้อมูลของพวกเขาในรูปแบบสาธารณะและรวมอินเทอร์เฟซสาธารณะที่รู้จักกันดีในรุ่นส่วนตัวเข้ากับระบบของพวกเขา