Skip to main content

สถาปัตยกรรมคลังข้อมูลคืออะไร?

สถาปัตยกรรมคลังข้อมูลเป็นการออกแบบที่ห่อหุ้มทุกแง่มุมของคลังข้อมูลสำหรับสภาพแวดล้อมขององค์กรคลังข้อมูลคือการสร้างโดเมนกลางเพื่อจัดเก็บข้อมูลองค์กรที่ซับซ้อนและกระจายอำนาจในหน่วยตรรกะที่ช่วยให้การขุดข้อมูล, ระบบธุรกิจอัจฉริยะและการเข้าถึงข้อมูลที่เกี่ยวข้องทั้งหมดภายในองค์กรสถาปัตยกรรมคลังข้อมูลรวมถึงข้อกำหนดการรายงานทั้งหมดการจัดการข้อมูลข้อกำหนดด้านความปลอดภัยข้อกำหนดความกว้างของวงดนตรีและข้อกำหนดการจัดเก็บ

เมื่อสร้างสถาปัตยกรรมคลังข้อมูลเป็นสิ่งสำคัญที่จะต้องแบ่งสถาปัตยกรรมออกเป็นโดเมนเฉพาะออกแบบ.การออกแบบนี้ควรได้รับการพิจารณาว่าพิมพ์สีน้ำเงินสำหรับสถาปัตยกรรมข้อมูลองค์กรโดยเฉพาะอย่างยิ่งพื้นที่หลักหลายแห่งควรได้รับการพัฒนาเมื่อพิจารณาสถาปัตยกรรมคลังข้อมูลพื้นที่เหล่านี้คือการเข้าถึงระบบต้นทางกระบวนการจัดเตรียมพื้นที่กระบวนการเพิ่มประสิทธิภาพข้อมูลสถาปัตยกรรมข้อมูลกระบวนการทางธุรกิจและข้อกำหนดการจัดเก็บ

คลังข้อมูลต้องการข้อมูลแหล่งที่มาที่จะถ่ายโอนจากธุรกรรมหรือฐานข้อมูลของการบันทึกลงในคลังข้อมูลกระบวนการนี้ง่ายขึ้นในคำว่าสารสกัดและโหลด (ETL) ซึ่งโดยทั่วไปแล้วจะสรุปพื้นที่ของการเข้าถึงระบบต้นฉบับการเพิ่มประสิทธิภาพข้อมูลและสถาปัตยกรรมข้อมูลเพื่อความชัดเจนจะเป็นการดีกว่าที่จะออกแบบพื้นที่สถาปัตยกรรมเหล่านี้โดยละเอียดซึ่งสรุปว่ากระบวนการ ETL จะบรรลุผลอย่างไรในขณะที่ข้อมูลบางอย่างเป็นสิ่งจำเป็นจากระบบต้นทาง แต่ข้อมูลทั้งหมดไม่เป็นที่ต้องการเช่นเดียวกับคลังสินค้าขององค์กรประเด็นหลักของความกังวลเมื่อจัดการกับเลเยอร์ระบบต้นฉบับคือวิธีการเข้าถึงข้อมูลข้อมูลที่ต้องการจากระบบต้นทางและข้อกำหนดการรีเฟรชlayer สถาปัตยกรรมข้อมูลคลังข้อมูลถัดไปที่ควรพิจารณาคือกระบวนการจัดเตรียมพื้นที่เนื่องจากข้อมูลส่วนใหญ่จากระบบต้นทางจะต้องมีการตรวจสอบความถูกต้องและการทำความสะอาดข้อมูลจึงเป็นสิ่งสำคัญที่จะต้องสร้างโซนเชื่อมโยงไปถึงสำหรับข้อมูลแหล่งที่มาเพื่อที่จะอยู่ก่อนที่จะโหลดลงในชั้นกฎธุรกิจของคลังข้อมูลพื้นที่จัดเตรียมรักษาฟีดข้อมูลดิบจากระบบต้นทางที่มักจะถูกประทับตราเวลาเพื่อให้แน่ใจว่าข้อมูลล่าสุดของข้อมูล

กระบวนการเพิ่มคุณค่าข้อมูลหรือกฎเกณฑ์ทางธุรกิจเป็นที่ที่ข้อมูลได้รับการทำความสะอาดเพื่อให้ตรงตามผลลัพธ์ที่ต้องการของคลังข้อมูลตัวอย่างที่ดีของวิธีการทำความสะอาดนี้คือการใช้เครื่องมือทำความสะอาดที่อยู่ในกรณีที่ระบบต้นทางมีข้อมูลที่ไม่ถูกต้องกระบวนการเพิ่มประสิทธิภาพข้อมูลจะเรียกใช้ที่อยู่จากชุดข้อมูลดิบเป็นระบบกฎทางธุรกิจที่จะแก้ไขที่อยู่ที่ไม่ถูกต้องนี่เป็นเวลาที่ข้อมูลที่ไม่ถูกต้องถูกลบหรือแก้ไขเพื่อให้แน่ใจว่าสมบูรณ์ภายในคลังข้อมูล

เลเยอร์ถัดไปที่ควรพิจารณาคือเลเยอร์สถาปัตยกรรมข้อมูลพื้นที่นี้เป็นที่ที่การออกแบบที่แท้จริงหรือสคีมาของคลังข้อมูลองค์กรเสร็จสมบูรณ์คลังข้อมูลในการไม่รวมกันของชุดข้อมูลทั้งหมดภายในองค์กร แต่แทนที่จะเป็นฐานข้อมูลที่กำหนดไว้ใหม่ที่สร้างขึ้นเพื่อเปิดใช้งานภาพรวมของหน่วยงานธุรกิจทั้งหมดภายในองค์กร

สิ่งนี้ต้องใช้สถาปัตยกรรมข้อมูลเพื่อตอบคำถามที่ธุรกิจจะถูกโพสต์ในพื้นที่ของระบบธุรกิจอัจฉริยะและการขุดข้อมูลโดยการสร้างสถาปัตยกรรมข้อมูลในลักษณะนี้ชุดข้อมูลดิบจะถูกแปลงเป็นตารางความเป็นจริงที่จะช่วยให้ผู้ใช้สามารถทำการรายงาน ad-hoc ในมุมมององค์กรทั้งหมดค่อนข้างฐานข้อมูลเฉพาะนี่เป็นพื้นที่ที่จะรักษาข้อมูลเมตาเกี่ยวกับข้อมูลจากระบบดิบซึ่งอาจรวมถึงชื่อระบบต้นฉบับหรือคีย์หลัก

พื้นที่ถัดไปที่ควรพิจารณาคือข้อกำหนดทางธุรกิจและข้อกำหนดการรายงานเลเยอร์นี้สามารถพิจารณาได้ว่าเป็นข้อกำหนดของผู้ใช้สำหรับคลังข้อมูลโดยทั่วไปพื้นที่นี้มีรายงานกระป๋องความสามารถในการรายงานแบบ Ad-Hoc และบอร์ด Dash หรือการแจ้งเตือนขององค์กรธุรกิจอัจฉริยะโดยปกติเลเยอร์ E จะได้รับการพิจารณามากที่สุดเนื่องจากเป็นองค์ประกอบเดียวที่หันหน้าไปทางด้านนอกภายในคลังข้อมูล

เลเยอร์สุดท้ายสำหรับการพิจารณาคือข้อกำหนดการจัดเก็บข้อมูลโดยรวมและการบำรุงรักษาในฐานะที่เป็นคลังข้อมูลยังคงเติบโตและขยายตัวการจัดเก็บข้อมูลฐานผู้ใช้จะต้องได้รับการจัดการและบำรุงรักษาอย่างเคร่งครัดนอกจากนี้ในขณะที่สร้างสถาปัตยกรรมคลังข้อมูลการออกแบบควรทำการประมาณการที่เป็นจริงเกี่ยวกับสิ่งที่จะต้องใช้ในรูปแบบความจุการจัดเก็บข้อมูลรวมถึงวงดนตรีที่มีความสามารถในการเข้าถึงข้อมูลข้อกำหนดเหล่านี้จะมีความสำคัญเนื่องจากคลังข้อมูลถูกนำมาใช้กันอย่างแพร่หลายตลอดทั้งองค์กร