데이터 중복 란 무엇입니까?
데이터 중복성은 데이터베이스 시스템 내에서 발생하는 상황이며 데이터베이스의 기능에 필요하지 않은 의도하지 않은 복제 된 데이터의 생성을 포함합니다. 어떤 상황에서는 중복성이 종종 바람직한 특성이지만 데이터베이스의 기능에 있어서는 사실이 아닙니다. 복제 된 데이터의 존재는 종종 시스템의 기능에 악영향을 미칠 수있어 도움이되지 않는 시스템 쿼리에 대한 응답으로 정보를 반환 할 수 있습니다. 데이터 관리의 주요 기능 중 하나는 복제 된 데이터를 식별하고 복제를 제거하는 것입니다.
데이터 중복 가능성은 거의 모든 유형의 데이터베이스 프로그램에서 발견됩니다. 스프레드 시트와 같이 평평한 것으로 간주되고 데이터의 수동 입력에 의존하는 프로그램은 특히 원하는 정보를 검색 할 때 합병증으로 이어질 수있는 정보의 복제에 특히 취약합니다. 판매와 같은 관계형 스타일 데이터베이스연락처 데이터베이스는 종종 동일한 회사와 관련된 동일한 연락처에서 두 개의 다른 연락처 파일 생성과 같은 의도하지 않은 복제 가능성을 최소화하는 데 도움이되는 프로세스를 포함합니다. 데이터 중복 발생률을 줄이기 위해 시스템 점검을 사용하더라도 여전히 문제가 발생할 가능성이 여전히있어 데이터베이스 내에서 데이터 정리 작업에 정기적으로 참여해야합니다.
기껏해야 데이터 중복성은 데이터베이스에 필수적인 정보가 있지만 필요할 때 데이터를 찾는 능력에 실질적인 위협이되지 않는다는 것을 의미합니다. 최악의 경우, 복제 된 데이터의 존재는 데이터베이스의 필수 기능을 느리게하고 데이터베이스를 사용하여 특정 작업을 관리하는 프로세스를 복잡하게 할 수 있습니다. 예를 들어, 중복 정보로 막히는 고객 데이터베이스를 사용하여 우편 레이블을 생성합니다.ULD는 다수의 복제 된 레벨을 생성하여 레이블을 사용하기 전에 복제물을 정렬하고 폐기해야합니다. 또는 레이블을 생성하기 전에 데이터베이스를 정리하는 데 시간이 걸립니다.
다행히도 데이터 중복성을 모니터링하고 수정하는 것은 많은 데이터 관리 시스템이 상대적으로 쉽게 달성 할 수있는 것입니다. 일부 시스템은 복제 된 데이터의 입력을 표시하여 인식 된 복제를 쉽게 검토하고 삭제할지 여부를 결정할 수 있습니다. 복제를 위해 기존 데이터베이스를 스캔하는 데 사용할 수있는 소프트웨어 프로그램도 있습니다.