데이터 중복이란 무엇입니까?

데이터 중복성은 데이터베이스 시스템 내에서 발생하는 상황이며 데이터베이스 기능에 필요하지 않은 중복 된 데이터의 의도하지 않은 생성을 포함합니다. 일부 상황에서는 중복성이 바람직한 특성 인 경우가 많지만 데이터베이스의 기능에있어 이것은 사실이 아닙니다. 중복 된 데이터가 있으면 시스템 기능에 악영향을 미쳐 도움이되지 않는 시스템 쿼리에 대한 정보를 반환합니다. 데이터 관리의 주요 기능 중 하나는 중복 된 데이터를 식별하고 해당 중복을 제거하는 것입니다.

데이터 중복 가능성은 거의 모든 유형의 데이터베이스 프로그램에서 찾을 수 있습니다. 스프레드 시트와 같이 평평한 것으로 간주되고 수동 데이터 입력에 의존하는 프로그램은 특히 원하는 정보를 검색 할 때 합병증을 유발할 수있는 정보의 복제에 영향을 받기 쉽습니다. 영업 담당자 데이터베이스와 같은 관계형 스타일 데이터베이스에는 종종 같은 회사와 연결된 동일한 담당자에 대해 서로 다른 두 개의 담당자 파일을 작성하는 등 의도하지 않은 복제 가능성을 최소화하는 데 도움이되는 프로세스가 포함됩니다. 데이터 중복 발생률을 줄이는 데 도움이되는 시스템 검사를 사용하더라도 문제가 발생할 가능성이 여전히 있으므로 데이터베이스 내에서 데이터 정리 작업을 주기적으로 수행해야합니다.

기껏해야 데이터 중복성은 데이터베이스가 필수는 아니지만 필요할 때 필요할 때 데이터를 찾는 기능에 실질적인 위협이되지 않는 정보로 가득 차 있다는 것을 의미합니다. 최악의 경우, 중복 된 데이터가 있으면 데이터베이스의 필수 기능이 느려지고 데이터베이스를 사용하여 특정 작업을 관리하는 프로세스가 복잡해질 수 있습니다. 예를 들어, 중복 정보로 막힌 고객 데이터베이스를 사용하여 메일 링 레이블을 생성하면 여러 개의 중복 레벨이 생성되므로 레이블을 사용하기 전에 중복을 분류 및 폐기해야합니다. 레이블을 생성하기 전에 데이터베이스를 정리할 시간입니다.

다행히 데이터 중복을 모니터링하고 수정하는 것은 많은 데이터 관리 시스템이 비교적 쉽게 달성 할 수있는 것입니다. 일부 시스템은 복제 된 데이터의 입력에 플래그를 지정하여 인식 된 복제를 쉽게 검토하고 삭제 여부를 결정할 수 있습니다. 기존 데이터베이스에서 중복이 있는지 스캔하고 중복 항목을 상대적으로 쉽게 제거하는 데 사용할 수있는 소프트웨어 프로그램도 있습니다.

데이터 중복이란 무엇입니까?

이 문서가 도움이 되었나요?