데이터 정리 란 무엇입니까?
데이터 스크러빙이라고도하는 데이터 정리는 일련의 데이터가 정확하고 정확한지 확인하는 프로세스입니다. 이 과정에서 레코드의 정확성과 일관성을 검사하고 필요에 따라 수정하거나 삭제합니다. 단일 레코드 집합 내에서 또는 병합해야하거나 함께 작동 할 여러 데이터 집합간에 발생할 수 있습니다.
간단한 과정
가장 간단한 형태의 데이터 정리에는 개인 또는 일련의 레코드를 읽고 정확성을 확인하는 사람이 포함됩니다. 오타 및 철자 오류가 수정되고 잘못 레이블이 지정된 데이터에 올바르게 레이블이 지정되고 제출되며 불완전하거나 누락 된 항목이 완료됩니다. 이러한 작업은 종종 오래된 또는 복구 할 수없는 레코드를 제거하여 공간을 차지하지 않고 비효율적 인 작업을 유발합니다.
복잡한 과정
보다 복잡한 작업에서는 컴퓨터 프로그램으로 데이터 정리를 수행 할 수 있습니다. 이 프로그램은 사용자가 결정한 다양한 규칙과 절차로 데이터를 확인할 수 있습니다. 지난 5 년 내에 업데이트되지 않은 모든 레코드를 삭제하고 철자가 틀린 단어를 수정하고 중복 사본을 삭제하도록 프로그램을 설정할 수 있습니다. 보다 복잡한 프로그램은 올바른 우편 번호를 기준으로 누락 된 도시를 채우거나 데이터베이스의 모든 항목 가격을 다른 유형의 통화로 변경할 수 있습니다.
혜택
데이터 정리는 데이터 종속 비즈니스의 효율성에 매우 중요합니다. 예를 들어, 데이터베이스 내의 일부 클라이언트에 정확한 전화 번호가 없으면 직원이 쉽게 연락 할 수 없습니다. 다른 예로 고객의 이메일 주소가 올바르게 형식화되지 않으면 자동 이메일 시스템이 최신 쿠폰 및 특별 거래를 발송할 수 없습니다. 데이터 정리 작업은 시스템이 데이터를 사용할 수 있도록 시스템 내의 데이터가 올바른지 확인하는 것입니다. 부정확하거나 불완전한 기록은 누구에게나 많이 사용되지 않습니다.
두 데이터 시스템이 함께 작동해야 할 때마다 데이터 정리가 더 중요합니다. 회사에 동일한 고객 다수와 협력하는 두 개의 지점이있는 경우 각 지점의 데이터가 완전하고 정확해야 할뿐만 아니라 두 지점도 일치하는 데이터를 가져야합니다. 고객이 한 지점으로 전화 번호를 업데이트 할 때 다른 지점의 데이터를 동일한 정보로 업데이트하여 효율성을 극대화해야합니다. 데이터 정리는 데이터의 정확성을 보장 할뿐만 아니라 다른 레코드 간에도 일관성을 유지하기 위해 작동합니다.
많은 양의 데이터가 저장 될 때마다 시스템에 오류가 발생합니다. 데이터 정리의 목표는 이러한 오류를 최소화하고 데이터를 최대한 유용하고 의미있게 만드는 것입니다. 이 프로세스를 정기적으로 수행하지 않으면 실수와 오류가 더해져 작업 효율이 떨어지고 더 복잡해집니다.