데이터 마이닝 프로세스는 무엇입니까?

데이터 마이닝 프로세스는 많은 양의 데이터에서 통계적으로 유의 한 패턴을 발견하기위한 도구입니다. 일반적으로 준비, 데이터 탐색, 모델 구축, 배포 및 검토를 포함한 5 가지 주요 단계가 포함됩니다. 프로세스의 각 단계에는 다른 기술 세트가 포함되지만 대부분은 어떤 형태의 통계 분석을 사용합니다.

데이터 마이닝 프로세스가 시작되기 전에 연구자들은 일반적으로 연구 목표를 설정합니다. 이 준비 단계는 일반적으로 어떤 유형의 데이터를 연구 해야하는지, 어떤 데이터 마이닝 기술을 사용해야하는지, 그리고 결과가 어떤 형태를 취할 것인지 결정합니다. 프로세스 의이 초기 단계는 유용한 정보를 수집하는 데 중요 할 수 있습니다.

데이터 마이닝 프로세스의 다음 단계는 탐색입니다. 이 단계에는 일반적으로 정보 창고 또는 수집 엔티티에서 필요한 데이터를 수집하는 것이 포함됩니다. 그런 다음 광업 전문가는 일반적으로 분석을 위해 원시 데이터 세트를 준비합니다. 이 단계는 일반적으로 수집, 청소, 조직 및모든 데이터를 오류에 대해 확인합니다.

이 준비된 데이터는 일반적으로 데이터 마이닝 프로세스의 세 번째 단계 인 모델 빌딩을 입력합니다. 이를 달성하기 위해 연구자들은 일반적으로 소규모 테스트 데이터 샘플을 가져 와서 다양한 데이터 마이닝 기술을 적용합니다. 모델링 단계는 종종 원하는 결과를 달성하는 데 필요한 최상의 통계 분석 방법을 결정하는 데 사용됩니다.

데이터 마이닝 프로세스에 적용 할 수있는 4 가지 주요 기술이 있습니다. 첫 번째는 분류이며, 데이터를 사전 정의 된 그룹 또는 범주로 배열합니다. 클러스터링이라는 두 번째 기술에서 연구원들은 컴퓨터가 데이터를 그룹으로 구성 할 수 있도록 허용합니다. 세 번째 데이터 마이닝 기술은 변수 간의 연관성을 추구합니다. 네 번째는 일반적으로 미래 추세를 예측하는 데 사용될 수있는 데이터에서 순차적 패턴을 찾습니다.

데이터 마이닝 프로의 마지막 단계Cess는 배포입니다. 이를 위해 모델에서 선택된 기술은 더 큰 데이터 세트에 적용되며 결과는 분석됩니다. 이 단계에서 나오는 보고서는 일반적으로 데이터 세트에 존재하는 분류, 클러스터, 연관 또는 순차적 패턴을 포함하여 전체 프로세스에서 발견 된 패턴을 보여줍니다.

검토는 종종 ​​중요한 최종 단계입니다. 프로세스 의이 단계는 일반적으로 기본 세트가 전체 데이터 모집단을 대표하는지 확인하기 위해 새로운 데이터 세트로 마이닝 모델을 반복하는 것을 포함합니다. 데이터 샘플이 정확하게 표현되지 않으면 결과는 더 큰 모집단의 추세를 예측할 수 없습니다.

다른 언어

이 문서가 도움이 되었나요? 피드백 감사드립니다 피드백 감사드립니다

어떻게 도와 드릴까요? 어떻게 도와 드릴까요?