가장 중요한 데이터 마이닝 개념은 무엇입니까?

가장 중요한 데이터 마이닝 개념은 수집 된 정보를 분석하는 데 사용되며, 특히 동작을 관찰하기 위해 노력합니다. 데이터 간의 알려지지 않은 상호 작용은 다양한 방법으로 연구되어 주제와 집계 된 정보 간의 중요한 관계를 확인합니다. 데이터 마이닝의 한 가지 과제는 수집 된 실제 정보가 전체 도메인을 연상시키는 것이 아니라는 것입니다. 이 사실을 해결하기 위해 다양한 데이터 마이닝 개념을 통해 데이터 간의 상관 관계를 체계적으로 제어 할 수 있습니다.

데이터 마이닝 개념의 표준은 SIGKDD (지식 발견 및 데이터 마이닝)에 대한 컴퓨팅 기계 협회의 특별 관심 그룹에 의해 시행됩니다. 이 조직은“국제 정보 기술 및 의사 결정 저널”과 SIGKDD 탐색 저널을 발행합니다. 데이터 마이닝의 윤리 및 기본 원칙을 적용하면 산업이 효율적이고 법적 문제가 제한없이 작동 할 수 있습니다.

정보의 전처리는 데이터 마이닝의 가장 중요한 측면 중 하나입니다. 원시 데이터는 마이닝 및 해석되어야합니다. 이 작업을 수행하려면 프로세스를 결정하고 대상 데이터를 모으고 패턴을 찾아야합니다. 이 프로세스는 데이터베이스에서 지식 발견으로 알려져 있으며 1989 년 Gregory Piatetsky-Shapiro에 의해 개발되었습니다.

4 가지 종류의 데이터 마이닝 개념을 통해 프로세스를 수행 할 수 있습니다. 클러스터링 은 데이터 마이닝 프로세스에서 생성 된 알고리즘을 사용하여 항목을 유사한 그룹으로 어셈블합니다. 클러스터링과 달리 정보 분류 는 데이터가 사전 정의 된 그룹으로 어셈블되고 분석 될 때입니다. 연관 은 변수 사이의 관계를 찾아서 일반적으로 연관되는 데이터 그룹을 판별합니다. 데이터 마이닝의 최종 유형은 데이터 수집 내에서 함수를 식별하는 방법에 따라 회귀 입니다.

정보 검증은 데이터 마이닝 애플리케이션이 나타내는 것을 발견하는 마지막 단계입니다. 모든 알고리즘에 유효한 데이터 세트가없는 경우 발생하는 패턴으로 인해 과적 합이라는 상황이 발생할 수 있습니다. 이 문제를 극복하기 위해 데이터를 테스트 세트와 비교합니다. 이는 측정이 가능한 데이터 세트를 제공하는 일련의 알고리즘과 정렬되는 개념입니다. 획득 한 정보가 테스트 세트와 일치하지 않으면 데이터의 가정 된 패턴이 정확하지 않아야합니다.

가장 중요한 데이터 마이닝 개념 중 일부는 다양한 산업에서 발생합니다. 게임, 비즈니스, 마케팅, 과학, 엔지니어링 및 감시는 모두 데이터 마이닝 기술을 사용합니다. 이러한 기술을 수행함으로써 각 분야는 모범 사례 또는 결과를 찾는 더 나은 방법을 결정할 수 있습니다.

가장 중요한 데이터 마이닝 개념은 무엇입니까?

이 문서가 도움이 되었나요?