다른 데이터 마이닝 방법은 무엇입니까?

소프트웨어 옵션과 이론적 개념 모두에 사용되는 다양한 데이터 마이닝 방법이 있습니다. 이를 통해 사용자는 다양한 도구를 사용하여 개인 및 회사가 수집 한 데이터에서 정보를 추출 할 수 있습니다. 많은 양의 데이터를 사용하여 단일 주제 또는 다양한 주제의 다양한 요소를 결정할 수 있습니다. 이러한 데이터 마이닝 방법은 사기 방지, 마케팅 및 감시 분야에서 가장 일반적으로 사용됩니다.

수백 년 동안 데이터 마이닝 방법은 주제에서 정보를 추출하는 데 사용되었습니다. 그러나 현대 기술은 자동화 된 개념을 사용하여 컴퓨터 리소스를 통해 실질적인 데이터를 제공합니다. 20 세기에 컴퓨터 과학이 등장함에 따라, 데이터 마이닝 방법의 개념은 수집 된 대규모 데이터에서 숨겨진 패턴을 극복하기 위해 개발되었습니다. 좋은 예는 광고 회사가 온라인 고객의 쇼핑 패턴을 분석 할 때입니다. 그런 다음이 회사는 개인이 구매에 관심을 가질 수있는 특정 제품을 마케팅 할 수 있습니다.

업계에서 일반적으로 사용되는 하나의 데이터 마이닝 기술을 지식 검색 데이터베이스 (KDD)라고합니다. 1989 년 Gregory Piatetsky-Shapiro가 개발 한 KDD를 통해 사용자는 원시 데이터를 처리하고 필요한 데이터에 대한 정보를 분석하고 결과를 해석 할 수 있습니다. 이 방법을 사용하면 알고리즘에서 패턴을 찾을 수 있지만 일반적인 데이터는 항상 정확하지는 않으며 타협 할 수있는 방식으로 조합 할 수 있습니다. 이를 과적 합이라고 합니다.

기본 데이터 마이닝 방법에는 분류, 클러스터링, 회귀 및 연관이라는 네 가지 특정 유형의 작업이 포함됩니다. 분류 는 존재하는 정보를 가져 와서 정의 된 그룹으로 병합합니다. 클러스터링 은 정의 된 그룹을 제거하고 데이터가 유사한 항목별로 분류되도록합니다. 회귀 는 정보의 기능에 중점을두고 개념에 대한 데이터를 모델링합니다. 최종 데이터 마이닝 방법 인 association 은 다양한 데이터 피드 사이의 관계를 찾으려고 시도합니다.

다양한 데이터 마이닝 방법을 사용할 때 프로세스에서 사용할 수있는 매개 변수를 결정하기 위해 특정 표준이 사용됩니다. SIGKDD (지식 발견 및 데이터 마이닝)에 대한 컴퓨팅 기계류의 특수 관심 그룹 (SIGKDD)은 적절한 프로세스를 결정하는 연례 회의를 개최합니다. 윤리적 요소는 개인 및 회사에 대한 최상의 정보를 찾기위한 실용적인 응용 프로그램과 함께 평가됩니다. 이 정보는 SIGKDD Explorations 라는 업계 저널에 게시됩니다 .

다른 언어

이 문서가 도움이 되었나요? 피드백 감사드립니다 피드백 감사드립니다

어떻게 도와 드릴까요? 어떻게 도와 드릴까요?