데이터 마이닝이란 무엇입니까?
데이터 마이닝은 많은 데이터 세트에서 작동하는 비교적 많은 양의 컴퓨팅 성능을 사용하여 데이터 포인트 간의 규칙 성과 연결을 결정합니다. 통계, 머신 러닝 및 패턴 인식 기술을 사용하는 알고리즘은 큰 데이터베이스를 자동으로 검색하는 데 사용됩니다. 데이터 마이닝은 KDD (Knowledge-Discovery in Databases)라고도합니다.
인공 지능 이라는 용어와 마찬가지로 데이터 마이닝은 다양한 활동에 적용될 수있는 포괄적 인 용어입니다. 기업 세계에서 데이터 마이닝은 추세의 방향을 결정하고 미래를 예측하는 데 가장 자주 사용됩니다. 사람들이 사용할 수있는 정보를 제공하는 모델 및 의사 결정 지원 시스템을 구축하는 데 사용됩니다. 데이터 마이닝은 테러와의 전쟁에서 최전선 역할을합니다. 9/11 공격의 리더를 결정하는 데 사용 된 것으로 추정됩니다.
데이터 마이너는 근접 모델 , k- 평균 군집화 , 홀드 아웃 방법 , k- 폴드 교차 검증 , 탈퇴 방법 등과 같은 이름을 가진 기술을 사용하는 통계 학자입니다. 회귀 기술은 관련없는 패턴을 빼는 데 사용되며 유용한 정보 만 남습니다. 베이지안 이라는 용어는 조건부 이벤트를 기반으로 사전 확률과 확률을 결합하여 미래 이벤트의 가능성을 예측하는 일련의 추론 기법을 지칭하는 것으로 현장에서 자주 볼 수 있습니다. 스팸 필터링은 데이터 마이닝의 한 형태로, 혼란스러운 피싱 시도와 비아그라 피치에서 관련 메시지를 자동으로 표면으로 가져옵니다.
의사 결정 트리는 데이터의 산을 필터링하는 데 사용됩니다. 의사 결정 트리에서 모든 데이터는 입구 노드를 통과하며, 데이터는 특성에 따라 데이터를 스트림으로 분리하는 필터를 향합니다. 예를 들어 소비자 행동에 대한 데이터는 인구 통계 학적 요소를 기준으로 필터링 될 수 있습니다. 데이터 마이닝은 주로 멋진 그래프와 시각화 기술에 관한 것이 아니라 찾은 것을 보여주기 위해 사용합니다. 우리는 구두로보다 더 많은 통계 정보를 시각적으로 흡수 할 수있는 것으로 알려져 있으며, 올바른 형식으로 사용될 경우 프레젠테이션 형식은 매우 설득력 있고 강력 할 수 있습니다.
우리의 문명이 점점 더 포화되고 센서가 우리의 지역 환경에 대량으로 배포됨에 따라, 우리는 실수로 처음 지나칠 때 놓칠 수있는 것을 발견 할 것입니다. 데이터 마이닝을 통해 이러한 실수를 해결하고 과거 데이터를 기반으로 한 새로운 통찰력을 발견 할 수있어 데이터 스토리지 비용을 더 많이 절약 할 수 있습니다.