Quali sono i concetti di data mining più importanti?
I concetti più importanti di data mining vengono utilizzati per l'analisi delle informazioni raccolte, in particolare nello sforzo di osservare un comportamento. Le interazioni sconosciute tra i dati sono ricercate in vari modi per accertare relazioni critiche tra soggetti e informazioni aggregate. Una sfida nel data mining è che le informazioni effettivamente raccolte potrebbero non ricordare l'intero dominio. Nel tentativo di affrontare questo fatto, le correlazioni tra i dati possono essere controllate metodicamente dai vari concetti di data mining.
Gli standard per i concetti di data mining sono applicati dall'Association for Computing Machinery's Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD). Questa organizzazione pubblica il "International Journal of Information Technology and Decision Making" e la rivista SIGKDD Explorations. L'applicazione dell'etica e dei principi di base del data mining consente all'industria di lavorare in modo efficiente e con problemi legali limitati.
La preelaborazione delle informazioni è uno degli aspetti più importanti del data mining. I dati non elaborati devono essere estratti e interpretati. Per eseguire questa azione, è necessario determinare un processo, i dati di destinazione devono essere assemblati e devono essere trovati i pattern. Il processo è noto come Knowledge Discovery in Database ed è stato sviluppato da Gregory Piatetsky-Shapiro nel 1989.
Quattro diverse classi di concetti di data mining consentono il processo. Il clustering utilizza l'algoritmo creato dal processo di data mining per assemblare elementi in gruppi simili. A differenza del clustering, la classificazione delle informazioni avviene quando i dati vengono assemblati in gruppi predefiniti e analizzati. L'associazione tenta di trovare relazioni tra le variabili, determinando quali gruppi di dati sono comunemente associati. Il tipo finale di data mining è la regressione , basato sul metodo di identificazione di una funzione all'interno della raccolta dati.
La convalida delle informazioni è il passaggio finale per scoprire cosa rappresenta l'applicazione di data mining. Quando non tutti gli algoritmi presentano un set di dati valido, i pattern che si verificano possono provocare una situazione chiamata overfitting. Per ovviare a questo problema, i dati vengono confrontati con un set di test. Questo è un concetto in cui le misurazioni sono allineate con una serie di algoritmi che fornirebbero una serie plausibile di serie di dati. Se le informazioni acquisite non si allineano al set di test, i modelli ipotizzati nei dati devono essere imprecisi.
Alcuni dei più importanti concetti di data mining sono presenti in svariati settori. Gioco, affari, marketing, scienza, ingegneria e sorveglianza utilizzano tutti tecniche di data mining. Conducendo queste tecniche, ogni campo può determinare le migliori pratiche o modi migliori per trovare risultati.