Quali sono i diversi metodi di data mining?

Esistono diversi metodi di data mining utilizzati sia nelle opzioni software che nei concetti teorici. Ciò consente agli utenti di estrarre informazioni dai dati raccolti da individui e aziende utilizzando una varietà di strumenti. Grandi quantità di dati possono essere utilizzate per determinare vari fattori in un singolo soggetto o varietà di soggetti. Questi metodi di data mining sono più comunemente utilizzati nei settori della protezione dalle frodi, del marketing e della sorveglianza.

Per centinaia di anni, sono stati utilizzati metodi di data mining per estrarre informazioni dagli argomenti. Le tecniche moderne, tuttavia, utilizzano concetti automatizzati per fornire dati sostanziali tramite risorse computerizzate. Con la nascita delle scienze informatiche nel corso del 20 ° secolo, il concetto di metodi di data mining si è sviluppato nel tentativo di superare schemi nascosti in ampie parti di dati raccolti. Un buon esempio di ciò è quando un'azienda pubblicitaria che analizza i modelli di acquisto di un cliente online. Questa società può quindi commercializzare determinati prodotti che l'interessato potrebbe essere interessato ad acquistare.

Una tecnica di data mining utilizzata comunemente nel settore si chiama Knowledge Discovery in D Database (KDD). Sviluppato nel 1989 da Gregory Piatetsky-Shapiro, KDD consente agli utenti di elaborare i dati grezzi, analizzare le informazioni per i dati necessari e interpretare i risultati. Questo metodo consente agli utenti di trovare schemi negli algoritmi, tuttavia i dati generali non sono sempre precisi e possono essere messi insieme in modo compromettente. Questo è noto come overfitting .

I metodi di base del data mining prevedono quattro tipi particolari di attività: classificazione, clustering, regressione e associazione. La classificazione prende le informazioni presenti e le unisce in raggruppamenti definiti. Il clustering rimuove i raggruppamenti definiti e consente ai dati di classificarsi in base a elementi simili. La regressione si concentra sulla funzione delle informazioni, modellando i dati sul concetto. Il metodo di data mining finale, l' associazione , tenta di trovare relazioni tra i vari feed di dati.

Quando si utilizzano i vari metodi di data mining, vengono utilizzati determinati standard per determinare quali parametri possono essere utilizzati nel processo. Il gruppo di interesse speciale dell'Associazione per le macchine informatiche sulla scoperta della conoscenza e l'estrazione dei dati (SIGKDD) tiene una riunione annuale per determinare quali processi sono appropriati. I fattori etici vengono valutati insieme ad applicazioni pratiche per trovare le migliori informazioni su individui e aziende. Questa informazione è pubblicata in una rivista del settore chiamata SIGKDD Explorations.

ALTRE LINGUE

Questo articolo è stato utile? Grazie per il feedback Grazie per il feedback

Come possiamo aiutare? Come possiamo aiutare?