Che cos'è il data mining?

Il data mining utilizza una quantità relativamente elevata di potenza di elaborazione che opera su un ampio set di dati per determinare regolarità e connessioni tra i punti dati. Gli algoritmi che utilizzano tecniche basate su statistiche, apprendimento automatico e riconoscimento di schemi vengono utilizzati per eseguire automaticamente ricerche su database di grandi dimensioni. Il data mining è anche noto come Knowledge-Discovery in D Database (KDD).

Come il termine intelligenza artificiale , il data mining è un termine generico che può essere applicato a diverse attività. Nel mondo aziendale, il data mining viene utilizzato più frequentemente per determinare la direzione delle tendenze e prevedere il futuro. Viene utilizzato per costruire modelli e sistemi di supporto alle decisioni che forniscono alle persone le informazioni che possono utilizzare. Il data mining ha un ruolo di primo piano nella lotta contro il terrorismo. È stato presumibilmente usato per determinare il leader degli attacchi dell'11 settembre.

I minatori di dati sono statistici che usano tecniche con nomi come modelli vicini , k cluster significa , metodo di controllo , convalida incrociata di k , metodo di esclusione e così via. Le tecniche di regressione vengono utilizzate per sottrarre schemi irrilevanti, lasciando solo informazioni utili. Il termine bayesiano viene visto frequentemente sul campo, riferendosi a una classe di tecniche di inferenza che predicono la probabilità di eventi futuri combinando le probabilità e le probabilità precedenti basate su eventi condizionali. Il filtro antispam è probabilmente una forma di data mining, che porta automaticamente in superficie i messaggi pertinenti da un mare caotico di tentativi di phishing e piazzole di Viagra.

Gli alberi decisionali vengono utilizzati per filtrare montagne di dati. In un albero decisionale, tutti i dati passano attraverso un nodo di entrata, dove si trova di fronte a un filtro che separa i dati in flussi in base alle sue caratteristiche. Ad esempio, è probabile che i dati sul comportamento del consumatore vengano filtrati in base a fattori demografici. Il data mining non riguarda principalmente grafici e tecniche di visualizzazione fantasiosi, ma li utilizza per mostrare ciò che ha trovato. È noto che possiamo assorbire più informazioni statistiche visivamente che verbalmente e questo formato per la presentazione può essere molto convincente e potente se utilizzato nel giusto contesto.

Man mano che la nostra civiltà diventa sempre più saturata di dati e i sensori vengono distribuiti in massa nei nostri ambienti locali, scopriremo inavvertitamente cose che potrebbero essere perse al primo passaggio. Il data mining ci consentirà di correggere questi errori e scoprire nuove intuizioni basate sui dati passati, dandoci più botto per il nostro buck di archiviazione dei dati.

ALTRE LINGUE

Questo articolo è stato utile? Grazie per il feedback Grazie per il feedback

Come possiamo aiutare? Come possiamo aiutare?