Cos'è la privacy che preserva il data mining?
La conservazione della privacy del data mining è il processo di impegno collaborativo nel data mining senza esporre dettagli confidenziali relativi alle informazioni contenute in nessuno dei database da estrarre. È tradizionalmente usato quando un individuo o un'organizzazione lavora con concorrenti del settore. Sebbene a volte i concorrenti possano beneficiare reciprocamente della condivisione delle risorse, tutte le parti interessate sono interessate a preservare informazioni potenzialmente private o riservate sui loro progetti attuali. La tutela della privacy del data mining protegge le confidenze di tutte le parti producendo i risultati del data mining, senza rivelare effettivamente la fonte di alcun bit specifico di informazioni.
Il data mining è il processo di acquisizione di un grosso gruppo di dati e scansione per le tendenze generali. Un esempio di base del data mining sarebbe quello di consultare un database delle vendite per scoprire in quali stagioni le vendite di un determinato prodotto sono più alte. La business intelligence derivata da questo mining aiuterebbe un'azienda a creare vendite durante i periodi non di punta e ad apportare altre modifiche per aumentare i profitti lordi. Un altro esempio più complesso sarebbe quello di scansionare attraverso i database le tendenze dei consumatori nelle decisioni di acquisto. Ciò consentirebbe ai produttori di prevedere con precisione quali tipi di prodotti stanno diventando popolari, consentendo loro di sapere dove concentrare le proprie risorse limitate.
Unendo le informazioni archiviate in un database con le informazioni archiviate nei database dai concorrenti, l'efficienza del data mining è drasticamente aumentata. Più dati ci sono da studiare, più diventa facile trovare e sfruttare le tendenze. In altre parole, quando una singola organizzazione ha 10.000 esempi da cui attingere, in genere possono catturare schemi che non sarebbero evidenti con solo 100 esempi dello stesso tipo. Naturalmente, tuttavia, ci sono sempre alcune informazioni che le società sono riluttanti a condividere con i loro concorrenti. È qui che entra in gioco la conservazione della riservatezza del data mining.
La tutela della privacy del data mining funziona consentendo alle aziende concorrenti di alimentare solo i dati che desiderano condividere in un database centrale "comune". Limitando il data mining a informazioni strettamente volontarie, la privacy viene mantenuta da entrambe le parti senza compromettere lo scopo centrale degli sforzi di data mining. La privacy può anche essere protetta utilizzando una parte intermedia disinteressata per condurre l'effettivo mining, consentendo alle aziende di mettere in comune le risorse del proprio database senza che nessuna delle due società abbia accesso diretto ai tipi di dati privati dell'altra società.