Qu'est-ce que la confidentialité préservant l'exploration de données?
La préservation de la confidentialité de l'exploration de données est le processus de s'engager dans des efforts collaboratifs d'exploration de données sans exposer les détails confidentiels liés aux informations contenues dans l'une des bases de données minées. Il est traditionnellement utilisé lorsqu'un individu ou une organisation travaille avec des concurrents de l'industrie. Bien que les concurrents puissent parfois bénéficier mutuellement du partage des ressources, toutes les parties ont une participation dans la préservation des informations potentiellement privées ou confidentielles sur leurs projets actuels. La préservation de la confidentialité de l'exploration de données protège les confidences de toutes les parties en produisant les résultats de l'exploration de données, sans réellement divulguer la source d'un bit spécifique d'informations.
L'exploration de données est le processus de prise d'une grande touche de données et de la numérisation pour les tendances globales. Un exemple de base de l'exploration de données serait d'examiner une base de données de vente pour savoir pendant les saisons que les ventes d'un produit particulier sont les plus élevées. L'intelligence d'affaires dérivée de cette mineAidez une entreprise à créer des ventes pendant des temps hors pointe et apporter d'autres modifications pour augmenter leurs bénéfices bruts. Un autre exemple plus complexe serait de parcourir les bases de données des tendances des consommateurs dans les décisions d'achat. Cela permettrait aux fabricants de prédire avec précision quels types de produits deviennent populaires, ce qui leur permet de savoir où concentrer leurs ressources limitées.
En regroupant les informations stockées dans une base de données avec les informations stockées dans les bases de données par des concurrents, l'efficacité de l'exploration de données est considérablement augmentée. Plus il y a de données à étudier, plus il devient facile de trouver et d'exploiter les tendances. En d'autres termes, lorsqu'une organisation individuelle a 10 000 exemples à tirer, il peut généralement prendre des modèles qui ne deviendraient pas évidents avec seulement 100 exemples du même type. Naturellement, cependant, certaines sociétés d'information sont réticentes à partager avec théritiers. C'est là que l'exploration de données de préservation de la confidentialité entre en jeu.
La préservation de la confidentialité de l'exploration de données fonctionne en permettant aux entreprises concurrentes de nourrir uniquement les données qu'ils souhaitent partager dans une base de données "communautaire" centrale. En limitant l'exploration de données à des informations strictement volontaires, la confidentialité est maintenue des deux côtés sans saper l'objectif central des efforts d'exploration de données. La confidentialité peut également être protégée en utilisant une partie intermédiaire désintéressée de mener l'exploitation minière réelle, permettant aux entreprises de mettre en commun leurs ressources de base de données sans l'une ou l'autre des entreprises ayant un accès direct aux types de données privés de l'autre entreprise.