¿Qué es la privacidad que preserva la minería de datos?
La minería de datos para preservar la privacidad es el proceso de participar en esfuerzos de minería de datos en colaboración sin exponer detalles confidenciales relacionados con la información contenida en cualquiera de las bases de datos que se extraen. Se usa tradicionalmente cuando un individuo u organización trabaja con competidores de la industria. Si bien los competidores a veces pueden beneficiarse mutuamente de compartir recursos, todas las partes tienen interés en preservar información potencialmente privada o confidencial sobre sus proyectos actuales. La minería de datos para preservar la privacidad protege las confidencias de todas las partes al producir los resultados de la minería de datos, sin revelar realmente la fuente de ningún bit de información específico.
La minería de datos es el proceso de tomar una gran cantidad de datos y escanearlos en busca de tendencias generales. Un ejemplo básico de minería de datos sería mirar a través de una base de datos de ventas para averiguar durante qué temporadas las ventas de un producto en particular son más altas. La inteligencia de negocios derivada de esta minería ayudaría a una empresa a crear ventas durante las horas pico y realizar otras modificaciones para aumentar sus ganancias brutas. Otro ejemplo más complejo sería buscar en las bases de datos las tendencias del consumidor en las decisiones de compra. Esto permitiría a los fabricantes predecir con precisión qué tipos de productos se están volviendo populares, permitiéndoles saber dónde enfocar sus recursos limitados.
Al agrupar la información almacenada en una base de datos con la información almacenada en las bases de datos por los competidores, la eficiencia de la minería de datos aumenta drásticamente. Cuantos más datos haya para estudiar, más fácil será encontrar y explotar tendencias. En otras palabras, cuando una organización individual tiene 10,000 ejemplos de los cuales extraer, generalmente pueden detectar patrones que no serían evidentes con solo 100 ejemplos del mismo tipo. Naturalmente, sin embargo, siempre hay algunas empresas de información que son reacias a compartir con sus competidores. Ahí es donde entra en juego la privacidad que preserva la minería de datos.
La minería de datos para preservar la privacidad funciona al permitir que las compañías competidoras alimenten solo los datos que desean compartir en una base de datos central "comunal". Al limitar la minería de datos a información estrictamente voluntaria, se mantiene la privacidad en ambos lados sin socavar el propósito central de los esfuerzos de minería de datos. La privacidad también puede protegerse mediante la utilización de una parte intermediaria desinteresada para llevar a cabo la minería real, lo que permite a las compañías agrupar los recursos de su base de datos sin que ninguna de las compañías tenga acceso directo a los tipos de datos privados de la otra compañía.