O que é privacidade preservando a mineração de dados?
A preservação da privacidade da mineração de dados é o processo de se envolver em esforços colaborativos de mineração de dados sem expor detalhes confidenciais relacionados às informações contidas em qualquer um dos bancos de dados que estão sendo minerados. É tradicionalmente usado quando um indivíduo ou organização está trabalhando com concorrentes da indústria. Embora os concorrentes às vezes possam se beneficiar mutuamente do compartilhamento de recursos, todas as partes têm interesse em preservar informações potencialmente privadas ou confidenciais sobre seus projetos atuais. A preservação da privacidade da mineração de dados protege as confidências de todas as partes, produzindo os resultados da mineração de dados, sem revelar a fonte de nenhuma informação específica.
A mineração de dados é o processo de pegar uma grande quantidade de dados e varrê-los em busca de tendências gerais. Um exemplo básico de mineração de dados seria examinar um banco de dados de vendas para descobrir em que épocas as vendas de um determinado produto são mais altas. A inteligência comercial derivada dessa mineração ajudaria uma empresa a criar vendas fora dos horários de pico e fazer outras modificações para aumentar seus lucros brutos. Outro exemplo mais complexo seria procurar nos bancos de dados as tendências do consumidor nas decisões de compra. Isso permitiria aos fabricantes prever com precisão quais tipos de produtos estão se tornando populares, permitindo saber onde concentrar seus recursos limitados.
Ao agrupar as informações armazenadas em um banco de dados com as informações armazenadas em bancos de dados pelos concorrentes, a eficiência da mineração de dados aumenta drasticamente. Quanto mais dados houver para estudar, mais fácil será encontrar e explorar tendências. Em outras palavras, quando uma organização individual tem 10.000 exemplos para extrair, normalmente pode capturar padrões que não se tornariam evidentes com apenas 100 exemplos do mesmo tipo. Naturalmente, no entanto, sempre há algumas empresas de informação relutantes em compartilhar com seus concorrentes. É aí que a privacidade que preserva a mineração de dados entra em jogo.
A preservação da privacidade da mineração de dados funciona permitindo que as empresas concorrentes alimentem apenas os dados que desejam compartilhar em um banco de dados "comunitário" central. Ao limitar a mineração de dados a informações estritamente voluntárias, a privacidade é mantida em ambos os lados, sem comprometer o objetivo central dos esforços de mineração de dados. A privacidade também pode ser protegida utilizando um intermediário desinteressado para realizar a mineração real, permitindo que as empresas agrupem seus recursos de banco de dados sem que nenhuma empresa tenha acesso direto aos tipos de dados privados da outra empresa.