Hva er personvernbevarende datagruver?
Personvernbevaring av data mining er prosessen med å samarbeide data mining-innsats uten å avsløre konfidensielle detaljer relatert til informasjonen i noen av databasene som blir utvunnet. Det brukes tradisjonelt når en enkeltperson eller organisasjon jobber med konkurrenter i bransjen. Mens konkurrenter noen ganger kan gjensidig dra nytte av å dele ressurser, har alle parter en andel i å bevare potensielt privat eller konfidensiell informasjon om sine nåværende prosjekter. Personvernbevaring av data mining beskytter fortrolighet for alle parter ved å produsere resultatene av data mining, uten å røpe kilden til noen spesifikk informasjonsbit.
Data mining er prosessen med å ta en stor klump med data og skanne den etter generelle trender. Et grunnleggende eksempel på datadrift er å se gjennom en salgsdatabase for å finne ut i hvilke årstider salget av et bestemt produkt er høyest. Forretningsintelligensen som stammer fra denne gruvedriften vil hjelpe et selskap med å skape salg i løpet av høysesongen og gjøre andre modifikasjoner for å øke brutto fortjenesten. Et annet mer komplekst eksempel ville være å skanne gjennom databaser for forbrukertrender i kjøpsbeslutninger. Dette vil gi produsenter mulighet til å forutsi nøyaktig hvilke typer produkter som blir populære, slik at de kan vite hvor de skal fokusere sine begrensede ressurser.
Ved å samle informasjonen som er lagret i en database med informasjonen som er lagret i databaser av konkurrenter, økes effektiviteten av data mining drastisk. Jo mer data det er å studere, jo lettere blir det å finne og utnytte trender. Med andre ord, når en individuell organisasjon har 10 000 eksempler å trekke fra, kan de typisk fange mønstre som ikke ville bli tydelig med bare 100 eksempler av samme type. Naturligvis er det imidlertid alltid noen informasjonsselskaper er motvillige til å dele med sine konkurrenter. Det er her personvern som beskytter data mining kommer inn.
Personvernbevaring av data mining fungerer ved at konkurrerende selskaper kun kan mate inn dataene de ønsker å dele i en sentral "felles" database. Ved å begrense datautvindingen til strengt frivillig informasjon, opprettholdes personvern på begge sider uten å undergrave det sentrale formålet med innsatsen for datagruving. Personvern kan også beskyttes ved å bruke en uinteressert mellommann til å utføre selve gruvedriften, slik at selskapene kan samle databaseressursene sine uten at noen av selskapene har direkte tilgang til det andre selskapets private datatyper.