Vad är integritetsbevarande data mining?
Integritetsbevaring av data mining är processen för att delta i samarbetsdata mininginsatser utan att avslöja konfidentiella detaljer relaterade till informationen i någon av databaserna som bryts. Det används traditionellt när en individ eller organisation arbetar med en branschkonkurrenter. Medan konkurrenter ibland kan dra nytta av att dela resurser, har alla parter en andel för att bevara potentiellt privat eller konfidentiell information om sina nuvarande projekt. Sekretess som bevarar data mining skyddar alla parters förtroende genom att producera resultaten av data mining, utan att faktiskt avslöja källan till någon specifik information.
data mining är processen att ta en stor klump av data och skanna den för övergripande trender. Ett grundläggande exempel på data mining skulle vara att titta igenom en försäljningsdatabas för att ta reda på under vilka årstider försäljning av en viss produkt är högst. Business Intelligence som härrör från denna gruvdrift skulleHjälp ett företag att skapa försäljning under tidstider och göra andra ändringar för att öka sina grova vinster. Ett annat mer komplicerat exempel skulle vara att skanna igenom databaser för konsumenttrender för att köpa beslut. Detta skulle göra det möjligt för tillverkare att exakt förutsäga vilka typer av produkter som blir populära, vilket gör att de kan veta var de ska fokusera sina begränsade resurser.
Genom att samla informationen lagrad i en databas med informationen lagrad i databaser av konkurrenterna ökas effektiviteten för data mining drastiskt. Ju mer data det finns att studera, desto lättare blir det att hitta och utnyttja trender. Med andra ord, när en enskild organisation har 10 000 exempel att dra från kan de vanligtvis fånga mönster som inte skulle bli tydliga med bara 100 exempel av samma typ. Naturligtvis finns det dock alltid att vissa informationsföretag är ovilliga att dela med Tarvtagare. Det är där integritetsbevarande data mining spelar in.
Integritetsbevaring av data mining fungerar genom att låta konkurrerande företag endast mata de uppgifter de vill dela i en central "kommunal" databas. Genom att begränsa databrytningen till strikt frivillig information upprätthålls integriteten på båda sidor utan att undergräva det centrala syftet med data mininginsatser. Sekretess kan också skyddas genom att använda ett ointresserat mellanparti för att genomföra den faktiska gruvdrift, vilket gör att företagen kan samla sina databasresurser utan att något företag har direkt tillgång till det andra företagets privata typer av data.