Hvad er forskellen mellem datamining og datalagring?
Betingelserne data mining og data warehousing forveksles ofte af både forretningsfolk og teknisk personale. Hele feltet for datastyring har oplevet en fænomenal vækst med implementeringen af datainsamlingssoftwareprogrammer og de reducerede omkostninger til computerhukommelse. Det primære formål bag begge disse funktioner er at tilvejebringe værktøjer og metoder til at udforske mønstre og betydning i store datamængder.
De primære forskelle mellem dataindvinding og datalagring er systemdesign, anvendt metode og formålet. Data mining er brugen af mønstergenkendelseslogik til identitetstendenser inden for et eksempeldatasæt og ekstrapolerer denne information mod den større datapool. Datalagring er processen med at udtrække og lagre data for at muliggøre lettere rapportering.
Data mining er et generelt udtryk, der bruges til at beskrive en række forretningsprocesser, der stammer mønstre fra data. Typisk bruges en statistisk analysesoftwarepakke til at identificere specifikke mønstre, baseret på datasættet og forespørgsler genereret af slutbrugeren. En typisk brug af data mining er at oprette målrettede marketingprogrammer, identificere økonomisk svig og at markere usædvanlige mønstre i adfærd som en del af en sikkerhedsgennemgang.
Et fremragende eksempel på dataindvinding er den proces, som telefonfirmaer bruger til at markedsføre produkter til eksisterende kunder. Telefonfirmaet bruger data mining software til at få adgang til sin database med kundeinformation. Der skrives en forespørgsel for at identificere kunder, der har abonneret på den grundlæggende telefonpakke og internettjenesten over en bestemt tidsramme. Når dette datasæt er valgt, skrives en anden forespørgsel for at bestemme, hvor mange af disse kunder, der drage fordel af gratis ekstra telefonfunktioner under en prøvefremme. Resultaterne af denne dataindvindingsøvelse afslører adfærdsmønstre, der kan drive eller hjælpe med at forbedre en markedsføringsplan for at øge brugen af yderligere telefontjenester.
Det er vigtigt at bemærke, at det primære formål med data mining er at få øje på mønstre i dataene. De specifikationer, der bruges til at definere prøvesættet, har en enorm indflydelse på relevansen af output og analysens nøjagtighed. Vend tilbage til eksemplet ovenfor, hvis datasættet er begrænset til kunder inden for et specifikt geografisk område, vil resultaterne og mønstrene afvige fra et bredere datasæt. Selvom både data mining og data warehousing arbejder med store mængder information, er de anvendte processer ganske forskellige.
Et datavarehus er et softwareprodukt, der bruges til at gemme store mængder data og køre specifikt designet forespørgsler og rapporter. Business intelligence er et voksende studieområde, der fokuserer på datalagring og relateret funktionalitet. Disse værktøjer er designet til at udtrække data og gemme dem i en metode designet til at give forbedret systemydelse. Meget af terminologien inden for data mining og data warehousing er den samme, hvilket fører til mere forvirring.