Hva er forskjellen mellom datadrift og datalagring?

Begrepene data mining og data warehousing blir ofte forvirret av både forretnings- og teknisk personale. Hele feltet for datahåndtering har opplevd en fenomenal vekst med implementeringen av datainnsamlingsprogrammer og de reduserte kostnadene for dataminne. Hovedformålet bak begge disse funksjonene er å tilby verktøyene og metodikkene for å utforske mønstrene og betydningen i store datamengder.

De primære forskjellene mellom data mining og data warehousing er systemdesign, metodikk som brukes og formålet. Databehandling er bruk av mønstergjenkjenningslogikk for identitetstrender i et eksempeldatasett og ekstrapolerer denne informasjonen mot det større datapool. Datalagring er prosessen med å trekke ut og lagre data for å gjøre det lettere å rapportere.

Data mining er et generelt begrep som brukes for å beskrive en rekke forretningsprosesser som stammer mønstre fra data. Vanligvis brukes en programvarepakke for statistisk analyse for å identifisere spesifikke mønstre, basert på datasettet og spørringene generert av sluttbrukeren. En typisk bruk av data mining er å lage målrettede markedsføringsprogrammer, identifisere økonomisk svindel og å flagge uvanlige mønstre i oppførsel som en del av en sikkerhetsgjennomgang.

Et utmerket eksempel på data mining er prosessen som brukes av telefonselskaper for å markedsføre produkter til eksisterende kunder. Telefonselskapet bruker programvare for gruvedrift for å få tilgang til sin database med kundeinformasjon. Det blir skrevet en spørring for å identifisere kunder som har abonnert på den grunnleggende telefonpakken og Internett-tjenesten over en bestemt tidsramme. Når dette datasettet er valgt, skrives en annen spørring for å avgjøre hvor mange av disse kundene som benyttet seg av gratis ekstra telefonfunksjoner under en prøvekampanje. Resultatene fra denne dataminearbeidingen avslører atferdsmønstre som kan drive eller bidra til å avgrense en markedsføringsplan for å øke bruken av ytterligere telefontjenester.

Det er viktig å merke seg at det primære formålet med data mining er å oppdage mønstre i dataene. Spesifikasjonene som brukes for å definere prøvesettet har stor innvirkning på relevansen av utdataene og nøyaktigheten av analysen. Tilbake til eksemplet ovenfor, hvis datasettet er begrenset til kunder innenfor et spesifikt geografisk område, vil resultatene og mønstrene avvike fra et bredere datasett. Selv om både data mining og data warehousing jobber med store mengder informasjon, er prosessene som brukes ganske forskjellige.

Et datavarehus er et programvareprodukt som brukes til å lagre store datamengder og kjøre spesielt designet spørringer og rapporter. Business intelligence er et voksende studieretning som fokuserer på datavarehus og relatert funksjonalitet. Disse verktøyene er designet for å hente ut data og lagre dem i en metode som er utviklet for å gi forbedret systemytelse. Mye av terminologien innen data mining og data warehousing er den samme, noe som fører til mer forvirring.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?