Hvad er datavarehusminedrift?
Data warehouse mining er analysen af oplysninger, der er indeholdt i en eller flere databaser for at gøre informationen nyttig. Disse databaser, eller datalager, er et centralt depositar for data. Virksomheder samler de oplysninger, de indsamler om deres kunder i et datavarehus. Når informationen er indsamlet, "udvindes", og nyttig information trækkes ud for at producere information, der kan hjælpe virksomheden med at tage forretningsbeslutninger, der øger overskuddet eller reducerer omkostningerne. Detailhandlere bruger ofte datavarehoveddrift til at analysere og forudsige deres kunders adfærd.
Når en shopper for eksempel går i supermarkedet og giver kassereren sit hyppige shopperkort, indsamles og opbevares oplysninger om hendes køb i virksomhedens datalager. En supermarkedskæde vil have millioner af stykker data om, hvad folk køber, hvornår, i hvilke mængder og til hvilken pris. En butik ved måske, at der blev solgt 50.000 pakker med frosne ærter sidste år, men at oplysningerne alene ikke er særlig nyttige. Hvis datalagerudvindingen imidlertid afslører, at 75% af de frosne ærter blev solgt i løbet af måneder, hvor friske ærter ikke var tilgængelige, eller at 10% af ærterne blev solgt i de to uger frem til Thanksgiving, kan virksomheden muligvis være i stand til at bruge disse oplysninger til at øge deres årlige salg af frosne ærter.
Virksomheder kan anvende datavarehusmineteknikker til at forudsige fremtidig salg. Data mining kan også hjælpe dem med at estimere virkningen af lager- og prisbeslutninger. I supermarkedet kan dataminering forhindre butikkerne i at løbe tør for frosne ærter i tilfælde af en dårlig afgrøde af friske ærter i et givet år.
Data mining regression er en data mining-teknik, der bruges til at vise, hvad der sandsynligvis vil ske med en dataværdi, hvis noget i ligningen ændres. Ved hjælp af supermarkedseksemplet ville regression forudsige niveauet for frosne ærter, hvis friske ærter steg i pris. Regression bruger historiske data og anvender en formel til dem, der forudsiger fremtidig adfærd.
Virksomheder vil ofte bruge et softwareapplikation til datalager mining til at indsamle og mine deres data. Den rigtige applikation bestemmes af den mængde data, de har, og den type analyse, de vil udføre. Valg af det rigtige dataindvindingsværktøj er afgørende for indsamling og fortolkning af nyttige data.