Vad är Data Warehouse Mining?
Data Warehouse Mining är analysen av information som finns i en eller flera databaser för att göra informationen användbar. Dessa databaser, eller datalager, är en central depå för data. Företag samlar informationen de samlar in på sina kunder i ett datalager. När informationen har samlats in är den "bryts" och användbar information extraheras från den för att producera information som kan hjälpa företaget att fatta affärsbeslut som kommer att öka vinsten eller minska kostnaderna. Återförsäljare använder ofta Data Warehouse Mining för att analysera och förutsäga sina kunders beteende.
Till exempel, när en shoppare går till stormarknaden och ger kassören som hennes ofta shopparkort samlas in och lagras i företagets datalager. En stormarknadskedja kommer att ha miljoner data om vad folk köper, när, i vilka mängder och till vilket pris. En butik kanske vet att 50 000 paket frysta ärtor såldes senastår, men den informationen ensam är inte särskilt användbar. Om datalagerbrytningen avslöjar, emellertid att 75% av de frysta ärtorna såldes under månader när färska ärtor inte var tillgängliga, eller att 10% av ärtorna såldes under de två veckorna som ledde till Thanksgiving, kan företaget kunna använda den informationen för att öka deras årliga försäljning av frysta ärtor.
Företag kan använda datalager gruvtekniker för att förutsäga framtida försäljning. Data mining kan också hjälpa dem att uppskatta effekterna av beslut om lagring och prissättning. I stormarknaden kan data mining hindra butikerna från att ta slut på frysta ärtor i händelse av en dålig skörd av färska ärter under ett visst år.
Regression av data mining är en datateknik som används för att visa vad som sannolikt kommer att hända med ett datavärde om något i ekvationen ändras. Med hjälp av stormarknadsexemplet skulle regression förutsägaNivån på fryst ärtförsäljning om färska ärtor ökade i pris. Regression använder historiska data och tillämpar en formel på den, som förutsäger framtida beteende.
Företag kommer ofta att använda en datalagerprogramvara för att samla in och gruva sina data. Rätt applikation bestäms av mängden data de har och vilken typ av analys de vill göra. Att välja rätt verktyg för data mining är avgörande för att samla in och tolka användbar data.