Vad är datavarehusbrytning?
Datalagerbrytning är analysen av information som finns i en eller flera databaser för att göra informationen användbar. Dessa databaser, eller datalager, är en central depå för data. Företag samlar informationen de samlar in på sina kunder i ett datalager. När informationen har samlats in "bryts den" och användbar information extraheras från den för att producera information som kan hjälpa företaget att fatta affärsbeslut som kommer att öka vinsten eller sänka kostnaderna. Återförsäljare använder ofta gruvdrift för datalager för att analysera och förutsäga beteendet hos sina kunder.
Till exempel, när en shoppare går till stormarknaden och ger kassan sitt ofta shopparkort, samlas information om hennes inköp och lagras i företagets datalager. En stormarknadskedja kommer att ha miljoner uppgifter om vad folk köper, när, i vilka mängder och till vilket pris. En butik kanske vet att 50 000 paket med frysta ärter såldes förra året, men den informationen ensam är inte särskilt användbar. Om datalagerbrytningen emellertid avslöjar att 75% av de frysta ärtorna såldes under månader då färska ärter inte fanns tillgängliga, eller att 10% av ärterna såldes under de två veckorna fram till Thanksgiving, kan företaget kunna att använda den informationen för att öka sin årliga försäljning av frysta ärter.
Företag kan använda tekniker för gruvdrift för datalager för att förutsäga framtida försäljning. Data mining kan också hjälpa dem att uppskatta effekterna av lager- och prisbeslut. I snabbköpet kan datautvinning hindra butikerna från att lösa ut frysta ärter i händelse av en dålig gröda gröna ärter under ett visst år.
Regression av data mining är en data mining-teknik som används för att visa vad som sannolikt kommer att hända med ett datavärde om något i ekvationen ändras. Med hjälp av stormarknadsexempel skulle regression förutsäga nivån på frysta ärter om färska ärter ökade i pris. Regression använder historiska data och tillämpar en formel för den, som förutsäger framtida beteende.
Företagen kommer ofta att använda ett datalager gruvdrift programvara för att samla in och gruva sina data. Rätt applikation bestäms av mängden data de har och typen av analys de vill göra. Att välja rätt dataverktyg är avgörande för att samla in och tolka användbar data.