Vad är skillnaden mellan dataanläggning och datalagring?

Begreppen data mining och data warehousing förväxlas ofta av både affärs- och teknisk personal. Hela datahanteringsfältet har upplevt en fenomenal tillväxt med implementeringen av program för datainsamling och minskade kostnader för datorminne. Det främsta syftet bakom båda dessa funktioner är att tillhandahålla verktyg och metoder för att utforska mönstren och betydelsen i stora mängder data.

De primära skillnaderna mellan data mining och data warehousing är systemdesignen, metodologin och syftet. Datamining är användningen av mönsterigenkänningslogik för identitetstrender inom en provdataset och extrapolerar denna information mot den större datapoolen. Datalagring är processen för att extrahera och lagra data för att möjliggöra enklare rapportering.

Data mining är en allmän term som används för att beskriva en rad affärsprocesser som härrör från mönster från data. Typiskt används ett programvarupaket för statistisk analys för att identifiera specifika mönster, baserat på datauppsättningen och frågor som genereras av slutanvändaren. En typisk användning av data mining är att skapa riktade marknadsföringsprogram, identifiera ekonomisk bedrägeri och att flagga ovanliga mönster i beteende som en del av en säkerhetsgranskning.

Ett utmärkt exempel på data mining är den process som telefonföretagen använder för att marknadsföra produkter till befintliga kunder. Telefonföretaget använder programvara för gruvdrift för att få åtkomst till sin databas med kundinformation. En fråga skrivs för att identifiera kunder som har prenumererat på det grundläggande telefonpaketet och internettjänsten under en viss tidsram. När denna datauppsättning är vald, skrivs en annan fråga för att avgöra hur många av dessa kunder som utnyttjade gratis extra telefonfunktioner under en provkampanj. Resultaten av denna utvinning av data avslöjar beteendemönster som kan driva eller hjälpa till att förfina en marknadsföringsplan för att öka användningen av ytterligare telefontjänster.

Det är viktigt att notera att det primära syftet med data mining är att upptäcka mönster i data. Specifikationerna som används för att definiera provuppsättningen har en enorm inverkan på produktens relevans och analysens noggrannhet. Om vi ​​återgår till exemplet ovan, om datauppsättningen är begränsad till kunder inom ett specifikt geografiskt område, kommer resultaten och mönstret att skilja sig från en bredare datamängd. Även om både data mining och data warehousing arbetar med stora mängder information, är processerna som är ganska olika.

Ett datalager är en mjukvaruprodukt som används för att lagra stora datamängder och köra specifikt utformade frågor och rapporter. Business intelligence är ett växande studieområde som fokuserar på datalagring och relaterad funktionalitet. Dessa verktyg är utformade för att extrahera data och lagra dem på en metod utformad för att ge förbättrad systemprestanda. Mycket av terminologin inom data mining och data warehousing är densamma, vilket leder till mer förvirring.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?