Wat is het verschil tussen datamining en datawarehousing?

De voorwaarden data -mining en data warehousing zijn vaak in de war door zowel zakelijk als technisch personeel. Het hele veld van gegevensbeheer heeft een fenomenale groei doorgemaakt met de implementatie van softwareprogramma's voor gegevensverzameling en de verlaagde kosten van computergeheugen. Het primaire doel achter beide functies is om de tools en methoden te bieden om de patronen en betekenis in grote hoeveelheid gegevens te verkennen.

De primaire verschillen tussen datamining en datawarehousing zijn de systeemontwerpen, gebruikte methodologie en het doel. Datamining is het gebruik van patroonherkenningslogica voor identiteitstrends binnen een voorbeeldgegevensset en extrapoleer deze informatie tegen de grotere gegevenspool. Data Warehousing is het proces van het extraheren en opslaan van gegevens om eenvoudiger rapportage mogelijk te maken.

Datamining is een algemene term die wordt gebruikt om een ​​reeks bedrijfsprocessen te beschrijven die patronen uit gegevens afleiden. Meestal wordt een statistisch analysesoftwarepakket gebruikt om SPE te identificerenCIFIC -patronen, gebaseerd op de gegevensset en vragen gegenereerd door de eindgebruiker. Een typisch gebruik van datamining is om gerichte marketingprogramma's te maken, financiële fraude te identificeren en ongebruikelijke patronen in gedrag te markeren als onderdeel van een beveiligingsbeoordeling.

Een uitstekend voorbeeld van datamining is het proces dat wordt gebruikt door telefoonbedrijven om producten op de markt te brengen voor bestaande klanten. Het telefoonbedrijf maakt gebruik van datamining -software om toegang te krijgen tot de database met klantinformatie. Er is een zoekopdracht geschreven om klanten te identificeren die zich over een specifiek tijdsbestek hebben geabonneerd op het basistelefoonpakket en de internetdienst. Zodra deze gegevensset is geselecteerd, wordt een andere query geschreven om te bepalen hoeveel van deze klanten gebruik maakten van gratis extra telefoonfuncties tijdens een proefpromotie. De resultaten van deze data -mining oefening onthullen gedragspatronen die kunnen stimuleren of helpen bij het verfijnen van een marketingplan om te verhogenhet gebruik van extra telefonische diensten.

Het is belangrijk op te merken dat het primaire doel van datamining is om patronen in de gegevens te spotten. De specificaties die worden gebruikt om de monsterset te definiëren, heeft een enorme impact op de relevantie van de output en de nauwkeurigheid van de analyse. Terugkerend naar het bovenstaande voorbeeld, als de gegevensset beperkt is tot klanten binnen een specifiek geografisch gebied, verschillen de resultaten en patronen van een bredere gegevensset. Hoewel zowel datamining als datawarehousing werken met grote hoeveelheden informatie, zijn de gebruikte processen heel verschillend.

Een datawarehouse is een softwareproduct dat wordt gebruikt om grote hoeveelheden gegevens op te slaan en specifiek ontworpen query's en rapporten uit te voeren. Business Intelligence is een groeiend vakgebied dat zich richt op datawarehousing en gerelateerde functionaliteit. Deze tools zijn ontworpen om gegevens te extraheren en op te slaan in een methode die is ontworpen om verbeterde systeemprestaties te bieden. Veel van de terminologie in datamining en data warehOuderen zijn hetzelfde, wat leidt tot meer verwarring.

ANDERE TALEN