Vad är verktyg för gruvdrift?
Data mining-verktyg är mjukvarukomponenter och teorier som gör det möjligt för användare att extrahera information från data. Verktygen ger individer och företag möjlighet att samla in stora mängder data och använda den för att göra bestämningar om en viss användare eller grupper av användare. Några av de vanligaste användningarna av data mining-verktyg är inom områdena marknadsföring, skydd mot bedrägerier och övervakning.
Den manuella extraktionen av data har funnits i hundratals år. Automatiseringen av data mining har dock varit mest utbredd sedan datorns början. Under 1900-talet framkom olika datavetenskaper som hjälpte till att stödja konceptet att utveckla data mining-verktyg. Det övergripande målet med att använda verktygen är att avslöja dolda mönster. Till exempel, om ett marknadsföringsföretag upptäcker att en person tar en månatlig resa från New York till Los Angeles, blir det fördelaktigt för det företaget att annonsera information om destinationen till individen.
Inom databearbetningsindustrin har standarder fastställts för att definiera parametrarna för användningen av data mining-verktyg. Årligen håller Association for Computing Machines Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD) ett möte för att avgöra vilka processer som används. Samma grupp ansvarar också för att bedöma de etiska konsekvenserna av analysen av data från individer och företag. En tvåårig tidskrift publiceras av gruppen med titeln SIGKDD Explorations.
Det mest utbredda verktyget som används vid dataanläggning är processen som kallas Knowledge Discovery in Databases (KDD). KDD utvecklades 1989 av Gregory Piatetsky-Shapiro. Med hjälp av detta data mining-verktyg kan användare bearbeta rådata, bryta data för information och tolka de olika resultaten i form av informationshantering.
En av de viktigaste formerna för datalagring används för att bekämpa terrorism under 2000-talet. I USA använder National Research Council begreppen "mining mining" och ämnesbaserad data mining för att identifiera terroristaktiviteter i den stora informationspoolen runt om i världen. Mönsterbrytning definieras av processen för att lokalisera mönster inom en stor datamängd. Ämnesbaserad databehandlingsförsök försöker identifiera relationer mellan individer. Båda teknikerna kan också användas i allmän affärspraxis genom att definiera en kundbasens tankesätt och det interaktiva förhållandet mellan kunder.