Vilka är de olika metoderna för gruvdrift?

Det finns en mängd olika metoder för datainsamling som används i både mjukvarualternativ och teoretiska koncept. Dessa gör det möjligt för användare att extrahera information från data som samlas in av individer och företag med olika verktyg. Stora mängder data kan användas för att bestämma olika faktorer i ett enda ämne eller olika ämnen. Dessa metoder för databearbetning används oftast inom områdena bedrägeriskydd, marknadsföring och övervakning.

Under hundratals år har metoder för utvinning av data använts för att extrahera information från ämnen. Moderna tekniker använder emellertid automatiserade koncept för att tillhandahålla betydande data via datoriserade resurser. När datavetenskapen växte fram under 1900-talet utvecklades konceptet för datalagringsmetoder i ett försök att övervinna dolda mönster i stora streck av insamlade data. Ett bra exempel på detta är när ett reklamföretag analyserar en online kunders shoppingmönster. Detta företag kan sedan marknadsföra vissa produkter som individen kan vara intresserad av att köpa.

En teknik för gruvdrift som används ofta i branschen kallas Knowledge Discovery in Databases (KDD). KDD utvecklades 1989 av Gregory Piatetsky-Shapiro och gör det möjligt för användare att bearbeta rådata, analysera informationen för nödvändig data och tolka resultaten. Denna metod gör det möjligt för användare att hitta mönster i algoritmerna, men de allmänna uppgifterna är inte alltid korrekta och kan sättas samman på kompromisserande sätt. Detta kallas övermontering .

Grundläggande datainsamlingsmetoder involverar fyra specifika typer av uppgifter: klassificering, kluster, regression och associering. Klassificering tar informationen som finns och sammanfogar den i definierade grupperingar. Clustering tar bort de definierade grupperingarna och gör att data kan klassificera sig genom liknande objekt. Regression fokuserar på informationens funktion, modellerar data om konceptet. Den slutliga dataminingmetoden, associering , försöker hitta relationer mellan de olika dataflödena.

När man använder de olika metoderna för data mining används vissa standarder för att bestämma vilka parametrar som kan användas i processen. Association for Computing Machines Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD) håller ett årligt möte som avgör vilka processer som är lämpliga. Etiska faktorer vägs tillsammans med praktiska tillämpningar för att hitta bästa information om individer och företag. Denna information publiceras i en branschjournal som heter SIGKDD Explorations.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?