Wat zijn de verschillende methoden voor datamining?
Er zijn verschillende methoden voor datamining die worden gebruikt in zowel software -opties als theoretische concepten. Hiermee kunnen gebruikers informatie extraheren uit gegevens die zijn verzameld door personen en bedrijven die een verscheidenheid aan tools gebruiken. Grote hoeveelheden gegevens kunnen worden gebruikt om verschillende factoren te bepalen in een enkel onderwerp of verscheidenheid aan onderwerpen. Deze dataminingmethoden worden meestal gebruikt op het gebied van fraudebescherming, marketing en surveillance. Moderne technieken gebruiken echter geautomatiseerde concepten om substantiële gegevens te verstrekken via geautomatiseerde bronnen. Naarmate de computerwetenschappen in de 20e eeuw ontstonden, is het concept van dataminingmethoden ontwikkeld in een poging verborgen patronen te overwinnen in grote delen van verzamelde gegevens. Een goed voorbeeld hiervan is wanneer een advertentiebedrijf de winkelpatronen van een online klant analyseert. Dit bedrijf kan dan bepaalde producten op de markt brengenDe persoon is mogelijk geïnteresseerd in de aankoop.
Eén dataminingtechniek die vaak in de industrie wordt gebruikt, wordt kennisontdekking genoemd in databases (KDD). Met KDD is in 1989 ontwikkeld door Gregory Piatetsky-Shapiro en kunnen gebruikers onbewerkte gegevens verwerken, de informatie voor noodzakelijke gegevens analyseren en de resultaten interpreteren. Met deze methode kunnen gebruikers patronen in de algoritmen vinden, maar de algemene gegevens zijn niet altijd nauwkeurig en kunnen op compromitterende manieren worden samengesteld. Dit staat bekend als overfitting .
Basisgegevensmethoden voor datamining omvatten vier specifieke soorten taken: classificatie, clustering, regressie en associatie. Classificatie neemt de aanwezige informatie en gaat deze samen in gedefinieerde groeperingen. clustering verwijdert de gedefinieerde groeperingen en stelt de gegevens in staat zichzelf te classificeren door vergelijkbare items. regressie richt zich op de functie van de informatie, modelleringDe gegevens over concept. De uiteindelijke dataminingmethode, Association , probeert relaties te vinden tussen de verschillende gegevensfeeds.
Bij gebruik van de verschillende dataminingmethoden worden bepaalde normen gebruikt om te bepalen welke parameters in het proces kunnen worden gebruikt. De speciale interessegroep van de Association for Computing Machinery over kennisontdekking en datamining (SIGKDD) heeft een jaarlijkse vergadering die bepaalt welke processen geschikt zijn. Ethische factoren worden gewogen samen met praktische toepassingen om de beste informatie over individuen en bedrijven te vinden. Deze informatie wordt gepubliceerd in een industriejournaal genaamd sigkdd verkenningen.