Wat zijn datamininghulpmiddelen?
data -mining -tools zijn softwarecomponenten en theorieën waarmee gebruikers informatie uit gegevens kunnen halen. De tools bieden individuen en bedrijven de mogelijkheid om grote hoeveelheden gegevens te verzamelen en te gebruiken om bepalingen te maken over een bepaalde gebruiker of groepen gebruikers. Enkele van de meest voorkomende toepassingen van dataminingtools zijn op het gebied van marketing, fraudebescherming en surveillance.
De handmatige extractie van gegevens bestaat al honderden jaren. De automatisering van datamining is echter het meest voorkomend sinds het begin van het computertijdperk. In de 20e eeuw zijn verschillende computerwetenschappen naar voren gekomen om het concept van het ontwikkelen van dataminingtools te ondersteunen. Het algemene doel van het gebruik van de tools is om verborgen patronen te ontdekken. Als een marketingbedrijf bijvoorbeeld vindt dat een persoon een maandelijkse reis van New York City naar Los Angeles maakt, wordt het voordelig voor dat bedrijf om details van de bestemming voor het individu te adverteren.
binnen de DATEen mijnindustrie, normen zijn vastgesteld om de parameters van het gebruik van dataminingtools te definiëren. Jaarlijks houdt de Special Interest Group van de Association for Computing Machinery over kennisontdekking en datamining (SIGKDD) een vergadering om te bepalen welke processen worden gebruikt. Dezelfde groep is ook verantwoordelijk voor het beoordelen van de ethische implicaties van de analyse van gegevens van individuen en bedrijven. Een tweejaarlijkse tijdschrift wordt gepubliceerd door de groep getiteld SIGKDD Explorations.
De meest voorkomende tool die wordt gebruikt bij datamining is het proces dat kennisontdekking wordt genoemd in databases (KDD). KDD werd in 1989 ontwikkeld door Gregory Piatetsky-Shapiro. Met behulp van deze datamining tool kunnen gebruikers onbewerkte gegevens verwerken, de gegevens voor informatie ontginnen en de verschillende resultaten interpreteren in de vorm van informatiebeheer.
Een van de belangrijkste vormen van dataminingtools wordt gebruikt voor COMbating terrorisme in de 21ste eeuw. In de Verenigde Staten gebruikt de National Research Council de concepten van patroonwinning en onderworpen datamining om terroristische activiteiten te identificeren in de grote pool van informatie over de hele wereld. Patroonwinning wordt gedefinieerd door het proces van het lokaliseren van patronen binnen een groot aantal gegevens. Op onderwerp gebaseerde datamining probeert relaties tussen individuen te identificeren. Beide technieken kunnen ook worden gebruikt in de algemene bedrijfspraktijk door de mindset van een klantenbestand en de interactieve relatie tussen klanten te definiëren.