Wat zijn dataminingtools?
Dataminingtools zijn softwarecomponenten en theorieën waarmee gebruikers informatie uit gegevens kunnen extraheren. De tools bieden individuen en bedrijven de mogelijkheid om grote hoeveelheden gegevens te verzamelen en te gebruiken om beslissingen te nemen over een bepaalde gebruiker of groepen gebruikers. Enkele van de meest voorkomende toepassingen van dataminingtools zijn op het gebied van marketing, fraudebescherming en surveillance.
De handmatige extractie van gegevens bestaat al honderden jaren. De automatisering van datamining is echter het meest gangbaar sinds het begin van het computertijdperk. In de 20e eeuw ontstonden verschillende computerwetenschappen om het concept van de ontwikkeling van dataminingtools te ondersteunen. Het algemene doel van het gebruik van de tools is om verborgen patronen te ontdekken. Als een marketingbedrijf bijvoorbeeld ontdekt dat een persoon een maandelijkse reis van New York City naar Los Angeles maakt, wordt het voor dat bedrijf voordelig om details over de bestemming aan het individu te adverteren.
Binnen de datamining-industrie zijn normen opgesteld om de parameters voor het gebruik van dataminingtools te definiëren. Jaarlijks houdt de Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD) van de Association for Computing Machinery een vergadering om te bepalen welke processen worden gebruikt. Dezelfde groep is ook verantwoordelijk voor het beoordelen van de ethische implicaties van de analyse van gegevens van personen en bedrijven. Een tweejaarlijks tijdschrift wordt gepubliceerd door de groep getiteld SIGKDD Explorations.
De meest voorkomende tool die wordt gebruikt bij datamining is het proces genaamd Knowledge Discovery in Databases (KDD). KDD werd ontwikkeld in 1989 door Gregory Piatetsky-Shapiro. Met behulp van deze datamining-tool kunnen gebruikers onbewerkte gegevens verwerken, de gegevens opzoeken voor informatie en de verschillende resultaten interpreteren in de vorm van informatiebeheer.
Een van de belangrijkste vormen van dataminingtools wordt in de 21e eeuw gebruikt om terrorisme te bestrijden. In de Verenigde Staten gebruikt de National Research Council de concepten van pattern mining en subject-based datamining om terroristische activiteiten in de grote hoeveelheid informatie over de hele wereld te identificeren. Patroon mining wordt gedefinieerd door het proces van het lokaliseren van patronen binnen een grote hoeveelheid gegevens. Op onderwerpen gebaseerde datamining probeert relaties tussen individuen te identificeren. Beide technieken kunnen ook in de algemene bedrijfspraktijk worden gebruikt door de mindset van een klantenbestand en de interactieve relatie tussen klanten te definiëren.