Que sont les outils d'exploration de données?
Les outils d'exploration de données sont des composants logiciels et des théories permettant aux utilisateurs d'extraire des informations à partir de données. Les outils offrent aux particuliers et aux entreprises la possibilité de rassembler de grandes quantités de données et de les utiliser pour prendre des décisions concernant un utilisateur ou des groupes d'utilisateurs particuliers. Certaines des utilisations les plus courantes des outils d’exploration de données concernent le marketing, la protection contre la fraude et la surveillance.
L'extraction manuelle des données existe depuis des centaines d'années. Toutefois, l’automatisation de l’exploration de données a été la plus répandue depuis le début de l’ère informatique. Au cours du 20ème siècle, diverses sciences informatiques ont émergé pour aider à soutenir le concept de développement d’outils d’exploration de données. L’objectif général de l’utilisation des outils est de révéler des modèles cachés. Par exemple, si une entreprise de marketing découvre qu'une personne effectue un voyage mensuel de New York à Los Angeles, il devient alors avantageux pour cette entreprise de lui communiquer les détails de la destination.
Au sein de l'industrie de l'extraction de données, des normes ont été établies pour définir les paramètres d'utilisation des outils d'extraction de données. Chaque année, le groupe d'intérêt de l'Association for Computing Machinery sur la découverte des connaissances et l'exploration de données (SIGKDD) organise une réunion pour déterminer les processus utilisés. Le même groupe est également chargé d’évaluer les implications éthiques de l’analyse de données provenant d’individus et d’entreprises. Le groupe intitulé SIGKDD Explorations publie un journal semestriel .
L'outil le plus utilisé dans l'exploration de données est le processus appelé Découverte de connaissances dans des bases de données (KDD). KDD a été développé en 1989 par Gregory Piatetsky-Shapiro. Grâce à cet outil d’exploration de données, les utilisateurs sont en mesure de traiter des données brutes, de rechercher des informations dans les données et d’interpréter les différents résultats sous forme de gestion de l’information.
L'une des formes les plus importantes d'outils d'exploration de données est utilisée pour lutter contre le terrorisme au XXIe siècle. Aux États-Unis, le National Research Council utilise les concepts de l'extraction de modèles et de l'extraction de données par sujet pour identifier les activités terroristes dans le vaste réservoir d'informations existant dans le monde. L'exploration de modèles est définie par le processus de localisation des modèles dans un grand volume de données. L'exploration de données par sujet tente d'identifier les relations entre les individus. Les deux techniques peuvent également être utilisées dans la pratique commerciale générale en définissant l'état d'esprit d'une clientèle et la relation interactive entre clients.