Qu'est-ce que l'exploitation de structure?

La fouille de structure est un type de fouille de données dans lequel une source de données semi-structurée est analysée et où des éléments de sa structure sont découverts et mis en surbrillance. Une source de données semi-structurée n'utilise pas la structure de base de tables traditionnelle, mais comporte un élément sémantique qui sépare les informations via des balises et des marqueurs. L'exploration de structure peut être utilisée pour extraire des bases de données, des sites Web et de nombreuses autres formes d'informations informatiques afin de découvrir des éléments de la structure. Il aide les utilisateurs à comprendre comment les éléments interagissent les uns avec les autres ou comment trouver des informations sous certaines balises. Cette exploration peut également être utilisée pour prédire ce qu'est un élément, en fonction de règles écrites par l'utilisateur.

Il existe de nombreux types d'exploration de données, et la plupart concernent l'extraction d'une source traditionnellement structurée. Cela inclut toute source utilisant les tables et les nœuds typiques de la plupart des bases de données. Dans l'exploration de structure, seules les données semi-structurées sont utilisées. Dans ce cas, les données proviennent de sites Web ou de simples bases de données ayant une structure, mais non conforme aux règles de base de données traditionnelles. Les données ont besoin d’étiquettes ou de marqueurs qui distinguent chaque élément pour l’exploitation appropriée.

En lisant l'ensemble de données semi-structuré, l'exploration de structure est en mesure de découvrir comment la structure interagit. Par exemple, chaque site Web possède un modèle de navigation, et c'est ce modèle qui détermine la manière dont les pages interagissent. En explorant la structure, l'utilisateur peut découvrir le fonctionnement de cette navigation, ce qui peut aider à créer un schéma de navigation similaire.

L'exploration de structure peut également être utilisée pour rechercher des éléments en écrivant des règles dans le programme d'exploration. Par exemple, s'il existe un ensemble de données de livre, l'utilisateur peut écrire une règle selon laquelle tous les livres sans index doivent être renvoyés en tant que fiction et ceux avec un index doivent être renvoyés en tant que non-fiction. La plupart des livres de fiction n’ayant pas d’index, cette règle permet de prédire avec une grande précision les données. Cela aide les utilisateurs à examiner un ensemble semi-structuré doté d'une méthode d'organisation mais pas d'une méthode adaptée à ce que l'utilisateur recherche.

Après avoir déterminé la structure de l'unité semi-structurée, l'utilisateur la comparera généralement à une autre unité semi-structurée. Si l'utilisateur a un site Web professionnel, il peut exploiter un autre site Web professionnel pour la navigation et les liens, et voir en quoi son site Web est similaire. En comparant les informations extraites, l'utilisateur peut trouver des moyens d'accroître l'efficacité de la structure.

DANS D'AUTRES LANGUES

Cet article vous a‑t‑il été utile ? Merci pour les commentaires Merci pour les commentaires

Comment pouvons nous aider? Comment pouvons nous aider?