Qu'est-ce que l'extraction de connaissances?
L'extraction de connaissances consiste à utiliser diverses sources d'informations pour créer une banque de connaissances cohérente. Dans le cadre de cette approche, l’extraction s’appuiera souvent sur une gamme de sources structurées et non structurées. En cas de succès, l’extraction de connaissances donne des données solides qui peuvent facilement être lues et interprétées par un programme donné, permettant ainsi à l’utilisateur final d’utiliser ces connaissances formelles à ses fins.
Plusieurs sources différentes peuvent être utilisées dans le processus d’extraction de connaissances. Dans le cadre des sources structurées, les données peuvent être extraites de divers types de bases de données relationnelles ou d'un type de langage de balisage extensible ou de source XML. Des sources non structurées, telles que des images, différentes formes de documents de traitement de texte, des feuilles de calcul et même du texte capturé sur des programmes de style bloc-notes peuvent être utilisées dans le cadre du processus d'extraction. Tant que les sources sont lisibles par le programme utilisé pour gérer le processus d'extraction des connaissances, elles peuvent être utilisées comme sources permettant d'étendre le potentiel du projet avancé grâce à l'extraction et de permettre l'utilisation des connaissances finales produites .
Plusieurs applications courantes se produisent avec l'extraction de connaissances. Un exemple fréquent est la capacité de capturer des données à partir d'une source non structurée et de les incorporer dans un type de source de connaissances structurée. L'extraction de données trouvées dans des bases de données relationnelles et leur utilisation pour créer de nouveaux documents ou utiliser des documents électroniques pour importer des données dans des bases de données relationnelles sont un autre exemple de la manière dont ce type d'extraction peut accélérer le partage de connaissances formelles sans qu'il soit nécessaire de saisir manuellement des données. qui est déjà disponible à partir d'une autre source. Cette réutilisation des connaissances existantes dans un nouveau format est souvent très utile dans un certain nombre de scénarios, ce qui permet d'utiliser ces connaissances d'une manière qui n'aurait peut-être pas été possible avec la source existante. De cette manière, l'utilisateur peut créer des sources idéales pour un certain nombre d'applications différentes plutôt que seulement celles pertinentes pour le foyer d'origine des connaissances formelles.
Avec l'utilisation de l'extraction de données, il est possible de faire appel à un vaste entrepôt de données, permettant d'importer et d'exporter facilement des données afin de créer une nouvelle source utilisable dans un but spécifique. À leur tour, ces sources nouvellement créées trouvent également une place dans l’entrepôt de données et peuvent éventuellement être utilisées pour créer de nouvelles extractions utilisées pour répondre aux nouveaux besoins d’utilisation. Dans cet esprit, l'extraction de connaissances peut être considérée comme un outil très utile permettant de tirer le meilleur parti de toutes les ressources actuellement disponibles, en simplifiant de nombreuses tâches liées au partage de ces connaissances formelles.