Che cos'è l'estrazione della conoscenza?
L'estrazione della conoscenza è il processo di utilizzo di varie fonti di informazione per creare una banca della conoscenza coesa. Come parte di questo approccio, l'estrazione attingerà spesso da una gamma di fonti strutturate e non strutturate. In caso di successo, l'estrazione della conoscenza genera dati solidi che possono essere facilmente letti e interpretati da un determinato programma, consentendo all'utente finale di utilizzare quella conoscenza formale per qualsiasi scopo desideri.
Diverse fonti diverse possono essere utilizzate nel processo di estrazione della conoscenza. Nell'ambito delle fonti strutturate, i dati possono essere estratti da vari tipi di database relazionali o da qualche tipo di linguaggio di markup estensibile o fonte XML. Durante il processo di estrazione possono essere utilizzate fonti non strutturate, come immagini, diverse forme di documenti di elaborazione testi, fogli di calcolo e persino testo acquisito su programmi in stile blocco note. Finché le fonti sono leggibili per il programma utilizzato per gestire il processo di estrazione della conoscenza, possono essere utilizzate come fonti che espandono il potenziale per il progetto che viene avanzato mediante l'estrazione e consentono di utilizzare le conoscenze finali prodotte .
Esistono diverse applicazioni comuni che si verificano con l'estrazione della conoscenza. Un esempio frequente è la capacità di acquisire dati da una fonte non strutturata e incorporarli in un qualche tipo di fonte di conoscenza strutturata. L'estrazione di dati trovati in database relazionali e il loro utilizzo per creare nuovi documenti o utilizzare documenti elettronici per importare dati in database relazionali, è un altro esempio di come questo tipo di estrazione può accelerare la condivisione delle conoscenze formali senza la necessità di inserire manualmente i dati che è già disponibile da qualche altra fonte. Questo riutilizzo delle conoscenze esistenti in alcuni nuovi formati è spesso molto utile in numerosi scenari, rendendo possibile l'utilizzo di tali conoscenze in modi che potrebbero non essere stati possibili con la fonte esistente. In questo modo, l'utente può creare fonti ideali per un numero di applicazioni diverse anziché solo quelle pertinenti alla sede originale della conoscenza formale.
Con l'uso dell'estrazione dei dati, è possibile utilizzare un vasto data warehouse, importando ed esportando facilmente i dati come un modo per creare una nuova fonte utilizzabile per uno scopo specifico. Queste fonti di nuova creazione a loro volta trovano anche un posto nel data warehouse e possono eventualmente essere utilizzate nella creazione di nuove estrazioni che vengono utilizzate per soddisfare le esigenze di utilizzo più recenti. In quest'ottica, l'estrazione della conoscenza può essere vista come uno strumento molto utile che aiuta a sfruttare al massimo tutte le risorse attualmente disponibili, semplificando molti dei compiti coinvolti nella condivisione di tale conoscenza formale.