Wat is kennisextractie?
Kennisextractie is het proces waarbij gebruik wordt gemaakt van verschillende informatiebronnen om een samenhangende kennisbank te creëren. Als onderdeel van deze benadering zal de extractie vaak gebruikmaken van een reeks gestructureerde en ongestructureerde bronnen. Als dit lukt, resulteert de kennisextractie in solide gegevens die gemakkelijk kunnen worden gelezen en geïnterpreteerd door een bepaald programma, zodat de eindgebruiker die formele kennis kan gebruiken voor welk doel dan ook.
Verschillende bronnen kunnen worden gebruikt in het proces van kennisextractie. Binnen het bereik van gestructureerde bronnen kunnen gegevens worden geëxtraheerd uit verschillende soorten relationele databases of een of ander type uitbreidbare opmaaktaal of XML-bron. Ongestructureerde bronnen, zoals afbeeldingen, verschillende vormen van tekstverwerkingsdocumenten, spreadsheets en zelfs tekst vastgelegd in programma's in Kladblokstijl kunnen worden gebruikt als onderdeel van het extractieproces. Zolang de bronnen leesbaar zijn voor het programma dat wordt gebruikt om het kennisextractieproces te beheren, kunnen ze worden gebruikt als bronnen die het potentieel voor het project dat wordt gevorderd door middel van de extractie uitbreiden en de uiteindelijke geproduceerde kennis bruikbaar maken .
Er zijn verschillende veel voorkomende toepassingen die zich voordoen bij kennisextractie. Een veel voorkomend voorbeeld is de mogelijkheid om gegevens uit een ongestructureerde bron vast te leggen en op te nemen in een soort gestructureerde kennisbron. Extraheren van gegevens gevonden in relationele databases en het gebruiken om nieuwe documenten te maken, of gebruik maken van elektronische documenten om gegevens in relationele databases te importeren, is een ander voorbeeld van hoe dit type extractie het delen van formele kennis kan versnellen zonder de noodzaak om handmatig gegevens in te voeren die al beschikbaar is vanaf een andere bron. Dit hergebruik van bestaande kennis in een nieuw formaat is vaak zeer nuttig in een aantal scenario's, waardoor het mogelijk wordt die kennis te gebruiken op manieren die misschien niet mogelijk waren met de bestaande bron. Op deze manier kan de gebruiker bronnen maken die ideaal zijn voor een aantal verschillende toepassingen in plaats van alleen die welke relevant zijn voor de oorspronkelijke thuisbasis van de formele kennis.
Met het gebruik van data-extractie is het mogelijk om gebruik te maken van een enorm datawarehouse, waarbij gegevens eenvoudig kunnen worden geïmporteerd en geëxporteerd als een manier om een nieuwe bron te creëren die bruikbaar is voor een specifiek doel. Deze nieuw gecreëerde bronnen vinden op hun beurt ook een plaats in het datawarehouse en kunnen uiteindelijk worden gebruikt bij het maken van nieuwe extracties die worden gebruikt om aan nieuwere gebruiksbehoeften te voldoen. Met dit in gedachten kan kennisextractie worden gezien als een zeer nuttig hulpmiddel dat helpt bij het optimaal benutten van alle beschikbare middelen, waardoor veel van de taken die met het delen van die formele kennis gemoeid zijn, worden vereenvoudigd.