Hva er kunnskapsutvinning?
Kunnskapsutvinning er prosessen der man bruker forskjellige informasjonskilder for å opprette en sammenhengende kunnskapsbank. Som en del av denne tilnærmingen vil utvinningen ofte benytte seg av en rekke både strukturerte og ustrukturerte kilder. Når det lykkes, resulterer kunnskapsutvinningen i solide data som lett kan leses og tolkes av et gitt program, slik at sluttbrukeren kan bruke den formelle kunnskapen til hvilket formål han eller hun ønsker.
Flere forskjellige kilder kan brukes i prosessen med kunnskapsutvinning. Innenfor omfanget av strukturerte kilder, kan data hentes ut fra forskjellige typer relasjonsdatabaser eller en eller annen type utvidbar merkingsspråk eller XML-kilde. Ustrukturerte kilder, for eksempel bilder, forskjellige former for tekstbehandlingsdokumenter, regneark og til og med tekst som er fanget på notisblokkstilprogrammer, kan brukes som en del av utvinningsprosessen. Så lenge kildene er lesbare for programmet som brukes til å styre kunnskapsutvinningsprosessen, kan de brukes som kilder som utvider potensialet for prosjektet som blir fremskutt ved hjelp av utvinningen og lar den endelige kunnskapen som produseres være brukbar .
Det er flere vanlige applikasjoner som oppstår med kunnskapsutvinning. Et hyppig eksempel er muligheten til å fange data fra en ustrukturert kilde og innlemme i en slags strukturert kunnskapskilde. Å trekke ut data som er funnet i relasjonsdatabaser og bruke dem til å lage nye dokumenter, eller benytte seg av elektroniske dokumenter for å importere data til relasjonsdatabaser, er et annet eksempel på hvordan denne typen utvinning kan fremskynde deling av formell kunnskap uten å måtte legge inn data manuelt som allerede er tilgjengelig fra en annen kilde. Denne gjenbruken av eksisterende kunnskap i et nytt format er ofte veldig nyttig i en rekke scenarier, noe som gjør det mulig å utnytte denne kunnskapen på måter som kanskje ikke har vært mulig med den eksisterende kilden. På denne måten kan brukeren lage kilder som er ideelle for en rekke forskjellige applikasjoner i stedet for bare de som er relevante for det originale hjemmet til den formelle kunnskapen.
Med bruk av datautvinning er det mulig å benytte seg av et stort datavarehus, enkelt importere og eksportere data som en måte å lage en ny kilde som kan brukes til et bestemt formål. Disse nyopprettede kildene på sin side finner også et sted i datavarehuset og kan etter hvert brukes i opprettelsen av nye utdrag som brukes for å imøtekomme nyere bruksbehov. Med dette i bakhodet kan kunnskapsutvinning sees på som et veldig nyttig verktøy som hjelper til med å få mest mulig ut av alle ressursene som er til rådighet, og forenkle mange av oppgavene som er involvert i delingen av den formelle kunnskapen.