Hvad er videnudvinding?

Videnekstraktion er processen med at bruge forskellige informationskilder til at skabe en sammenhængende vidensbank. Som en del af denne tilgang vil udtrækningen ofte trække på en række både strukturerede og ustrukturerede kilder. Når det lykkes, resulterer videnekstraktionen i solide data, der let kan læses og fortolkes af et givet program, så slutbrugeren kan bruge denne formelle viden til det formål han eller hun ønsker.

Flere forskellige kilder kan anvendes i processen med videnekstraktion. Inden for omfanget af strukturerede kilder kan data udvindes fra forskellige typer relationelle databaser eller en eller anden type udvidelig markup-sprog eller XML-kilde. Ustrukturerede kilder, såsom billeder, forskellige former for tekstbehandlingsdokumenter, regneark og endda tekst, der er fanget på notepad-stilprogrammer, kan bruges som en del af udvindingsprocessen. Så længe kilderne er læsbare for det program, der bruges til at styre videnekstraktionsprocessen, kan de bruges som kilder, der udvider potentialet for det projekt, der fremføres ved hjælp af ekstraktionen og tillader, at den producerede færdige viden er anvendelig .

Der er flere almindelige applikationer, der opstår med videnekstraktion. Et hyppigt eksempel er evnen til at fange data fra en ustruktureret kilde og indarbejde i en slags struktureret videnskilde. Ekstrahering af data, der findes i relationelle databaser og anvendelse af dem til at oprette nye dokumenter, eller gøre brug af elektroniske dokumenter til at importere data til relationelle databaser, er et andet eksempel på, hvordan denne type udtrækning kan fremskynde deling af formel viden uden behov for manuelt at indtaste data der er allerede tilgængelig fra en anden kilde. Denne genbrug af eksisterende viden i et nyt format er ofte meget nyttigt i en række scenarier, hvilket gør det muligt at udnytte denne viden på måder, der måske ikke har været muligt med den eksisterende kilde. På denne måde kan brugeren oprette kilder, der er ideelle til en række forskellige applikationer i stedet for kun dem, der er relevante for det originale hjemsted for den formelle viden.

Med brug af dataekstraktion er det muligt at gøre brug af et stort datalager, som let kan importeres og eksporteres som en måde at skabe en ny kilde, der kan bruges til et specifikt formål. Disse nyoprettede kilder finder igen også et sted i datalageret og kan til sidst bruges til oprettelse af nye uddrag, der bruges til at imødekomme nyere brugsbehov. Med dette for øje kan videnekstraktion ses som et meget nyttigt værktøj, der hjælper med at få mest muligt ud af alle de ressourcer, der i øjeblikket er til rådighed, og forenkle mange af de opgaver, der er involveret i delingen af ​​den formelle viden.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?