Hva er struktur gruvedrift?

Structure mining er en type data mining der en semistrukturert datakilde skannes, og elementer i strukturen blir oppdaget og fremhevet. En semistrukturert datakilde er en som ikke bruker den tradisjonelle databasestrukturen i tabeller, men har et semantisk element som skiller informasjon via koder og markører. Struktur gruvedrift kan brukes til å gruve databaser, nettsteder og mange andre former for datainformasjon for å oppdage elementer i strukturen. Det hjelper brukere med å forstå hvordan brikker samhandler med hverandre, eller hvordan de finner informasjon under bestemte koder. Denne gruvedriften kan også brukes til å forutsi hva en vare er, basert på regler skrevet av brukeren.

Det er mange forskjellige typer data mining, og de fleste er opptatt av gruvedrift av en tradisjonelt strukturert kilde. Dette inkluderer alle kilder som bruker tabeller og noder som er typiske for de fleste databaser. I struktur gruvedrift brukes bare semistrukturerte data. I dette tilfellet er dataene fra nettsteder eller enkle databaser som har en struktur, men ikke en som er i samsvar med tradisjonelle databaseregler. Dataene trenger koder eller markører som skiller hvert element for å bli utvunnet på riktig måte.

Ved å lese det semistrukturerte datasettet, er struktur gruvedrift i stand til å oppdage hvordan strukturen interagerer. For eksempel har hvert nettsted en navigasjonsmodell, og det er denne modellen som bestemmer hvordan sidene samhandler. Ved å gruve strukturen, kan brukeren oppdage hvordan denne navigasjonen fungerer, noe som kan hjelpe med å lage et lignende navigeringsskjema.

Struktur gruvedrift kan også brukes til å finne elementer ved å skrive regler i gruveprogrammet. For eksempel, hvis det er et bokdatasett, kan brukeren skrive en regel om at bøker uten indeks skal returnere som fiksjon, og de med en indeks skal returnere som sakprosa. De fleste skjønnlitterære bøker mangler en indeks, så denne regelen vil forutsi med høy nøyaktighet hva dataene er. Dette hjelper brukere når de ser på et semistrukturert sett som har en organisasjonsmetode, men ikke et som passer det brukeren er ute etter.

Etter å ha funnet ut strukturen til den semistrukturerte enheten, vil brukeren vanligvis sammenligne den med en annen semistrukturert enhet. Hvis brukeren har et bedriftsnettsted, kan han eller hun gruve et annet bedriftsnettsted for navigasjon og lenker, og se hvordan nettstedet hans er likt. Ved å sammenligne den utvinnede informasjonen, kan brukeren finne måter å øke strukturen effektivitet.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?