Hva er Web Data Mining?
Flere enn noen gang bruker både enheter og enkeltpersoner World Wide Web for å utføre en rekke forretningsmessige og personlige transaksjoner. Som et resultat benytter selskapene seg i økende grad verktøy og teknikker for datadrift for å finne måter å forbedre bunnlinjene og øke kundegrunnlaget på. Nettdatautvikling innebærer prosessen med å samle og oppsummere data fra et nettsted hyperkoblingsstruktur, sideinnhold eller brukslogg for å identifisere mønstre. Ved å bruke nettdatautvikling kan et selskap identifisere en potensiell konkurrent, forbedre kundeservicen eller målrette kundenes behov og forventninger. Et myndighetsorgan kan også søke å avdekke terrortrusler eller annen kriminell virksomhet gjennom bruk av en applikasjon for gruvedrift av data.
Noen vanlige teknikker for gruvedrift av nettdata inkluderer gruvedrift av innhold, gruvedrift av nettbruk og gruvedrift av nettstrukturer. Nettverksdrift undersøker emnene til et nettsted. For eksempel kan gruvearbeidere på nettinnhold analysere et nettsteds lyd-, tekst-, bilder- og videofunksjoner. Gruvearbeidere på nettet fokuserer vanligvis på nettstedets tekstinformasjon mer enn andre funksjoner på nettstedet. Naturlig språkbehandling og innhenting av informasjon er to data mining-teknikker som ofte brukes av gruvearbeidere på nettet.
Nettbruksdrift er vanligvis en automatisert prosess der webservere samler inn og rapporterer brukeradgangsmønstre i serveradgangslogger. Et selskap kan for eksempel bruke et verktøy for gruvedrift av data for nettbruk for å rapportere om serveradgangslogger og brukerregistreringsinformasjon for å skape en mer effektiv nettstedstruktur. Nettstruktur gruvedrift studerer noden og tilkoblingsstrukturen til nettsteder. Det kan være nyttig for å identifisere likheter og forhold som finnes mellom forskjellige nettsteder. Nettstruktur gruvedrift innebærer ofte å avdekke mønstre fra hyperkoblinger eller trekke ut dokumentstrukturer på en webside.
To generelle data mining-teknikker som kan benyttes av nettdata gruvearbeidere er analyse av data mining association og regression av data mining. Analyse av data mining mining hjelper til med å avdekke bemerkelsesverdige forhold begravet i store datasett. Data mining-regresjon er en statistisk teknikk der matematiske formler brukes til å forutsi fremtidige resultater, for eksempel overskuddsmarginer, husverdier eller salgstall.
Produsenter av data mining-programvare tilbyr verktøy for gruvedrift av data, som kan hente prediktiv informasjon fra store datamengder. Bedrifter bruker ofte verktøyene for programvareutvinning for å analysere spesifikke datasett angående forbrukeratferd. Ved å bruke resultatene fra dataanalysen kan bedriftene forutse fremtidige forretningsutviklinger.