Hvad er Web Data Mining?
Mere end nogensinde bruger enheder og enkeltpersoner World Wide Web til at udføre en række forretningsmæssige og personlige transaktioner. Som et resultat anvender virksomheder i stigende grad værktøjer og teknikker til webdata-mining til at finde måder til at forbedre deres bundlinjer og udvide deres kundegrundlag. Webdataindvinding involverer processen med at indsamle og sammenfatte data fra et websteds hyperlinkstruktur, sideindhold eller brugslog for at identificere mønstre. Ved hjælp af webdata mining, kan en virksomhed identificere en potentiel konkurrent, forbedre kundeservicen eller målrette kundernes behov og forventninger. Et regeringsagentur kan også forsøge at afdække terrortrusler eller andre kriminelle aktiviteter gennem brug af en applikation til webdata-mining.
Nogle almindelige teknikker til minedrift af webdata inkluderer mining af webindhold, minedrift af brug af web og mining af webstrukturer. Mining af webindhold undersøger et websteds emne. For eksempel kan minearbejdere på webindhold analysere et websteds lyd-, tekst-, billeder- og videofunktioner. Minearbejdere på webindhold fokuserer typisk på et websteds tekstoplysninger mere end andre webstedsfunktioner. Naturlig sprogbehandling og indhentning af information er to teknikker til dataindvinding, der ofte bruges af minearbejdere med webindhold.
Webbrugsindvinding er normalt en automatiseret proces, hvorved webservere indsamler og rapporterer brugeradgangsmønstre i serveradgangslogger. En virksomhed kan for eksempel bruge et dataanvendelsesværktøj til brug af data til at rapportere om serveradgangslogger og brugerregistreringsoplysninger for at skabe en mere effektiv webstedsstruktur. Webstrukturminedrift undersøger webstedets knudepunkt og forbindelsesstruktur. Det kan være nyttigt til at identificere ligheder og forhold, der findes mellem forskellige websteder. Webstrukturminedrift involverer ofte at afdække mønstre fra hyperlinks eller trække dokumentstrukturer ud på en webside.
To generelle teknikker til minedrift af data, der kan anvendes af webdata-minearbejdere, er analyse af dataminingforening og regrering af datamining. Analyse af data mining mining hjælper med at afdække bemærkelsesværdige forhold, der er begravet i store datasæt. Data mining regression er en statistisk teknik, hvor matematiske formler bruges til at forudsige fremtidige resultater, såsom fortjenstmargener, husværdier eller salgstall.
Udbydere af data mining software tilbyder web data mining tools, der kan hente forudsigelig information fra store mængder data. Virksomheder bruger ofte disse software til minedrift af software til at analysere specifikke datasæt vedrørende forbrugeradfærd. Ved hjælp af resultaterne fra dataanalysen er virksomheder i stand til at forudsige fremtidige forretningsudviklinger.