Wat is webdatamining?
Meer dan ooit gebruiken entiteiten en individuen het World Wide Web om tal van zakelijke en persoonlijke transacties uit te voeren. Als gevolg hiervan gebruiken bedrijven steeds vaker hulpmiddelen en technieken voor webdatamining om manieren te vinden om hun bedrijfsresultaten te verbeteren en hun klantenbestand uit te breiden. Webdatamining omvat het verzamelen en samenvatten van gegevens uit de hyperlinkstructuur, pagina-inhoud of gebruikslog van een website om patronen te identificeren. Met behulp van web-datamining kan een bedrijf een potentiële concurrent identificeren, de klantenservice verbeteren of de behoeften en verwachtingen van klanten benaderen. Een overheidsinstantie kan ook proberen terroristische dreigingen of andere criminele activiteiten aan het licht te brengen door het gebruik van een web-datamining-applicatie.
Enkele veel voorkomende technieken voor webdatamining zijn mijnbouw van webinhoud, mijnbouw van webgebruik en mijnbouw van webstructuren. Web content mining onderzoekt het onderwerp van een website. Mijnwerkers van webcontent kunnen bijvoorbeeld de audio-, tekst-, afbeeldingen- en videofuncties van een site analyseren. Mijnwerkers van webcontent richten zich doorgaans meer op de tekstuele informatie van een site dan op andere sitefuncties. Natuurlijke taalverwerking en het ophalen van informatie zijn twee technieken voor datamining die vaak worden gebruikt door mijnwerkers.
Webgebruikmining is meestal een geautomatiseerd proces waarbij webservers patronen van gebruikerstoegang verzamelen en rapporteren in logs voor toegang tot de server. Een bedrijf kan bijvoorbeeld een tool voor het gebruik van gegevens voor webgebruik gebruiken om te rapporteren over logs voor servertoegang en gebruikersregistratie-informatie om een meer effectieve websitestructuur te creëren. Webstructuurmijnbouw bestudeert de knoop- en verbindingsstructuur van websites. Het kan nuttig zijn bij het identificeren van overeenkomsten en relaties tussen verschillende websites. Webstructuurmining omvat vaak het blootleggen van patronen van hyperlinks of het uittrekken van documentstructuren op een webpagina.
Twee algemene technieken voor datamining die kunnen worden gebruikt door web-datamijners zijn datamining-associatieanalyse en regressie van datamining. Data mining associatie analyse helpt opmerkelijke relaties te ontdekken die begraven liggen in grote datasets. Dataminingregressie is een statistische techniek waarbij wiskundige formules worden gebruikt om toekomstige resultaten te voorspellen, zoals winstmarges, huiswaarden of verkoopcijfers.
Leveranciers van software voor datamining bieden tools voor webdatamining die voorspellende informatie uit grote hoeveelheden gegevens kunnen halen. Bedrijven gebruiken deze software mining-tools vaak om specifieke gegevenssets met betrekking tot consumentengedrag te analyseren. Met behulp van de resultaten van de data-analyse kunnen bedrijven toekomstige bedrijfstrends voorspellen.