Vad är webbbrytning?
Webbbrytning är en form av informationsskörd som gäller data som samlas in från onlinekällor. Datainsamling från källor över Internet gör det möjligt för användare att samla stora mängder information för analys för att fatta viktiga affärsbeslut i en online-miljö. Till exempel kan en forskare använda gruvdrift på webben för att samla in information om användningen av specifika sökord i webbinnehåll. Alternativt använder återförsäljare och andra professionella marknadsförare professionell dataanvinning för att upptäcka trender i webbtrafik, konvertering av besökare till köpare och annan webbanvändning.
När det gäller insamling, sortering och analys av data, efterliknar webb-gruvdrift traditionella data-gruvverksamheter. Jämförelsevis fokuserar webbbrytningsaktiviteter på webbaserad information, snarare än ett stort tvärsnitt av informationskällor som offline datordatabaser, kundregister eller papperskopieringsdata, som vanligtvis sker med traditionell datakommunikation. Att enbart fokusera på datainsamling från onlinekällor ger riktad analys som behövs för online marknadsföringsstrategier, beslut om webbplatsstruktur och liknande elektroniska handelsrelaterade beslutsfattande. Insamling av data via webbminering ger också den extra fördelen med en bred internationell demografisk, eftersom webbplatser från hela världen är tillgängliga för forskare och informationssamlare.
Professionellt är webbbrytning indelad i tre specifika kategorier: gruv för webbstruktur, gruvdrift för användning och gruv för webbinnehåll. Varje område fokuserar på specifik information såsom strukturen och hyperlänkar på en viss webbplats, serverlogginformation om besökarnas användning och specifikt innehåll tillgängligt online. Webbplatsanalysprogramvarupaket och -tjänster är ett utmärkt exempel på gruvdrift för webbanvändning, vilket ger webbansvariga information om besökares trafik, sökresultat, länkar som klickats på och tidsbruk för att interagera med specifika sidor. Structure mining, å andra sidan, ger detaljerad information om en specifik webbplats interna struktur, inklusive hyperlänkar, databaser och frågefunktioner.
För marknadsförare erbjuder webbbrytning många användningsområden relativt marknadsföringsaktiviteter. Att veta hur besökare använder en viss webbplats, hur konkurrenter skapar en konkurrerande webbplats och vilket innehåll som redan finns online är värdefull information. Sådan information hjälper viktiga beslutsfattare att utforma en marknadsföringsstrategi baserad på tidigare beprövade tekniker och dokumenterad information.
Högskolor och universitet utnyttjar även webbgrävning via programvara som verifierar att studentdokument är unika och inte plagierade. Med hjälp av gruvprinciper för webbinnehåll söker sådana graderingshjälpmedel på hela Internet efter liknande innehåll. Instruktörer laddar upp texten i ett studentdokument och instruerar sedan plagieringsprogramvaran att kolla på Internet för liknande fraser eller kopierad text online. Resultaten uttrycks ofta som procent av matchande text. Länkar till liknande resultat tillhandahålls för att instruktörer ska kunna besöka webbplatser för att avgöra om matcher verkligen är plagierade.