Vad är webbskörd?
Webbskörd är den process genom vilken specialiserad programvara samlar in data från Internet och placerar dem i filer för en slutanvändare. Den tjänar en funktion som liknar, men mer avancerad än de uppgifter som en sökmotor utför. Även känd som webbskrotning ger webbskörd användaren automatiserad tillgång till information på Internet som sökmotorer inte kan behandla eftersom den kan fungera kring HTML-kod. De tre huvudtyperna av webbskörd är för webbinnehåll, struktur och användning.
Inhämtning av webbinnehåll innebär utvinning av information genom att dra data från både sökresultatsidor och från en djupare sökning i innehållet doldt på webbsidor. Denna ytterligare information döljs ofta från sökmotorer eftersom den döljs av HTML-kod. Processen skannar information som liknar mänskliga ögon och kastar tecken som inte bildar meningsfulla fraser för att extrahera användbara element.
Istället för att söka efter innehåll samlar skörd av webbstrukturer data om hur information organiseras inom specifika områden på Internet. Den insamlade informationen ger värdefull feedback från vilka förbättringar inom områden som informationsorganisation och hämtning kan göras. Det är ett sätt att förfina strukturen på webben.
Skörd av webbanvändning spårar allmänna åtkomstmönster och anpassad användning av webbanvändare. Genom att analysera webbanvändning kan skörden hjälpa till att skapa tydlighet om hur användarna beter sig. Detta är ett annat sätt att förbättra funktionen på webben, men på slutanvändarnivå. Det kan hjälpa designers att förbättra sina webbplatsers användargränssnitt för maximal effektivitet. Processen ger också inblick i vilken typ av information som användare söker efter och hur de går till för att hitta den, vilket ger en uppfattning om hur innehåll ska utvecklas framöver.
Genom att samla in text- och bilddata från HTML-filer och bilder, kan skörden av webben utföra mer komplex webbsökning som går djupare in i varje dokument. Den analyserar också länkarna som pekar på det innehållet för att avgöra om informationen har betydelse och relevans på Internet. Detta ger en mer fullständig bild av hur informationen hänför sig till och påverkar resten av webben.
Företag använder webbskörd för en mängd olika syften. Det kan vara ett effektivt sätt att samla in data som ska analyseras. Några av de vanligare datamängderna som sammanställts är information om konkurrenter, listor över olika produktpriser och finansiella data. Data kan också samlas in för att analysera kundbeteende.