Hva er netthøsting?
Netthøsting er prosessen der spesialisert programvare samler inn data fra Internett og plasserer dem i filer for en sluttbruker. Den serverer en funksjon som ligner på, men mer avansert enn oppgavene en søkemotor utfører. Web-høsting, også kjent som Web-skraping, gir brukeren automatisk tilgang til informasjon på Internett som søkemotorer ikke kan behandle fordi den kan fungere rundt HTML-kode. De tre hovedtyper av webhøsting er for webinnhold, struktur og bruk.
Innhøsting av webinnhold innebærer utvinning av informasjon ved å trekke data fra både søkeresultatsiden og fra et dypere søk etter innholdet som er skjult på websidene. Denne tilleggsinformasjonen skjemmes ofte fra søkemotorer fordi den skjemmes av HTML-kode. Prosessen skanner informasjon som ligner menneskets øyne, og forkaster tegn som ikke danner meningsfulle setninger for å trekke ut nyttige elementer.
I stedet for å søke etter innhold, samler innhøsting av nettstrukturer data om hvordan informasjon er organisert i bestemte områder på Internett. Dataene som samles inn gir verdifull tilbakemelding fra hvilke forbedringer innen områder som informasjonsorganisering og innhenting kan gjøres. Det er en måte å avgrense strukturen på nettet på.
Høsting av nettbruk sporer generelle tilgangsmønstre og tilpasset bruk av nettbrukere. Ved å analysere nettbruk kan høsting bidra til å skape klarhet om hvordan brukere oppfører seg. Dette er en annen måte å forbedre nettets funksjon, men på sluttbrukernivå. Det kan hjelpe designere med å forbedre sine nettsteder 'brukergrensesnitt for maksimal effektivitet. Prosessen gir også innsikt i hva slags informasjon brukere søker etter og hvordan de går ut på å finne den, og gir dermed en ide om hvordan innhold skal utvikles fremover.
Ved å samle inn tekst- og bildedata fra HTML-filer og bilder, kan webhøsting utføre mer kompleks nettkryping som dypere ned i hvert dokument. Den analyserer også koblingene som peker til det innholdet for å avgjøre om informasjonen har betydning og relevans på Internett. Dette gir et mer fullstendig bilde av hvordan informasjonen forholder seg til og påvirker resten av nettet.
Bedrifter bruker netthøsting til en rekke formål. Det kan være en effektiv måte å samle inn data som skal analyseres. Noen av de mer vanlige datasettene som er satt sammen er informasjon om konkurrenter, lister over forskjellige produktpriser og økonomiske data. Data kan også samles inn for å analysere kundeadferd.