Hva er en skjermskraper?

En skjermskraper er et dataprogram som samler inn karakterbaserte data fra skjermutgangen til et annet program. Skjermskrapere kan trekke ut dataene de leter etter og presentere dem i et rikere format, for eksempel med grafer eller tabeller, eller bare indeksere dataene for lagring. Det er mange andre navn på en skjermskraper, inkludert nettstedskrape, innholdsgruvebryter, ripper for nettsteder, websuger, automatisert datainnsamler og HTML skraper.

En skjermskraper vil søke gjennom koden til et nettsted og filtrere ut den fremmede koden som er på plass for å gi en fin presentasjon til sluttleseren. En slik kode er nødvendig for å se hele siden i den tiltenkte utformingen, men en skraper er ganske enkelt på jakt etter nyttige data. Disse dataene blir samlet og presentert som en enkel database, uten klokkene og fløyter med den opprinnelige HTML-koden.

Et godt eksempel på en skjermskraper i aksjon er med søkemotor edderkopper. Disse edderkoppene får tilgang til hundretusenvis av nettsteder, som hver inneholder mange sider innenfor. Nøkkelorddataene fra disse nettstedene blir samlet og indeksert, og deretter til slutt presentert for sluttbrukeren som søkemotorresultater.

De fleste skjermskrapere skurer HTML-kodingen på et nettsted for å få informasjonen deres, men de kan også søke på andre skriptspråk som JavaScript eller PHP. Dataene som er utvunnet, kan deretter presenteres som HTML selv, slik at brukeren kan få tilgang til den med nettleseren sin, eller lagres som tekstdata som brukeren kan få tilgang til frakoblet.

Bedrifter bruker skjermskrapere for å utvinne dataene fra en rekke søkeordrelaterte nettsteder for å generere grafer, diagrammer, regneark og sammenligningsdata som skal brukes i rapporter og presentasjoner. Skjermskraperen sparer ekstra tid, siden en ansatt som gjør den samme oppgaven, må søke etter relevante nettsteder, klikke på lenker og bla gjennom hvert enkelt sted for å finne og registrere gjeldende data de trenger. En skjermskraper kan også brukes når informasjon er lagret i et system som ikke lenger kan nås på grunn av problemer med kompatibilitet med nyere maskinvare eller programvare.

Skjermskrapere kan være både en velsignelse og en forbannelse for nettstedseiere og surfere. Selv om de absolutt gir en funksjonell tjeneste for bedrifter, søkemotorer og andre, kan en skjermskrape også brukes til mindre enn altruistiske formål. For eksempel kan selskaper eller enkeltpersoner som bruker spam som annonseringsmetode, bruke en skjermskraper til å gruve e-postadresser fra nettsteder.

Mens en skjermskraper kan være et nyttig verktøy, er det en viss debatt blant nettsamfunnet om legaliteter og etikk når du bruker dem. Opphavsrettsproblemer blir uskarpe når en skjermskraper trekker ut noens harde arbeid og presenterer det i et annet format for et annet nettsted, og de nettstedene som er avhengige av reklame for å generere inntekter, har problemer når annonsene deres blir kastet av skjermskraperen. Som et resultat har noen nettstedseiere begynt å implementere verktøy som vil forhindre at nettstedene deres blir skrapt.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?