Hvad er en skærmskraber?

En skærmskraber er et computerprogram, der indsamler karakterbaserede data fra displayudgangen fra et andet program. Skærmskrabere kan udtrække de data, de leder efter, og præsentere dem i et rigere format, f.eks. Med grafer eller tabeller, eller blot indeksere dataene til opbevaring. Der er mange andre navne på en skærmskraber, herunder webstedskraber, indholdsminearbejder, webstedsripper, webekstraktor, automatiseret datasamler og HTML-skraber.

En skærmskraber vil søge gennem koden på et websted og filtrere den uvedkommende kode, der er på plads, for at give en flot præsentation til slutbrowser. En sådan kode er nødvendig for at se hele siden i dets tilsigtede layout, men en skraber er simpelthen på udkig efter nyttige data. Disse data indsamles og præsenteres som en simpel database uden klokker og fløjter den medfølgende originale HTML-kode.

Et godt eksempel på en skærmskraber i handling er med søgemaskinspiders. Disse edderkopper får adgang til hundretusinder af websteder, som hver indeholder adskillige sider inden i. Nøgleordsdataene fra disse websteder er samlet og indekseret, og derefter til sidst præsenteret for slutbrugeren som søgemaskineresultater.

De fleste skærmskrabere skure HTML-kodning på et websted for at få deres information, men de kan også søge på andre scripting-sprog som JavaScript eller PHP. Data, der udvindes, kan derefter præsenteres som HTML i sig selv, så brugeren kan få adgang til dem med deres webbrowser, eller gemt som tekstdata, som brugeren kan få adgang til offline.

Virksomheder bruger skærmskrabere til at udnytte dataene fra en række søgeordsrelaterede websteder for at generere grafer, diagrammer, regneark og sammenligningsdata, der skal bruges i rapporter og præsentationer. Skærmskraberen sparer en ekstraordinær mængde tid, da en medarbejder, der udfører den samme opgave, bliver nødt til at søge efter relevante sider, klikke på links og gennemse hvert websted individuelt for at finde og registrere de relevante data, de har brug for. En skærmskraber kan også bruges, når der gemmes oplysninger på et system, der ikke længere kan nås på grund af problemer med kompatibilitet med nyere hardware eller software.

Skrabere kan være både en velsignelse og en forbandelse for webstedsejere og websurfere. Mens de absolut leverer en funktionel service til virksomheder, søgemaskiner og andre, kan en skærmskraber også bruges til mindre end altruistiske formål. For eksempel kan virksomheder eller enkeltpersoner, der bruger spam som en reklamemetode, bruge en skærmskraber til at mine e-mail-adresser fra websteder.

Mens en skærmskraber kan være et praktisk værktøj, er der en vis debat blandt websamfundet om legaliteter og etik, når du bruger dem. Problemer med ophavsret bliver sløret, når en skærmskraber udtrækker nogens hårde arbejde og præsenterer det i et andet format til et andet websted, og de websteder, der er afhængige af reklame for at generere indtægter, har problemer, når deres annoncer kasseres af skærmskraberen. Som et resultat er nogle webstedsejere begyndt at implementere værktøjer, der forhindrer, at deres websteder skrabes.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?