Vad är en skärmskrapa?
En skärmskrapare är ett datorprogram som samlar in karaktärsbaserad data från visningen av ett annat program. Skärmskrapare kan extrahera informationen de letar efter och presentera dem i ett rikare format, till exempel med diagram eller tabeller, eller helt enkelt indexera data för lagring. Det finns många andra namn på en skärmskrapa, inklusive webbplatsskrapa, innehållsgruva, webbplatsrivare, webbuttagare, automatiserad datasamlare och HTML-skrapa.
En skärmskrapare kommer att söka igenom koden på en webbplats och filtrera bort den främmande koden som finns på plats för att ge en snygg presentation till slutbläsaren. En sådan kod är nödvändig för att visa hela sidan i dess avsedda layout, men en skrapa letar helt enkelt efter användbar data. Dessa data samlas in och presenteras som en enkel databas, utan att klockorna och visslarna har den ursprungliga HTML-koden.
Ett bra exempel på en skärmskrapa i aktion är med sökmotorspindlar. Dessa spindlar har tillgång till hundratusentals webbplatser, som var och en innehåller flera sidor inom. Sökordsdata från dessa webbplatser samlas in och indexeras och presenteras slutligen för slutanvändaren som sökmotorresultat.
De flesta skärmskrapare skurar HTML-kodning på en webbplats för att få information, men de kan också söka på andra skriptspråk som JavaScript eller PHP. Data som bryts kan sedan presenteras som HTML själv, så att användaren kan komma åt den med sin webbläsare, eller lagra som textdata som kan nås av användaren offline.
Företag använder skärmskrapare för att gruva upp data från en mängd sökordrelaterade webbplatser för att generera grafer, diagram, kalkylark och jämförelsesdata som ska användas i rapporter och presentationer. Skärmskraparen sparar extra tid, eftersom en anställd som utför samma uppgift måste söka efter relevanta webbplatser, klicka på länkar och bläddra igenom varje webbplats individuellt för att hitta och registrera relevant information de behöver. En skärmskrapa kan också användas när information lagras i ett system som inte längre kan nås på grund av kompatibilitetsproblem med nyare hårdvara eller programvara.
Screen scrapers kan vara både en välsignelse och en förbannelse för webbplatsägare och surfare. Medan de absolut tillhandahåller en funktionell tjänst för företag, sökmotorer och andra, kan en skärmskrapa också användas för mindre än altruistiska ändamål. Till exempel kan företag eller individer som använder skräppost som reklammetod använda en skärmskrapare för att bryta e-postadresser från webbplatser.
Även om en skärmskrapa kan vara ett praktiskt verktyg, är det en viss debatt bland webbsamhället om legalitet och etik när du använder dem. Upphovsrättsfrågor blir suddiga när en skärmskrapa extraherar någons hårda arbete och presenterar det i ett annat format för en annan webbplats, och de webbplatser som är beroende av reklam för att generera intäkter har problem när deras annonser kasseras av skärmskraparen. Som ett resultat har vissa webbplatsägare börjat implementera verktyg som kommer att förhindra att deras webbplatser skrotas.