Wat is een schermschraper?
Een schermschraper is een computerprogramma dat op tekens gebaseerde gegevens verzamelt uit de weergave-uitvoer van een ander programma. Schermschrapers kunnen de gegevens die ze zoeken extraheren en deze in een rijker formaat presenteren, zoals met grafieken of tabellen, of eenvoudig de gegevens voor opslag indexeren. Er zijn veel andere namen voor een schermschraper, waaronder websiteschraper, contentminer, website ripper, webextractor, geautomatiseerde gegevensverzamelaar en HTML -schraper.
Een schermschraper zoekt de code van een website en filtert de externe code die bestaat om een mooie presentatie te geven aan de eindbrowser. Een dergelijke code is nodig om de hele pagina in de beoogde lay -out te bekijken, maar een schraper is gewoon op zoek naar nuttige gegevens. Deze gegevens worden verzameld en gepresenteerd als een eenvoudige database, zonder de klokken en fluitjes de originele HTML -code die is verstrekt.
Een goed voorbeeld van een schermschraper in actie is met zoekmachinespinnen. Deze spinnen hebben toegang tot honderdduizenden WEBSITES, die elk talloze pagina's binnenin bevatten. De trefwoordgegevens van deze sites worden verzameld en geïndexeerd en vervolgens uiteindelijk gepresenteerd aan de eindgebruiker als zoekmachines.
De meeste schermschrapers zoeken de HTML -codering van een website om hun informatie te krijgen, maar ze kunnen ook andere scripttalen zoeken, zoals JavaScript of PHP. De gegevens die worden gedolven, kunnen vervolgens worden gepresenteerd als HTML zelf, zodat de gebruiker deze toegang heeft tot zijn webbrowser of opgeslagen als tekstgegevens die offline door de gebruiker kunnen worden toegankelijk.
Bedrijven gebruiken schermschrapers om de gegevens van verschillende zoekwoordgerelateerde websites te ontginnen om grafieken, grafieken, spreadsheets en vergelijkingsgegevens te genereren die moeten worden gebruikt in rapporten en presentaties. De schermschraper bespaart een buitengewone tijd, omdat een werknemer die dezelfde taak doet, moet zoeken naar relevante sites, op links klikken en door elke site bladerenIndividueel om de toepasselijke gegevens die ze nodig hebben te vinden en vast te leggen. Een schermschraper kan ook worden gebruikt wanneer informatie wordt opgeslagen op een systeem dat niet langer toegankelijk is vanwege compatibiliteitsproblemen met nieuwere hardware of software.
Schermschrapers kunnen zowel een zegen als een vloek zijn voor site -eigenaren en websurfers. Hoewel ze absoluut een functionele service bieden voor bedrijven, zoekmachines en anderen, kan een schermschraper ook voor minder dan altruïstische doeleinden worden gebruikt. Bedrijven of personen die SPAM als advertentiemethode gebruiken, kunnen bijvoorbeeld een schermschraper gebruiken om e-mailadressen van websites te ontginnen.
Hoewel een schermschraper een handig hulpmiddel kan zijn, is er een debat onder de webgemeenschap over legaliteit en ethiek bij het gebruik ervan. Copyright -problemen worden wazig wanneer een schermschraper iemands harde werk uittrekt en deze in een ander formaat presenteert voor een andere website, en die sites die afhankelijk zijn van advertenties om inkomsten te genereren, hebben problemen wanneer hun advertenties zijne wordt weggegooid door de schermschraper. Als gevolg hiervan zijn sommige website -eigenaren begonnen met het implementeren van tools die voorkomen dat hun sites worden geschraapt.