Was ist ein Screen Scraper?
Ein Bildschirmschaber ist ein Computerprogramm, das zeichenbasierte Daten von der Anzeigeausgabe eines anderen Programms sammelt. Screen Scraper können die gesuchten Daten extrahieren und in einem reichhaltigeren Format darstellen, z. B. mit Grafiken oder Tabellen, oder einfach die Daten für die Speicherung indizieren. Es gibt viele andere Namen für einen Bildschirmschaber, einschließlich Website-Schaber, Content Miner, Website-Ripper, Web-Extraktor, automatisierten Datenkollektor und HTML-Schaber.
Ein Screen Scraper durchsucht den Code einer Website und filtert den vorhandenen Fremdcode heraus, um dem Endbrowser eine ansprechende Präsentation zu bieten. Ein solcher Code ist erforderlich, um die gesamte Seite in ihrem beabsichtigten Layout anzuzeigen, aber ein Scraper sucht einfach nach nützlichen Daten. Diese Daten werden gesammelt und als einfache Datenbank dargestellt, ohne dass der ursprüngliche HTML-Code unkompliziert zur Verfügung gestellt wird.
Ein gutes Beispiel für einen in Aktion befindlichen Bildschirmschaber sind Suchmaschinenspinnen. Diese Spinnen greifen auf Hunderttausende von Websites zu, die jeweils zahlreiche Seiten enthalten. Die Keyword-Daten dieser Websites werden gesammelt und indexiert und schließlich dem Endbenutzer als Suchmaschinenergebnisse angezeigt.
Die meisten Screen Scraper durchsuchen die HTML-Codierung einer Website, um ihre Informationen abzurufen. Sie können jedoch auch nach anderen Skriptsprachen wie JavaScript oder PHP suchen. Die gewonnenen Daten können dann als HTML dargestellt werden, sodass der Benutzer mit seinem Webbrowser darauf zugreifen kann, oder als Textdaten gespeichert werden, auf die der Benutzer offline zugreifen kann.
Unternehmen verwenden Screen Scraper, um die Daten von einer Vielzahl von Websites mit Keyword-Bezug abzurufen und Grafiken, Diagramme, Tabellenkalkulationen und Vergleichsdaten für Berichte und Präsentationen zu generieren. Der Bildschirmschaber spart außerordentlich viel Zeit, da ein Mitarbeiter, der die gleiche Aufgabe ausführt, nach relevanten Sites suchen, auf Links klicken und jede Site einzeln durchsuchen muss, um die erforderlichen Daten zu finden und aufzuzeichnen. Ein Bildschirmschaber kann auch verwendet werden, wenn Informationen auf einem System gespeichert sind, auf die aufgrund von Kompatibilitätsproblemen mit neuerer Hardware oder Software nicht mehr zugegriffen werden kann.
Screen Scraper können sowohl ein Segen als auch ein Fluch für Websitebesitzer und Websurfer sein. Ein Bildschirmschaber bietet Unternehmen, Suchmaschinen und anderen Unternehmen einen funktionalen Service. Er kann jedoch auch für weniger als altruistische Zwecke eingesetzt werden. Beispielsweise können Unternehmen oder Personen, die Spam als Werbemethode verwenden, mit einem Bildschirmschaber E-Mail-Adressen von Websites abrufen.
Während ein Bildschirmschaber ein nützliches Werkzeug sein kann, gibt es in der Web-Community einige Debatten über Legalität und Ethik bei der Verwendung. Urheberrechtsprobleme verschwimmen, wenn ein Bildschirmschaber die harte Arbeit einer anderen Person extrahiert und in einem anderen Format für eine andere Website präsentiert. Bei Websites, die zur Erzielung von Einnahmen auf Werbung angewiesen sind, treten Probleme auf, wenn ihre Anzeigen vom Bildschirmschaber verworfen werden. Infolgedessen haben einige Websitebesitzer damit begonnen, Tools zu implementieren, die verhindern, dass ihre Websites beschädigt werden.