Co je to škrabka na obrazovku?
Scraper obrazovky je počítačový program, který shromažďuje znaková data z výstupů displeje jiného programu. Scrapers obrazovky mohou extrahovat hledaná data a prezentovat je v bohatším formátu, například s grafy nebo tabulkami, nebo jednoduše indexovat data pro uložení. Existuje mnoho dalších jmen pro škrabku obrazovky, včetně škrabky na webových stránkách, obsahového mineru, rozrývače na webových stránkách, extraktoru webu, automatického sběrače dat a škrabky HTML.
Scraper obrazovky prohledá kód webové stránky a odfiltruje cizí kód, který je na místě, aby poskytl příjemnou prezentaci koncovému prohlížeči. Takový kód je nezbytný pro zobrazení celé stránky v plánovaném rozvržení, ale škrabka prostě hledá užitečná data. Tato data jsou shromažďována a prezentována jako jednoduchá databáze, bez zvonků a pískání původního poskytnutého HTML kódu.
Dobrým příkladem škrabky obrazovky v akci jsou pavouci vyhledávačů. Tito pavouci přistupují ke stovkám tisíc webů, z nichž každý obsahuje četné stránky uvnitř. Data klíčových slov z těchto webů jsou shromažďována a indexována a nakonec prezentována koncovému uživateli jako výsledky vyhledávače.
Většina scrapers obrazovky sleduje HTML kódování webových stránek, aby získala jejich informace, ale mohou také hledat v jiných skriptovacích jazycích, jako je JavaScript nebo PHP. Data, která se těží, pak mohou být prezentována jako HTML samotná, takže k nim může uživatel přistupovat pomocí svého webového prohlížeče, nebo mohou být uložena jako textová data, ke kterým má uživatel přístup offline.
Podniky používají škrabky na obrazovky k těžbě dat z různých webů souvisejících s klíčovými slovy, aby vytvořily grafy, grafy, tabulky a srovnávací údaje, které se použijí v sestavách a prezentacích. Scraper obrazovky šetří mimořádné množství času, protože zaměstnanec provádějící stejný úkol by musel hledat relevantní weby, kliknout na odkazy a procházet každý web jednotlivě, aby našel a zaznamenal použitelná data, která potřebují. Škrabku obrazovky lze použít také v případě, že jsou informace uloženy v systému, ke kterému již nelze přistupovat kvůli problémům s kompatibilitou s novějším hardwarem nebo softwarem.
Škrabky na obrazovky mohou být požehnáním i prokletím pro majitele stránek a webové surfaře. I když naprosto poskytují funkční služby pro podniky, vyhledávače a další, škrabku obrazovky lze použít i pro méně než altruistické účely. Například společnosti nebo jednotlivci, kteří používají spam jako reklamní metodu, mohou pomocí mřížky obrazovky těžit e-mailové adresy z webových stránek.
Zatímco škrabka obrazovky může být užitečným nástrojem, mezi webovou komunitou existuje určitá debata o zákonnosti a etice při jejich používání. Problémy s autorskými právy se stávají rozmazanými, když škrabka na obrazovce extrahuje něčí práci a prezentuje ji v jiném formátu pro jiné webové stránky, a ty weby, které jsou závislé na reklamě a vytvářejí příjmy, mají problémy, když jsou jejich reklamy vyřazeny škrabkou na obrazovku. Výsledkem je, že někteří vlastníci webových stránek začali implementovat nástroje, které zabrání jejich poškrábání.