Co je to škrabka obrazovky?
Skarkera obrazovky je počítačový program, který shromažďuje data založená na znacích z výstupu jiného programu. Scraphery obrazovky mohou extrahovat data, která hledají, a prezentovat je v bohatším formátu, jako jsou grafy nebo tabulky, nebo jednoduše indexovat data pro ukládání. Existuje mnoho dalších jmen pro škrabku na obrazovce, včetně škrabky webových stránek, horníka obsahu, roztržení webových stránek, webového extraktoru, automatizovaného sběratele dat a škrabky HTML.
Škrabka obrazovky prohledá kód webové stránky a odfiltruje vnější kód, který je zaveden, aby poskytl pěkně vyhlížející prezentaci koncovému prohlížeči. Takový kód je nezbytný pro zobrazení celé stránky ve svém zamýšleném rozvržení, ale škrabka jednoduše hledá užitečná data. Tato data jsou shromažďována a prezentována jako jednoduchá databáze, bez zvonků a píšťalky původního poskytnutého kódu HTML. Tito pavouci přistupují ke stovkám tisíc WEbsites, z nichž každá obsahuje četné stránky uvnitř. Data klíčových slov z těchto webů jsou shromažďována a indexována, poté nakonec představena koncovému uživateli jako výsledky vyhledávače.
Většina škrabky na obrazovce hledá kódování HTML na webu, aby získaly své informace, ale mohou také hledat další skriptovací jazyky, jako je JavaScript nebo PHP. Údaje, která jsou těžena, pak mohou být prezentována jako samotná HTML, takže uživatel má přístup k jejich webovému prohlížeči nebo uložen jako textová data, ke kterým může být uživatel offline.
Podniky používají škrabky obrazovky k těžiště dat z různých webových stránek souvisejících s klíčovými slovy, aby generovaly grafy, grafy, tabulky a porovnávací data, která se použijí ve zprávách a prezentacích. Škrabka obrazovky šetří mimořádnou dobu, protože zaměstnanec, který vykonává stejný úkolindividuálně najít a zaznamenat použitelná data, která potřebují. Škrabka obrazovky lze také použít, když jsou informace uloženy v systému, který již nelze přistupovat kvůli problémům s kompatibilitou s novějším hardwarem nebo softwarem.
Scrapers obrazovky mohou být požehnáním i kletbou pro majitele webu a webové surfaře. I když absolutně poskytují funkční službu pro firmy, vyhledávače a další, škrabku obrazovky lze také použít pro méně než altruistické účely. Například společnosti nebo jednotlivci, kteří používají spam jako metodu reklamy
Zatímco škrabka obrazovky může být šikovným nástrojem, mezi jejich používáním existuje mezi webovou komunitou debata o zákonnosti a etice. Problémy s autorskými právy se stanou rozmazanými, když škrabka obrazovky extrahuje něčí tvrdou práci a představuje ji v jiném formátu pro jiný web, a ty weby, které závisí na reklamě na generování příjmůe je vyřazen škrabkou obrazovky. Výsledkem je, že někteří majitelé webových stránek začali implementovat nástroje, které zabrání seškrábání jejich stránek.