Che cos'è un sito Scraper?
Un sito di scraper è un sito Web che estrae contenuti da altre fonti e li ripubblica, in genere senza attribuzione. Tali siti sono mantenuti per una serie di motivi e destano grande preoccupazione per molti legittimi produttori di contenuti su Internet, poiché presentano una serie di problemi. La maggior parte dei siti di scraper viola le leggi sul copyright ristampando i contenuti senza consenso e non accreditando l'autore, e inoltre causano il caos nei risultati dei motori di ricerca e nelle classifiche dei siti, il che può rendere difficile per gli utenti di Internet trovare i siti che vogliono effettivamente vedere.
La caratteristica principale di un sito di scraper è che utilizza mezzi automatizzati per raccogliere contenuti da altri siti. La pratica della raccolta di contenuti è nota come "scraping" e può essere realizzata in diversi modi, dal download di interi siti al prelievo di contenuti dai feed generati in RSS, XML e Atom a beneficio dei lettori che vogliono iscriversi a un sito, piuttosto che visitarlo costantemente per verificare la presenza di nuovo materiale. Una volta scansionato, il contenuto viene sollevato alla lettera e installato su un nuovo sito.
La maggior parte dei siti di scraper viene gestita allo scopo di generare entrate pubblicitarie attraverso annunci pubblicitari collegati al sito. Le persone possono cercare innocentemente qualcosa, atterrare sul sito del raschietto e quindi fare clic sugli annunci per confusione. I siti di raschietti sono anche utilizzati nell'agricoltura dei link, una pratica che prevede la manutenzione di diversi siti che si collegano tra loro, gonfiando così le classifiche dei motori di ricerca.
Quando il contenuto viene rubato, è frustrante il creatore originale sia perché viola la legge sul copyright sia perché il sito dello scraper può privare il proprietario del contenuto originale delle entrate. Molti webmaster usano una varietà di tecniche nel tentativo di sconfiggere i siti di scraper, e alcuni hanno chiesto di agire da parte dei motori di ricerca e delle società pubblicitarie, chiedendo loro di eliminare i siti di scraper o renderli meno redditizi in modo che la pratica sia meno allettante.
Nei casi in cui un sito di scraper attribuisce credito al creatore, questo può anche danneggiare il creatore facendolo sembrare come se il suo sito si trova in un "brutto quartiere", con un gran numero di link spam piuttosto che link da siti rispettati. Di conseguenza, le classifiche nei motori di ricerca potrebbero cadere e il proprietario del sito potrebbe non essere in grado di fare nulla al riguardo, poiché i proprietari del sito non possono controllare chi li collega.
Ottenere un sito di scraper per rimuovere contenuti protetti da copyright può essere estremamente impegnativo, poiché molti di questi siti utilizzano livelli di sotterfugi per nascondere i loro proprietari. Alcuni webmaster frustrati vanno direttamente alla società che ospita il sito del raschietto, citando violazioni del copyright e richiedendo una rimozione immediata del contenuto contestato.
Tecnicamente, anche i motori di ricerca e i siti di aggregazione delle notizie potrebbero essere considerati siti di scraper. Tuttavia, poiché questi siti sono mantenuti per il bene pubblico e poiché il loro uso del materiale rientra nelle linee guida sull'uso corretto, questi siti non sono generalmente raggruppati con siti di raschietti dannosi.