Qu'est-ce qu'un site de raclage?
Un site racleur est un site Web qui extrait du contenu provenant d'autres sources et le republie, généralement sans attribution. Ces sites sont maintenus pour diverses raisons et inquiètent beaucoup de producteurs de contenu légitimes sur Internet, car ils posent un certain nombre de problèmes. La plupart des sites racleurs enfreignent les lois sur le droit d'auteur en réimprimant du contenu sans consentement et sans en créditer l'auteur. Ils perturbent également les résultats des moteurs de recherche et le classement des sites, ce qui peut rendre difficile la recherche par les internautes des sites qu'ils souhaitent réellement voir.
La principale caractéristique d'un site Web consiste en l'utilisation de moyens automatisés pour exploiter le contenu d'autres sites. La collecte de contenu est connue sous le nom de «grattage» et peut s'effectuer de différentes manières, du téléchargement de sites entiers à la récupération de contenu à partir de flux générés sous RSS, XML et Atom au profit des lecteurs souhaitant s'abonner. sur un site, plutôt que de le visiter en permanence pour rechercher de nouveaux documents. Une fois gratté, le contenu est soulevé textuellement et installé sur un nouveau site.
La plupart des sites de raclage sont gérés dans le but de générer des revenus publicitaires par le biais de publicités liées au site. Les gens peuvent innocemment rechercher quelque chose, atterrir sur le site du racleur, puis cliquer sur les annonces pour éviter toute confusion. Les sites de raclage sont également utilisés dans l'agriculture de liens, une pratique qui implique la maintenance de plusieurs sites qui sont tous liés les uns aux autres, gonflant ainsi les classements des moteurs de recherche.
Lorsque le contenu est volé, le créateur d'origine est frustré à la fois par le fait qu'il enfreint la loi sur le droit d'auteur et par le fait que le site de grattoir prive le propriétaire du contenu d'origine de revenus. De nombreux webmasters utilisent diverses techniques pour tenter de déjouer les sites de raclage. Certains ont appelé les moteurs de recherche et les agences de publicité à agir, leur demandant de supprimer de la liste les sites de raclage ou de les rendre moins rentables afin de rendre la pratique moins attrayante.
Dans les cas où un site récupérateur crédite le créateur, cela peut également lui être préjudiciable en lui donnant l’impression que son site se trouve dans un "mauvais voisinage", avec un grand nombre de liens spammés plutôt que des liens de sites respectés. En conséquence, les classements dans les moteurs de recherche risquent de tomber et le propriétaire du site peut être impuissant à faire quoi que ce soit à ce sujet, car les propriétaires du site ne peuvent pas contrôler les personnes qui les lient.
Il peut être extrêmement difficile d’obtenir un site protégé pour supprimer le contenu protégé par le droit d’auteur, car de nombreux sites utilisent des couches de subterfuge pour dissimuler leurs propriétaires. Certains webmasters frustrés s'adressent directement à la société hébergeant le site Scraper, invoquant des violations du droit d'auteur et demandant la suppression immédiate du contenu litigieux.
Techniquement, les moteurs de recherche et les sites d’agrégation de nouvelles pourraient également être considérés comme des sites de nettoyage. Cependant, étant donné que ces sites sont entretenus pour le bien public et que leur utilisation de matériel est soumise à des directives d'utilisation équitable, ces sites ne sont généralement pas dotés de sites de nettoyage dangereux.