Qu'est-ce qu'un grattoir d'écran?

Un grattoir d’écran est un programme informatique qui collecte des données textuelles à partir de la sortie d’affichage d’un autre programme. Les grattoirs d'écran peuvent extraire les données qu'ils recherchent et les présenter dans un format plus riche, comme des graphiques ou des tableaux, ou simplement indexer les données pour les stocker. Il existe de nombreux autres noms pour un grattoir d'écran, notamment grattoir de site Web, mineur de contenu, ripper de site Web, extracteur de Web, collecteur de données automatisé et grattoir HTML.

Un grattoir d’écran recherchera dans le code d’un site Web et filtrera le code superflu mis en place pour fournir une présentation attrayante au navigateur final. Un tel code est nécessaire pour afficher la page entière dans sa mise en page prévue, mais un racleur recherche simplement des données utiles. Ces données sont collectées et présentées comme une base de données simple, sans les cloches et sifflets du code HTML original fourni.

Les araignées des moteurs de recherche constituent un bon exemple de grattoir d'écran en action. Ces araignées accèdent à des centaines de milliers de sites Web contenant chacun de nombreuses pages. Les données de mots-clés de ces sites sont collectées et indexées, puis présentées à l'utilisateur final sous forme de résultats de moteur de recherche.

La plupart des nettoyeurs d'écran parcourent le codage HTML d'un site Web pour obtenir leurs informations, mais ils peuvent également effectuer des recherches dans d'autres langages de script tels que JavaScript ou PHP. Les données extraites peuvent ensuite être présentées sous forme de code HTML lui-même, de sorte que l'utilisateur puisse y accéder avec son navigateur Web, ou stockées sous forme de données de texte accessibles par l'utilisateur en mode hors connexion.

Les entreprises utilisent des grattoirs d’écran pour exploiter les données d’une variété de sites Web liés aux mots clés afin de générer des graphiques, des diagrammes, des feuilles de calcul et des données de comparaison à utiliser dans les rapports et les présentations. Le grattoir d’écran permet de gagner un temps extraordinaire, puisqu'un employé effectuant la même tâche doit rechercher des sites pertinents, cliquer sur des liens et parcourir chaque site individuellement pour trouver et enregistrer les données pertinentes dont ils ont besoin. Un grattoir d’écran peut également être utilisé lorsque des informations stockées sur un système ne peuvent plus être consultées en raison de problèmes de compatibilité avec du matériel ou des logiciels plus récents.

Les grattoirs d'écran peuvent être à la fois une bénédiction et une malédiction pour les propriétaires de site et les internautes. Bien qu'ils fournissent absolument un service fonctionnel aux entreprises, aux moteurs de recherche et autres, un grattoir peut également être utilisé à des fins moins qu'altruistes. Par exemple, les entreprises ou les particuliers qui utilisent le spam comme méthode publicitaire peuvent utiliser un grattoir d’écran pour extraire les adresses électroniques des sites Web.

Même si un grattoir d’écran peut être un outil pratique, la communauté Web débat de la légalité et de l’éthique lors de son utilisation. Les problèmes de copyright deviennent flous lorsqu'un grattoir extrait le travail de quelqu'un et le présente sous un autre format pour un autre site Web. Les sites qui dépendent de la publicité pour générer des revenus rencontrent des problèmes lorsque leurs annonces sont supprimées par le grattoir. En conséquence, certains propriétaires de sites Web ont commencé à mettre en place des outils qui empêcheront leur site d’être détruit.

DANS D'AUTRES LANGUES

Cet article vous a‑t‑il été utile ? Merci pour les commentaires Merci pour les commentaires

Comment pouvons nous aider? Comment pouvons nous aider?