Qu'est-ce qu'un grattoir d'écran?
Un grattoir à écran est un programme informatique qui collecte des données basées sur des caractères à partir de la sortie d'affichage d'un autre programme. Les grattoirs à écran peuvent extraire les données qu'ils recherchent et les présenter dans un format plus riche, comme avec des graphiques ou des tables, ou simplement indexer les données de stockage. Il existe de nombreux autres noms pour un grattoir d'écran, notamment le grattoir du site Web, le mineur de contenu, le ripper du site Web, l'extracteur Web, le collecteur de données automatisé et le grattoir HTML.
Un grattoir d'écran recherchera dans le code d'un site Web et filtrera le code étranger qui est en place pour fournir une présentation agréable au navigateur final. Un tel code est nécessaire pour afficher toute la page dans sa disposition prévue, mais un grattoir recherche simplement des données utiles. Ces données sont collectées et présentées comme une base de données simple, sans les cloches et sifflent le code HTML d'origine fourni.
Un bon exemple de grattoir d'écran en action est avec les araignées du moteur de recherche. Ces araignées accèdent à des centaines de milliers de wEbsites, qui contiennent chacun de nombreuses pages à l'intérieur. Les données de mots clés de ces sites sont collectées et indexées, puis finalement présentées à l'utilisateur final en tant que résultats des moteurs de recherche.
La plupart des grattoirs d'écran parcourent le codage HTML d'un site Web pour obtenir leurs informations, mais ils peuvent également rechercher d'autres langages de script tels que JavaScript ou PHP. Les données extraites peuvent ensuite être présentées comme HTML elle-même, afin que l'utilisateur puisse y accéder avec son navigateur Web ou stocké comme des données de texte qui peuvent être accessibles par l'utilisateur hors ligne.
Les entreprises utilisent des grattoirs d'écran pour extraire les données à partir d'une variété de sites Web liés aux mots clés afin de générer des graphiques, des graphiques, des feuilles de calcul et des données de comparaison à utiliser dans les rapports et les présentations. Le grattoir d'écran permet d'économiser un temps extraordinaire, car un employé faisant la même tâche devrait rechercher des sites pertinents, cliquer sur les liens et parcourir chaque siteindividuellement pour trouver et enregistrer les données applicables dont ils ont besoin. Un grattoir d'écran peut également être utilisé lorsque les informations sont stockées sur un système qui ne peut plus être accessible en raison de problèmes de compatibilité avec un matériel ou un logiciel plus récent.
Les grattoirs d'écran peuvent être à la fois une bénédiction et une malédiction pour les propriétaires de sites et les surfeurs Web. Bien qu'ils fournissent absolument un service fonctionnel pour les entreprises, les moteurs de recherche et autres, un grattoir d'écran peut également être utilisé à moins que des fins altruistes. Par exemple, les entreprises ou les particuliers qui utilisent le spam comme méthode publicitaire peuvent utiliser un grattoir d'écran pour exploiter les adresses e-mail des sites Web.
Bien qu'un grattoir d'écran puisse être un outil pratique, il y a un débat entre la communauté Web sur les légalités et l'éthique lors de leur utilisation. Les problèmes de droit d'auteur deviennent flous lorsqu'un grattoir d'écran extrait le travail acharné de quelqu'un et le présente dans un autre format pour un autre site Web, et les sites qui dépendent de la publicité pour générer des revenus ont des problèmes lorsque leurs annonces sontE étant jeté par le grattoir à écran. En conséquence, certains propriétaires de sites Web ont commencé à mettre en œuvre des outils qui empêcheront leurs sites d'être grattés.