O que é um site de raspador?

Um site de raspador é um site que extrai o conteúdo de outras fontes e o republica, normalmente sem atribuição. Esses sites são mantidos por vários motivos e são de grande preocupação para muitos produtores legítimos de conteúdo na Internet, porque apresentam vários problemas. A maioria dos sites raspadores viola a lei de direitos autorais, reimprimindo conteúdo sem consentimento e sem creditar o autor, além de causar estragos nos resultados dos mecanismos de pesquisa e nas classificações de sites, o que pode dificultar aos usuários da Internet encontrar os sites que realmente desejam ver.

A principal característica de um site de raspador é que ele usa meios automatizados para coletar conteúdo de outros sites. A prática de coletar conteúdo é conhecida como "raspagem" e pode ser realizada de várias maneiras, desde o download de sites inteiros até a retirada de conteúdo de feeds gerados em RSS, XML e Atom para o benefício dos leitores que desejam se inscrever. para um site, em vez de visitá-lo constantemente para verificar se há novo material. Depois de raspado, o conteúdo é levantado literalmente e instalado em um novo site.

A maioria dos sites de raspadores é mantida com o objetivo de gerar receita com publicidade por meio de anúncios vinculados ao site. As pessoas podem inocentemente procurar algo, chegar ao site do raspador e clicar nos anúncios por confusão. Os sites de raspadores também são usados ​​no cultivo de links, uma prática que envolve a manutenção de vários sites, todos vinculados entre si, aumentando assim as classificações dos mecanismos de pesquisa.

Quando o conteúdo é roubado, frustra o criador original, porque viola a lei de direitos autorais e porque o site do raspador pode privar o proprietário do conteúdo original da receita. Muitos webmasters usam uma variedade de técnicas na tentativa de derrotar sites de scraper, e alguns pediram ação por parte de mecanismos de pesquisa e empresas de publicidade, pedindo que excluam sites de scraper ou os tornem menos lucrativos para que a prática seja menos atraente.

Nos casos em que um site raspador credita o criador, isso também pode prejudicá-lo, fazendo com que pareça que seu site está em um "bairro ruim", com um grande número de links com spam, em vez de links de sites respeitados. Como resultado, as classificações nos mecanismos de pesquisa podem cair, e o proprietário do site pode não ter o poder de fazer algo a respeito, uma vez que os proprietários do site não podem controlar quem vincula a eles.

Conseguir que um site raspador remova conteúdo protegido por direitos autorais pode ser extremamente desafiador, pois muitos desses sites usam camadas de subterfúgios para ocultar seus proprietários. Alguns webmasters frustrados vão diretamente à empresa que hospeda o site do raspador, citando violações de direitos autorais e solicitando a remoção imediata do conteúdo contestado.

Tecnicamente, os mecanismos de pesquisa e sites de agregação de notícias também podem ser considerados sites de raspagem. No entanto, como esses sites são mantidos para o bem público e como o uso de material se enquadra nas diretrizes de uso justo, esses sites geralmente não são agrupados com sites de raspagem perigosos.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?