スクレイパーサイトとは
スクレーパーサイトは、他のソースからコンテンツを取得して再公開するWebサイトであり、通常は帰属表示なしになります。 このようなサイトはさまざまな理由で維持されており、多くの問題を引き起こすため、インターネット上の多くの正当なコンテンツ制作者にとって大きな懸念事項です。 ほとんどのスクレイパーサイトは、同意なしにコンテンツを転載し、作者にクレジットを与えないことで著作権法に違反します。また、検索エンジンの結果やサイトのランキングに大混乱を引き起こします。
スクレイパーサイトの主な機能は、自動化された手段を使用して他のサイトからコンテンツを収集することです。 コンテンツを収集する方法は「スクレイピング」と呼ばれ、購読する読者のために、サイト全体のダウンロードからRSS、XML、Atomで生成されたフィードからコンテンツを引き出すまで、さまざまな方法で実現できます。新しい素材をチェックするために絶えずアクセスするのではなく、サイトにアクセスします。 スクレイピングされると、コンテンツは逐語的に持ち上げられ、新しいサイトにインストールされます。
ほとんどのスクレイパーサイトは、サイトにリンクされた広告を通じて広告収入を生み出す目的で維持されています。 人々は無邪気に何かを検索し、スクレイパーサイトにアクセスして、混乱しないように広告をクリックする場合があります。 スクレーパーサイトはリンクファーミングでも使用されます。リンクファーミングでは、すべて互いにリンクしている複数のサイトを維持することにより、検索エンジンのランキングを上げます。
コンテンツが盗まれた場合、著作権法に違反し、スクレイパーサイトが元のコンテンツ所有者から収益を奪う可能性があるため、元の作成者を苛立たせます。 多くのウェブマスターは、スクレイパーサイトを打ち負かすためにさまざまな手法を使用しており、検索エンジンや広告会社にアクションを求めて、スクレイパーサイトをリストから削除するか、収益性を下げてプラクティスが魅力的でないようにするよう求めています。
スクレイパーサイトが作成者を信用している場合、尊敬されているサイトからのリンクではなく、スパムサイトのリンクが多数ある「悪い近所」にあるように見せることで、作成者に損害を与える可能性があります。 その結果、検索エンジンのランキングが低下する可能性があり、サイトの所有者は誰にリンクするかを制御できないため、サイトの所有者はそれについて何もできない場合があります。
著作権で保護されたコンテンツを削除するためにスクレイパーサイトを取得することは、そのようなサイトの多くが所有者を隠すために巧妙なレイヤーを使用するため、非常に難しい場合があります。 フラストレーションのあるウェブマスターの中には、スクレイパーサイトをホストしている会社に直接アクセスし、著作権侵害を主張し、紛争のあるコンテンツの即時削除を要求するものがいます。
技術的には、検索エンジンとニュース集約サイトもスクレイパーサイトと見なすことができます。 ただし、これらのサイトは公共の利益のために維持されており、素材の使用がフェアユースのガイドラインに該当するため、これらのサイトは一般に有害なスクレーパーサイトで集中していません。