Co to jest witryna zgarniająca?
Witryna zgarniająca to witryna, która pobiera treści z innych źródeł i publikuje je ponownie, zwykle bez przypisywania. Takie strony są utrzymywane z różnych powodów i są bardzo ważne dla wielu legalnych producentów treści w Internecie, ponieważ stwarzają wiele problemów. Większość stron zgarniających narusza prawo autorskie, przedrukowując treści bez zgody i nie podając autora, a także sieją spustoszenie w wynikach wyszukiwarek i rankingach witryn, co może utrudnić użytkownikom Internetu znalezienie stron, które faktycznie chcą zobaczyć.
Kluczową cechą witryny zgarniającej jest to, że korzysta ona ze zautomatyzowanych środków do pozyskiwania treści z innych witryn. Praktyka zbierania treści jest znana jako „skrobanie” i może być realizowana na wiele sposobów, od pobierania całych witryn po wyciąganie treści z kanałów generowanych w kanałach RSS, XML i Atom z korzyścią dla czytelników, którzy chcą zasubskrybować do witryny, zamiast odwiedzać ją nieustannie w celu sprawdzenia dostępności nowych materiałów. Po zeskrobaniu treść jest podnoszona dosłownie i instalowana na nowej stronie.
Większość witryn zgarniających jest utrzymywana w celu generowania przychodów z reklam poprzez reklamy powiązane z witryną. Ludzie mogą niewinnie szukać czegoś, lądować na stronie skrobaka, a następnie klikać reklamy z zamieszania. Witryny skrobakowe są również wykorzystywane w hodowli linków, która polega na utrzymywaniu kilku witryn, które wszystkie się ze sobą łączą, a tym samym podwyższaniu pozycji w wyszukiwarkach.
Kradzież treści frustruje oryginalnego twórcę zarówno dlatego, że narusza prawo autorskie, jak i dlatego, że witryna zgarniająca może pozbawić pierwotnego właściciela treści dochodów. Wielu webmasterów używa różnych technik, próbując pokonać witryny z scraperami, a niektórzy wzywają do działania ze strony wyszukiwarek i firm reklamowych, prosząc ich o usunięcie z listy witryn z scraperami lub uczynienie ich mniej dochodowymi, aby praktyka była mniej atrakcyjna.
W przypadkach, w których skrobaczka przypisuje twórcy, może to również zaszkodzić twórcy, sprawiając, że wygląda on tak, jakby jego strona znajdowała się w „złym sąsiedztwie”, z dużą liczbą spamerskich linków zamiast linków z szanowanych witryn. W rezultacie rankingi w wyszukiwarkach mogą spaść, a właściciel witryny może być bezsilny, aby coś z tym zrobić, ponieważ właściciele witryn nie mogą kontrolować, kto do nich prowadzi.
Uzyskanie skrobaczki do usunięcia treści chronionych prawem autorskim może być niezwykle trudne, ponieważ wiele takich stron używa warstw podstępu do ukrywania swoich właścicieli. Niektórzy sfrustrowani webmasterzy udają się bezpośrednio do firmy, która udostępnia witrynę zgarniającą, powołując się na naruszenia praw autorskich i prosząc o natychmiastowe usunięcie kwestionowanej treści.
Pod względem technicznym wyszukiwarki i witryny gromadzące wiadomości można również uznać za witryny skrobakowe. Ponieważ jednak witryny te są utrzymywane dla dobra publicznego, a ich wykorzystanie materiałów podlega wytycznym dozwolonego użytku, strony te nie są zazwyczaj zbijane ze szkodliwymi witrynami ze zgarniaczem.