Ekran kazıyıcı, karakter tabanlı verileri başka bir programın ekran çıktısından toplayan bir bilgisayar programıdır. Ekran sıyırıcılar, aradıkları verileri ayıklayabilir ve bunları grafikler veya tablolar gibi daha zengin bir biçimde sunabilir veya depolama için verileri dizine ekleyebilir. Ekran kazıyıcı için, web sitesi kazıyıcı, içerik madencisi, web sitesi yırtıcısı, web çıkarıcı, otomatik veri toplayıcı ve HTML kazıyıcı dahil olmak üzere birçok başka ad vardır.
Bir ekran kazıyıcı, bir web sitesinin kodunu arayacak ve son tarayıcıya güzel görünümlü bir sunum sağlamak için mevcut olan harici kodu filtreleyecektir. Bu tür bir kod, sayfanın tamamını istenen düzende görüntülemek için gereklidir, ancak bir sıyırıcı yalnızca yararlı veriler aramaktadır. Bu veriler, sağlanan orijinal HTML kodunun zilleri ve ıslıkları olmadan toplanır ve basit bir veritabanı olarak sunulur.
Ekrandaki bir sıyırıcıya iyi bir örnek, arama motoru örümcekleriyle ilgilidir. Bu örümcekler, her biri içinde çok sayıda sayfa bulunan yüz binlerce web sitesine erişir. Bu sitelerdeki anahtar kelime verileri toplanır ve dizine eklenir, ardından sonuçta son kullanıcıya arama motoru sonuçları olarak sunulur.
Çoğu ekran sıyırıcı, bir web sitesinin HTML kodlamasını araştırır, ancak aynı zamanda JavaScript veya PHP gibi diğer betik dillerinde de arama yapabilir. Daha sonra mayınlı veriler HTML'in kendisi olarak sunulabilir, böylece kullanıcı web tarayıcısından erişebilir veya kullanıcı tarafından çevrimdışı olarak erişilebilen metin verileri olarak saklanabilir.
İşletmeler, raporlarda ve sunumlarda kullanılacak grafikler, çizelgeler, elektronik tablolar ve karşılaştırma verilerini oluşturmak için çeşitli anahtar kelime ile ilgili web sitelerinden gelen verileri araştırmak için ekran sıyırıcıları kullanır. Ekran sıyırıcısı olağanüstü bir zaman kazandırır, çünkü aynı görevi yapan bir çalışan ilgili siteleri aramak, linklere tıklamak ve ihtiyaç duyduğu uygulanabilir verileri bulmak ve kaydetmek için her bir siteye ayrı ayrı göz atmak zorunda kalır. Ekran kazıyıcı, yeni donanım veya yazılımla uyumluluk sorunları nedeniyle artık erişilemeyen bir sistemde bilgi depolandığında da kullanılabilir.
Ekran sıyırıcılar, site sahipleri ve web sörfçüleri için hem kutsama hem de lanet olabilir. İşletmeler, arama motorları ve diğerleri için kesinlikle işlevsel bir hizmet sunsalar da, bir ekran sıyırıcısı özgecilikten daha az amaç için de kullanılabilir. Örneğin, spam'i bir reklam yöntemi olarak kullanan şirketler veya bireyler, web sitelerinden e-posta adreslerini almak için ekran sıyırıcı kullanabilir.
Bir ekran sıyırıcı kullanışlı bir araç olsa da, web topluluğu arasında kullanım sırasında yasallık ve etik konularında bazı tartışmalar vardır. Bir ekran sıyırıcısı birinin zorlu çalışmasını çıkardığında ve başka bir web sitesi için başka bir biçimde sunduğunda, telif hakkı sorunları bulanıklaşır ve reklamları gelir elde etmek için bağımlı olan siteler, reklamları ekran kazıyıcı tarafından atılırken sorun yaşar. Sonuç olarak, bazı web sitesi sahipleri, sitelerinin kazınmasını önleyecek araçları uygulamaya başlamıştır.


