Veri temizleme olarak da bilinen veri temizleme, bir veri kümesinin doğru ve doğru olmasını sağlama işlemidir. Bu işlem sırasında kayıtlar doğruluk ve tutarlılık açısından kontrol edilir ve gerektiğinde düzeltilir veya silinir. Bu, tek bir kayıt grubunda veya birleştirilmesi gereken veya birlikte çalışacak olan birden fazla veri kümesi arasında gerçekleşebilir.
Basit bir işlem
En basit şekliyle veri temizliği, bir kayıt kümesini okuyan ve doğruluğunu onaylayan bir kişiyi veya kişileri içerir. Yazım ve yazım hataları düzeltildi, yanlış etiketlenmiş veriler uygun şekilde etiketlendi ve dosyalandı, eksik veya eksik girdiler tamamlandı. Bu işlemler çoğu zaman eski veya kurtarılamaz kayıtları temizleyerek yer kaplamaz ve verimsiz işlemlere neden olur.
Karmaşık süreç
Daha karmaşık işlemlerde, veri temizleme bilgisayar programları tarafından gerçekleştirilebilir. Bu programlar verileri kullanıcı tarafından karar verilen çeşitli kural ve prosedürlerle kontrol edebilir. Önceki beş yıl içinde güncellenmemiş tüm kayıtları silmek, yanlış yazılmış kelimeleri düzeltmek ve kopya kopyaları silmek için bir program oluşturulabilir. Daha karmaşık bir program, doğru bir posta koduna dayanarak kayıp bir şehri doldurabilir veya bir veritabanındaki tüm öğelerin fiyatlarını başka bir para birimine göre değiştirebilir.
Yararları
Veri temizleme, verilere bağlı işlerin etkinliği için çok önemlidir. Örneğin, bir veritabanındaki müşterilerin bazılarının doğru telefon numaraları yoksa, çalışanlar onlarla kolayca iletişim kuramaz. Bir müşterinin e-posta adresleri doğru şekilde biçimlendirilmezse, başka bir örnek olarak, otomatik bir e-posta sistemi en yeni kuponları ve özel teklifleri gönderemez. Veri temizleme işi, bir sistem içindeki verilerin doğru olduğundan ve sistemin verileri kullanabildiğinden emin olmaktır. Yanlış veya eksik kayıtlar hiç kimseye fazla kullanılmıyor.
İki veri sisteminin birlikte çalışması gerektiğinde, veri temizliği daha da önemlidir. Bir şirketin aynı müşterilerin çoğuyla çalışan iki şubesi varsa, yalnızca her şubedeki verilerin eksiksiz ve doğru olması gerekmez, aynı zamanda iki şubenin de eşleşen verilere sahip olması gerekir. Bir müşteri telefon numarasını bir şubeyle güncellediğinde, diğer şubedeki verinin en yüksek verimi sağlamak için aynı bilgilerle güncellenmesi gerekir. Veri temizleme yalnızca verilerin doğru olduğundan emin olmak için değil, aynı zamanda farklı kayıtlar arasında tutarlı olmasını sağlamak için de çalışır.
Ne zaman bir çok veri saklanırsa, hatalar sisteme girmeye zorlanır. Veri temizlemenin amacı, bu hataları en aza indirgemek ve verileri mümkün olduğu kadar faydalı ve anlamlı kılmaktır. Bu işlem düzenli yapılmadan hatalar ve hatalar eklenebilir, bu da daha az verimli çalışmalara ve daha fazla komplikasyona yol açabilir.


