Co to jest proliferacja danych?
„Rozprzestrzenianie danych” to ogólne pojęcie dotyczące dużej liczby plików i ilości danych przechowywanych przez podmioty, takie jak rządy i przedsiębiorstwa. Ogromna ilość danych przychodzących codziennie oznacza, że podmioty te potrzebują więcej miejsca i sprzętu, ale proliferacja danych przesuwa się szybciej niż postępy komputerowe w 2011 roku. Nie ma znaczenia, jaki rodzaj informacji jest przechowywany - niezależnie od tego, czy jest on ustrukturyzowany, czy nieustrukturyzowany; liczy się tylko to, że zabiera się pamięć komputera. Przechowywanie wszystkich tych danych może być trudne, co prowadzi do dodatkowych kosztów. Innym problemem związanym z proliferacją danych jest to, że sieć, w której dane są przechowywane, i wszystkie powiązane programy mają tendencję do spowalniania.
Problem proliferacji danych nie dotyczy takich problemów, jak konsumenci i przeciętni użytkownicy komputerów. Podczas gdy przeciętni użytkownicy komputerów potrzebowali więcej pamięci w miarę upływu czasu, komputery były w stanie rozwijać się z taką szybkością, aby zaspokoić te potrzeby. Jednak w przypadku firm, rządów i innych podmiotów gromadzących codziennie ogromne ilości danych problem proliferacji danych może się objawiać.
Jeśli przeciętny użytkownik komputera potrzebuje więcej pamięci, zwykle dostaje większy dysk twardy. Gdy duża jednostka potrzebuje więcej pamięci, zwykle musi uzyskać więcej serwerów. W normalnym tempie nie powinno to powodować żadnych problemów, ale wiele dużych podmiotów w 2011 r. Przechowuje coraz większe ilości danych w tempie przewyższającym technologię, a do przechowywania wszystkiego, co jednostka musi przechowywać, może być potrzebna ogromna liczba serwerów. Wynika to z faktu, że technologia komputerowa nie jest jeszcze w stanie stworzyć urządzenia zdolnego do przechowywania wszystkich informacji, co oznacza, że duży podmiot musi nadal kupować i używać coraz więcej sprzętu.
Niektóre warunki danych lub problemy dotyczą tylko jednego rodzaju informacji. Jeśli chodzi o rozprzestrzenianie danych, nie ma jednak znaczenia, jakiego rodzaju dane są w to zaangażowane. Tak długo, jak pamięć komputera jest zajmowana w szybkim tempie, proliferacja danych staje się problemem.
Jednym z wielu problemów związanych z rozprzestrzenianiem danych są koszty. Oprócz kosztów dodatkowego sprzętu do przechowywania danych, istnieją również koszty przechowywania fizycznego i zasobów ludzkich. Serwery muszą być gdzieś umieszczone, a ludzie muszą być zatrudnieni do ich obsługi, co spowoduje teoretycznie koszty, które teoretycznie mogą stać się zbyt duże, aby jednostka mogła je utrzymać i doprowadzić do znacznego spadku zysków. Kolejny problem dotyczy szybkości sieci, ponieważ zatykanie danych może powodować, że programy poruszają się znacznie wolniej, co oznacza, że pracownicy mogą wykonywać mniej pracy w ciągu dnia roboczego.