Hvad er spredning af data?
"Dataproliferation" er et paraplybegrep, der vedrører det store antal filer og mængden af data, der er gemt af enheder som regeringer og virksomheder. Den enorme mængde data, der kommer dagligt, betyder, at disse enheder har brug for mere plads og hardware, men spredning af data bevæger sig hurtigere end fremskridt med computere fra og med 2011. Det betyder ikke noget, hvilken type information der er gemt - uanset om det er struktureret eller ustruktureret; alt hvad der betyder noget er, at computerhukommelsen optages. Lagring af alle disse data kan være vanskeligt, hvilket fører til ekstra omkostninger. Et andet problem med spredning af data er, at det netværk, som dataene er lagret på, og at alle tilknyttede programmer har en tendens til at bremse.
Problemet med spredning af data er ikke et problem, der let angår forbrugere og gennemsnitlige computerbrugere. Mens gennemsnitlige computerbrugere har krævet mere hukommelse over tid, har computere været i stand til at gå videre med en hastighed for at tilfredsstille disse behov. Når det drejer sig om virksomheder, regeringer og andre enheder, der indsamler massive data på daglig basis, kan problemet med dataforøgelse imidlertid manifestere sig.
Hvis en gennemsnitlig computerbruger har brug for mere computerhukommelse, får han typisk bare en større harddisk. Når en stor enhed har brug for mere hukommelse, skal den typisk få flere servere. Til en normal hastighed skulle dette ikke give problemer, men mange store enheder i 2011 lagrer stigende mængder data til priser, der overgår teknologien, og et massivt antal servere kan være nødvendigt for at holde alt, hvad enheden har brug for at gemme. Dette skyldes, at computerteknologi endnu ikke er i stand til at gøre en enhed, der er i stand til at indeholde alle oplysninger, hvilket betyder, at en stor enhed skal fortsætte med at købe og bruge mere og mere hardware.
Nogle datavilkår eller problemer vedrører kun en type information. Når det kommer til spredning af data, betyder det dog ikke noget, hvilken type data der er tale om. Så længe computerhukommelsen optages i en hurtig hastighed, bliver dataformidling et problem.
Et af de mange problemer med spredning af data er omkostninger. Bortset fra omkostningerne ved ekstra opbevaringshardware er der også omkostninger til fysisk opbevaring og menneskelige ressourcer. Serverne skal placeres et sted, og folk skal ansættes for at køre serverne, hvilket resulterer i omkostninger, der teoretisk kan blive for meget for en enhed til at opretholde og føre til alvorligt nedsat fortjeneste. Et andet problem vedrører netværkshastighed, fordi tilstopning af data kan føre til, at programmer bevæger sig meget langsommere, hvilket betyder, at medarbejderne kan udføre mindre arbejde i løbet af en arbejdsdag.