Wat is gegevensproliferatie?
"Gegevensproliferatie" is een overkoepelende term die betrekking heeft op het grote aantal bestanden en de hoeveelheid gegevens die zijn opgeslagen door entiteiten zoals overheden en bedrijven. De enorme hoeveelheid gegevens die dagelijks binnenkomt, betekent dat deze entiteiten meer ruimte en hardware nodig hebben, maar dat de proliferatie van gegevens sneller verloopt dan computerverbeteringen vanaf 2011. Het maakt niet uit wat voor soort informatie wordt opgeslagen - of deze gestructureerd of ongestructureerd is; het enige dat telt is dat computergeheugen in beslag wordt genomen. Het opslaan van al deze gegevens kan moeilijk zijn en tot extra kosten leiden. Een ander probleem met gegevensproliferatie is dat het netwerk waarop de gegevens worden opgeslagen en alle bijbehorende programma's de neiging hebben te vertragen.
Het probleem van gegevensproliferatie is niet een probleem dat consumenten en gemiddelde computergebruikers gemakkelijk aangaat. Hoewel gemiddelde computergebruikers in de loop van de tijd meer geheugen nodig hebben, konden computers sneller vooruitgaan om aan deze behoeften te voldoen. Als het gaat om bedrijven, overheden en andere entiteiten die dagelijks massale gegevens verzamelen, kan het probleem van gegevensproliferatie zich echter voordoen.
Als een gemiddelde computergebruiker meer computergeheugen nodig heeft, krijgt hij meestal gewoon een grotere harde schijf. Wanneer een grote entiteit meer geheugen nodig heeft, moet deze meestal meer servers krijgen. Bij een normale snelheid zou dit geen problemen moeten opleveren, maar veel grote entiteiten slaan in 2011 steeds meer gegevens op met snelheden die de technologie overtreffen, en een enorm aantal servers kan nodig zijn om alles te bewaren wat de entiteit nodig heeft om op te slaan. Dit komt omdat computertechnologie nog niet in staat is om een apparaat te maken dat alle informatie kan bevatten, wat betekent dat een grote entiteit steeds meer hardware moet blijven kopen en gebruiken.
Sommige gegevens of problemen betreffen slechts één type informatie. Als het gaat om gegevensproliferatie, maakt het echter niet uit om wat voor soort gegevens het gaat. Zolang computergeheugen snel wordt gebruikt, wordt gegevensproliferatie een probleem.
Een van de vele problemen met gegevensproliferatie is de kostprijs. Afgezien van de kosten van extra opslaghardware, zijn er ook fysieke opslag- en personeelskosten. De servers moeten ergens worden geplaatst en er moeten mensen worden aangesteld om de servers te runnen, wat resulteert in kosten die theoretisch te veel kunnen worden voor een entiteit om te leiden en tot sterk verminderde winst. Een ander probleem betreft de netwerksnelheid, omdat het dichtslibben van gegevens ertoe kan leiden dat programma's veel langzamer gaan, wat betekent dat werknemers minder werk kunnen doen tijdens een werkdag.