Skip to main content

Wat zijn big data?

Big data zijn gegevensmetingen die zo groot zijn geworden dat normale databases niet in staat zijn om de enorme hoeveelheid informatie te bevatten en werken.Gegevens zijn er in drie maten: klein, gemiddeld en groot;Geen van deze metingen is streng;In plaats daarvan hangt elk meer af van gebruiksgemak en welk type machine de informatie kan verwerken.Speciale machines, veel groter en complex dan die welke worden gebruikt voor gewone databases, zijn nodig voor big data.Dit soort gegevens worden meestal aangetroffen in overheids- en wetenschappelijke agentschappen, maar sommige zeer grote websites bevatten ook deze grote hoeveelheid informatie.

Gegevens zijn er in drie standaard, maar niet strikte maten.Kleine gegevens kunnen op een enkele computer of machine passen, zoals een laptop.Gemiddelde gegevens kunnen op een schijfarray passen en worden het best beheerd door een database.Databases, hoe groot ook, zijn niet in staat om met big data te werken en speciale systemen worden in plaats daarvan veel gebruikt.Hoewel er geen strikte richtlijn is voor wat big data zijn, begint het meestal rond het terabyte (tb) niveau en gaat het naar het petabyte (PB) niveau.

Probeert om met big database te werken in een database die hier niet voor is gespecialiseerdDe hoeveelheid gegevens zal verschillende substantiële problemen veroorzaken.De database kan niet de hoeveelheid informatie verwerken, dus sommige gegevens moeten worden gewist.Dit is hetzelfde als proberen 100 gigabytes (GB) op een computer te passen met slechts 50 GB ruimte van harde schijf;het kan niet worden gedaan.De linker gegevens zijn logisch om zowel te besturen als te beheren, omdat elke functie lang zou duren om te voltooien en de database moet worden afgesloten voor nieuwe inzendingen.

Hoewel het mogelijk is om inkoopmachines te bewaren en nieuwe gegevens aan de databases toe te voegen, dit creëert het onhandige probleem.Dit komt omdat databasesoftware alleen wordt gemaakt om te werken met middelgrote gegevens.Grotere datasets leiden tot fouten en administratieve problemen, omdat de software eenvoudigweg niet kan verplaatsen of met grote gegevens kunnen werken zonder problemen te ondervinden.

Big data worden niet aangetroffen door de meeste organisaties of websites.Defensie en militaire instanties gebruiken deze hoeveelheid informatie om modellen te maken en testresultaten te bewaren, en veel grote wetenschappelijke agentschappen hebben deze gespecialiseerde machines nodig om vergelijkbare redenen.Sommige zeer grote websites hebben grote datamachines nodig, maar websites zijn niet zo gebruikelijk als bureaus in deze markt.Deze organisaties moeten al hun gegevens bewaren, omdat het helpt om toekomstige gegevens beter te analyseren en voorspellingen te doen.