Vad är Big Data?
Big data är mätningar av data som har blivit så stora att normala databaser inte kan innehålla och arbeta med den enorma mängden information. Data finns i tre storlekar: små, medelstora och stora; ingen av dessa mätningar är strikta; istället beror var och en mer på användarvänlighet och vilken typ av maskin som kan hantera informationen. Specialmaskiner, mycket större och komplexa än de som används för vanliga databaser, behövs för big data. Dessa typer av data finns vanligtvis hos myndigheter och vetenskapliga myndigheter, men vissa mycket stora webbplatser innehåller också denna stora mängd information.
Uppgifterna finns i tre standard, men inte strikta, storlekar. Små data kan passa på en enda dator eller maskin, till exempel en bärbar dator. Medeldata kan passa på en diskarray och hanteras bäst av en databas. Databaser, oavsett hur stora de är, kan inte arbeta med big data, och specialsystem används mycket i stället. Även om det inte finns någon strikt riktlinje för vad big data är, börjar det vanligtvis runt terabyte (TB) -nivån och går upp till petabyte-nivån (PB).
Att försöka arbeta med big data i en databas som inte är specialiserad för denna datamängd kommer att orsaka flera väsentliga problem. Databasen kan inte hantera mängden information, så vissa data måste raderas. Detta är som att försöka passa 100 gigabyte (GB) på en dator med bara 50 GB hårddiskutrymme; det kan inte göras. De kvarvarande uppgifterna kommer att vara olämpliga för både kontroll och hantering, eftersom alla funktioner skulle ta lång tid att slutföra och databasen måste stängas av för nya inlämningar.
Även om det är möjligt att fortsätta köpa maskiner och lägga till nya data i databaserna, skapar detta det besvärliga problemet. Detta beror på att databasprogramvara bara är utformad för att fungera med medelstora data. Större datasätt leder till fel och administrativa problem, eftersom programvaran helt enkelt inte kan flytta eller arbeta med stora data utan att stöta på problem.
Big data stöds inte av de flesta organisationer eller webbplatser. Försvars- och militärbyråer använder denna mängd information för att skapa modeller och lagra testresultat, och många stora vetenskapliga byråer behöver dessa specialmaskiner av liknande skäl. Vissa mycket stora webbplatser behöver stora datamaskiner, men webbplatser är inte lika vanliga som byråer på denna marknad. Dessa organisationer måste behålla alla sina uppgifter, eftersom det hjälper till att bättre analysera framtida data och göra förutsägelser.