Cosa sono i big data?
I big data sono misurazioni di dati che sono cresciuti così grandi che i normali database non sono in grado di contenere e lavorare con l'enorme quantità di informazioni. I dati sono disponibili in tre dimensioni: piccoli, medi e grandi; Nessuna di queste misurazioni è severa; Invece, ognuno dipende più dalla facilità d'uso e dal tipo di macchina può gestire le informazioni. Per i big data sono necessarie macchine speciali, molto più grandi e complesse di quelle utilizzate per i database ordinari. Questi tipi di dati si trovano in genere nelle agenzie governative e scientifiche, ma alcuni siti Web molto grandi contengono anche questa grande quantità di informazioni.
I dati sono disponibili in tre dimensioni standard, ma non severi. Piccoli dati sono in grado di adattarsi a un singolo computer o macchina, come un laptop. I dati medi sono in grado di adattarsi a un array di disco e sono meglio gestiti da un database. I database, non importa quanto grandi, non sono in grado di lavorare con i big data e invece verranno utilizzati sistemi speciali. Sebbene non ci siano linee guida rigorose per quali sono i big data, in genereInizia intorno al livello di terabyte (TB) e passa al livello di Petabyte (Pb).
Il tentativo di lavorare con i big data su un database che non è specializzato per questa quantità di dati causerà diversi problemi sostanziali. Il database non è in grado di gestire la quantità di informazioni, quindi alcuni dati devono essere cancellati. È come cercare di adattarsi a 100 gigabyte (GB) su un computer con solo 50 GB di spazio del disco rigido; non può essere fatto. I dati lasciati saranno ingombranti sia nel controllo che nella gestione, perché qualsiasi funzione richiederebbe molto tempo per il completamento e il database deve essere chiuso a nuove comunicazioni.
Sebbene sia possibile mantenere le macchine per l'acquisto e l'aggiunta di nuovi dati ai database, questo crea il problema ingombrante. Questo perché il software di database viene fatto solo per funzionare con dati medi. Set di dati più grandi portano a errori e problemi amministrativi, perché il software semplicemente non può muoversi o funzionare conH grandi dati senza riscontrare problemi.
I big data non sono riscontrati dalla maggior parte delle organizzazioni o siti Web. Le agenzie di difesa e militari utilizzano questa quantità di informazioni per creare modelli e archiviare i risultati dei test e molte grandi agenzie scientifiche necessitano di queste macchine specializzate per ragioni simili. Alcuni siti Web molto grandi richiedono grandi macchine di dati, ma i siti Web non sono comuni come le agenzie in questo mercato. Queste organizzazioni devono mantenere tutti i loro dati, perché aiutano ad analizzare meglio i dati futuri e fare previsioni.