O que são big data?
Big data são medições de dados que cresceram tão grandes que os bancos de dados normais não conseguem conter e trabalhar com a enorme quantidade de informações. Os dados vêm em três tamanhos: pequeno, médio e grande; Nenhuma dessas medidas é rigorosa; Em vez disso, cada um depende mais da facilidade de uso e que tipo de máquina pode lidar com as informações. Máquinas especiais, muito maiores e complexas do que as usadas para bancos de dados comuns, são necessários para o big data. Esses tipos de dados são normalmente encontrados em agências governamentais e científicas, mas alguns sites muito grandes também contêm essa grande quantidade de informações.
Os dados vêm em três tamanhos padrão, mas não rigorosos. Dados pequenos podem caber em um único computador ou máquina, como um laptop. Os dados médios podem se encaixar em uma matriz de disco e são melhor gerenciados por um banco de dados. Os bancos de dados, não importa o tamanho, são incapazes de trabalhar com big data, e sistemas especiais serão muito usados. Embora não haja diretrizes estritas para o que são big data, normalmenteComeça ao redor do nível Terabyte (TB) e sobe para o nível Petabyte (PB).
Tentar trabalhar com big data em um banco de dados que não é especializado para essa quantidade de dados causará vários problemas substanciais. O banco de dados não pode lidar com a quantidade de informações; portanto, alguns dados devem ser apagados. É como tentar encaixar 100 gigabytes (GB) em um computador com apenas 50 GB de espaço no disco rígido; não pode ser feito. Os dados restantes serão difíceis de controlar e gerenciar, porque qualquer função levaria muito tempo para concluir e o banco de dados deve ser fechado para novos envios.
Embora seja possível continuar comprando máquinas e adicionando novos dados aos bancos de dados, isso cria o problema pesado. Isso ocorre porque o software de banco de dados é feito apenas para funcionar com dados médios. Conjuntos de dados maiores levam a erros e problemas administrativos, porque o software simplesmente não pode se mover ou trabalhar com a inteligênciah grandes dados sem encontrar problemas.
O big data não é encontrado pela maioria das organizações ou sites. As agências de defesa e militar usam essa quantidade de informações para criar modelos e armazenar resultados de testes, e muitas grandes agências científicas precisam dessas máquinas especializadas por razões semelhantes. Alguns sites muito grandes precisam de máquinas de dados grandes, mas os sites não são tão comuns quanto as agências nesse mercado. Essas organizações precisam manter todos os seus dados, porque ajudam a analisar melhor dados futuros e fazer previsões.