¿Qué son Big Data?
Los grandes datos son mediciones de datos que han crecido tan grandes que las bases de datos normales no pueden contener y trabajar con la gran cantidad de información. Los datos vienen en tres tamaños: pequeño, mediano y grande; Ninguna de estas mediciones es estricta; En cambio, cada uno depende más de la facilidad de uso y qué tipo de máquina puede manejar la información. Se necesitan máquinas especiales, mucho más grandes y complejas que las utilizadas para las bases de datos ordinarias, para Big Data. Estos tipos de datos generalmente se encuentran en las agencias gubernamentales y científicas, pero algunos sitios web muy grandes también contienen esta gran cantidad de información.
Los datos vienen en tres tamaños estándar, pero no estrictos. Los datos pequeños pueden caber en una sola computadora o máquina, como una computadora portátil. Los datos medianos pueden caber en una matriz de disco y son mejor administrados por una base de datos. Las bases de datos, sin importar cuán grandes, son incapaces de trabajar con Big Data, y se utilizarán mucho sistemas especiales. Si bien no hay una directriz estricta para lo que son los big data, generalmentecomienza alrededor del nivel de terabyte (TB) y sube al nivel de petabyte (PB).
Intentar trabajar con Big Data en una base de datos que no esté especializada para esta cantidad de datos causará varios problemas sustanciales. La base de datos no puede manejar la cantidad de información, por lo que se deben borrar algunos datos. Esto es como tratar de ajustar 100 gigabytes (GB) en una computadora con solo 50 GB de espacio de disco duro; no se puede hacer. Los datos que quedan serán difíciles de controlar tanto para controlar y administrar, porque cualquier función tardaría mucho en completarse y la base de datos debe cerrarse a nuevas presentaciones.
Si bien es posible seguir compras de máquinas y agregar nuevos datos a las bases de datos, esto crea el problema difícil de manejar. Esto se debe a que el software de la base de datos solo está hecho para funcionar con datos medios. Los conjuntos de datos más grandes conducen a errores y problemas administrativos, porque el software simplemente no puede moverse o trabajar conH Grandes datos sin encontrar problemas.
La mayoría de las organizaciones o sitios web no encuentran grandes datos. Las agencias de defensa y militar usan esta cantidad de información para crear modelos y almacenar resultados de pruebas, y muchas agencias científicas grandes necesitan estas máquinas especializadas por razones similares. Algunos sitios web muy grandes necesitan grandes máquinas de datos, pero los sitios web no son tan comunes como las agencias en este mercado. Estas organizaciones deben mantener todos sus datos, ya que ayuda a analizar mejor los datos futuros y hacer predicciones.