Was sind Big Data?
Big Data sind Messungen von Daten, die so groß geworden sind, dass normale Datenbanken die enorme Menge an Informationen nicht mehr enthalten und damit arbeiten können. Die Daten sind in drei Größen erhältlich: klein, mittel und groß. keines dieser Maße ist streng; Stattdessen hängt jede davon ab, wie einfach die Bedienung ist und welcher Maschinentyp mit den Informationen umgehen kann. Für Big Data werden spezielle Maschinen benötigt, die viel größer und komplexer sind als die für gewöhnliche Datenbanken verwendeten. Diese Art von Daten findet man normalerweise in Behörden und wissenschaftlichen Einrichtungen, aber einige sehr große Websites enthalten auch diese große Menge an Informationen.
Die Daten werden in drei Standardgrößen, jedoch nicht streng, geliefert. Kleine Daten passen auf einen einzelnen Computer oder Computer, z. B. einen Laptop. Mittlere Daten können auf ein Festplattenarray passen und werden am besten von einer Datenbank verwaltet. Unabhängig von der Größe können Datenbanken nicht mit Big Data arbeiten, und stattdessen werden häufig spezielle Systeme verwendet. Zwar gibt es keine strengen Richtlinien für Big Data, diese beginnen jedoch normalerweise bei Terabyte (TB) und reichen bis zu Petabyte (PB).
Der Versuch, mit Big Data in einer Datenbank zu arbeiten, die nicht auf diese Datenmenge spezialisiert ist, führt zu mehreren erheblichen Problemen. Die Datenbank kann die Informationsmenge nicht verarbeiten, daher müssen einige Daten gelöscht werden. Dies entspricht dem Versuch, 100 Gigabyte (GB) auf einem Computer mit nur 50 GB Festplattenspeicherplatz unterzubringen. es kann nicht gemacht werden. Die verbleibenden Daten sind sowohl für die Steuerung als auch für die Verwaltung unhandlich, da die Ausführung jeder Funktion viel Zeit in Anspruch nimmt und die Datenbank für neue Übermittlungen gesperrt werden muss.
Es ist zwar möglich, weiterhin Maschinen zu kaufen und neue Daten zu den Datenbanken hinzuzufügen, dies schafft jedoch das unhandliche Problem. Dies liegt daran, dass Datenbanksoftware nur für die Arbeit mit mittleren Daten gedacht ist. Größere Datenmengen führen zu Fehlern und Verwaltungsproblemen, da die Software große Datenmengen einfach nicht ohne Probleme verschieben oder verarbeiten kann.
Big Data wird von den meisten Organisationen oder Websites nicht erkannt. Verteidigungs- und Militärbehörden verwenden diese Informationsmenge, um Modelle zu erstellen und Testergebnisse zu speichern, und viele große wissenschaftliche Behörden benötigen diese Spezialmaschinen aus ähnlichen Gründen. Einige sehr große Websites benötigen große Datenmaschinen, aber Websites sind auf diesem Markt nicht so verbreitet wie Agenturen. Diese Organisationen müssen alle ihre Daten aufbewahren, da dies dazu beiträgt, zukünftige Daten besser zu analysieren und Vorhersagen zu treffen.