Co to są Big Data?
Big Data to pomiary danych, które rosły tak duże, że normalne bazy danych nie są w stanie zawierać i pracować z ogromną ilością informacji. Dane są dostępne w trzech rozmiarach: małych, średnich i dużych; Żadne z tych pomiarów nie jest surowe; Zamiast tego każdy zależy bardziej od łatwości użytkowania i jakiego rodzaju maszyny może obsłużyć informacje. Do dużych zbiorów danych potrzebne są specjalne maszyny, znacznie większe i złożone niż te używane do zwykłych baz danych. Tego rodzaju dane występują zwykle w agencjach rządowych i naukowych, ale niektóre bardzo duże strony internetowe zawierają również taką dużą ilość informacji.
Dane są dostępne w trzech standardach, ale nie ścisłych rozmiarach. Małe dane mogą zmieścić się na jednym komputerze lub maszynie, na przykład laptopa. Średnie dane są w stanie dopasować się do tablicy dysków i najlepiej zarządzają bazą danych. Bazy danych, bez względu na to, jak duże, nie są w stanie pracować z dużymi zbiorami danych, a zamiast tego użyć specjalnych systemów. Chociaż nie ma ścisłych wytycznych dotyczących tego, czym są duże dane, zazwyczaj tozaczyna się od poziomu terabajtów (TB) i przechodzi do poziomu petabajtów (PB).
Próba pracy z Big Data nad bazą danych, która nie jest wyspecjalizowana dla tej ilości danych, spowoduje kilka istotnych problemów. Baza danych nie jest w stanie obsługiwać ilości informacji, więc niektóre dane muszą zostać usunięte. To tak, jakby próbować dopasować 100 gigabajtów (GB) na komputerze z zaledwie 50 GB miejsca na dysku twardym; Nie można tego zrobić. Pozostałe dane będą nieporęczne zarówno do kontroli, jak i zarządzania, ponieważ każda funkcja zajęłaby dużo czasu, a baza danych musi zostać zamknięta na nowe zgłoszenia.
Chociaż możliwe jest utrzymanie maszyn do zakupu i dodawanie nowych danych do baz danych, stwarza to nieporęczny problem. Wynika to z faktu, że oprogramowanie do bazy danych ma działać tylko ze średnimi danymi. Większe zestawy danych prowadzą do błędów i problemów administracyjnych, ponieważ oprogramowanie po prostu nie może się poruszać ani działać na dowcipH duże dane bez napotkania problemów.
Większość organizacji lub stron internetowych nie napotyka dużych zbiorów danych. Agencje obronne i wojskowe wykorzystują tę ilość informacji do tworzenia modeli i przechowywania wyników testów, a wiele dużych agencji naukowych potrzebuje tych specjalistycznych maszyn z podobnych powodów. Niektóre bardzo duże strony internetowe potrzebują dużych maszyn danych, ale strony internetowe nie są tak powszechne jak agencje na tym rynku. Organizacje te muszą zachować wszystkie swoje dane, ponieważ pomaga lepiej analizować przyszłe dane i dokonywać prognoz.