빅 데이터 란?
빅 데이터는 일반 데이터베이스가 방대한 양의 정보를 포함하고 작업 할 수 없을 정도로 커진 데이터를 측정 한 것입니다. 데이터는 세 가지 크기로 나옵니다 : 중소형 및 대형; 이러한 측정 중 어느 것도 엄격한 것은 아닙니다. 대신, 각각은 사용의 용이성과 정보를 처리 할 수있는 기계 유형에 더 의존합니다. 빅 데이터에는 일반 데이터베이스보다 훨씬 크고 복잡한 특수 머신이 필요합니다. 이러한 유형의 데이터는 일반적으로 정부 및 과학 기관에서 볼 수 있지만 일부 초대형 웹 사이트에도 이러한 대량의 정보가 포함되어 있습니다.
데이터는 세 가지 표준이지만 엄격하지는 않습니다. 작은 데이터는 랩톱과 같은 단일 컴퓨터 나 컴퓨터에 적합합니다. 중간 규모 데이터는 디스크 배열에 적합하며 데이터베이스에서 가장 잘 관리됩니다. 데이터베이스는 아무리 크더라도 빅 데이터로 작업 할 수 없으며 대신 특수 시스템이 많이 사용됩니다. 빅 데이터가 무엇인지에 대한 엄격한 지침은 없지만 일반적으로 테라 바이트 (TB) 수준에서 시작하여 페타 바이트 (PB) 수준으로 올라갑니다.
이 양의 데이터에 특화되지 않은 데이터베이스에서 빅 데이터를 사용하려고 시도하면 몇 가지 실질적인 문제가 발생합니다. 데이터베이스가 정보량을 처리 할 수 없으므로 일부 데이터를 삭제해야합니다. 이는 50GB의 하드 드라이브 공간 만있는 컴퓨터에서 100GB를 맞추는 것과 같습니다. 할 수 없습니다. 모든 기능을 완료하는 데 시간이 오래 걸리고 데이터베이스를 새 제출로 닫아야하기 때문에 남아있는 데이터는 제어 및 관리에 모두 적합하지 않습니다.
머신을 계속 구매하고 데이터베이스에 새 데이터를 추가하는 것이 가능하지만 다루기 힘든 문제가 발생합니다. 데이터베이스 소프트웨어는 중간 데이터에서만 작동하도록하기 때문입니다. 소프트웨어가 문제없이 큰 데이터로 이동하거나 작업 할 수 없기 때문에 더 큰 데이터 세트로 인해 오류 및 관리 문제가 발생합니다.
대부분의 조직이나 웹 사이트에는 빅 데이터가 없습니다. 방위 및 군사 기관은이 양의 정보를 사용하여 모델을 작성하고 테스트 결과를 저장하며, 많은 대형 과학 기관은 이와 유사한 이유로 이러한 특수 기계가 필요합니다. 일부 초대형 웹 사이트에는 대용량 데이터 머신이 필요하지만 웹 사이트는이 시장의 대행사만큼 일반적이지 않습니다. 이러한 조직은 향후 데이터를보다 효과적으로 분석하고 예측하는 데 도움이되므로 모든 데이터를 보관해야합니다.