Co to jest optymalizacja wydajności?
Optymalizacja pojemności składa się z różnych, ale często uzupełniających się metod zarówno przechowywania danych, jak i zmniejszania zapotrzebowania na miejsce podczas tworzenia kopii zapasowych. Często firmy i pojedyncze przedsiębiorstwa wykonują wiele kopii zapasowych, a potrzeba przechowywania, indeksowania i odzyskiwania danych wymaga optymalizacji w celu zmniejszenia ilości sprzętu i wynikającego z tego obciążenia niezbędnego do obsługi wszystkich tych danych. Podczas tworzenia kopii zapasowych często występują nadmiarowości i tylko niewielkie zmiany między kopiami zapasowymi. W świetle nadmiarowości strategie optymalizacji pojemności opracowują rozwiązania, które zmniejszają koszty przechowywania i rozmiar kopii zapasowych zmniejszone z oryginałów nawet o 95 procent. Optymalizacja przepustowości jest czasami nazywana optymalizacją przepustowości, gdy jest używana w aplikacji sieci rozległej (WAN), aby umożliwić większą przepustowość podczas przesyłania i odbierania danych w sieci.
Kompresja danych zasadniczo wykorzystuje techniki kodowania w celu zmniejszenia rozmiaru danych przechowywanych lub przesyłanych. W zależności od tego, czy niektóre dane są odrzucane w procesie, można je scharakteryzować jako stratne - utraty danych - lub bezstratne. Skanowanie danych w poszukiwaniu redundancji lub powtórzeń i zastąpienie ich tokenami z odsyłaczami i indeksami pozwala na znaczne zmniejszenie potrzebnej przestrzeni dyskowej. Książki kodów tłumienia danych prowadzą akceleratory w komunikacji do synchronizacji i wykorzystania pamięci lub dysku twardego do zapisywania historii kompresji w repozytorium pamięci, umożliwiając wykorzystanie proxy protokołu TCP (TCP) jako bufora pakietów lub sesji, tak aby prędkości transmisji nie były zredukowany. Inna metoda kompresji danych zmniejsza rozmiar danych w czasie rzeczywistym podczas pierwszej kopii zapasowej, a tym samym poprzez dalszą optymalizację, co prowadzi do większych oszczędności zarówno miejsca, jak i czasu.
Zastosowanie tradycyjnych metod kompresji może zmniejszyć rozmiar przechowywanych danych w stosunku 2: 1; zastosowanie optymalizacji pojemności może zwiększyć tę redukcję nawet do 20: 1. Poszukiwanie nadmiarowości w sekwencjach bajtowych w oknach porównania i stosowanie kryptograficznych funkcji skrótu dla unikatowych sekwencji w algorytmach do deduplikacji pozwala na segmentację strumieni danych. Do tych segmentów strumienia są następnie przypisywane unikalne identyfikatory i indeksowane do pobrania. W ten sposób tylko nowe zestawy danych są przechowywane przed dalszą kompresją przy użyciu algorytmów standardów kompresji. Niektóre metody deduplikacji są oparte na sprzęcie, a połączenie ich z tradycyjnymi algorytmami kompresji oprogramowania pozwala obu funkcjom na znaczne oszczędności miejsca i czasu.
Wiele podejść koncentruje się na redukcji kosztów i pojemności pamięci masowej w celu zmniejszenia kosztów związanych z infrastrukturą pamięci masowej, a podobne rozważania pojawiają się w scenariuszach sieci WAN. Warstwa zwana warstwą transportową musi istnieć między aplikacjami i podstawowymi strukturami sieciowymi podczas transmisji, umożliwiając wydajne i szybkie wysyłanie i odbieranie danych, jednak warstwa transportowa jest nadal tą utworzoną w 1981 r., Kiedy TCP został utworzony po raz pierwszy i działał z prędkością 300 bodów oceniać. Dlatego akceleratory używają serwerów proxy TCP, zmniejszając straty podczas transmisji i potwierdzając, aby zwiększyć rozmiar pakietów przy użyciu zaawansowanych metod kompresji danych, aby dostarczyć więcej danych na segment czasu. Aby pokonać przeszkody podczas transmisji, techniki te współpracują ze sobą w celu poprawy wydajności aplikacji i zmniejszenia zużycia przepustowości.