Co je deduplikace?
Deduplikace je proces používaný k odstranění nadbytečných dat. Během procesu je na pevném disku počítače zkontrolován velký sled dat v porovnávacích oknech. Při skenování duplicitních dat jsou obvykle vybírány sekvence 8 kilobajtů nebo více. Pokud je sekvence nalezena jinde v úložném systému, na duplikovaný soubor se odkazuje spíše než na znovu uložený.
Úspěšná deduplikace může eliminovat několik kilobajtů dat v počítači, což vede ke zřejmým výhodám. Duplikování dat zabírá zbytečné místo v systému, a když se odstraní nadbytečná data, ponechá to uživateli více místa v počítači. To umožní, aby systém běžel rychleji a efektivněji, protože není zablokován s dalšími daty. Kromě toho je zlepšení šířky pásma vždy patrnější, když má počítač více volného místa.
Deduplikace zahrnuje odkazování velkého množství dat na první místo a vymazání dalších kopií dat, které jsou však v případě potřeby indexovány. Stejná přesná data mohou být často uložena až na 100 různých místech na pevném disku. Pokud každý zabírá jeden megabajt místa, deduplikace zmenší tento prostor na pevném disku ze 100 megabajtů na jeden. Proces funguje tak, že se data archivují a další prostor, který se získá, je pro pevný disk počítače velmi prospěšný.
Mezi další výhody deduplikace patří snížení množství potřebného záložního prostoru až o 90 procent, snížení nákladů, jako jsou požadavky na energii, prostor a chlazení, obnovení vyšší úrovně služeb, eliminace mnoha různých druhů chyb a obnovení dat při několika různé body. Nevýhodou deduplikace je to, že identifikuje duplicitní data pomocí kryptografických hašovacích funkcí, které mohou být nespolehlivé, a kolize nebo jiný typ chyby by vedl ke ztrátě dat. Rovněž pokud osoba, která autorizovala postup, není vědoma snížení redundance, může být nepříznivě ovlivněna spolehlivost počítače.
Deduplikace dat funguje tak, že nejprve segmentuje každý zpracovávaný údaj. Každý segment je identifikován a porovnán s daty, která již jsou v systému. Pokud jsou data jedinečná, uloží se na disk. Pokud se jedná o duplikát dat, vytvoří se odkaz. Deduplikace může být implementována pomocí softwaru s názvem Datová doména, který pracuje s datovými a úložnými systémy pro filtrování dat, odkazování, vylučování nebo ukládání každého bajtu, podle potřeby.