Co je deduplikace?
Deduplikace je proces používaný k odstranění redundantních dat. Během procesu je pevný disk počítače naskenován pro velké sekvence dat napříč srovnávacími okny. Při skenování duplicitních dat jsou obvykle vybírány sekvence osmi kilobajtů nebo více. Pokud je sekvence nalezena jinde v systému úložiště, je na duplikovaném souboru odkazován spíše než znovu uložen. Duplikace dat zabírá zbytečnou místnost v systému a když jsou odstraněna cizí data, ponechává uživateli více úložného prostoru v počítači. To umožní systému běžet rychleji a efektivněji, protože není zazpan s dalšími daty. Kromě toho je zlepšení šířky pásma vždy patrnější, když má počítač více volného prostoru.Data, která jsou však indexována v případě, že by měla být potřeba. Stejná přesná data mohou být často uložena na až 100 různých místech na pevném disku. Pokud každý vezme jeden megabajt prostoru, deduplikace sníží tento prostor na pevném disku ze 100 megabajtů na jeden. Proces funguje archivací dat a další prostor, který se získá, je velmi prospěšný pro pevný disk počítače.
Mezi další výhody deduplikace patří snížení množství záložního prostoru potřebného až o 90 procent, snižování nákladů, jako je napájení, prostor a požadavky na chlazení, obnovení vyšší úrovně služby, eliminování mnoha různých druhů chyb a obnovení dat v několika různých bodech. Nevýhodou deduplikace je, že identifikuje duplicitní data pomocí kryptografických hashových funkcí, které mohou být nespolehlivé, a kolize nebo jiný typ chyby by resupři ztrátě dat. Také, pokud osoba, která tento postup povolila, si není vědoma redundance, může být spolehlivost počítače nepříznivě ovlivněna.
Deduplikace dat funguje prvním segmentováním každého zpracovaného kusu. Každý segment je identifikován a porovnán s daty, která jsou již v systému. Pokud jsou data jedinečná, jsou uložena na disku. Pokud se jedná o duplicitní kus dat, místo toho se vytvoří odkaz. Deduplikace může být implementována pomocí softwaru nazvaného Data Domain, který pracuje s datovými a úložnými systémy pro filtrování prostřednictvím dat, odkazování, eliminace nebo ukládání každého bajtu, podle potřeby.