Hva er deduplisering?

Deduplisering er en prosess som brukes til å eliminere overflødige data. Under prosessen skannes en datamaskinens harddisk for store sekvenser av data på tvers av sammenligningsvinduer. Mens du skanner etter duplikatdata, blir sekvenser på åtte kilobyter eller mer vanligvis plukket ut. Hvis sekvensen finnes andre steder på lagringssystemet, refereres den dupliserte filen i stedet for lagret igjen.

En vellykket deduplisering kan eliminere flere kilobyter med data på en datamaskin, noe som fører til åpenbare fordeler. Data duplisering tar unødvendig rom i systemet, og når ekstern data fjernes, etterlater dette brukeren mer lagringsplass på datamaskinen. Dette vil tillate systemet å løpe raskere og mer effektivt fordi det ikke er fastet med ekstra data. I tillegg er forbedring av båndbredde alltid mer merkbar når en datamaskin har mer ledig plass.

Deduplisering innebærer å referere til den store mengden data til det første stedet og slette de ekstra kopiene av THan data, som imidlertid indekseres i tilfelle de skal være nødvendig. Ofte kan de samme eksakte dataene lagres på så mange som 100 forskjellige steder på en harddisk. Hvis hver tar opp en megabyte plass, vil deduplisering redusere denne plassen på harddisken fra 100 megabyte til bare en. Prosessen fungerer ved å arkivere dataene, og den ekstra plassen som oppnås er veldig gunstig for datamaskinens harddisk.

Ytterligere fordeler med deduplisering inkluderer å redusere mengden av sikkerhetskopieringsplass som er nødvendig med så mye som 90 prosent, redusere kostnader som strøm, plass og kjølekrav, gjenopprette et høyere servicenivå, eliminere mange forskjellige typer feil og gjenvinne data på flere forskjellige punkter. En ulempe med deduplisering er at de identifiserer duplikatdataene ved bruk av kryptografiske hasjfunksjoner, som kan være upålitelige, og en kollisjon eller annen type feil vil resuLT i tap av data. Hvis personen som autoriserte prosedyren ikke er klar over reduksjonsreduksjonen som er involvert, kan datamaskinens pålitelighet påvirkes negativt.

Data -deduplisering fungerer ved å først segmentere hvert stykke data som blir behandlet. Hvert segment blir identifisert og sammenlignet med data som allerede er i systemet. Hvis dataene er unike, lagres de på en disk. Hvis det er et duplikat stykke data, opprettes en referanse i stedet. Deduplisering kan implementeres ved hjelp av programvare kalt Data Domain, som fungerer med data og lagringssystemer for å filtrere gjennom data, referere, eliminere eller lagre hver byte, etter behov.

ANDRE SPRÅK