Wat is gegevensontdubbeling?
Gegevensontdubbeling is een techniek voor het comprimeren van gegevens waarbij dubbele gegevens worden verwijderd, waarbij één kopie van elke informatie-eenheid op een systeem wordt behouden in plaats van dat veelvouden gedijen. De bewaarde exemplaren hebben referenties waardoor het systeem ze kan ophalen. Deze techniek vermindert de behoefte aan opslagruimte en kan systemen sneller laten werken naast het beperken van de kosten in verband met gegevensopslag. Het kan op verschillende manieren werken en wordt op veel soorten computersystemen gebruikt.
Bij gegevensontdubbeling op bestandsniveau zoekt het systeem naar dubbele bestanden en verwijdert het de extra's. Op deduplicatie op blokniveau worden gegevensblokken in bestanden bekeken om externe gegevens te identificeren. Mensen kunnen om verschillende redenen met dubbele gegevens eindigen, en het gebruik van gegevensontdubbeling kan een systeem stroomlijnen, waardoor het gemakkelijker te gebruiken is. Het systeem kan periodiek door de gegevens bladeren om te controleren op duplicaten, extra's elimineren en referenties genereren voor de achtergebleven bestanden.
Dergelijke systemen worden soms aangeduid als intelligente compressiesystemen of opslagsystemen met één exemplaar. Beide termen verwijzen naar het idee dat het systeem intelligent werkt om gegevens op te slaan en op te slaan om de belasting van het systeem te verminderen. Gegevensontdubbeling kan vooral waardevol zijn bij grote systemen waar gegevens uit een aantal bronnen worden opgeslagen en de opslagkosten voortdurend stijgen, omdat het systeem in de loop van de tijd moet worden uitgebreid.
Deze systemen zijn ontworpen als onderdeel van een groter systeem voor het comprimeren en beheren van gegevens. Gegevensontdubbeling kan systemen niet beschermen tegen virussen en fouten, en het is belangrijk om adequate antivirusbescherming te gebruiken om een systeem veilig te houden en virale besmetting van bestanden te beperken, terwijl ook back-ups worden gemaakt op een aparte locatie om zorgen over gegevensverlies als gevolg van storingen, schade aan te pakken apparatuur, enzovoort. Als u de gegevens comprimeert voordat u een back-up maakt, bespaart u tijd en geld.
Systemen die gegevensontdubbeling gebruiken in hun opslag, kunnen sneller en efficiënter werken. Ze zullen nog steeds periodiek moeten worden uitgebreid om nieuwe gegevens te kunnen verwerken en om bezorgdheid over de beveiliging weg te nemen, maar ze zouden minder snel geneigd moeten zijn om snel dubbele gegevens op te vullen. Dit is een veel voorkomende zorg op e-mailservers, waar de server grote hoeveelheden gegevens voor gebruikers kan opslaan en aanzienlijke delen ervan kunnen bestaan uit duplicaten zoals dezelfde bijlagen die steeds opnieuw worden herhaald; Veel mensen die e-mailen vanaf hun werk hebben bijvoorbeeld voetteksten met e-mail disclaimers en bedrijfslogo's bijgevoegd, en deze kunnen snel serverruimte verspillen.