Qu'est-ce que la déduplication des données?
La déduplication des données est une technique de compression des données où les données en double sont supprimées, en maintenant une copie de chaque unité d'information sur un système plutôt que de permettre aux multiples de prospérer. Les copies conservées ont des références permettant au système de les récupérer. Cette technique réduit le besoin d'espace de stockage et peut maintenir plus rapidement les systèmes en plus de limiter les dépenses associées au stockage des données. Il peut fonctionner de plusieurs façons et est utilisé sur de nombreux types de systèmes informatiques.
Dans la déduplication des données au niveau du fichier, le système recherche tous les fichiers dupliqués et supprime les extras. La déduplication au niveau du bloc examine les blocs de données dans les fichiers pour identifier les données étrangères. Les gens peuvent se retrouver avec des données doublées pour une grande variété de raisons, et l'utilisation de la déduplication des données peut rationaliser un système, ce qui facilite l'utilisation. Le système peut périodiquement passer à travers les données pour vérifier les doublons, éliminer les extras et générer des références pour les fichiers laissés.
tels systèmeLes MS sont parfois appelées systèmes de compression intelligents ou systèmes de stockage à instance unique. Les deux termes font référence à l'idée que le système fonctionne intelligemment pour stocker et déposer des données afin de réduire la charge sur le système. La déduplication des données peut être particulièrement précieuse avec les grands systèmes où les données d'un certain nombre de sources sont stockées et les coûts de stockage sont constamment en hausse, car le système doit être élargi au fil du temps.
Ces systèmes sont conçus pour faire partie d'un système plus grand de compression et de gestion des données. La déduplication des données ne peut pas protéger les systèmes contre les virus et les défauts, et il est important d'utiliser une protection antivirus adéquate pour assurer la sécurité d'un système et limiter la contamination virale des fichiers tout en s'appuyant à un emplacement séparé pour répondre aux préoccupations concernant la perte de données en raison des pannes, des dommages à l'équipement, etc. La compression des données avant de sauvegarder va gagner du tempset de l'argent.
Les systèmesutilisant la déduplication des données dans leur stockage peuvent fonctionner plus rapidement et plus efficacement. Ils auront toujours besoin d'une expansion périodique pour s'adapter à de nouvelles données et pour répondre aux préoccupations concernant la sécurité, mais ils devraient être moins enclins à remplir rapidement des données dupliquées. Il s'agit d'une préoccupation particulièrement courante sur les serveurs de messagerie, où le serveur peut stocker de grandes quantités de données pour les utilisateurs et des morceaux importants pourraient être constitués de doublons comme les mêmes pièces jointes répétées encore et encore; Par exemple, de nombreuses personnes par e-mail par e-mail au travail ont joint des pieds avec des avertissements par e-mail et des logos d'entreprise, et ceux-ci peuvent manger rapidement un espace de serveur.