Qu'est-ce que la capture de données de changement?
La capture de données modifiées est le processus de localisation, d’enregistrement et de sauvegarde des enregistrements de version dans les systèmes de données. Dans la plupart des cas, les systèmes de capture de données modifiés fonctionnent en attribuant aux données certains marqueurs faisant référence à des entrées de données spécifiques. Lorsque les données sont modifiées, ces marqueurs changent également. Cela alerte le système de capture de données modifiées et enregistre l'ancienne version de données, donnant ainsi aux utilisateurs et aux systèmes un accès aux données anciennes et nouvelles. Ces processus sont courants dans les grands systèmes de stockage de données tels que les entrepôts de données et les systèmes de données basés sur le Web.
Le contrôle des données est considéré comme un aspect très important du stockage de données. Lorsqu'un élément de données est écrasé par un autre, l'élément de données d'origine ne peut pas simplement disparaître. Cela causerait des dégâts si cette information était importante pour un processus en cours ou un enregistrement d'entreprise.
La création de versions de différents éléments de données constitue le centre de la capture de données modifiées. Si une seule information change cinq fois, le système doit mémoriser chacune des cinq valeurs et leur modification. Ceci est à la fois important pour la conservation des enregistrements à long terme et la vérification des erreurs. Par exemple, si un travailleur imputait un chiffre d'affaires dans la mauvaise partie d'une base de données, cela pourrait perturber une énorme quantité d'informations. La gestion des versions permet à l'entreprise d'inverser ce nombre si nécessaire.
Il n'y a pas une seule méthode de capture de données modifiées. Différents systèmes de données utilisent leurs propres versions, souvent développées en interne, pour accompagner leur propre style de stockage de données. Malgré cela, il existe une poignée de méthodes couramment utilisées. Il n’est pas inhabituel qu’un même système utilise plusieurs méthodes différentes de saisie de données modifiées sur le même système. Souvent, chaque méthode est spécialisée dans un certain type de capture ou fonctionne comme un système redondant à sécurité intégrée.
Les méthodes les plus courantes pour créer différentes versions de données sont les marqueurs spéciaux dans les données. Ces marqueurs se trouvent dans une ligne ou une colonne spéciale dans les données, permettant de savoir quand les changements se produisent. Les scripts de capture de données de modification surveillent ces zones et surveillent les modifications apportées. Ces cellules spéciales peuvent contenir des numéros de version, des horodatages ou des chaînes de données propriétaires.
Les deux endroits les plus courants pour trouver des systèmes de capture de données de changement à grande échelle sont les entrepôts de données et les bases de données à accès ouvert. L'un des principaux arguments de vente pour l'entreposage de données est la sauvegarde constante et complète des données. Tant qu'un utilisateur s'abonne à ses services, ces systèmes ne se débarrassent jamais de rien. Les bases de données à accès libre, telles que Wikipedia, utilisent le contrôle de version pour empêcher toute tentative de modification et consigner les modifications apportées par les utilisateurs. Bien que les versions de Wikipedia ne soient pas aussi complètes que celles utilisées dans les entrepôts de données, elles sont souvent examinées par un plus grand nombre d'utilisateurs.