Co je to redundance dat?

Redundance dat je situace, která se vyskytuje v rámci databázových systémů a zahrnuje neúmyslné vytváření duplikovaných dat, která nejsou pro funkci databáze nezbytné. Zatímco redundance je v některých situacích často žádoucí vlastností, není to pravda, pokud jde o funkci databáze. Přítomnost duplikovaných dat může mít často nepříznivý účinek na funkci systému, což má za následek vrácení informací v reakci na systémové dotazy, které jsou méně než užitečné. Jednou z klíčových funkcí správy dat je identifikace duplikovaných dat a odstranění těchto duplikací.

Potenciál pro redundanci dat se nachází v téměř jakémkoli typu databázového programu. Programy, které jsou považovány za ploché, jako jsou tabulky a spoléhají na manuální zadávání dat, jsou zvláště náchylné k duplicitě informací, které mohou vést k komplikacím, pokud jde o získání požadovaných informací. Databáze relačního stylu, jako je prodejKontaktní databáze často zahrnují procesy, které pomáhají minimalizovat šance na neúmyslnou duplicitu, jako je vytvoření dvou různých kontaktních souborů na stejném kontaktu spojeném se stejnou společností. I při použití systémových kontrol, které pomáhají snížit výskyt redundance dat, stále existuje potenciál pro problémy, které mají dojít, což je nutné se pravidelně zapojit do úkolu čištění dat v databázi.

Přinejlepším, redundance dat znamená, že databáze je posetá informacemi, které nejsou nezbytné, ale nepředstavuje žádnou skutečnou hrozbu pro schopnost najít data, kdy a podle potřeby. V nejhorším případě přítomnost duplikovaných dat zpomaluje základní funkce databáze a může komplikovat proces používání databáze ke správě určitých úkolů. Například pomocí databáze zákazníků, která je ucpaná redundantními informacemi pro generování poštovních štítkůVýsledkem ULD je vytvoření řady duplikovaných úrovní, což je nutné buď třídit a zlikvidovat duplikáty před použitím štítků, nebo si udělejte čas na vyčištění databáze před pokusem o generování štítků.

Naštěstí je monitorování a oprava redundance dat něco, čeho může mnoho systémů pro správu dat relativně snadno dosáhnout. Některé systémy budou označovat vstup duplikovaných dat, což usnadní kontrolu vnímané duplikace a rozhodnout se, zda ji odstranit nebo nechat je stát. Existují dokonce i softwarové programy, které lze použít ke skenování existující databáze pro duplikace a automaticky tyto redundantní položky odstranit s relativně snadno.

Co je to redundance dat?

JINÉ JAZYKY

SOUVISEJÍCÍ ČLÁNKY

Jak můžeme pomoci?