Co je redundance dat?

Redundance dat je situace, ke které dochází v databázových systémech, a zahrnuje neúmyslné vytvoření duplikovaných dat, které není nutné pro fungování databáze. I když je redundance v některých situacích často žádoucí vlastností, není to pravda, pokud jde o funkci databáze. Přítomnost duplikovaných dat může mít často nepříznivý vliv na funkci systému, což má za následek vrácení informací v reakci na systémové dotazy, které jsou méně užitečné. Jednou z klíčových funkcí správy dat je identifikace duplikovaných dat a odstranění těchto duplikací.

Potenciál pro redundanci dat je téměř u každého typu databázového programu. Programy, které jsou považovány za ploché, jako jsou tabulky, a které se spoléhají na ruční zadávání údajů, jsou zvláště citlivé na zdvojení informací, které mohou vést ke komplikacím při získávání požadovaných informací. Databáze relačních stylů, jako jsou databáze prodejních kontaktů, často zahrnují procesy, které pomáhají minimalizovat šance na neúmyslnou duplicitu, jako je vytvoření dvou různých kontaktních souborů na stejném kontaktu asociovaných se stejnou společností. I s použitím systémových kontrol, které pomáhají snižovat výskyt redundance dat, stále existuje problém, který může nastat, takže je nutné pravidelně se zabývat úkolem čištění dat v databázi.

Redundance dat v nejlepším případě znamená, že databáze je poseta informacemi, které nejsou podstatné, ale nepředstavují skutečné nebezpečí pro schopnost najít data v případě potřeby. V nejhorším případě přítomnost duplikovaných dat zpomaluje základní funkce databáze a může komplikovat proces používání databáze ke správě určitých úkolů. Například použití zákaznické databáze, která je zanesena nadbytečnými informacemi, ke generování poštovních štítků, by mělo za následek vytvoření řady duplikovaných úrovní, což by před použitím štítků bylo nutné buď třídit a zlikvidovat duplikáty, nebo převzít čas na vyčištění databáze před pokusem o vygenerování štítků.

Naštěstí monitorování a oprava redundance dat je něco, čeho mnoho systémů správy dat může dosáhnout relativně snadno. Některé systémy označí vstup duplikovaných dat, což usnadní kontrolu vnímané duplikace a rozhodne se, zda ji smažete nebo necháte stát. Existují dokonce i softwarové programy, které lze použít ke skenování existující databáze na zdvojení a tyto nadbytečné položky automaticky odstranit relativně snadno.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?