Skip to main content

Что такое нормализация базы данных?

Нормализация базы данных используется в системе управления базами данных (СУБД), особенно с реляционными базами данных, чтобы уменьшить избыточную информацию и, следовательно, минимизировать аномалии данных. Аномалии могут возникать из-за того, что информация плохо сгруппирована или избыточна и может вызывать ряд эффектов, таких как неправильная вставка данных или удаление всей группы данных. Используя нормализацию базы данных, можно избежать этих аномалий, и память обычно освобождается, чтобы база данных могла функционировать более эффективно. Функции нормализации следует использовать периодически, примерно раз в неделю, чтобы поддерживать базу данных свежей и свободной от неожиданных проблем.

Никто не создает реляционную базу данных, чтобы иметь избыточные данные специально, но это обычно происходит, несмотря на все усилия разработчика базы данных. Например, в базе данных сотрудников сотрудник может быть указан в нескольких таблицах. Когда избыточность происходит в больших масштабах, возникают аномалии. Администраторы базы данных обычно не могут перехватить все избыточные данные, поэтому нормализация базы данных - лучший способ исправить эту проблему.

Первой задачей нормализации базы данных является удаление или перемещение повторяющейся информации. Если информация не нужна, она будет удалена из базы данных. Для данных, которые необходимы в других таблицах, нормализация стремится создать лучшие реляционные таблицы. Функции нормализации разбивают большие таблицы, исправляют и улучшают отношения между данными и изолируют информацию, чтобы упростить изменение данных в базе данных. Вычитая повторяющиеся данные, память обычно освобождается, что позволяет базе данных работать более плавно и быстро.

Аномалии возникают из-за отказа или забвения нормализовать базу данных, и они могут сделать информацию бесполезной. Аномалия обновления - это когда кто-то обновляет данные, но вместо изменения целевых данных база данных создает новую запись с высокой избыточностью. При аномалии вставки запись добавляется в базу данных, но под новую запись ничего добавить нельзя. Аномалии удаления будут случайным образом удалять запись. Это всего лишь несколько распространенных аномалий, которые возникают, если база данных не нормализована.

Не существует твердого стандарта, сообщающего администратору, когда он или она должны использовать функции нормализации для обеспечения эффективности базы данных. Планирование нормализации базы данных примерно раз в неделю, как правило, является лучшим, потому что это предотвращает аномалии всей новой информации, добавленной в течение недели. Меньшие базы данных, вероятно, можно нормализовать один раз в месяц, а очень большие базы данных следует делать два раза в неделю, потому что большие объемы данных приводят к более высокой вероятности аномалий. Однако нет никакого стандарта, поэтому администратор базы данных обычно выбирает расписание, которое он или она считает наилучшим для базы данных.