Skip to main content

Что такое плоский файл?

Плоский файл представляет собой набор информации, хранимой и доступной последовательно в базе данных, часто создаваемой для хранения информации неструктурированным способом. Например, в таблицах значений, разделенных запятыми (CSV), представлена ​​информация, в которой каждое поле отделено от следующего запятой. Хотя плоская файловая система предлагает некоторые преимущества, она часто делает большие объемы данных довольно громоздкими для хранения и доступа. Большинство используемых сегодня баз данных - это реляционные системы, которые используют структурированные запросы для извлечения информации и представления ее пользователю.

Как это работает

Чтобы сделать модель данных плоского файла функциональной, вся соответствующая информация о записи должна храниться в одном файле. Например, в листе CSV никакие специфичные для приложения форматы не применяются к данным, содержащимся в файле; только запятая обозначает конец одного поля в записи. Каждая запись записывается в строку в файле, что позволяет хранить все данные для одной записи отдельно от других записей.

Такие базы данных могут быстро стать очень большими и трудными для управления из-за простого способа их организации. Многие современные модели данных используют связанные таблицы для организации групп связанных данных. Это упрощает поиск и гибкость такой информации.

Использование плоской системы

Если клиент звонит компании, чтобы разместить заказ, то кто-то вводит его или ее информацию в таблицу или базу данных. Тот же самый человек или кто-то еще вводит информацию для этого конкретного заказа. Плоская файловая система может хранить всю эту информацию для клиента в одном файле.

Однако в этом нет необходимости, поэтому можно поддерживать несколько файлов: один для клиента и один для каждого отдельного заказа. Информация о заказе, хранящаяся в одном плоском файле, не связана с информацией о клиенте, хранящейся в другом. Эти файлы не имеют никакого отношения, поэтому кто-то, использующий базу данных плоских файлов для поиска информации о клиентах, может легко пропустить дополнительные файлы о заказах.

Слабые стороны этой системы

Поскольку каждая запись должна быть завершена сама по себе, плоская файловая система обычно приводит к очень большим файлам или отсутствию связи между информацией внутри нее. Общая база данных, используемая сегодня, является реляционной базой данных. Эта модель позволяет связать информацию в одной таблице с другими таблицами, используя ключевые поля, которые существуют в каждой из них. Несколько таблиц соединяются через эти поля, что позволяет каждой из них иметь только часть всей необходимой информации.

Реляционные базы данных

Тот же пример клиента, приведенный выше, может выглядеть совсем иначе в реляционной модели. Когда клиент звонит, чтобы разместить заказ, кто-то вводит его или ее информацию в таблицу «клиент» в базе данных. Затем другой человек может ввести информацию для своего заказа в отдельной таблице. Каждая из этих таблиц содержит поля, которые связывают их друг с другом. Это означает, что кто-то может использовать систему для более удобного поиска всей информации для клиента, включая общую историю заказов.

Продолжение использования

Базы данных с плоскими файлами действительно используются, хотя функциональность этой модели данных не так эффективна, как более быстрый реляционный подход. Простые системы могут легко содержать основную информацию для быстрой базы данных. Отсутствие связанных полей также устраняет ошибки, которые могут возникнуть из-за отсутствующих таблиц, поэтому многие загружаемые базы данных используют этот формат, чтобы избежать таких проблем.