Skip to main content

Что такое отказоустойчивость?

Компьютерные приложения работают на компьютерном оборудовании, изготовленном из очень сложных электрических механизмов. Эти серверы, как и любое механическое оборудование, имеют ограниченный срок службы до отказа. Отказ компьютера - это стратегия, при которой компьютерное приложение распределяется на несколько наборов оборудования, чтобы уменьшить вероятность простоя. Это ограничивает ненужные потери из-за аппаратного сбоя, потому что система продолжит работать после сбоя одного сервера.

Многие крупные организации используют кластеры компьютеров для управления своей технологической системой. Этот подход обычно включает в себя резервные системы и план отработки отказа. Отказоустойчивость является более дорогим вариантом, чем проектирование с одним сервером, поскольку для этого требуются дублирующие лицензии на оборудование и программное обеспечение.

Аварийное восстановление - это технический термин, используемый для планирования аварийного переключения и методов проектирования. Это не ограничивается компьютерным оборудованием. Расширенные услуги также доступны для сетей и электроэнергии для зданий. Большинство коммерческих центров обработки данных предлагают возможности отработки отказа размещенным приложениям внутри здания. Отказоустойчивые сервисы считаются дополнительной функцией для центра обработки данных и обычно продаются в качестве платного сервиса.

Важно определить требования к отказоустойчивости компьютерного приложения перед его развертыванием. Этот тип планирования, как правило, будет слишком сложным и трудным для реализации после развертывания.

Резервное питание - важная особенность при отказоустойчивости. Это, как правило, включает в себя услуги по управлению зданием, которые позволяют коммерческие источники энергии в здание. Такой подход снижает вероятность полного сбоя питания, поскольку в здании имеется два электропитания.

Газовые генераторы являются еще одним вариантом, часто используемым при аварийном восстановлении. Эти генераторы должны быть расположены рядом с компьютерным оборудованием компании, чтобы обеспечить достаточную мощность. Генераторы обеспечивают кратковременное резервное питание, в то время как основное питание восстанавливается и обычно работает на дизельном топливе.

Аварийное переключение программного обеспечения - это еще один вариант проектирования системы, который используется при аварийном восстановлении. Этот подход требует загрузки программного приложения на два компьютера с использованием специального оборудования для балансировки нагрузки. Программный подход имеет ограничения, поскольку он не учитывает проблемы с питанием и сетью.