Skip to main content

Что такое теория оптимального управления?

Теория оптимального управления широко используется в науке и технике. Это метод математической оптимизации, обычно используемый при создании политик контроля. Лев Понтрягин вместе со своей командой в бывшем Советском Союзе и американец Ричард Беллман в основном отвечают за теорию оптимального управления. Общая цель теории состоит в том, чтобы использовать различные методы анализа для определения параметров системы путем проведения проб и ошибок.

Теория оптимального управления оказывается полезной при решении задач непрерывной оптимизации времени. Теория решает проблему путем определения закона управления для гипотетической системы с целью достижения уровня оптимальности. Оптимальное управление состоит из ряда различных уравнений, которые описывают пути переменных, сводящих функционал стоимости к минимуму. Функциональный элемент затрат в основном является функцией переменных, связанных с состоянием и контролем. Теория оптимального управления использует принцип максимума Понтрягина, который обычно утверждает, что можно решить задачу оптимизации P с использованием гамильтоновой функции H в течение одного периода, что является необходимым условием. Теория также может быть выведена с помощью уравнения Гамильтона-Якоби-Беллмана.

Чтобы помочь человеку понять теорию оптимального управления, обычно используется пример «вождения автомобиля по холмистой дороге». Представьте себе, что вы едете в автомобиле по скалистой дороге по прямой. Теория может определить, как нужно ускоряться, чтобы минимизировать абсолютное время в пути. В таком случае «система» состоит из транспортного средства и каменистой дороги, а критерием оптимальности является достижение минимума времени в пути. Известно, что такие проблемы включают ограничения (например, ограничение топлива, ограничения скорости). Другой вопрос может заключаться в том, чтобы найти способ оптимизировать потребление топлива автомобилем при необходимости пройти определенный курс за определенный промежуток времени.

Еще один пример использования теории оптимального управления - это решение о создании цены или тени. Он состоит из предельного значения расширения переменной состояния. Решив это, оптимальное значение для управления может сформировать дифференциальное уравнение, зависящее от осведомленности о состоянии. Для этой стратегии характерно решение для регионов, которые описывают оптимальное управление и скрывают фактические значения выбора во времени.