Quelle est la théorie du contrôle optimal?
La théorie du contrôle optimal est largement utilisée en science et en ingénierie. C'est une technique d'optimisation mathématique couramment utilisée dans la création de politiques de contrôle. Lev Pontryagin, avec son équipe de l'ex-Union soviétique, et l'Américain Richard Bellman sont principalement responsables de la théorie du contrôle optimal. L'objectif général de la théorie est d'utiliser diverses méthodes d'analyse pour déterminer les paramètres d'un système en effectuant des processus d'essais et d'erreurs.
La théorie du contrôle optimal est pratique pour tenter de résoudre des problèmes d'optimisation de temps continu. La théorie s'attaque à un problème en déterminant une loi de contrôle pour un système hypothétique afin d'atteindre un niveau d'optimalité. Le contrôle optimal consiste en un ensemble de diverses équations décrivant les chemins des variables qui rendent le coût fonctionnel au minimum. Le coût fonctionnel est fondamentalement fonction des variables liées à l'état et au contrôle. La théorie du contrôle optimal utilise le principe de Pontryagin maximum, qui stipule généralement que le problème d'optimisation P peut être résolu avec l'utilisation d'une fonction hamiltonienne H sur une période, condition nécessaire. La théorie peut également être dérivée avec l'équation de Hamilton-Jacobi-Bellman.
Afin d'aider une personne à comprendre la théorie du contrôle optimal, on utilise couramment l'exemple «conduire sa voiture sur une route vallonnée». Imaginez voyager en voiture sur une route escarpée en ligne droite. La théorie peut déterminer comment accélérer de manière à minimiser le temps de parcours absolu. Dans un tel cas, le «système» comprend le véhicule et la route rocheuse et le critère d’optimalité est l’atteinte de la minimisation du temps de parcours. On sait que ces problèmes incluent des contraintes (limitation du carburant, limites de vitesse, par exemple). Une autre question peut être de trouver un moyen pour la voiture d'optimiser sa consommation de carburant tout en étant obligée de suivre un certain parcours dans un délai donné.
Un autre exemple d'utilisation de la théorie du contrôle optimal est la résolution du costate ou du prix fictif. Il s'agit de la valeur marginale de l'expansion de la variable d'état. Après avoir résolu ce problème, la valeur optimale du contrôle peut former une équation différentielle conditionnelle à la prise de conscience du costate. Il est courant que cette stratégie résolve les problèmes de régions décrivant le contrôle optimal et isolant les valeurs de choix réelles dans le temps.