Hvad er den optimale kontrolteori?
Optimal kontrolteori bruges i vid udstrækning både inden for videnskab og teknik. Det er en matematisk optimeringsteknik, der ofte bruges til at oprette kontrolpolitikker. Lev Pontryagin sammen med sit team i det ex-Sovjetunionen og amerikaneren Richard Bellman er for det meste ansvarlige for optimal kontrolteori. Teoriens generelle mål er at bruge forskellige analysemetoder til at bestemme parametrene for et system ved at udføre prøve-og-fejl-processer.
Den optimale kontrolteori er praktisk, når man prøver at løse kontinuerlige tidsoptimeringsproblemer. Teorien løser et problem ved at bestemme en kontrollov for et hypotetisk system for at opnå et niveau af optimalitet. Den optimale kontrol består af et sæt forskellige ligninger, der beskriver stierne for de variabler, der bringer omkostnings funktionelle til et minimum. Omkostningsfunktionen er dybest set en funktion af variabler relateret til tilstand og kontrol. Den optimale kontrolteori anvender Pontryagin-maksimumsprincippet, der generelt siger, at man kan løse optimeringsproblemet P med brugen af en Hamiltonian-funktion H over en periode, hvilket er en nødvendig betingelse. Teorien kan også udledes med Hamilton-Jacobi-Bellman-ligningen.
For at hjælpe en person med at forstå den optimale kontrolteori anvendes eksemplet ”kørsel af din bil gennem en kuperet vej” ofte. Forestil dig at rejse i en bil på en ujævn vej i en lige linje. Teorien kan bestemme, hvordan man skal accelerere for at minimere den absolutte rejsetid. I et sådant tilfælde består "systemet" af køretøjet og den klippede vej, og optimitetskriterierne er, når man når minimeringen af rejsetiden. Sådanne problemer vides at indeholde begrænsninger (f.eks. Brændstofbegrænsning, hastighedsgrænser). Et andet spørgsmål kan være at finde en måde for bilen at optimere sit forbrug af brændstof på, mens den er forpligtet til at gennemføre en bestemt kursus inden for en given tidsfrist.
Et andet eksempel på brugen af den optimale kontrolteori er løsning af pris eller skygge. Det består af den marginale værdi af at udvide tilstandsvariablen. Efter at have løst det, kan den optimale værdi for styringen danne en differentialligning betinget af kendskabet til prisen. Det er almindeligt, at denne strategi løses for regioner, der beskriver den optimale kontrol og isolerer de aktuelle valgværdier i tide.