Hva er den optimale kontrollteorien?
Optimal kontrollteori brukes i stor grad både i vitenskap og i ingeniørfag. Det er en matematisk optimaliseringsteknikk som ofte brukes i å lage kontrollpolicyer. Lev Pontryagin, sammen med teamet sitt i det eks-Sovjetunionen, og amerikaneren Richard Bellman er stort sett ansvarlig for optimal kontrollteori. Det generelle målet med teorien er å bruke forskjellige analysemetoder for å bestemme parametrene til et system ved å utføre prøve-og-feil prosesser.
Den optimale kontrollteorien kommer godt med når du prøver å løse kontinuerlige tidsoptimaliseringsproblemer. Teorien takler et problem ved å bestemme en kontrolllov for et hypotetisk system for å oppnå et nivå av optimalitet. Den optimale kontrollen består av et sett med forskjellige ligninger, som beskriver stiene til variablene som gir kostnadene funksjonelle til et minimum. Kostnadsfunksjonell er i utgangspunktet en funksjon av variabler relatert til tilstand og kontroll. Den optimale kontrollteorien benytter seg av Pontryagin maksimumsprinsippet, som generelt sier at man kan løse optimaliseringsproblemet P med bruk av en Hamiltonian-funksjon H over en periode, som er en nødvendig betingelse. Teorien kan også avledes med Hamilton-Jacobi-Bellman-ligningen.
For å hjelpe en person til å forstå den optimale kontrollteorien, brukes ofte "å kjøre bilen gjennom en kupert vei". Se for deg å reise i en bil på en skjørt vei i en rett linje. Teorien kan bestemme hvordan man skal akselerere for å minimere den absolutte reisetiden. I et slikt tilfelle består "systemet" av kjøretøyet og den steinete veien, og optimalitetskriteriene er at man når minimeringen av reisetiden. Slike problemer er kjent for å inkludere begrensninger (f.eks. Drivstoffbegrensning, fartsgrenser). Et annet spørsmål kan være å finne en måte for bilen å optimalisere forbruket av drivstoff på mens den er forpliktet til å fullføre et bestemt kurs i en gitt tidsbegrensning.
Et annet eksempel på bruken av den optimale kontrollteorien er å løse pris eller skyggepris. Det består av den marginale verdien av å utvide tilstandsvariabelen. Etter å ha løst det, kan den optimale verdien for kontrollen danne en differensiallikning betinget av bevisstheten om kostprisen. Det er vanlig at denne strategien løses for regioner som beskriver optimal kontroll og isolerer de faktiske valgverdiene i tide.