Vad är den optimala kontrollteorin?
Optimal kontrollteori används till stor del både inom vetenskap och teknik. Det är en matematisk optimeringsteknik som vanligtvis används för att skapa kontrollpolicy. Lev Pontryagin, tillsammans med sitt team i ex-Sovjetunionen, och den amerikanska Richard Bellman är mest ansvariga för optimal kontrollteori. Det allmänna syftet med teorin är att använda olika analysmetoder för att bestämma parametrarna för ett system genom att genomföra försök och fel.
Den optimala kontrollteorin är praktiskt när man försöker lösa kontinuerliga tidsoptimeringsproblem. Teorin hanterar ett problem genom att bestämma en kontrolllag för ett hypotetiskt system för att uppnå en nivå av optimalitet. Den optimala kontrollen består av en uppsättning olika ekvationer, som beskriver vägarna för variablerna som ger kostnadsfunktionella till ett minimum. Kostnadsfunktionen är i princip en funktion av variabler relaterade till tillstånd och kontroll. Den optimala kontrollteorin använder sig av Pontryagin Maximum PRINCIPLE, som i allmänhet säger att man kan lösa optimeringsproblemet P med användningen av en Hamiltonian -funktion h under en period, vilket är ett nödvändigt tillstånd. Teorin kan också härledas med Hamilton-Jacobi-Bellman-ekvationen.
För att hjälpa en person att förstå den optimala kontrollteorin, används ofta exemplet "som kör din bil genom ett kuperat väg". Föreställ dig att resa i en bil på en klumpig väg i en rak linje. Teorin kan avgöra hur man ska accelerera för att minimera den absoluta resetiden. I ett sådant fall består "systemet" av fordonet och den steniga vägen och optimalitetskriterierna är att man når minimering av resetiden. Sådana problem är kända för att inkludera begränsningar (t.ex. bränslebegränsning, hastighetsgränser). En annan fråga kan vara att hitta ett sätt för bilen att optimera sin konsumtion av bränsle medan han är skyldig att slutföra en CEradera kursen i en given tidsgräns.
Ett annat exempel på användningen av den optimala kontrollteorin är att lösa kostnads- eller skuggpriset. Den består av det marginella värdet av att utöka tillståndsvariabeln. Efter att ha löst det kan det optimala värdet för kontrollen bilda en differentiell ekvation som är villkorad av medvetenheten om kostnaden. Det är vanligt att denna strategi löser för regioner som beskriver den optimala kontrollen och avskärmar de faktiska valvärdena i tid.