Hva er den optimale kontrollteorien?
Optimal kontrollteori brukes i stor grad innen vitenskap og ingeniørfag. Det er en matematisk optimaliseringsteknikk som vanligvis brukes til å lage kontrollpolitikk. Lev Pontryagin, sammen med teamet sitt i Ex-Sovjetunionen, og den amerikanske Richard Bellman er stort sett ansvarlige for optimal kontrollteori. Det generelle målet med teorien er å bruke forskjellige analysemetoder for å bestemme parametrene til et system ved å utføre prøve-og-feilingsprosesser.
Den optimale kontrollteorien kommer godt med når du prøver å løse kontinuerlige tidsoptimaliseringsproblemer. Teorien takler et problem ved å bestemme en kontrolllov for et hypotetisk system for å oppnå et nivå av optimalitet. Den optimale kontrollen består av et sett med forskjellige ligninger, som beskriver banene til variablene som gir kostnadsfunksjonell til et minimum. Kostnadsfunksjonen er i utgangspunktet en funksjon av variabler relatert til tilstand og kontroll. Den optimale kontrollteorien benytter seg av PRI PRINciple, som generelt sier at man kan løse optimaliseringsproblemet P med bruk av en Hamiltonian -funksjon H over en periode, noe som er en nødvendig tilstand. Teorien kan også avledes med Hamilton-Jacobi-Bellman-ligningen.
For å hjelpe en person til å forstå den optimale kontrollteorien, blir eksemplet "kjører bilen din gjennom en kupert vei" ofte brukt. Se for deg å reise i en bil på en skummel vei i en rett linje. Teorien kan bestemme hvordan man skal akselerere for å minimere den absolutte reisetiden. I et slikt tilfelle består "systemet" av kjøretøyet og Rocky Road og optimalitetskriteriene er at man når minimering av reisetiden. Slike problemer er kjent for å inkludere begrensninger (f.eks. Begrensning, fartsgrenser). Et annet spørsmål kan være å finne en måte for bilen å optimalisere forbruket av drivstoff mens den er forpliktet til å fullføre en CERtain -kurs i en gitt tidsbegrensning.
Et annet eksempel på bruken av den optimale kontrollteorien er å løse kostnads- eller skyggeprisen. Den består av den marginale verdien av å utvide tilstandsvariabelen. Etter å ha løst at den optimale verdien for kontrollen kan danne en differensialligning betinget av bevisstheten om kostnadene. Det er vanlig at denne strategien løser for regioner som beskriver den optimale kontrollen og tilbaketrukket de faktiske valgverdiene i tid.