Vad är den optimala kontrollteorin?

Optimal kontrollteori används till stor del både inom vetenskap och teknik. Det är en matematisk optimeringsteknik som vanligtvis används för att skapa kontrollpolicyer. Lev Pontryagin, tillsammans med sitt team i fd Sovjetunionen, och amerikanen Richard Bellman är främst ansvariga för optimal kontrollteori. Det allmänna syftet med teorin är att använda olika analysmetoder för att bestämma parametrarna för ett system genom att utföra test-och-fel-processer.

Den optimala kontrollteorin är praktiskt när man försöker lösa kontinuerliga tidsoptimeringsproblem. Teorin hanterar ett problem genom att fastställa en kontrolllag för ett hypotetiskt system för att uppnå en optimal nivå. Den optimala kontrollen består av en uppsättning olika ekvationer, som beskriver banorna för variablerna som minimerar funktionskostnaden. Kostnadsfunktionen är i princip en funktion av variabler relaterade till tillstånd och kontroll. Den optimala kontrollteorin använder sig av Pontryagins maximala princip, som generellt säger att man kan lösa optimeringsproblemet P med användning av en Hamiltonian-funktion H under en period, vilket är ett nödvändigt villkor. Teorin kan också härledas med Hamilton-Jacobi-Bellman-ekvationen.

För att hjälpa en person att förstå den optimala kontrollteorin, används vanligtvis "körning av din bil genom en kuperad väg". Föreställ dig att resa i en bil på en grov väg i en rak linje. Teorin kan bestämma hur man ska påskynda för att minimera den absoluta restiden. I ett sådant fall består ”systemet” av fordonet och den steniga vägen och optimeringskriterierna är att man når minimering av restiden. Sådana problem är kända för att inkludera begränsningar (t.ex. bränslebegränsning, hastighetsbegränsningar). En annan fråga kan vara att hitta ett sätt för bilen att optimera sin bränsleförbrukning medan den är skyldig att genomföra en viss kurs inom en viss tidsgräns.

Ett annat exempel på användningen av den optimala kontrollteorin är att lösa priset eller skuggpriset. Det består av det marginella värdet av att utöka tillståndsvariabeln. Efter att ha löst det kan det optimala värdet för kontrollen bilda en differentiell ekvation som är villkorad av medvetenheten om priset. Det är vanligt att denna strategi löses för regioner som beskriver den optimala kontrollen och avgränsar de faktiska valvärdena i tid.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?