Hvad er den optimale kontrolteori?

Optimal kontrolteori bruges stort set i videnskab såvel som teknik. Det er en matematisk optimeringsteknik, der ofte bruges til at skabe kontrolpolitikker. Lev Pontryagin sammen med sit team i det eks-sovjetiske union og den amerikanske Richard Bellman er for det meste ansvarlige for optimal kontrolteori. Det generelle mål med teorien er at bruge forskellige analysemetoder til at bestemme parametrene for et system ved at udføre prøve-og-fejl-processer.

Den optimale kontrolteori er praktisk, når man prøver at løse kontinuerlige tidsoptimeringsproblemer. Teorien tackler et problem ved at bestemme en kontrollov for et hypotetisk system for at opnå et niveau af optimalitet. Den optimale kontrol består af et sæt af forskellige ligninger, der beskriver stierne for de variabler, der bringer omkostningerne funktionelle til et minimum. Omkostningsfunktionel er dybest set en funktion af variabler relateret til tilstand og kontrol. Den optimale kontrolteori gør brug af Pontryagin maksimalt PRINCIPLE, der generelt siger, at man kan løse optimeringsproblemet P med brugen af ​​en Hamiltonian -funktion H over en periode, hvilket er en nødvendig betingelse. Teorien kan også afledes med Hamilton-Jacobi-Bellman-ligningen.

For at hjælpe en person med at forstå den optimale kontrolteori bruges "at køre din bil gennem et kuperet eksempel" ofte. Forestil dig at rejse i en bil på en uklar vej i en lige linje. Teorien kan bestemme, hvordan man skal accelerere for at minimere den absolutte rejsetid. I et sådant tilfælde består "systemet" af køretøjet og den stenede vej, og optimalitetskriterierne er ens, der når minimering af rejsetiden. Sådanne problemer vides at omfatte begrænsninger (f.eks. Brændstofbegrænsning, hastighedsgrænser). Et andet spørgsmål kan være at finde en måde for bilen at optimere sit forbrug af brændstof, mens den er forpligtet til at gennemføre en CERtain -kursus i en given tidsbegrænsning.

Et andet eksempel på brugen af ​​den optimale kontrolteori er løsningen af ​​omkostningsatet eller skyggeprisen. Det består af den marginale værdi af at udvide tilstandsvariablen. Efter at have løst det, kan den optimale værdi for kontrollen danne en differentiel ligning betinget af bevidstheden om omkostningsatet. Det er almindeligt for denne strategi at løse for regioner, der beskriver den optimale kontrol og afsonder de faktiske valgværdier i tide.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?