Jaká je teorie optimální kontroly?

Teorie optimální kontroly je do značné míry využívána ve vědě i inženýrství. Jedná se o techniku ​​matematické optimalizace, která se běžně používá při vytváření kontrolních politik. Lev Pontryagin, spolu s jeho týmem v bývalém sovětském svazu a americký Richard Bellman jsou většinou zodpovědní za teorii optimální kontroly. Obecným cílem teorie je použít různé metody analýzy k určení parametrů systému prováděním procesů pokusů a omylu.

Teorie optimální kontroly se hodí při pokusu o vyřešení problémů s optimalizací nepřetržitého času. Teorie řeší problém stanovením kontrolního zákona pro hypotetický systém, aby se dosáhlo úrovně optimality. Optimální ovládání se skládá ze sady různých rovnic, které popisují cesty proměnných, které zvyšují nákladovou funkci na minimum. Funkční náklady je v podstatě funkcí proměnných souvisejících se stavem a kontrolou. Teorie optimální kontroly využívá maximální PRI pontryaginNCIPLE, která obecně uvádí, že člověk může vyřešit problém optimalizace p s použitím hamiltonovské funkce H po dobu jednoho období, což je potřebná podmínka. Teorie může být také odvozena s rovnicí Hamilton-Jacobi-Bellman.

Abychom člověku pomohli pochopit optimální teorii kontroly, běžně se používá příklad „jízdy automobilem přes kopcovité silnice“. Představte si, že cestujete v automobilu na drsné silnici v přímé linii. Teorie může určit, jak by se člověk měl zrychlit, aby se minimalizovala absolutní doba cestování. V takovém případě se „systém“ skládá z vozidla a skalnaté silnice a kritérií optimality je dosažení minimalizace doby cestování. Je známo, že tyto problémy zahrnují omezení (např. Omezení paliva, rychlostní limity). Další otázkou může být nalezení způsobu, jak vozidlo optimalizovat jeho spotřebu paliva, zatímco je povinen dokončit CEKurz RTain v daném časovém limitu.

Dalším příkladem použití teorie optimálního řízení je řešení ceny nákladů nebo stínu. Skládá se z mezní hodnoty rozšíření proměnné státu. Poté, co to vyřešilo, může optimální hodnota pro ovládání tvořit diferenciální rovnici podmíněnou na vědomí státu. Je běžné, že tato strategie vyřeší pro regiony, které popisují optimální kontrolu a odloučeny skutečné hodnoty výběru v čase.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?