Skip to main content

Lý thuyết điều khiển tối ưu là gì?

Lý thuyết kiểm soát tối ưu phần lớn được sử dụng trong khoa học cũng như kỹ thuật.Đây là một kỹ thuật tối ưu hóa toán học thường được sử dụng trong việc tạo ra các chính sách kiểm soát.Lev Pontryagin, cùng với đội ngũ của anh ta ở Liên Xô cũ, và Richard Bellman người Mỹ chủ yếu chịu trách nhiệm về lý thuyết kiểm soát tối ưu.Mục đích chung của lý thuyết là sử dụng các phương pháp phân tích khác nhau để xác định các tham số của một hệ thống bằng cách tiến hành các quy trình thử và sai.Lý thuyết điều khiển tối ưu có ích khi cố gắng giải quyết các vấn đề tối ưu hóa thời gian liên tục.Lý thuyết đã giải quyết một vấn đề bằng cách xác định luật kiểm soát cho một hệ thống giả thuyết để đạt được mức độ tối ưu.Kiểm soát tối ưu bao gồm một tập hợp các phương trình khác nhau, mô tả các đường dẫn của các biến đưa chức năng chi phí ở mức tối thiểu.Chức năng chi phí về cơ bản là một chức năng của các biến liên quan đến trạng thái và kiểm soát.Lý thuyết kiểm soát tối ưu sử dụng nguyên tắc tối đa pontryagin, thường nói rằng người ta có thể giải quyết vấn đề tối ưu hóa p với việc sử dụng hàm Hamilton H trong một khoảng thời gian, đó là một điều kiện cần thiết.Lý thuyết này cũng có thể được bắt nguồn từ phương trình Hamilton-Jacobi-Bellman.

Để giúp một người hiểu lý thuyết điều khiển tối ưu, thì việc lái xe của bạn qua một ví dụ về đường đồi núi thường được sử dụng.Hãy tưởng tượng đi du lịch trong một chiếc ô tô trên một con đường hiểm trở trên một đường thẳng.Lý thuyết có thể xác định làm thế nào một người nên tăng tốc để giảm thiểu thời gian di chuyển tuyệt đối.Trong trường hợp như vậy, hệ thống của người Viking bao gồm phương tiện và con đường đá và các tiêu chí tối ưu là một trong những người đạt đến việc giảm thiểu thời gian di chuyển.Những vấn đề như vậy được biết là bao gồm các ràng buộc (ví dụ: giới hạn nhiên liệu, giới hạn tốc độ).Một câu hỏi khác có thể là tìm cách để xe tối ưu hóa việc tiêu thụ nhiên liệu trong khi bắt buộc phải hoàn thành một khóa học nhất định trong một giới hạn thời gian nhất định. Một ví dụ khác về việc sử dụng lý thuyết kiểm soát tối ưu là giải quyết giá chi phí hoặc bóng tối.Nó bao gồm giá trị cận biên của việc mở rộng biến trạng thái.Đã giải quyết điều đó, giá trị tối ưu cho điều khiển có thể tạo thành một phương trình vi phân có điều kiện theo nhận thức của chi phí.Người ta thường giải quyết chiến lược này cho các khu vực mô tả kiểm soát tối ưu và tách biệt các giá trị lựa chọn thực tế theo thời gian.