Nghiên cứu chiến lược tối ưu hóa trong điều khiển dự báo

Chia sẻ: Thi Thi | Ngày: | Loại File: PDF | Số trang:7

Thêm vào BST

Báo xấu

63
lượt xem 1
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tối ưu hóa trong điều khiển dự báo là một vấn đề khó đang được nhiều nhà khoa học trong và ngoài nước quan tâm nghiên cứu. Bài báo này, chúng tôi đưa ra những nghiên cứu tổng quan về các phương pháp tối ưu hóa phổ biến được sử dụng trong điều khiển dự báo đối với cả MPC tuyến tính và MPC phi tuyến.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Nghiên cứu chiến lược tối ưu hóa trong điều khiển dự báo

Nguyễn Thị Mai Hương và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 113(13): 115 - 121 NGHIÊN CỨU CHIẾN LƯỢC TỐI ƯU HÓA TRONG ĐIỀU KHIỂN DỰ BÁO Nguyễn Thị Mai Hương, Mai Trung Thái, Lê Thị Huyền Linh, Lại Khắc Lãi* Trường ĐH Kỹ thuật Công nghiệp – ĐH Thái Nguyên; Đại học Thái Nguyên TÓM TẮT Tối ưu hóa trong điều khiển dự báo là một vấn đề khó đang được nhiều nhà khoa học trong và ngoài nước quan tâm nghiên cứu. Bài báo này, chúng tôi đưa ra những nghiên cứu tổng quan về các phương pháp tối ưu hóa phổ biến được sử dụng trong điều khiển dự báo đối với cả MPC tuyến tính và MPC phi tuyến. Từ khoá: Điều khiển dự báo,Tối ưu hóa, MPC tuyến tính, MPC phi tuyến. GIỚI THIỆU CHUNG* Lịch sử điều khiển tối ưu bắt đầu từ thập niên 60 khi xuất hiện 2 bài báo của Kalman. Hai bài báo này có tầm ảnh hưởng đáng kể đối với các nhà nghiên cứu về điều khiển tối ưu, là tiền đề cho sự phát triển của bộ điều khiển LQG (Linear Quadratic Gauss) mà sau này áp dụng lý trong thuyết điều khiển dự báo theo mô hình (MPC - Model Preditive Control). MPC về cơ bản là một dạng của bộ điều khiển LQG có bổ sung thêm các ràng buộc trong phạm vi dự báo hữu hạn. Có thể hiểu: MPC tuyến tính tầm vô hạn = LQG đơn giản Thập niên 70, MPC mới chỉ được sử dụng đối với các đối tượng biến đổi chậm, vì thủ tục tối ưu hóa sẽ được lặp đi lặp lại ở mọi bước. Cho tới thập niên 90, khi tốc độ tính toán của máy tính nhanh hơn thì MPC được áp dụng với nhiều loại đối tượng mà đặc tính động học nhanh như máy bay, robot, vệ tinh nhân tạo, máy móc tự động, … Khi áp dụng luật điều khiển rất nhiều vấn đề lý thuyết nảy sinh với MPC. Một trong các vấn đề chính là tìm ra thuật toán tối ưu thích hợp để giảm các sai số trong tương lai. Trong bài báo này, chúng tôi đưa ra những nghiên cứu tổng quát về các kỹ thuật tối ưu hóa phổ biến được sử dụng trong điều khiển dự báo. Các ứng dụng cho đối tượng cụ thể sẽ được công bố trong các bài báo tiếp sau. * Tel: 0913507464; Email: laikhaclai@gmail.com CHIẾN LƯỢC TỐI ƯU HÓA TRONG ĐIỀU KHIỂN DỰ BÁO Thuật toán điều khiển dự báo theo mô hình là sử dụng một mô hình quá trình rõ để dự báo đáp ứng tương lai của đối tượng. Bộ tối ưu hóa giải quyết một bài toán tối ưu, trong mỗi chu kì lấy mẫu của hệ thống điều khiển thông qua việc tính toán điều chỉnh chuỗi biến điều khiển tương lai, nhằm tối ưu hóa hoạt động của đối tượng ở mỗi một chu kì. Giá trị đầu tiên của chuỗi tối ưu được đưa tới điều khiển đối tượng, quá trình tính toán này sẽ được lặp lại trong mỗi chu kỳ tiếp theo. Hoạt động của MPC được biểu diễn như Hình 1. Hình 1. Hoạt động MPC Đặt Y là đầu ra của quá trình và u là đầu vào bộ điều khiển Ymongmuon (t ) = a1u (t − h ) + a 2 u ( t − 2 h ) + ... + b1 y (t − h ) + b2 y (t − 2 h ) + .... (1) YDubao (t ) = a1' u (t − h) + a 2' u (t − 2h) + ... +b1' y (t − h) + b2' y (t − 2h) + .... (2) 115 Nguyễn Thị Mai Hương và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ trong đó t = t – h là bước thời gian. Phương trình (1) miêu tả hoạt động vào/ra của hệ thống. Phương trình (2) biểu diễn hoạt động tương lai của hệ thống dự báo dựa trên đầu vào quá khứ của hệ thống u(t - h) và đầu ra y(t - h). Sai số giữa đầu ra dự báo và đầu ra mong muốn: e(t ) = YDubao (t ) − Ymongmuon (t ) (3) U toiuu (t ) = ce(t ) (4 Phương trình (4) chỉ ra tỉ lệ sai số c và dự báo đầu vào tối ưu tính toán Utốiuu(t) dựa trên tính toán trước đó. Phương trình (1), (2), (3) và (4) miêu tả hoạt động của hệ thống đối với mỗi chu kì lấy mẫu ở tương lai. Thực hiện lặp 4 phương trình trên tại các khoảng thời gian t + h, t + 2h, …để dự báo tín hiệu vào/ra tương lai của hệ thống có thể mô tả sơ lược như trong hình 1. Việc lặp các chu kì nhận được các sai số e(t), e(t + h), e(t + 2h) cho mỗi chu kì lấy mẫu. Để tối ưu hóa hệ thống (cực tiểu hóa sai số giữa đầu ra dự báo và tác động mong muốn) ta định nghĩa hàm số dư tương lai của hệ thống: Số dư = e2(t+ih), i=0, 1, …, n Mục tiêu là sử dụng các thuật toán tối ưu gần đúng và tìm các đầu vào tương lai sao cho cực tiểu hóa số dư, nghĩa là tìm cực tiểu (số dư). Tiến trình tối ưu hóa được miêu tả trong hình 2. Hệ thống tối ưu hóa Số dư cực tiểu (bằng việc lặp liên tục các phương trình (1), (2), (3) và (4)) D(số dư)/dt C=Csốdư U to iu u ( t ) = c e ( t ) Hình 2. Tiến trình tối ưu hóa MPC Sau đây trình bày ngắn gọn việc sử dụng các phương pháp tối ưu áp dụng cho MPC tuyến tính và MPC phi tuyến. 116 113(13): 115 - 121 MPC tuyến tính Bài toán tối ưu hóa trong MPC tuyến tính Xét hệ thống thời gian bất biến và rời rạc sau: xt+1 = Axt + But (6) yt = Cxt (7) với các điều kiện ràng buộc: ymin ≤ yt ≤ ymax (8) umin ≤ ut ≤ umax (9) trong đó xt ∈ℜ , ut ∈ℜ và yt ∈ℜ là các véc tơ trạng thái, véc tơ đầu vào và vec tơ đầu ra. Chỉ số dưới min và max biểu thị giới hạn dưới và giới hạn trên. Nói chung, tối ưu hóa trong MPC tuyến tính là cực tiểu hóa phiếm hàm mục tiêu có dạng: n m J = x t Qx + u t Ru p (10) Đa số các ứng dụng MPC trong công nghiệp sử dụng các mô hình thực nghiệm tuyến tính, vì vậy hầu hết các sản phẩm MPC và các thuật toán tối ưu đều dựa trên loại mô hình này. Các phương pháp tối ưu hóa đối với MPC tuyến tính Khó khăn lớn nhất trong MPC là tìm ra cách nhanh nhất để tối ưu hóa khi thời gian yêu cầu để giải thuật toán tối ưu rất ngắn. Vì thế mà chúng ta cần sử dụng giải pháp tối ưu hóa thời gian thực. Đôi khi để giảm mức độ phức tạp chúng ta tìm kiếm bằng giải pháp cận tối ưu, với các điều kiện ràng buộc là tuyến tính. Đối với MPC tuyến tính giải pháp tối ưu thường được biểu diễn ở dạng toàn phương hoặc một chuẩn tuyến tính, vì vậy mà kết quả của bài toán tối ưu có thể được lập trình toàn phương (QP) hoặc lập trình tuyến tính (LP). Lập trình tuyến tính (LP): Một số tác giả đã nghiên cứu tối ưu hóa MPC dựa trên lập trình tuyến tính [1]. Xét hàm mục tiêu dạng: min J = min Px N N −1 ∞ + ∑ Qxk k =0 + Ru k ∞ ∞ (11 với điều kiện ràng buộc G z ≤ W + Sx ( t ) Luật MPC được định nghĩa bởi giải pháp lập trình tuyến tính [2]. Schechter [2] đã chứng minh điều này đúng với bất kì tổng các giá trị hàm Afin (Affine) từng đoạn lồi. Nguyễn Thị Mai Hương và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ Phương pháp đại số: Xét hàm mục tiêu sau: Ny −1 min J = xt'+Ny t Pxt +Ny t + ∑ xt' +Ny t Qxt +k t + xt'+k Rut +k k =0 (12) các điều kiện ràng buộc ymin ≤ yt ≤ ymax , k =1,2,..., Nc umin ≤ ut ≤ umax , k = 0,1,..., Nc và động học hệ thống xt +k +1 = Axt +k t + But +k , k ≥ 0, yt +k t + Qxt +k t , k ≥ 0, ut +k = Kxt +k t , Nu ≤ k ≤ Ny , trong đó các ma trận Q = Q' ≥ 0, R = R' ≥ 0 và P≥ 0. Nu, Ny, Nc là phạm vi đầu vào, phạm vi đầu ra và phạm vi điều kiện ràng buộc sao cho Ny ≥ Nu và Nc ≤ Ny −1. Giải bài toán (12), tiến hành lặp ở mỗi thời điểm t đối với giá trị đo được hiện thời xt và biến trạng thái dự báo, xt+1t ,..., xt+k t ở các bước thời gian t + 1, …, t + k và đạt được các hoạt động điều khiển tối ưu tương ứng U* ={ut*,...,ut*+k−1} . Đầu vào dự báo đầu tiên được đưa vào hệ thống cụ thể là ut = u*t , tiến hành lặp ở thời điểm t + 1 dựa trên trạng thái mới xt+1. Việc điều khiển ma trận hàm mục tiêu P và hệ số phản hồi trạng thái K thường được sử dụng để đảm bảo ổn định vòng kín của hệ thống (12). Giải pháp đại số của hệ thống phụ thuộc vào việc tìm kiếm các giá trị của ma trận P và Q. Để tìm P ta dùng giải pháp rời rạc hóa phương trình Lyapunov: P = A’PA + Q Giả sử bài toán không ràng buộc, tầm vô hạn, nghĩa là Nc = Nu = Ny =∞ chúng ta có thể tìm hệ số phản hồi trạng thái K bằng việc giải phương trình Ricatti: −1 K = − ( R + B PB ) B PA, ' ' P = ( A + BK ) ' P ( A + BK ) + K ' RK + Q Giải phương trình Lyapunov và các phương trình Ricatti là phương pháp phổ biến nhất để 113(13): 115 - 121 tìm các giá trị của ma trận K và P [4], thực hiện tương tự ta giải được bài toán đại số. Lập trình toàn phương (QP): Rawins và Morari [3] đã chứng minh rằng MPC tuyến tính có thể được gọi là bài toán lập trình toàn phương (QP). Nếu chúng ta đưa mối liên hệ dưới đây xt +1 t = A xt + k k −1 ∑ A Bu j j =0 t + k −1kj vào trong hệ thống được miêu tả bởi phương trình (12) sẽ được biểu thức tối ưu hóa lập trình toàn phương sau: 1 1 J * ( xt ) = min U ' HU + xt' FU + xt'Yx(t ) (13) 2 2 điều kiện ràng buộc là G z ≤ W + S x ( t ) ' trong đó U ≜ ut' ,...,ut'+Nu −1 ∈ℜs và s ≜ mN u là vectơ của các biến tối ưu, H = H' ≻ 0, các ma trận H, P, Y, G, W, E thu được từ ma trận ràng buộc trạng thái S và ma trận đầu vào R. MPC áp dụng được nhờ giải quyết bài toán QP (13), lặp tại mỗi thời điểm t ≥ 0 đối với giá trị trạng thái hiện thời xt. Mặc dù bộ giải phương trình QP là giải được nhưng việc tính toán đầu vào ut trực tuyến phụ thuộc rất nhiều vào tốc độ tính toán [5]. Lập trình toàn phương đa tham số (Multi Parametric Quadratic Programming) (mp-QP) Mục đích của MPC là giảm thời gian tối ưu hóa trực tuyến bởi vì hệ thống hoạt động ở thời gian thực. Ngày nay, những nghiên cứu quan trọng đưa ra nhiều thuật toán tối ưu hóa hiệu quả. Tác giả Bemporad [4], [6] đã giải quyết bài toán (12) bằng cách lập trình toàn phương đa tham số. Bảng 1 dưới đây đưa ra các ưu, nhược điểm của các phương pháp điều khiển tối ưu trong MPC tuyến tính Bảng 1 Độ khó TƯ hóa ĐK ràng buộc P. pháp đại số Nhỏ Không Không P. pháp P. pháp LP QP T. bình Lớn Có Tốt hơn Có Không PP. ràng buộc QP Lớn hơn Tốt hơn Có Lập trình toàn phương đa tham số (mp-QP) thì tránh được hiện tượng tối ưu hóa. Biến đổi 117 Nguyễn Thị Mai Hương và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ bài toán QP (13) bên trong bài toán tối ưu hóa đa tham số thông qua việc biến đổi tuyến tính sau: x ≜ U + H −1 F ' xt trong đó z∈ℜ là tham số biến tối ưu. Vấn đề QP (13) có thể được biểu diễn thành vấn đề mp-QP: 1 Vz (xt ) = min z'Hz 2 điều kiện ràng buộc (14 G z ≤ W + Sx (t ) trong đó xt là vec tơ tham số và S = E +GH−1F' . Ưu điểm của công thức này là xt chỉ xuất hiện trong vế phải của điều kiện ràng buộc và không xuất hiện trong hàm mục tiêu. Khác với phương trình (13) véc tơ trạng thái xt xuất hiện ở vế phải của cả điều kiện ràng buộc và ở hàm mục tiêu. Vì vậy mà trong phương trình (14) z có thể đạt được như hàm Afin của x đối với không gian cho phép hoàn thiện của x [5]. Tác giả Vassilis đã chứng minh rằng tập hợp các tham số Xf ⊆ X lồi, giải pháp tối ưu z(x): X f →ℜ liên tục và affine từng đoạn, hàm mục tiêu tối ưu hóa Vz (x): X f →ℜ liên tục, lồi và toàn phương từng đoạn. Ưu điểm của phương pháp này là dễ cài đặt và thực hiện đánh giá trực tuyến nhanh hơn. Nhược điểm là trạng thái của hệ thống tăng, phạm vi điều khiển lớn hơn vì thế thực hiện cài đặt thuật toán khó khăn hơn. MPC phi tuyến Bài toán tối ưu hóa trong MPC phi tuyến MPC đã trở lên rất hấp dẫn với chiến lược điều khiển phản hồi, đặc biệt đối với các quá trình tuyến tính. Tuy nhiên, các mô hình tuyến tính không đủ tốt để miêu tả đặc tính động học quá trình khi yêu cầu sản phẩm chất lượng cao và tăng năng suất, các quy định môi trường chặt chẽ và yêu cầu về tính kinh tế trong các quá trình công nghiệp đòi hỏi các hệ thống phải hoạt động khép kín trong phạm vi cho phép, vì thế các mô hình phi tuyến được sử dụng. Cấu trúc cơ bản của NMPC được miêu tả như hình 3. Sơ đồ NMPC cơ bản làm việc như sau: 118 113(13): 115 - 121 1) Tính toán giá trị đặt/ước lượng trạng thái của hệ thống. 2) Tính toán tín hiệu đầu vào tối ưu thông qua việc cực tiểu hóa hàm mục tiêu đã cho trên phạm vi dự báo bền vững trong tương lai sử dụng một mô hình hệ thống. 3) Cài đặt tín hiệu đầu vào tối ưu đầu tiên cho đến khi đạt được giá trị đo mới/ ước lượng trạng thái mới của trạng thái có giá trị. 4) Tiếp tục với bước 1 Bộ điều khiển NMPC u Tối ưu Hàm mục tiêu + các ràng buộc Mô hình hệ thống xsp xˆ Quá trình y Ước lượng trạng thái Tính toán giá trị đặt Hình 3. Cơ sở vòng lặp điều khiển NMPC * Xét hệ thống phi tuyến được miêu tả bởi các phương trình rời rạc: xk = f t x ( x k −1 , u k −1 ) y k k −1 = g ( xk ) Điều kiện ràng buộc U = u ∈ ℜ m umin ≤ u ≤ umax X = x ∈ ℜ n xmin ≤ x ≤ xmax trong đó xk là vec tơ trạng thái, uk là vec tơ đầu vào điều khiển, yk là vec tơ đầu ra, tx là thời gian lấy mẫu, k k −1 chỉ số dưới được dùng để chỉ ra giá trị dự báo ở bước thứ k dựa trên giá trị đo được ở bước thứ k-1. Ở đây umin, umax và xmin, xmax là các vec tơ hằng. Sai số mô hình được tính toán bởi phương trình: dk = yk − yk k−1 Mục tiêu là cực tiểu hóa sai số sao cho nhận được đầu ra tối ưu như phương trình sau: xk +1 = f tx ( xk )uk yk +1 k = g ( xk +1 ) + d k Bài toán điều khiển tối ưu được mô tả trong miền thời gian rời rạc: Nguyễn Thị Mai Hương và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ N −1 min imize ∑ Li ( xi , zi , ui ) + E ( xN ) x , z ,u (15) i=0 Điều kiện ràng buộc x0 − x0 = 0 (16) xi+1 − fi (xi , zi , ui ) = 0, i = 0,..., N −1 (17) gi (xi , zi , ui ) = 0, i = 0,..., N −1 (18) hi (xi , zi , ui ) ≤= 0, i = 0,..., N −1 (19) r(xN ) ≤ 0 (20) Các phương pháp tối ưu hóa đối với MPC phi tuyến Bài báo này chúng tôi đưa ra 2 phương pháp để giải bài toán NMPC + Tối ưu hóa kiểu Newton + Phương pháp số Tối ưu hóa kiểu Newton: Phương pháp Newton để giải phương trình phi tuyến R(W)=0 bắt đầu với ước đoán ban đầu W0 và tạo thành một chuỗi lặp Wk mà mỗi chuỗi lặp này giải quyết sự tuyến tính hóa của hệ thống ở các lần lặp trước đó, cụ thể là với Wk đã cho thì lần lặp tiếp theo Wk+1 sẽ thỏa mãn R (W k ) + ∇ (W k ) T (W k +1 −W k) = 0 Phương pháp Newton có tỉ lệ hội tụ toàn phương cục bộ mà khả năng hội tụ nhanh như khi thực hiện bất kì phương pháp số nào đã được phân tích trong [7]. Nếu Jacobi ∇R (W k )T không tính được hoặc nghịch đảo không chính xác, dẫn đến tỉ lệ hội tụ chậm hơn thì việc lặp vô giá trị và phải tăng số lớp “phương pháp kiểu Newton” rộng hơn. Phương pháp này được đề cập rất chi tiết trong tài liệu [8]. Bài toán NMPC có cấu trúc đặc biệt của bài toán phi tuyến chung G ( X ) = 0 min imize P ( X ) s.t  x H ( X ) ≤ 0 đối với giải pháp tối ưu X* phải thỏa mãn các điều kiện của Karush-Kuhn-Tucker (KKT) là: ∇z = ( X*, λ*µ*) = 0 (21) G(X ) = 0 (22) * 0 ≥ H(X ) ⊥ µ ≥ 0 * * (23) 113(13): 115 - 121 Ở đây chúng ta sử dụng định nghĩa Hàm Lagrange l ( X , λ , µ ) = F ( X ) + G ( X )T λ + H ( X ) T µ và biểu tượng ⊥ giữa hai vec tơ trong bất phương trình (23) biểu thị điều kiện bổ sung thêm cũng nên được duy trì. Tất cả các kiểu tối ưu hóa của Newton cố gắng tuyến tính hóa các hàm toán và sử dụng phương pháp lập trình toàn phương liên tiếp (SQP, Sequential Quadratic Programming). a1. Lập trình toàn phương liên tiếp Bước đầu tiên để giải hệ thống Karush-KuhnTucker (KKT) là tuyến tính hóa tất cả các hàm phi tuyến từ (21) đến (23) bằng cách sử dụng các điều kiện của lập trình toàn phương (QP). k GQP ( X k ) + ∇G( X k )T ( X − X k ) = 0 k min imize PQP (X )  k k k T k X  H QP ( X ) + ∇H ( X ) ( X − X ) ≤ 0 với hàm mục tiêu 1 k FQP ( X ) = ∇H ( X k )T ( X ) + ( X − X k )T 2 ∇ 2x l ( X k , λ k , µ k )( X − X k ) (24) ∇ 2x l ( X k , λ k , µ k ) được gọi là ma trận Hessian bán hữu hạn dương, QP lồi vì vậy giải pháp tổng thể có thể tìm được đáng tin cậy. Phương pháp xấp xỉ tổng quát áp dụng cho bài toán tối ưu hóa phi tuyến được gọi là lập trình toàn phương liên tiếp (SQR). a2. Phương pháp SQP kinh điển của Powell Một trong những người thành công nhất sử dụng biến thể SQP là Powell [10]. Ông đã sử dụng chính xác điều kiện ràng buộc Jacobi để lặp ma trận Hessian ∇ 2x l ( X k , λ k , µ k ) bằng việc xấp xỉ Ak. Mỗi lần xấp xỉ tiếp theo ma trận Hessian thu được là Ak+1 từ lần xấp xỉ trước đó Ak bằng một công thức cập nhật mà sử dụng Lagrange gradients. γ = ∇ z l ( X k +1 , λ k +1 , µ k +1 ) − ∇ z l ( X k , λ k +1 , µ k +1(25) ) Mục tiêu của phương pháp Quasi-Newton hoặc phương pháp Variable-Metric là lựa chọn thông tin thứ 2 trong Ak+1 sao cho thỏa mãn phương trình cát tuyến Ak +1σ = γ Việc sử dụng rộng rãi phương pháp cập nhật là Broyden-Fletcher-Goldfarb-Shanno(BFGS) 119