intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Thiết kế bộ điều khiển phản hồi cận tối ưu cho hệ phi tuyến

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:3

4
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết Thiết kế bộ điều khiển phản hồi cận tối ưu cho hệ phi tuyến trình bày lý thuyết phương pháp tìm nghiệm xấp xỉ phương trình HJB trong và sử dụng MATLAB-SIMULINK để tổng hợp bộ điều khiển cận tối ưu cho hệ thống cụ thể.

Chủ đề:
Lưu

Nội dung Text: Thiết kế bộ điều khiển phản hồi cận tối ưu cho hệ phi tuyến

  1. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 THIẾT KẾ BỘ ĐIỀU KHIỂN PHẢN HỒI CẬN TỐI ƯU CHO HỆ PHI TUYẾN Phạm Đức Đại Trường Đại học Thủy lợi, email: ducdaipham79@gmail.com 1. GIỚI THIỆU CHUNG 2. f(x) là hàm liên tục và có đạo hàm trong  Điều khiển tối ưu cho hệ thống có động học và f(0) = 0. phi tuyến đã được nghiên cứu rộng rãi. Có rất 3. Hệ thống trên là điều khiển được trên nhiều kỹ thuật để tổng hợp luật điều khiển tập compact . phản hồi cho các hệ thống phi tuyến. Tuy 4. Hệ thống trên là quan sát được trạng nhiên, một trong những khó khăn khi tìm luật thái 0 thông qua Q. điều khiển tối ưu cho các hệ thống phi tuyến Nghiệm của bài toán tối ưu được tính đó là đại lượng điều khiển phụ thuộc vào thông qua phương trình HJB như sau: nghiệm phương trình Hamilton-Jacobi- Bellman (HJB) [1]. Trên thực tế, phương trình 1 1 VxT f ( x)  VxT gR 1 gTVx  xT Qx  0 HJB rất khó giải quyết. Trong bài báo này, tác 2 2 giả trình bày lý thuyết phương pháp tìm ở đó Vx = V(x)/x và Vx là giá trị tối ưu của nghiệm xấp xỉ phương trình HJB trong [1] và hàm sau: sử dụng MATLAB-SIMULINK để tổng hợp 1  bộ điều khiển cận tối ưu cho hệ thống cụ thể. V ( x)  min  ( xT Qx  uT Ru) dt u 2 0 2. PHƯƠNG PHÁP XẤP XỈ TÌM NGHIỆM Với V(x) > 0 và V(0) = 0. PHƯƠNG TRÌNH HJB Điều kiện cần cho tối ưu là: Bài toán điều khiển phản hồi trạng thái tối u   R 1 gT Vx ưu được xây dựng cho lớp bài toán với hệ phi Chú ý rằng bộ điều khiển cần tính Vx. Tuy tuyến thời gian không thay đổi được mô tả nhiên, phương trình HJB là rất khó để giải, như sau: đặc biệt với hệ phương trình phi tuyến. x  f ( x )  gu  Phương pháp xấp xỉ cận tối ưu (suboptimal) trong đó x    R n ; f  R n ; g  R nm ; u  R m ; - D nhằm tìm nghiệm xấp xỉ được trình bày g là ma trận hằng số. như sau. Xấp xỉ là quá trình được thực hiện Mục tiêu là tìm bộ điều khiển để tối thiểu bằng cách cộng các khai triển giảm dần tới hóa hàm chi phí quadratic, J cho bởi: hàm mục tiêu và giả sử rằng nghiệm triển 1   J   xT Qx  uT Ru dt 2 0  khai chuỗi tới đạo hàm của hàm tối ưu V.  Q  R ; R  R mm . Q là ma trận bán xác nn Giờ ta thêm  i1 Di i vào hàm mục tiêu: định dương và R là ma trận xác định dương. Để đảm bảo rằng bài toán tối ưu là có J 1  T 2 0     x Q   i 1 Di i x  uT Ru dt  nghiệm, ta giả sử: Di là một ma trận,  và Di được lựa chọn để 1. x   là tập compact và bao gồm điểm  Q   i 1 Di i là bán xác định dương (semi- gốc là điểm trong; u U và U cũng là tập compact. positive definite). 313
  2. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 Viết lại phương trình trạng thái như sau: Trong các phương trình trên, ki > 0; li > 0,   A( x )   i = 1,…, n là các số và có thể hiệu chỉnh x  f ( x )  gu   A0      x  gu      trong khi thiết kế. Ở đó A0 là ma trận không đổi mà (A0, g) là Các bước thực hiện thiết kế thuật toán xây ổn định và [A0 + A(x), g] là điều khiển được. dựng bộ điều khiển cận tối ưu: Tiếp theo ta định nghĩa: - Bước 1: Giải phương trình Riccati để tính   Vx T0, khi A0, Q, R được xác định. Chú ý rằng Ta có được phương trình HJB với: T0 là ma trận hằng xác định dương 1 2 1 2    T f ( x )   T gR 1 gT   xT Q   i 1 Di i x  0 - Bước 2: Giải phương trình Lyapunov để Giả sử rằng, ta có thể phân tích  thành xác định: T1(x, ), sử dụng phương trình, và chuỗi các hàm mũ của , cụ thể    i 0 Ti i x tính:  Ở đó Ti cần xác định và giả sử là đối xứng. Aco  A0  gR 1 gT T0 Thay  vào phương trình HJB và gán các T T P = I  Aco  Aco  I hệ số của bằng không, ta được các phương Vec(T1 )  P 1Vec(Q1 ( x, , t )) trình sau: T0 A0  A0 T0  T0 gR 1 gT T0  Q  0 T - Bước 3: Sử dụng các bước như trong bước 2 để tính T2(x, ). T1 ( A0  gR 1 gT T0 )  ( A0  T0 gR 1 gT )T1 T T0 A( x ) AT ( x )T0 3. ÁP DỤNG    D1   Cho hệ thống được mô tả bởi hệ phương T2 ( A0  gR g T0 )  ( A0  T0 gR 1 gT )T2 1 T T trình phi tuyến sau: T1 A( x ) AT ( x )T1 3 x1  x1  x1  x2  u1     T1 gR 1 gT T1  D2   2 x2  x1  x2  x1 x2  u1  Tn ( A0  gR 1 g T T0 )  ( A0  T0 gR 1 g T )Tn T Tìm đại lượng điều khiển u = [u1, u2] để Tn1 A( x ) AT ( x )Tn1    tối thiểu hóa hàm chi phí sau:   n 1 1  T 1 0  1 0    2 0  T T gR 1 gT Tn1 j 1 j  Dn J x 0 1  x  u 0 1  u  dt      Có thể thấy Ti phụ thuộc vào, cho nên, ta ký hiệu nó Ti (x,), và nghiệm tối ưu: Hệ thống được mô tả bởi phương các  phương trình sau. Từ đó, ta có được: u =  R 1 gT V x   R 1 gT  i 0 Ti ( x , ) i x 1 1   x2 0 Vấn đề tiếp theo là xác định ma trận Di, A0    ; A1   1  i = 1,…, n: 1 1  0  2 x1    T A( x ) AT ( x )T0  e210t 0   T0 A( x) AT ( x)T0  D1  k1e l1t   0   D1            0 e60t         T A( x ) AT ( x )T1  D2  k2el2t   1   T1 gR 1 gT T1  e210t 0   T0 A( x) AT ( x)T0      D2        0  e 60t       Và tổng quát là:  T A( x) AT ( x )Tn 1 n 1  Kết quả thử nghiệm với hai trường hợp 1) Dn  kn elnt  n1    j 1T j gR1 gT Tn  j        giá trị ban đầu x0 = [10; 10]. 314
  3. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 Có thể thấy rằng, trong cả hai trường hợp, trạng thái hệ thống điều khiển đều tiến tới trạng thái xác lập. 4. TÀI LIỆU THAM KHẢO [1] Ming Xin and S. N. Balakrishnan (2005) A new method for suboptimal control of a class of non-linear systems. Hình 1. Trạng thái hệ thống Hình 2. Đại lượng điều khiển Và trường hợp x0 = [25; 25]: Hình 3. Trạng thái hệ thống Hình 4. Đại lượng điều khiển 315
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0