Tóm tắt Luận án Tiến sĩ Kỹ thuật điều khiển và tự động hóa: Nghiên cứu ứng dụng điều khiển học tăng cường cho xe hai bánh tự cân bằng có mô hình bất định không dừng và nhiễu cơ cấu chấp hành

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:27

Thêm vào BST

Báo xấu

9
lượt xem 1
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục đích nghiên cứu của tóm tắt luận án "Nghiên cứu ứng dụng điều khiển học tăng cường cho xe hai bánh tự cân bằng có mô hình bất định không dừng và nhiễu cơ cấu chấp hành" là tìm hiểu về các loại xe hai bánh tự cân bằng; nghiên cứu, xây dựng mô hình toán học của xe hai bánh tự cân bằng phù hợp với mục đích thiết kế bộ điều khiển, từ đó có thể đề xuất các phương pháp điều khiển cho xe hai bánh tự cân bằng;... Mời các bạn cùng tham khảo!

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Tóm tắt Luận án Tiến sĩ Kỹ thuật điều khiển và tự động hóa: Nghiên cứu ứng dụng điều khiển học tăng cường cho xe hai bánh tự cân bằng có mô hình bất định không dừng và nhiễu cơ cấu chấp hành

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC BÁCH KHOA HÀ NỘI Trần Gia Khánh NGHIÊN CỨU ỨNG DỤNG ĐIỀU KHIỂN HỌC TĂNG CƯỜNG CHO XE HAI BÁNH TỰ CÂN BẰNG CÓ MÔ HÌNH BẤT ĐỊNH KHÔNG DỪNG VÀ NHIỄU CƠ CẤU CHẤP HÀNH TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA Hà Nội - 2024
Công trình được hoàn thành tại: Đại học Bách khoa Hà Nội Người hướng dẫn khoa học: 1. PGS.TS. Nguyễn Hoài Nam 2. GS.TS. Nguyễn Doãn Phước Phản biện 1: Phản biện 2: Phản biện 3: Luận án được bảo vệ trước Hội đồng đánh giá luận án tiến sĩ cấp Đại học Bách Khoa Hà Nội họp tại Đại học Bách khoa Hà Nội Vào hồi giờ, ngày tháng năm 2024 Có thể tìm hiểu luận án tại thư viện: 1. Thư viện Tạ Quang Bửu - Đại học Bách khoa Hà Nội 2. Thư viện Quốc gia Việt Nam Hà Nội - 2024
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN 1. Khanh G. Tran, Phuoc D. Nguyen and Nam H. Nguyen, “Advanced control methods for two-wheeled mobile robots," International Conference on System Science and Engineering, Vietnam, July 2017. (Scopus indexed). 2. Trần Gia Khánh, Lê Việt Anh, Phan Anh Tuấn, Phan Xuân Minh và Nguyễn Hoài Nam, "Điều khiển xe hai bánh tự cân bằng mô hình bất định dựa trên phương pháp quy hoạch động thích nghi" Hội nghị khoa học toàn quốc lần thứ nhất về Động lực học và Điều khiển, 2019. 3. Tran Gia Khanh, Nguyen Hoai Nam, Tran Doan Xuan, Pham Tan Long, Trinh Duc Trung, Nguyen Doan Phuoc, "Control of two-wheeled inverted pendulum robot using robust PI and LQR controllers," Journal of Military Science and Technology, Vol. 66A, May, 2020. 4. Khanh G. Tran, Nam H. Nguyen, Phuoc D. Nguyen, "Observer based con- trollers for two-wheeled inverted robots with unknown input disturbance and model cncertainty," Journal of Control Science and Engineering, 2020. (ISI Q3, ESCI). 5. Khanh G. Tran; Tuan T. Nguyen; Toi Q. Pham; Phuong D. Nguyen; Duc V. Nguyen; Phuong A. Nguyen; Hoang M. Pham; Phuoc D. Nguyen, and Nam H. Nguyen, "Control of TWIR using LQR controller and compound disturbance observer," ICA-SYMP’2021, Thailand 2021. (Scopus indexed).
1. Tính cấp thiết của đề tài Hệ thống hụt (thiếu) cơ cấu chấp hành là đối tượng điều khiển có đặc điểm nhận biết là số biến điều khiển nhỏ hơn số đầu ra của hệ thống hoặc số bậc tự do của hệ thống lớn hơn số đầu vào của hệ thống đó. Điều khiển các hệ thống hụt cơ cấu chấp hành là một lĩnh vực nghiên cứu được nhiều người quan tâm bởi vì những ứng dụng rộng rãi của nó trong rô bốt, các phương tiện bay và các phương tiện trên biển. Một số ví dụ về hệ thống hụt cơ cấu chấp hành như: Acrobot, con lắc ngược, xe tự hành, phương tiện dưới nước và phương tiên bay. Xe hai bánh tự cân bằng là một hệ thống hụt cơ cấu chấp hành. Trong thực tế chúng ta có thể thấy các xe như Segway, Scooter được sử dụng rộng rãi trong di chuyển ở các địa hình nhỏ như công viên và khu vui chơi giải trí, với mục đích an ninh và thuận tiện. Đây là đối tượng phi tuyến nhiều vào nhiều ra, thiếu cơ cấu chấp hành và không ổn định. Do đó, đối tượng này khó điều khiển. Việc tổng quan các phương pháp điều khiển hệ thống hụt cơ cấu chấp hành là rất cần thiết. Hiện tại chưa có tổng quan nào như thế đã được công bố. Các tổng quan mới chỉ dừng lại cho một lớp đối tượng nhất định. Hiện nay trên thế giới đang nghiên cứu và phát triển ô tô hai bánh dựa trên nguyên lý làm việc của xe hai bánh tự cân bằng. Do đó việc nghiên cứu và nâng cao chất lượng điều khiển của xe hai bánh tự cân bằng là rất cần thiết khi mô hình xe bất định và có nhiễu tác động để tăng độ an toàn cho người sử dụng, xe có thể hoạt động trong điều kiện phức tạp như lên xuống dốc, đường không bằng phẳng hoặc khi có phát sinh sự cố như một cơ cấu chấp hành bị lỗi không hoạt động được. Chính vì vậy, nghiên cứu sinh lựa chọn đề tài: Nghiên cứu ứng dụng điều khiển học tăng cường cho xe hai bánh tự cân bằng có mô hình bất định không dừng và nhiễu cơ cấu chấp hành. 2. Mục đích nghiên cứu Mục đích của đề tài là nghiên cứu các phương pháp điều khiển cho đối tượng hụt cơ cấu chấp hành và ứng dụng điều khiển xe hai bánh tự cân bằng, đề xuất phương pháp điều khiển mới có thể xử lý được thành phần bất định của mô hình và nhiễu tác động vào từ bên ngoài. Để thực hiện được mục tiêu này, luận án đặt ra các nhiệm vụ chính sau đây: Tìm hiểu về các loại xe hai bánh tự cân bằng. Nghiên cứu, xây dựng mô hình toán học của xe hai bánh tự cân bằng phù hợp với mục đích thiết kế bộ điều khiển, từ đó có thể đề xuất các phương pháp điều khiển cho xe hai bánh tự cân bằng. Nghiên cứu và ứng dụng mạch cầu H, các nguyên tắc điều chỉnh sử dụng tín hiệu PWM, xây dựng bộ lọc Kalman để lọc tín hiệu từ cảm biến. Nghiên cứu các vi điều khiển để thực hiện các thuật toán điều khiển đề xuất. 1
Nghiên cứu các thuật toán điều khiển hiện đại để áp dụng cho xe hai bánh tự cân bằng. Xây dựng mô hình xe hai bánh tự cân bằng trong phòng thí nghiệm, lập trình điều khiển, hoàn thiện và hiệu chỉnh nhằm kiểm chứng các kết quả nghiên cứu lý thuyết. 3. Đối tượng và phạm vi nghiên cứu của luận án Đối tượng nghiên cứu của luận án: Điều khiển bám quỹ đạo cho xe hai bánh tự cân bằng. Phạm vi nghiên cứu của luận án: Nghiên cứu và thiết kế các bộ điều khiển phản hồi trạng thái và bộ điều khiển bám quỹ đạo cho xe hai bánh tự cân bằng có nhiễu đầu vào bất định và tham số chưa biết. Phân tích và chứng minh tính ổn định của hệ kín bao gồm các bộ điều khiển đề xuất và đối tượng điều khiển. Mô phỏng so sánh và tiến hành thử nghiệm bộ điều khiển đề xuất cho xe hai bánh tự cân bằng. 4. Ý nghĩa khoa học và thực tiễn của luận án Luận án đưa ra phương pháp điều khiển cho đối tượng là xe hai bánh tự cân bằng có mô hình toán với tham số bất định và chịu tác động bởi nhiễu bên ngoài. Thông qua kết quả mô phỏng và thử nghiệm trên mô hình xe hai bánh tự cân bằng trong phòng thí nghiệm, phương pháp điều khiển đề xuất có thể được áp dụng vào thực tiễn. 5. Phương pháp nghiên cứu Để đạt được mục tiêu đề ra, phương pháp nghiên cứu của luận án đặt ra như sau: Phân tích và tổng hợp các tài liệu khoa học, các công trình nghiên cứu mới nhất đã được công bố trong và ngoài nước trong những năm gần đây về điều khiển xe hai bánh tự cân bằng. Mô phỏng hệ thống điều khiển xe hai bánh tự cân bằng trên phần mềm Matlab/Simulink để kiểm chứng tính đúng đắn của lý thuyết. Phân tích và chứng minh tính ổn định của hệ kín dựa vào lý thuyết ổn định Lyapunov. Thử nghiệm bộ điều khiển đề xuất trên vi điều khiển cho mô hình xe hai bánh tự cân bằng trong phòng thí nghiệm. 6. Bố cục của luận án Luận án được trình bày với 4 chương chính được tóm tắt như sau: 2
Chương 1: Tổng quan về hệ thiếu cơ cấu chấp hành, xe hai bánh tự cân bằng, các loại xe hai bánh, và các phương pháp điều khiển cho xe hai bánh tự cân bằng. Mô hình toán của xe tự cân bằng có thể được phân làm 3 loại: Không có xen kênh đầu vào, có xen kênh đầu vào và có bánh xe phản ứng. Chương 2: Xây dựng mô hình tuyến tính tương đương cho xe hai bánh khi có nhiễu đầu vào và bất định mô hình. Xây dựng bộ điều khiển dưa trên quy hoạch động thích nghi xấp xỉ cho xe hai bánh sử dụng mô hình gốc. Chương 3: Xây dựng bộ điều khiển thích nghi bền vững. Các bộ điều khiển thích nghi bền vững dựa trên bộ quan sát nhiễu kết hợp với luật điều khiển phản hồi trạng thái đảm bảo xe bám quỹ đạo khi chịu nhiễu đầu vào và có tham số bất định. Đầu tiên, mô hình phi tuyến của xe được chuyển về một mô hình tuyến tính tương đương, trong đó sự bất định của mô hình và nhiễu đầu vào được biểu diễn bằng nhiễu đầu vào tổng. Sau đó, một bộ quan sát nhiễu đầu vào tổng đã được thiết kế dựa trên xấp xỉ thành phần đạo hàm của mô hình tuyến tính tương đương. Cuối cùng, các bộ điều khiển phản hồi trạng thái, bộ điều khiển bám quỹ đạo đã được thiết kế cho mô hình tuyến tính tương đương khi đã có bù nhiễu tổng ở đầu vào. Một bộ điều khiển thích nghi bền vững dựa trên phương pháp quy hoạch động xấp xỉ tuyến tính kết hợp bộ quan sát nhiễu cũng đã được nghiên cứu và đề xuất. Tính ổn định của hệ kín bao gồm các bộ điều khiển và bộ quan sát nhiễu đã được phân tích và chứng minh chặt chẽ. Chương 4: Kiểm chứng kết quả thông qua mô phỏng và thực nghiệm. Mô phỏng trên Matlab đã được thực hiện để đánh giá chất lượng các phương pháp đề xuất và so sánh với phương pháp đã có như bộ điều khiển kinh điển LQR. Các kết quả chỉ ra rằng chất lượng điều khiển đã được đảm bảo tốt trong trường hợp có bất định tham số mô hình và nhiễu đầu vào chưa biết khi sử dụng các phương pháp điều khiển đề xuất, trong khi đó chất lượng điều khiển sẽ xấu hơn khi bộ điều khiển kinh điển LQR được áp dụng. Bộ điều khiển bám được đề xuất đã cho chất lượng điều khiển tốt hơn bộ điều khiển trong công trình [41] với dạng quỹ đạo đặt hình tròn, bộ điều khiển phản hồi trạng thái và cả bộ điều khiển LQR. Kết luận: Một bộ điều khiển phản hồi trạng thái với bộ quan sát nhiễu tổng đầu vào đã được đề xuất cho xe hai bánh tự cân bằng có tham số mô hình bất định và nhiễu đầu vào chưa biết và tính ổn định của hệ thống điều khiển kín đã được chứng minh. Các bộ điều khiển đề xuất có những ưu điểm là đơn giản khi cài đặt và linh hoạt trong việc tính toán ma trận khuếch đại K của bộ điều khiển phản hồi trạng thái, có thể giải quyết bất định tham số mô hình và nhiễu đầu vào. Ngoài ra một bộ điều khiển thích nghi bền vững dựa trên quy hoạch động xấp xỉ tuyến tính và bộ quan sát nhiễu cũng được đề xuất cho xe. 3
Chương 1: Tổng quan 1.1 Hệ thiếu cơ cấu chấp hành 1.2 Các dạng xe hai bánh tự cân bằng 1.3 Tổng quan các phương pháp điều khiển 1.4 Kết luận Chương này đã giới thiệu các dạng xe hai bánh và các phương pháp điều khiển cho xe tự cân bằng. Các phương pháp điều khiển đã được tổng quan lại. Có những vấn đề thách thức chưa được giải quyết như tính điều khiển được của xe, di chuyển trong bề mặt không phẳng cho các xe tự hành dựa trên xe tự cân bằng, bám quỹ đạo cho xe có mô hình đầu vào xen kênh, điều khiển xe có bánh phản ứng và vấn đề an toàn (một cơ cấu chấp hành hoặc cảm biến bị hỏng). Nghiên cứu tiếp theo sẽ tập trung vào so sánh giữa các phương pháp điều khiển gần đây thông qua mô phỏng và ứng dụng của xe tự cân bằng làm phương tiện vận tải không người lái trong đó khối lượng tải thay đổi. Chương 2: Xây dựng mô hình tuyến tính tương đương cho xe hai bánh. 2.1 Mô hình toán của xe hai bánh Các phương trình chuyển động của xe [26] được biểu diễn như trong (2.1), (2.2) và (2.3). 2J ˙ ˙ ¨ 2 x ˙ ˙ (M + 2m + 2 )¨ − M l(ψ 2 + θ2 )sin(θ) + M lcos(θ)θ + cα ( − θ) x r r r (2.1) 1 = (τL + τR ). r ¨ ˙ M lcos(θ)¨ + (M l2 + I2 )θ + (I3 − I1 − M l2 )ψ 2 sin(θ)cos(θ) − M lgsin(θ) x x ˙ (2.2) ˙ − 2cα ( − θ) = −(τL + τR ). r [I3 + 2K + md2 /2 + Jd2 /(2r2 ) − (I3 − I1 − M l2 )sin2 (θ)]ψ¨ ˙ ˙ + [M lx − 2(I3 − I1 − M l2 )]ψsin(θ) + cα ψd2 /(2r2 ) ˙ (2.3) = (τR − τL )d/(2r). Mô hình toán của xe hai bánh cũng có thể được mô tả dưới dạng như sau [26]: H(q)¨ + [C(q, q ) + D]˙ + G(q) = B(q)τ . q ˙ q (2.4) Định nghĩa lần lượt các biến trạng thái và đầu vào như sau: T x = x1 x2 x3 x4 x5 x6 u1 τ T và u = = L . (2.5) ˙ ˙ ˙ = x θ ψ x θ ψ u2 τR 4
Ta có: x1 =x4 , x2 = x5 x3 = x6 ˙ ˙ ˙ x = f (x, u), trong đó: ˙ (2.6) x4 =f4 (x, u), x5 = f5 (x, u)x6 = f6 (x, u) ˙ ˙ ˙ với Ω1 + Ω 2 Ω3 + Ω4 Ω5 f4 (x, u) = , f5 (x, u) = , f6 (x, u) = . Ω Ω Ω6 Hệ thống (2.6) sẽ được dùng để xây dựng một mô hình tuyến tính tương đương có mô hình bất định và nhiễu đầu vào tổng ở phần tiếp theo. 2.2 Xây dựng mô hình tuyến tính tương đương với nhiễu đầu vào và bất định mô hình cho xe hai bánh Gọi xe là một điểm cân bằng của hệ thống (2.6), thì xe là nghiệm của phương trình f (x, 0) = 0. (2.7) Do đó, T xe = ∗ 0 ∗ 0 0 0 (2.8) với ′ ∗′ là các giá trị bất kỳ của x1 và x3 , đó là góc hướng và vị trí mong muốn của xe. Không mất tính tổng quát, giả sử ′ ∗′ bằng không, điều này có nghĩa xe = 0. Vì f1 (x) = x4 , f2 (x) = x5 và f3 (x) = x6 là các hàm tuyến tính, đạo hàm bậc nhất của ba biến trang thái đầu tiên có thể được biểu diễn như sau x13 = A1 x + B1 u ˙ (2.9) x13 = A1 x ˙ trong đó x = [x1 x2 x3 x4 x5 x6 ] T ,     0 0 0 1 0 0 0 0 A1 = 0 0 0 0 1 0 , B1 = 0 0 , 0 0 0 0 0 1 0 0 và T x13 = x1 x2 x3 . (2.10) Vì các ma trận A1 và B1 là ma trận hằng số, hệ thống (2.9) là xác định và x4 , x5 cùng x6 được coi là các đầu vào của hệ thống. Hơn nữa, vì ma trận B1 = 03×2 , hệ thống (2.9) không bị ảnh hưởng trực tiếp bởi đầu vào và nhiễu đầu vào bất định. Vì f4 (x), f5 (x) và f6 (x) là các hàm phi tuyến, bằng cách khai triển Taylor, chúng có thể được biểu diễn chính xác như sau x46 = A2 x + B2 u + ∆(x, u) ˙ (2.11) trong đó ∆(x, u), có kích thước 3 × 1, là phần dư của chuối Taylor cho các hàm f4 (x), f5 (x) và f6 (x) tại xe ,       x4 0 a42 0 a44 a45 0 b4 b4 x46 =  x5  , A2 = 0 a52 0 a54 a55 0  , B2 = b5 b5  . x6 , 0 0 0 0 0 a66 b6 −b6 5
T Vì rank(B2 ) = 2, nghịch đảo của ma trận B2 B2 tồn tại. Cho nên, ∆(x, u) có thể được viết như sau ∆(x, u) = B2 d, (2.12) trong đó d = (B2 B2 )−1 B2 ∆(x, u). T T (2.13) Nói cách khác, ∆(x, u) thuộc không gian ảnh của B2 . Khi các tham số của xe là bất định, hệ thống (2.11) có thể được biểu diễn như sau x46 = (A2 + ∆A2 )x + (B2 + ∆B2 )u + ∆(x, u). ˙ (2.14) Nó tương đương với x46 = A2 x + B2 u + ∆u (x, u), ˙ (2.15) trong đó ∆u (x, u) = ∆(x, u) + ∆A2 x + ∆B2 u. (2.16) Tương tự, ta có ∆u (x, u) = B2 du , (2.17) trong đó du = (B2 B2 )−1 B2 ∆u . T T (2.18) Trong trường hợp này, ∆u (x, u) cũng nằm trong không gian ảnh của B2 . Từ các phương trình (2.9), (2.15) và (2.17), ta thu được x = Ax + B(u + du ), ˙ (2.19) trong đó: A1 B1 x A= ,B = x = 13 . (2.20) A2 B2 x46 Vì vậy, tính bất định của hệ thống (2.19), cũng là kết hợp giữa tính bất định của hệ thống (2.9) và hệ thống (2.15) là: 03×1 ∆l = (2.21) ∆u Thì (B T B)−1 B T ∆l =(B2 B2 )−1 B2 ∆u T T (2.22) =du , vì rank(B) = 2. Điều này có nghĩa là: ∆l = Bdu . (2.23) Do đó, ∆l thuộc không gian ảnh của B. Có nghĩa rằng tính bất định của hệ thống (2.6) có thể được mô tả bởi nhiễu đầu vào bất định du . Khi có nhiễu đầu vào chưa biết di tác động vào xe, hệ thống (2.19) trở thành x = Ax + B(u + dc ), ˙ (2.24) 6
trong đó: dc = du + di . (2.25) Vì thế, nhiễu tổng dc biểu diễn cả đầu vào bất định và sự bất định của mô hình. Hệ thống (2.24) là một mô hình tuyến tính biểu diễn chính xác hệ phi tuyến (2.6). 2.3 Điều khiển tối ưu dựa trên quy hoạch động thích nghi Giải thiết 2.1. Giả thiết tồn tại một luật điều khiển phản hồi ổn định tiệm cận toàn cục u0 tại gốc tọa độ, trên một miền Ω cho hệ (??) với hàm chi phí (??) tương ứng là hữu hạn. Một luật điều khiển thỏa mãn giả thiết trên được gọi là luật điều khiển ổn định chấp nhận được [85]. Giải thiết 2.2. Giả sử tồn tại số tự nhiên l0 và δ > 0 sao cho với mọi L ≥ l0 ta có: Φ1 (x(t)) − Ψ1 (x(t + T ))   . . .     L   1 T  ΦN1 (x(t)) − ΨN1 (x(t + T ))  θ θk,i ≥ δIN1 +N2 với θk,i =   t+T  (2.26) L i=0 k,i  t (u − uk )T Rwk+1 Ψ1 (x)dτ  T   . .   .  t+T T T t (u − uk ) Rwk+1 ΨN2 (x)dτ Giải thiết 2.3. Giả thiết hệ kín là ổn định ISS khi nhiễu khai phá được áp dụng vào luật điều khiển. Định lý 2.1 (1 ). Với các giả thiết 2.1, 2.2, 2.3, hệ kín sẽ ổn định tiệm cận tại gốc tọa độ nếu: q(x) > (uk+1 − uk+1 )T R(uk+1 − uk+1 ), ∀x ∈ Ω/{0}. ˆ ˆ (2.27) 2.4 Kết luận Trong chương này, em đã trình bày mô hình toán của xe hai bánh tự cân bằng (2.6). Mô hình này gồm có hai đầu vào là mô men tác độc lên bánh trái τL và mô men tác động lên bánh phải τR . Đầu ra quan tâm của mô hình gồm góc nghiêng của thân xe theo phương thẳng đứng θ, góc hướng của xe trong hệ tọa độ toàn cục Ψ và vị trí xe theo hướng chuyển động x. Từ góc hướng và vị trí xe, ta có thể tính ra được tọa độ của xe trong hệ trục tọa độ toàn cục xC , yC . Dựa trên mô hình toán (2.6), một mô hình tuyến tính tương đương có nhiễu đầu vào và bất định mô hình (2.24) đã được đề xuất sử sụng khai triển Taylor tại điểm cân bằng và xấp xỉ bậc nhất. Mô hình tuyến tính tương đương này sẽ được sử dụng để thiết kế các bộ điều khiển ở chương sau. Ngoài ra, trong chương này một bộ điều khiển ADP dựa trên cấu trúc Actor-Critic cũng được thiết kế cho mô hình phi tuyến (2.6). Tuy nhiên bộ điều khiển này chưa giải quyết được vấn đề nhiễu tác động ở đầu vào. 1 Khanh G. Tran et al., "Điều khiển xe hai bánh tự cân bằng mô hình bất định dựa trên phương pháp quy hoạch động thích nghi" Hội nghị khoa học toàn quốc lần thứ nhất về Động lực học và Điều khiển, 2019 7
Chương 3: Xây dựng bộ điều khiển thích nghi bền vững 3.1 Thiết kế bộ điều khiển thích nghi bền vững với bộ quan sát nhiễu đầu vào tổng 3.1.1 Thiết kế bộ quan sát nhiễu tổng Trong phần này, một bộ quan sát nhiễu đầu vào [79] được trình bày và áp dụng cho hệ thống (2.24). Sử dụng phương pháp Euler, ta có một mô hình gián đoạn xấp xỉ của hệ thống (2.24) như sau xk ≈ Ad xk−1 + Bd (uk + dc ), k (3.1) trong đó: Ad =I + Ts A, (3.2) Bd =Ts B, I là ma trận đơn vị, và Ts là thời gian lấy mẫu. Một mô hình tham chiếu sẽ được sử dụng để ước lượng nhiễu dc như sau k ˆc z k = Ad z k−1 + Bd (uk − dk−1 ), (3.3) ˆc trong đó dk−1 là nhiễu được ước lượng ở thời điểm trước đó k − 1. Do đó, hệ thống ˆc (3.1) có bù nhiễu dk−1 được biểu diễn là ˆc xk ≈ Ad xk−1 + Bd (uk + dc − dk−1 ) (3.4) k và hệ thống (2.24) với bù nhiễu xấp xỉ trở thành c ˙ ˆ x = Ax + B(u + dc − d ), (3.5) Trừ (3.3) từ (3.4) nhận được xk − z k ≈ Ad xk−1 − Ad z k−1 + Bd dc k (3.6) Do đó sẽ có sai lệch δ k trong phương trình (3.6), nó cũng là sai số xấp xỉ của hệ thống (3.1) do quá trình gián đoạn hóa, như sau δ k = xk − z k − Ad xk−1 + Ad z k−1 − Bd dc . k (3.7) Định nghĩa một hàm mục tiêu: Jk (dc ) = δ T δ k → min. k k (3.8) Thì một ước lượng tối ưu của dc là k ˆc dk = (Bd Bd )−1 Bd [xk − z k − Ad xk−1 + Ad z k−1 ]. T T (3.9) Với mô hình tham chiếu (3.3), có thể chọn z k−1 = xk−1 với ∀k. Do đó, phương trình (3.9) trở thành ˆc dk = (Bd Bd )−1 Bd [xk − z k ]. T T (3.10) 8
Giá trị đúng của nhiễu tổng là: dc = (Bd Bd )−1 Bd [xk − z k − δ k ]. k T (3.11) Do đó, sai số ước lượng là ˆc dk − dc = (Bd Bd )−1 Bd δ k . T T (3.12) k Tuy nhiên, δ k thì tỉ lệ với Ts2 vì sai số cục bộ [47]. Do đó, sai số ước lượng có thể làm nhỏ bằng cách giảm thời gian lấy mẫu Ts . Nhiễu tổng ước lượng được dùng để bù hệ thống (2.24) như trong (3.5), trong đó ˆc ˆc d (t) = dk−1 (3.13) ˆc ∀t, kTs ≤ t < (k + 1)Ts , and ∀k = 0, 1, ...,. Chú ý rằng nhiễu tổng ước lượng d (t) giống như một chuỗi hàm bước nhảy. 3.1.2 Phân tích tính ổn định của hệ kín Giải thiết 3.4. dc (t) là liên tục ∀t ≥ 0 và d c dt d (t) bị chặn. Giải thiết 3.5. Tồn tại một bộ điều khiển phản hồi trạng thái u = −Kx thỏa mãn điều kiện ma trận A − BK là Hurwitz (tất cả phần thực của các giá trị riêng đều âm). Bổ đề 3.1. Với giả thiết 3.4, hệ thống (3.5) với bộ điều khiển phản hồi trạng thái K thỏa mãn giả thiết 3.5 là ổn định đầu vào tới trạng thái (ISS). Tóm lại, bộ điều khiển phản hồi trạng thái với nhiễu đầu vào là ˆc u(t) = −Kx − d (t), (3.14) trong đó ma trận khuếch đại K có thể được thiết kế sử dụng các phương pháp hiện có như điều khiển LQR, phương pháp gán điểm cực hoặc thậm chí là điều khiển H∞. Bộ điều khiển đề xuất không chỉ đơn giản về thiết kế mà còn cả về vấn đề cài đặt. Hơn nữa, bộ điều khiển này có thể xử lý được bất định mô hình và nhiễu đầu vào của xe. Trong phần tiếp theo, bộ điều khiển bám quỹ đạo sẽ được đề xuất cho xe có bất định mô hình và nhiễu đầu vào. 3.1.3 Thiết kế bộ điều khiển bám thích nghi bền vững cho xe Đặt xd (t) là quỹ đạo mong muốn của xe. Định nghĩa e = x − xd là sai số bám của xe. Đạo hàm bậc nhất của sai số bám và sử dụng phương trình (3.5) thu được e = Ae − xd + Axd + B(u + γ). ˙ ˙ (3.15) trong đó γ đã được định nghĩa trước ở trong phần chứng mình của Bổ đề 3.1. 9
Định lý 3.2. Sai số bám sẽ bị chặn hay e(t) sẽ tiến về vùng chứa gốc 0 khi sử dụng luật điều khiển sau utr = −Ke − (BB T )−1 B T (Axd − xd ), ˙ (3.16) trong đó K thỏa mãn giả thiết 3.5. Tóm lại, bộ điều khiển bám quỹ đạo là ˙ ˆc u(t) = −Ke − (BB T )−1 B T (Axd − xd ) − d (t). (3.17) Để ước lượng nhiễu, các phương trình (3.3) và (3.10) sẽ được dùng , trong đó [(Bd Bd )−1 Bd ]2×6 là một ma trận hằng số, nó được tính từ trước một lần duy nhất. T T Điều này cũng đúng với việc tính toán ma trận[(BB T )−1 B T ]2×6 . Do đó, việc tính toán của tín hiệu điều khiển chỉ liên quan tới nhân và cộng véc tơ/ ma trận, do đó nó sẽ đơn giản khi cài đặt. Đây là một ưu điểm của phương pháp đề xuất so với phương pháp khác chẳng hạn như các công trình [50,41]. Trong công trình [50], một số tính toán tích phân liên quan tới luật thích nghi phải được thực hiện để có được các tín hiệu điều khiển và nhiễu đầu vào cũng không được xem xét trong quá trình thiết kế và mô phỏng. Trong công trình [41], tuyến tính hóa mô hình và giải phương trình đại số Riccati được thực hiện để có được ma trận khuếch đại điều khiển trong mọi chu kỳ, cho nên khối lượng tính toán là rất lớn khi cài đặt. 3.2 Thiết kế bộ điều khiển thích nghi bền vững dựa trên quy hoạch động xấp xỉ tuyến tính và bộ quan sát Khi thành phần tác động ở đầu vào dc được bù bằng bộ ước lượng bất định đầu ˆc vào d . Khi đó, mô hình (2.24) có dạng: x = Ax + B(u + ed ), ˙ (3.18) với sai số ước lượng ed giả thiết là đủ nhỏ. Với chiến lược điều khiển: c ˆ u = −Kk x − dk + en , (3.19) trong đó en đóng vai trò là tín hiệu nhiễu khai phá. Với chiến lược điều khiển (3.19), hệ thống (3.20) có dạng: x = Ak x + Ben , ˙ (3.20) trong đó Ak = A − BKk . Định nghĩa hàm: Vk (x) = xT Pk x, (3.21) Ta có: d T (x Pk x) =xT (AT Pk + Pk Ak )x − 2eT B T Pk x. k n (3.22) dt 10
d T (x Pk x) = − xT Qk x − 2eT RKk+1 x, n (3.23) dt T trong đó Qk = Q + Kk RKk . Tích phân hai vế của (3.22) trong khoảng thời gian bất kỳ [t, t + δt] ta có: xT (t + δt)Pk x(t + δt) − xT (t)Pk x(t) t+δt +2 eT RKk+1 x(t)dτ n (3.24) t t+δt =− xT (t)Qk x(t)dτ t (3.24) được gọi là phương trình lặp chiến lược online. Nó chỉ phụ thuộc vào các trạng thái đo được và tín hiệu điều khiển tác động vào đối tượng mà không cần biết về thông tin của mô hình. Phương trình này có thể được dùng để tính Pk và Kk+1 . Sử dụng tính chất của phép nhân Kronecker vec(XY Z) = (Z T X)vec(Y ), (3.25) ta có: xT Pk x =(xT xT )vec(Pk ) (3.26) eT RKk+1 x =(xT n (eT R))vec(Kk+1 ) n Áp dụng các công thức trên, ta có thể viết lại phương trình (3.24) thành: t+δt t+δt T vec(Pk ) xT xT +2 t (x (eT R))dτ n t vec(Kk+1 ) t+δt (3.27) =− xT Qk xdτ t Áp dụng cho nhiều khoảng thời gian khác ta thu được hệ phương trình tuyến tính sau: vec(Pk ) Θk = Ξk . (3.28) vec(Kk+1 ) Giải thiết 3.6 (86). Với mọi k = 0, 1, 2, ..., tồn tại một số nguyên dương đủ lớn lk sao cho điều kiện sau được thỏa mãn: n(n + 1) rank(Θk ) = + mn. (3.29) 2 Để thỏa mãn giả thiết trên, thường chọn lk ≥ n(n + 1) + 2nm. Bộ điều khiển thích nghi bền vững dựa trên quy hoạch động xấp xỉ tuyến tính được trình bày dưới dạng thuật toán như sau (on-policy): Định lý 3.3. Đặt K0 là một ma trận phản hồi ổn định và (Pk , Kk+1 ) thu được thuật toán trên. Thì các tính chất sau thỏa mãn dưới giả thiết 3.6: 11
Bước Thực hiện 1 ˆ Khởi tạo bộ điều khiển ổn định K0 , khởi tạo giá trị đầu d0 . c 2 ˆ Dùng u = −Kk x − dk + en làm bộ điều khiển, thu thập lk mẫu, tính Θk và Ξk . 3 Tính Pk và Kk+1 từ (3.28) 4 |Pk − Pk+1 | < ϵ với k ≥ 1. k = k + 1. Đúng sang bước 5, sai về bước 2. 5 Sử dụng bộ điều khiển u = −Kk x − dk−1ˆ Bảng 3.1: Thuật toán ADP tuyến tính on-policy. 1) Ak là Hurwitz 2) P ∗ ≤ Pk+1 ≤ Pk 3) limk→∞ Kk = K ∗ , limk→∞ Pk = P ∗ . Thuật toán trên có nhược điểm là cả hai ma trận hệ thống Θk và Ξk đều phụ thuộc vào Kk . Do đó, thuật toán học không trực tuyến (off-policy) được đề xuất như sau: Từ tính chất của phép nhân Kronecker ta có: xT Qk x = (xT xT )vec(Qk ), (3.30) và (u + Kk x)T RKk+1 x = [(xT xT )(In Kk R) + (xT T uT )(In R)]Kk+1 (3.31) Với l nguyên dương bất kỳ, định nghĩa: δx = [x x|t1 +δt , t1 x x|t2 +δt , t2 ..., x x|tl +δt ]T tl (3.32) t1 +δt t2 +δt tl +δt T Ix = x xdτ, x xdτ, ..., x xdτ (3.33) t1 t2 tl t1 +δt t2 +δt tl +δt T Iu = x udτ, x udτ, ..., x udτ (3.34) t1 t2 tl ˆc với t1 < t2 < ... < tl , u = u0 − d . Với bất kỳ bộ điều khiển Kk ổn định nào ta có: vec(Pk ) Θk = Ξk (3.35) vec(Kk+1 ) với T Θk = [δx , −2Ix (In Kk R) − 2Iu (In R)] (3.36) Ξk = −Ix vec(Qk ) (3.37) 12
Bước Thực hiện 1. Khởi tạo Xác định K0 ổn định. Đặt k = 0. 2. Thu thập dữ liệu ˆc Điều khiển với u = −K0 x − d + en . Tính δx , Ix , Iu theo (3.32), (3.33) và (3.34) cho tới khi giả thiết 3.7 thỏa mãn. 3. Đánh giá chiến lược Tính Pk và Kk+1 theo (3.35). 4. Lặp off-policy k = k + 1, lặp lại bước 3 cho đến khi Pk − Pk−1 < ϵ với k ≥ 1. 5. Kết thúc học ˆc Sử dụng u = −Kk x − d làm chiến lược điều khiển tối ưu xấp xỉ. Bảng 3.2: Thuật toán ADP tuyến tính không trực tuyến (off-policy) Giải thiết 3.7 (86). Tồn tại một số nguyên dương đủ lớn l > 0 sao cho n(n + 1) rank([Ix Iu ]) = + mn (3.38) 2 Ta có thuật toán quy hoạch động xấp xỉ tuyến tính off-policy như sau: Định lý 3.4. Đặt K0 là một ma trận phản hồi ổn định và (Pk , Kk+1 ) thu được thuật toán trên. Thì các tính chất sau thỏa mãn dưới giả thiết 3.7: 1) Ak là Hurwitz 2) P ∗ ≤ Pk+1 ≤ Pk 3) limk→∞ Kk = K ∗ , limk→∞ Pk = P ∗ . 3.3 Kết luận Ở chương này, các bộ điều khiển phản hồi trạng thái và bộ điều khiển bám quỹ đạo dựa trên bộ ước lượng nhiễu đầu vào đã được thiết kế cho xe hai bánh tự cân bằng với nhiễu đầu vào và có tham số bất định. Đầu tiên, mô hình phi tuyến của xe được chuyển về một mô hình tuyến tính tương đương, trong đó sự bất định của mô hình và nhiễu đầu vào được biểu diễn bằng nhiễu đầu vào tổng. Sau đó, một bộ quan sát nhiễu đầu vào tổng đã được thiết kế dựa trên xấp xỉ thành phần đạo hàm của mô hình tuyến tính tương đương. Cuối cùng, các bộ điều khiển phản hồi trạng thái và bộ điều khiển bám quỹ đạo đã được thiết kế cho mô hình tuyến tính tương đương khi đã có bù nhiễu tổng ở đầu vào. Tính ổn định của hệ kín bao gồm các bộ điều khiển và bộ quan sát nhiễu đã được phân tích và chứng minh chặt chẽ. Trong chương tiếp theo, các bộ điều khiển đề xuất sẽ được kiểm chứng thông qua mô phỏng và thực nghiệm trên mô hình xe trong phòng thí nghiệm. 13
Chương 4: Kiểm chứng kết quả bằng mô phỏng và thực nghiệm 4.1 Kết quả mô phỏng 4.1.1 Phương pháp điều khiển đề xuất Nhận xét 4.1. Vì đầu vào của bộ điều khiển LQR gồm các cặp biến trạng thái ˙ ˙ (x; x), (θ; θ) và (ψ; ψ), đầu ra của nó giống như tổng các đầu ra của ba bộ điều khiển ˙ P D trong các công trình [22,9,78], trong đó mỗi cặp biến trạng thái đầu vào là đầu vào của một bộ điều khiển P D. Để so sánh chất lượng điều khiển, bốn trường hợp sau được xem xét Trường hợp 1: Mô hình là xác định và không có nhiễu đầu vào. Trường hợp 2: Mô hình là xác định và có nhiễu đầu vào, trong đó 0.3sin(t + π/6) + 0.2 di = . (4.1) 0.4sin(2t + π/4) − 0.2 Do nhiễu đầu vào là bất định và có thể thay đổi theo thời gian, trong trường hợp này nó được chọn có dạng hình sin với biên độ và tần số khác nhau đối với các thành phần nhiễu. Trường hợp 3: Mô hình là bất định tham số và có nhiễu đầu vào cũng bất định, trong đó nhiễu đầu vào giống như trường hợp 2, và tính bất định của mô hình được cho như sau ∆M = 1.235 kg, ∆m = 0.01 kg, ∆l = 0.1 m, ∆d = 0.105 m và ∆r = 0.017 m. Trường hợp 4: Sử dụng cùng kịch bản mô phỏng như trường hợp 3, nhưng quỹ đạo đặt có dạng hình tròn với ψd =0.25t + π/2 θd =0 (4.2) xd =1.125t và các bộ điều khiển (3.14), (3.17) có cùng ma trận khuếch đại K được sử dụng. Ta có thể tính được quỹ đạo đặt trong hệ trục tọa độ toàn cục N như sau: xCd = 4.5cos(0.25t) (4.3) yCd = 4.5sin(0.25t) Với ba trường hợp đầu tiên, các giá trị đặt cho vị trí, góc nghiêng và góc hướng lần lượt là 1.5 (m), 0 (rad), và 0.4 (rad). Các giá trị ban đầu của vị trí, góc nghiêng và góc hướng lần lượt là 0 (m), 0.3 (rad), và 0 (rad). Mô hình phi tuyến (2.6) được dùng để mô phỏng xe và bộ điều khiển dựa trên bộ quan sát nhiễu (3.14) được dùng cho ba trường hợp này. Các nhiễu đầu vào và các giá trị ước lượng của chúng được thể hiện trong các hình vẽ 4.1 và 4.2. 14
Có thể thấy rằng với trường hợp 1, các nhiễu ước lượng khác không trong khoảng thời gian ngắn ban đầu. Điều này gây ra bởi sai số xấp xỉ Taylor ∆(x, u) trong phương trình (2.11). Với trường hợp thứ 2, bộ ước lượng nhiễu mất nhiều thời gian hơn để đầu ra của nó bám lấy nhiễu thực so với trường hợp 1. Nhưng với trường hợp thứ 3, bộ ước lượng nhiễu phải mất 2 giây để hội tụ với sai số nhỏ. Vị trí, góc nghiêng và góc hướng của xe được thể hiện trong các hình 4.3 và 4.4. Khi có nhiễu đầu vào bất định, bộ điều khiển đề xuất vẫn đảm bảo chất lượng giống như trường hợp 1. Chất lượng này khác một ít khi cả nhiễu đầu vào bất định và bất định mô hình đều tồn tại. Do đó, bộ điều khiển đề xuất đã duy trì tốt chất lượng điều khiển mặc dù có bất định mô hình và nhiễu đầu vào không biết. Khi sử dụng bộ điều khiển LQR mà không có bộ quan sát nhiễu đầu vào, chất lượng điều khiển xấu hơn phương pháp đã được đề xuất, bởi vì có sự dao động về vị trí và góc nghiêng và sự phân kỳ của góc hướng so với giá trị đặt (xem trường hợp 3 không có bộ quan sát nhiễu trong hình 4.4). Cho nên bộ điều khiển LQR chuẩn không điều khiển được xe khi có bất định mô hình và nhiễu đầu vào. (a) Trong khoảng thời gian ngắn ban đầu. (b) Trong thời gian mô phỏng. Hình 4.1: Nhiễu đầu vào thứ nhất và ước lượng của nó. (a) Trong khoảng thời gian ngắn ban đầu. (b) Trong thời gian mô phỏng. Hình 4.2: Nhiễu đầu vào thứ hai và ước lượng của nó. 15
(a) Vị trí của xe. (b) Góc nghiêng của thân xe. Hình 4.3: So sánh vị trí và góc nghiêng của xe. Hình 4.4: Góc hướng của xe 16
˙ Hình 4.5: So sánh x, x, θ và θ ˙ ˙ Hình 4.6: Tín hiệu diều khiển, so sánh quỹ đạo, ψ và ψ. Với trường hợp thứ 4, mô hình phi tuyến (2.6) vẫn được sử dụng để mô phỏng 17