
BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
Nguyễn Minh Đông
NGHIÊN CỨU XÂY DỰNG THUẬT TOÁN THÍCH NGHI
VÀ HỌC TĂNG CƯỜNG CẤU TRÚC ACTOR-CRITIC
ĐIỀU KHIỂN BÁM QUỸ ĐẠO CHO ROBOT DI ĐỘNG
ĐA HƯỚNG MECANUM
LUẬN ÁN TIẾN SĨ
KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
Hà Nội - 2025

BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
Nguyễn Minh Đông
NGHIÊN CỨU XÂY DỰNG THUẬT TOÁN THÍCH NGHI
VÀ HỌC TĂNG CƯỜNG CẤU TRÚC ACTOR- CRITIC
ĐIỀU KHIỂN BÁM QUỸ ĐẠO CHO ROBOT DI DỘNG
ĐA HƯỚNG MECANUM
LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
Mã số: 9 52 02 16
Xác nhận của Học viện
Khoa học và Công nghệ
Người hướng dẫn 1
(Ký, ghi rõ họ tên)
TS. Ngô Mạnh Tiến
Người hướng dẫn 2
(Ký, ghi rõ họ tên)
PGS. TS Đào Phương Nam
Hà Nội - 2025

i
MỤC LỤC
LỜI CAM ĐOAN ..................................................... Error! Bookmark not defined.
LỜI CẢM ƠN ........................................................... Error! Bookmark not defined.
MỤC LỤC ................................................................................................................... i
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ............................................... iii
BẢNG KÝ HIỆU CỦA CÁC THAM SỐ .................................................................. v
DANH MỤC CÁC BẢNG BIỂU ............................................................................ vii
DANH MỤC CÁC HÌNH VẼ................................................................................. viii
MỞ ĐẦU ..................................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN VỀ ROBOT DI ĐỘNG ĐA HƯỚNG ......................... 6
1.1. Tổng quan về robot di động ............................................................................. 6
1.2. Robot di động đa hướng mecanum .................................................................. 8
1.3. Mô hình toán học robot di động đa hướng mecanum .................................... 11
1.3.1. Cấu tạo bánh xe mecanum ...................................................................... 11
1.3.2. Phương trình động học robot di động bốn bánh xe mecanum ................ 13
1.3.3. Phương trình động lực học robot di động bốn bánh xe mecanum .......... 15
1.4. Cấu trúc hệ thống điều khiển robot di động ................................................... 18
1.5. Tổng quan tình hình nghiên cứu trong và ngoài nước ................................... 20
1.5.1. Tình hình nghiên cứu trong nước ............................................................ 20
1.5.2. Tình hình nghiên cứu ngoài nước ........................................................... 22
1.6. Kết luận chương 1 .......................................................................................... 24
CHƯƠNG 2. THUẬT TOÁN ĐIỀU KHIỂN BÁM QUỸ ĐẠO CHO ROBOT DI
ĐỘNG ĐA HƯỚNG MECANUM ........................................................................... 25
2.1. Bộ điều khiển PID điều khiển bám quỹ đạo cho FMWR .............................. 25
2.2. Bộ điều khiển trượt cơ bản cho FMWR ......................................................... 26
2.3. Thuật toán điều khiển Backstepping - SMC .................................................. 28
2.3.1. Thiết kế thuật toán ................................................................................... 28
2.3.2. Mô phỏng thuật toán ............................................................................... 31
2.4. Thuật toán điều khiển mặt trượt động cho FMWR ........................................ 32
2.5. Mô phỏng thuật toán PID, SMC và DSC trên Matlab/Simulink ................... 35
2.6. Đề xuất thuật toán điều khiển mặt trượt động chỉnh định thích nghi mờ cho
robot di động đa hướng mecanum (Fuzzy-DSC-FMWR) ........................................ 41

ii
2.6.1. Thiết kế thuật toán Fuzzy-DSC-FMWR ................................................. 41
2.6.2. Mô phỏng và đánh giá kết quả ................................................................ 43
2.7. Kết luận chương 2 .......................................................................................... 56
CHƯƠNG 3. THUẬT TOÁN HỌC TĂNG CƯỜNG ĐIỀU KHIỂN BÁM QUỸ
ĐẠO CHO ROBOT DI ĐỘNG ĐA HƯỚNG MECANUM .................................... 57
3.1. Cơ sở phương pháp luận nghiên cứu ............................................................. 57
3.1.1. Mạng nơ-ron xấp xỉ hàm ......................................................................... 57
3.1.2. Ổn định bị chặn tới hạn đều (UUB- Uniformly Ultimate Bounded) ...... 59
3.2. Thuật toán quy hoạch động (ADP- Adaptive Dynamic Programming) ........ 60
3.3. Thiết kế thuật toán học tăng cường cho bài toán điều khiển bám quỹ đạo .... 69
3.3.1. Biến đổi mô hình động lực học FMWR .................................................. 69
3.3.2. Bộ điều khiển tối ưu và phương trình HJB ............................................. 70
3.3.3. Thuật toán Actor- Critic On-policy ......................................................... 72
3.3.4. Xét tính ổn định cho hệ thống ................................................................. 75
3.3.5. Mô phỏng thuật toán ............................................................................... 78
3.4. Kết luận chương 3 .......................................................................................... 89
CHƯƠNG 4. THỰC NGHIỆM VỚI MÔ HÌNH ROBOT DI ĐỘNG ĐA HƯỚNG
MECANUM .............................................................................................................. 91
4.1.1. Thiết kế cơ khí cho FMWR .................................................................... 91
4.1.2. Thiết kế mạch điều khiển cho FMWR .................................................... 92
4.2. Hệ điều hành ROS .......................................................................................... 94
4.3. Chạy thử nghiệm mô hình trên Gazebo ......................................................... 95
4.4. Thực nghiệm mô hình robot ........................................................................... 97
4.5. Kết luận chương 4 ........................................................................................ 105
KẾT LUẬN VÀ KIẾN NGHỊ................................................................................. 107
DANH MỤC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ CỦA TÁC GIẢ . Error!
Bookmark not defined.
TÀI LIỆU THAM KHẢO ......................................... Error! Bookmark not defined.
PHỤ LỤC ......................................................................................................................

iii
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Chữ viết tắt
Tiếng Anh
Tiếng việt
AC
Actor- Critic
Cấu trúc Actor – Critic
AC-NNs
Neural Networks Actor Critic
Cấu trúc điều khiển mạng nơ-ron
Actor Critic
Actor NN
Actor Neural Network
Mạng nơ-ron Actor
ADP
Adaptive-Dynamic-
Programming
Thuật toán thích nghi quy hoạch
động
AGV
Automation Guided Vehicle
Robot di động
Critic NN
Critic Neural Network
Mạng nơ-ron Critic
DSC
Dynamic Surface Control
Điều khiển mặt trượt động
FMWR
Four Mecanum Wheeled Robot
Robot di động đa hướng mecanum
FMWR-ME
Four Mecanum Wheel Robot -
Mass Eccentricity
Robot di động đa hướng mecanum
lệch trọng tâm
Fuzzy-DSC
Adaptive Fuzzy Dynamic
Surface Control
Điều khiển mặt trượt động chỉnh
định thích nghi mờ
HJB
Hamilton-Jacobi-Bellman
Phương trình Hamilton Jacobi
Bellman
HJI
Hamilton Jacobi Isaacs
Phương trình vi phân và đạo hàm
riêng
MSSC
Multi Surface Sliding Control
Thuật toán điều khiển đa mặt trượt
NCS
Nghiên cứu sinh
NN
Neural Network
Mạng nơ-ron nhân tạo
NNs
Neural Network
Mạng nơ-ron
Off-Policy
IRL
Integral Reinforcement
Learning Off-Policy
Luật điều khiển ngoại tuyến với
thuật toán học tăng cường
PE
Persistence of Excitation
Điều kiện PE
PI
Policy- Iteration
Thuật toán vòng lặp để xấp xỉ
nghiệm tối ưu cho luật điều khiển
PID
Proportional Integral
Derivative
Bộ điều khiển vi tích phân tỉ lệ
RISE
Robust Integral of the Sign of
the Error
Tích phân bền vững của sai lệch