Sử dụng bộ điều khiển nơron được tối ưu bằng giải thuật di truyền trong mạch truyền thẳng điều khiển robot bằng phương pháp tính momen.
Tác giả: Nguyễn Trần Hiệp - Học viện Kỹ thuật Quân sư. Phạm Thượng Cát - Viện Công nghệ Thông tin.
và robot sẽ được điều khiển bám sát quỹ đạo mong muốn. Vì ma trận H là xác định dương và khả đảo nên từ hình 1 và công thức 1.1 vòng điều khiển kín có dạng:
uq =&&
u
k +
+
+
=
dτ )
q &&
t ∫
ek & iDi
di
iI
(τe i
ek i Pi
i
0
(1.3) Như vậy hệ kín có dạng là n tích phân riêng biệt điều khiển độc lập n khớp và tín hiệu điều khiển độc lập tại mỗi khớp sẽ là: (1.4)
q& d&
q
d
P
qd
u
Robot
H(q)u
τ
D
q& & +
I
Tính: q),qh( + & + e + K ∫ + eKdteK &
dq&
q&
~ HH ≠
~ hh ≠
;
1-
Khi ma trận H và vector h giả thiết được xác định chính xác, hệ thống sẽ là ổn định tiệm cận nếu các hệ số kDi, kPi, kIi và thậm chí không còn xuất hiện dao động và độ quá chỉnh trong hệ thống [18]. Thực tế, ma trân H và vector h không thể biết được chính xác ~ mà chúng ta chỉ nhận được một giá trị ước lượng H ~ ( ~ ). Thay thế các giá trị ước lượng H và h ~ vào phương trình động lực học của robot ta và h nhận được:
(
)h-hHuHq ) ~ 1- H + =&&
Hình 1: Phương pháp điều khiển tính momen
(11)
q),qh(
H(q)u
τ
=
&+
Tóm tắt: Phương pháp tính momen là một phương pháp phổ biến trong điều khiển robot hiện đại. Nó cho phép loại bỏ được tất cả các thành phần phi tuyến và liên kết chéo trong robot. Nhược điểm của phương pháp này là các tham số phi tuyến thường không được ước lượng chính xác và quá trình tính toán phức tạp đòi hỏi thời gian thực. Vì vậy trong thực tế dao động và quá chỉnh thường xuyên xuất hiện khi điều khiển bằng phương pháp tính momen. Mạng nơron và thuật di truyền có thể cho phép khắc phục được những nhược điểm này. Bài báo này giới thiệu việc sử dụng mạng nơron được tối ưu bằng thuật di truyền thực hiện tính toán chính xác các tham số phi tuyến và liên kết chéo của hệ robot. Hệ điều khiển được kiểm chứng bằng MATLAB SIMULINK 6.0 trên cánh tay máy hai bậc tự do. Abstract: The computed torque method is very popular in modern in rorbot control. The computed torque method involes computation and cancellation of all non-linearities and cross-coupling terms. The disadvantage of this method is the misestimation of non – linear parametes and the computation complexity of the real-time implementation. In practice oscillation and overshoot always occurs when computed torque method applicated. The drawbacks of this method are overcome by Neural network and genetic algorithm. This paper presents a neural netwokr optimied by genetic algorithm to correct computation of all non-linearities and cross-coupling terms.. The controller was tested through simulation by MATLAB simulink 6.0 on the 2 – DOF manipulator. 1. Đặt vấn đề. Phương pháp tuyến tính hoá phản hồi hay còn được gọi là phương pháp tính momen là một phương pháp điều khiển hiện đại trong công nghiệp robot. Bộ điều khiển được thực hiện trên cơ sở tách riêng mô hình động lực học của robot thanh hai phần tuyến tính và phi tuyến, do đó các thành phần như trọng lực, lực ma sát, momen hướng tâm, lực Coriolis .v.v. sẽ được bù đủ [18] [20]. Khi đó, bộ điều khiển PD hay PID được sử dụng để điều khiển vị trí của robot tiệm cận với quỹ đạo mong muốn. Sơ đồ hệ điều khiển tính momen được biểu diễn như sau: Dựa vào sơ đồ trên ta viết được phương trình:
(1.2)
K
e(τ
=
+
τ +
)
t ∫
&&
eKqu + d
P
I
eKd & D
0
( ~ (1.5) Rõ ràng phương trình này khác với phương trình 1.3 và vì vậy luật điều khiển tính momen như trên sẽ gây ra sai số. Trong thực tế phương pháp này phần nào khắc phục được tính không xác định của mô hình vì hệ thống đã tính đến các thành phần phi tuyến của đối tượng điều khiển và sai số của điều khiển phụ thuộc vào mức độ sai lệch giữa H(θ) và
~ (θH ; )
h(q, & )q
−
Trong đó e = qd – q;
qe = & &
d
~ )q(q,h &
1
. Một khó khăn nữa của phương pháp tính và momen là đòi hỏi thực hiện ở chế độ thời gian thực. Việc tính toán như vậy đòi hỏi những hệ tính toán q & KI , KP, KD là các ma trận đường chéo xác định dương. Nếu ma trận H và vector h được xác định chính xác thì momen τ cũng được xác định chính xác
~ (θH , )
~ )q(q,h &
(1.6) 2. Điều khiển robot hai bậc tự do sử dụng ANN được tối ưu bằng GAs theo phương pháp tính momen. Xét một mô hình robot hai bậc tự do được mô tả như hình 1.3. Phương trình chuyển động của robot hai bậc tự do có sơ đồ như hình 1.3 được viết như sau: &&
)H(
=θθ+θθ
T
2
τ
R
& τ),h( là momen của khớp robot.
1
T
2
θ
R
1
~ (θH , )
Biểu diễn góc quay của khớp robot.
~ q(q,h &
là ma trận quán tính của robot có các phần
⎤
H
I
2l
l
l
cos
θ
+
+
+
(1.7)
[ ] ∈ττ= , 2 [ ] ∈θθ= , 2 ( ) 2x2R H ∈θ tử được cho như sau: m2 + g1
I += 1
m l 1
11
2
2 g2
l n1
2
2 n1
2
)⎥⎦
⎤
H
H
l2
cos
=
+
g2 ( θ
21
2 2g
2
l 2g1n
2
12
(1.8)
( )⎥⎦
H
⎡ ⎢⎣ ⎡ lmI += ⎢⎣ 2 lmI += 2
22
2 2g2
~ và
(1.9)
n rob
biểu diễn thành phần của lực
2R)q
h(q, ∈&
y
khớp
I2, m2
ln2
θ2
ln1
lg2
I1, m1
lg1
khớp
θ1
x Hình 1.3: Biểu diễn robot hai bậc tự do
Thuật học (GAs)
lm
(1.10) Chỉnh trọng số wij
sin
2
h
−=
θ
)(
)
(
2
2
1
2
1
I1, I2 là momen quán tính của khớp thứ nhất và khớp thứ hai lg1, lg2 ;ag khoảng cách từ khớp thứ nhất và khớp thứ hai đến trọng tâm của khớp một và hai. ln1; ln2 là chiều dài của khớp một và khớp hai. m1; m2 là khối lượng của khớp một và khớp hai. mm1; mm2 là khối lượng của động cơ khớp một và khớp hai. Vector Coriolis và trọng lực của hai khớp: & & & l θθ+θ 2g1n2
dq&&
(1.11)
sin
lmh =
(
l 2g1n2
2
&) θθ 1 2
q
d
P
qd
D
I
+ + eKq && + ∫ + eKdteK &
Robot Mạng Nơron τ (ANN)
dq&
q&
Với các tham số của robot được cho như sau: Khớp thứ Khớp thứ
nhất hai
50.0 50.0 Trọng lượng khớp mij [kg] Hình 2: H ệ điều khiển tính momen d ùng ANN v à thuật học G As 5.0 5.0 Trọng lượng của động cơ
2
mmi [kg] phức tạp và đắt tiền. Để nâng cao chất lượng của điều khiển theo phương pháp phản hồi tuyến tính trong kỹ thuật điều khiển nói chung hay trong điều khiển robot nói riêng đã có nhiều nghiên cứu được đề xuất. Chủ yếu tập trung vào việc tính toán một cách chính xác và và nhanh chóng các giá trị ước lượng P, KI, KD của bộ điều khiển. Chẳng hạn các hệ số K như Keigo và Mohamad sử dụng ANN hay như đề xuất của Nguyễn Công Định sử dụng GAs và Fuzzy để xác định các hệ số KP, KI, KD tối ưu của bộ điều khiển [20]. Một phương pháp nữa là sử dụng ANN để ) xác định chính xác các giá trị ước lượng mà M .Rodi và R.Safaric đã sử dụng [7][16][17]. Các phương pháp sử dụng ANN như đã trình bày ở trên đều sử dụng thuật học BP. Vấn đề chính là ở chỗ thuật học BP và các thuật học khác sử dụng nguyên lý gradient suy giảm không có khả năng hội tụ toàn cục. Chỉ có giải thuật di truyền (GAs) mới có khả năng làm cho quá trình học của ANN tiến tới hội tụ toàn cục. Bài báo này đề xuất một phương pháp sử dụng mạng nơron nhân tạo (ANN) được học bằng GAs để ~ xác định chính xác các tham số phi tuyến H )q(q,h & u khi điề khiể ot bằng phương pháp tính momen. Khi đó đối tượng điều khiển (robot) được coi như là P, KI, KD, đảm bảo một hệ tuyến tính và các hệ số K cho hệ ổn định và có tốc độ hội tụ nhanh trong trường hợp này có thể được xác định như với hệ điều khiển PID cho các đối tượng tuyến tính. Hình 1.2 mô tả hệ điều khiển tính momen có sử dụng ANN được tối ưu tham số bằng GAs để bù các thành phần không xác định của đối tượng. Số đầu vào của ANN như trên hình 1.2 chính là các biến trạng thái và đạo hàm của chúng, tín hiệu u trên đầu ra của bộ lấy tích phân, tín hiệu điều khiển τ tác động lên đối tượng được tạo ra trên đầu ra của ANN. Thuật di truyền (GAs) đóng vai trò giám sát sẽ thay đổi các trọng số liên kết của ANN để tìm được tập hợp trọng số tối ưu sao cho chất lượng của điều khiển là tốt nhất. e e& e&& Hệ số KP, KI, KD
10.0 10.0
Quán tính của khớp Ili [kg.m2]
0.01 0.01 obot trong trường hợp này có Quán tính của động cơ Imi [kg.m2]
1.0 1.0 Khoảng cách li [m]
u1
Chỉnh trọng
+
0.5 0.5 Khoảng cách lgi [m]
+
Hệ số giảm tốc của hộp số 100 100
+
e&
+
+
+ KI1
GAs
ANN
Ro bot
d1
kri KD1 Quỹ đạo mong muốn của robot được giả thiết là KP1 hàm thời gian của vị trí, vận tốc và gia tốc góc [21]: ∫ edt
cos
t π
=
θd2(t) = 0.5 sin (πt) + 1.0 & θ π
sin
−=
π
50 .
)
(
(
θ
&& θ
2
2
d2
θd1(t) = 0.5 cos (πt); & 50 t θ π . ) KI2 ∫ edt
sin
t π
&& θ
π
−=
cos
π
−=
t2d )( t )(
(
)
50 .
t1d )( t )(
(
50 .
; ; t π )
2d
++
d2
++
KP2
Chỉnh trọng
++ u2
KD2
&& θ 1d Mục đích của bài toán điều khiển là tìm momen tác động lên các khớp của robot để robot chuyển động đến vị trí mong muốn thoả mãn các yêu cầu của quá trình điều khiển. Sai số của mô hình robot, sự thay đổi các tham số của robot, vị trí và đạo hàm của tín hiệu phản hồi được dùng để tính toán chính xác tín hiệu điều khiển tác động lên robot. Do tính không xác định của mô hình robot nên phương trình 1.6 được viết:
&&
Hình 1.4: Bộ điều k n sử dụng ANN và hiển tính mome ật học GAs thu (1.12)
~ )(H
~ & τ),(h =θθ+θθ
~ (θH và )
Cấu trúc mạng nơron được biểu diễn như sau: là các giá trị ước lượng của H(θ) và
~ )q(q,h &
. Kết hợp 1.8; 1.9; 1.10và 1.11 ta có:
h(q, & )q
t
&&
&& dteKeKeKθθ +
+
+
=
d
P
d
i
&
(1.13) Thuật học GAs
∫
0 = [θd - θ] là các giá trị
)
q q& q&& qd dq& dq&& Tín hiệu e = [e1, e2]T Ch sai lệch. ỉnh trọng số Wi j
)q(q,h &
~ (θH và ~ hoàn toàn giống như thì phương trình của vector sai lệch sẽ
1
)q&
t
+
+
0dt =
D
P
I
&
1 Z2
Khi H(θ) và h(q, thoả mãn phương trình tuyến tính sau: (1.14) τ1
∫eKeKeKe + &&
0
Z3
Z4
Z5
Z6
τ2
Z7
Wi j
,
& θθ , 1 1
1
& θθ , , 2 2 ] 1 ττ ,
2
3
Lớp đầu ra Lớp đầu vào Lớp ẩn Như vậy ta có thể chọn KP, KI, KD để hệ thống này ổn định như mong muốn. Hệ điều khiển khi đó được coi như là một hệ tuyến tính, các hệ số KP, KI, KD lúc đó được chọn như khi thiết kế bộ điều khiển PID với đối tượng tuyến tính cho hệ nhiều đầu vào/ra. Các hệ số này có thể chọn theo phương pháp dễ dàng nhất như phương pháp đặt điểm cực. Với ANN có cấu trúc 6-8-2 tức là có 6 nơron trên lớp vào [ ]2 u u , 8 nơron tại lớp ẩn và 2 , nơron trên đầu ra [ . Với cấu trúc như trên hình 1.4 số lượng các liên kết của ANN sẽ là (7x8) + (9x2) = 74. Hàm tác động của các nơron tại đầu vào là hàm cực và tuyến tính, tại lớp ẩn là hàm sigmoid lưỡng của nơron tại lớp ra là hàm dấu bão hoà[10]. Hệ thống điều khiển r s ơ đồ cấu trúc như sau: Q uỹ đạo mong muốn & d1, θ θ d1, & && θ,θ d2 Hình 1.5: Cấu trúc ANN và thuật học GAs
2
5, z6, z7]
θ
,
2
1
T
2
R
τ
θθ & , , 1 1 [ ∈ττ= , 2
ải , z vào z = [z , z , z Trong đó tập hợp đầu 4 3 ]2 chính là tập hợp đầu vào [ 2 θ&, u u . , ] tìm được ph Tín hiệu điều khiển
1
thỏa mãn điều kiện làm việc th c tế của robot: ự (1.14)
τ
τ
τ≤
≤
min
max
Biểu diễn góc dự định và góc thực tế tại khớp một
0
Trong đó τ min và τmax phụ thuộc vào công suất của động cơ điều khiển tại các khớp của robot bởi vì nếu giá trị τ tối ưu tìm được nằm ngoài khoảng này thì động cơ của robot không có khả năng tạo được tín hiệu điều khiển. Giải thiết quỹ đạo mong muốn của robot qd nằm trong vùng hoạt động cho phép của robot. Điều này cho phép tìm được một giá trị τ tối ưu đảm bảo cho q →qd. Để sử dụng GAs trong quá trình học của ANN, hàm mục tiêu được chọn theo nghịc đảo c ủa giá trị sai số trung bình bình phương [2] [3] [6]:
q
q
>
nÕu
max
(
,
))
=
F
chroms
( tq
i
(
))
q
q
nÕu
≤
( Tq
F 1
max
c
⎧ ⎪ ⎨ ⎪⎩
C là ch
T u kỳ điều khiển.
q
max
là giá trị tới hạn quy định vùng làm việc
Biểu diễn vận tốc góc dự định và thực tế tại khớp một
giá trị ước lượng theo hàm mục
1
ng trung của robot. F(chromsi, q(t)) là của cá th ể thứ i. tiêu là nghịgh đảo sai số bình phươ CTqF ((1 )) bình của các biếntrạng thái tại thời điểm TC. (1.15)
qF (( 1
)) =CT
2
2
2
e
e &
(
)
)
)
(
)
e
e
−
−
T
T
(0
C
C
T C
T C
e &
)
)
e ∆+∆+∆ && ; ; e e =∆ & & là sai lệch giữa sai số cho phép
−
T
T
(0 (0
C
C
e &&
e ( &&
Biểu diễn của momen dự định và thực tế tại khớp một
i min
sec ẫu
3 sec 10 m 0.5 0.1 ± 5 17 300
e =∆ e =∆ && tại thời điểm TC và sai số thực tế tại thời điểm TC. Chương trình mô phỏng được thực hiện trên MATLAB 6.0 với các tham số của GAs được cho như sau: Chu kỳ điều khiển TC Khoảng thời gian lấy m Tỷ lệ liên kết chéo ( PC) Tỷ lệ biến đổi (Pm) Giá trị giới hạn của trọng số Wi max, W Số bit mã hóa nhị phân (có 1 bi t dấu) Kích thước của tập hợp (Psize) Các giá trị của hệ số KP, KI, KD như đã nói ở trên được xác định bằng phương pháp đặt điểm cực chọn được Ki1 = 1; KP1 = 3; KD1 = 3; KI2 = 8; KD2 = 12 v à K P2 = 6. Kết quả mô phỏng được biểu diễn như sau:
4
~ (θH và )
và sự lựa chọn các hệ số K
~ )q(q,h &
khiển phụ thuộc vào độ chính xác của các giá trị ước P, lượng KI, KD của bộ điều khiển PID. Tác giả đề xuất một phương pháp sử dụng ANN được tối ưu bằng GAs để ~ (θH và xác định chính xác các giá trị ước lượng ) ~ . Các kết quả mô phỏng trên tay máy hai bậc tự )q(q,h & do cho thấy rằng phương pháp mà tác giả đề xuất ở trên có thể là một đóng góp nhằm làm phong phú hơn các thuật học của ANN cũng như sự phong phú khi sử dụng ANN vào các quá trình điều khiển nói chung. Tài liệu tham khảo: [1] Nguyễn Trần Hiệp, Phạm Thượng Cát- Biểu diễn góc dự định và góc thực tế tại khớp hai Genetic Algorithm and its applications in Control
Engineering.
[2] Nguyễn Trần Hiệp, Phạm Thượng Cát- Nghiên
cứu bài toán dao động con lắc ngược sử dụng thuật
Gen bằng MATLAB. Hội thảo toàn quốc về phát
triển Phát triển công cụ tin học trợ giúp cho giảmg
dạy và nghiên cứu ứng dụng toán học – hà nội 4/199,
trang 326-334
[3] Nguyễn Trần Hiệp, Phạm Thượng Cát -
(1999) - Điều khiển con lắc ngược bằng phương pháp
trượt sử dụng mạng nơron được tối ưu bằng thuật gen Biểu diễn vận tốc góc dự định và thực tế tại khớp hai tr 30 – 38 Tạp chỉ KHKT số 90 năm 2000 - Học viện
Kỹ thuật Quân sự
[4] Nguyến Thanh Thuỷ, Trần Ngọc Hà, (1999)
Tích hợp kỹ thuật mạng nơron và giải thuật di truyền
trong phân tích dữ liệu. Tạp chí tin học và điều khiển
học T15, S.2
[5] Trần Văn Hãn - Đại số tuyến tính trong kỹ
thuật – Nhà xuất bản Đại học và trung học chuyên
nghiệp 1978.
[6] A. Haeussler, K. C. Ng Y. Li, D. J. Murray-
Smith, and K. C. Sharman - Neurocontrollers
designed by a genetic algorithm.
In Proc. First IEE/IEEE Int. Conf. on GA in Eng.
Syst.: Innovations and Appl., pages 536-542,
~ (θH và )
Sheffield, U.K., September 1995.
~ )q(q,h &
5
Biểu diễn của momen dự định và thực tế tại khớp hai Kết luận: Trong bài báo này, tác giả đã trình bày phương pháp khắc phục được những nhược điểm của phương pháp điều khiển tính momen. Hệ điều khiển có đặc trưng phi tuyến đượcđược đưa về hệ tuyến tính trên cơ sở bù chính xác các thành phần phi tuyến là các giá trị ước lượng . Phương pháp này đảm bảo được độ chính xác và hội tụ của hệ điều khiển. Độ chính xác và chất lượng của quá trình điều [7] Ales Hace, Riko Safaric, Karel Jezernik - Faculty of Electrical Engineering and computer Sciences University of Maribor Slovernia -Artificial
Neural Network control of Engineering at Glasgow University – Technical
for Maipulators and theory. Web site: http://robin2.r.uni- Lyapunov Reports CSC-96016. 1996.
mb.si/konference/ales/airtc95/airtc95.html. [18] J.Somlo - B.Lantos - P.T.Cat - Advanced
Robot Control. Akademiai Kiado. Budapest 1997. for control
[19] John E. Gibson – Nonlinear automatic Control, Mc Graw-Hill Book Company, Inc. 1963. [20] Keigo Watanabe, Mohammad Teshnehlab – [8] A. Guez, J. L Eilbert, M. Kam - Neural , International network Architecture Conference on Neural Networks, San Diego, California, June 21-24,, 1987, pp 22 – 25. [9] Bernard Friedland - New Jersey Institute of Intelligent Control Base on Flexible Neural Technology - Advanced Control System Design. Networks, Kluwer Academic Publishers 1999. Prentice-Hall International, Inc 1995. [21] Mohammad Teshnehlab, Keigo Watanabe – [10] Bart Kosko – Neural Networks and Fuzzy Intelligent Control Based on Flexible Neural Systems, Prentice-Hall, Inc. Asimon & Schuster Networks, Kluwer Academic Publicshers Dordecht/ Company, 1992. Boston/ London. [11] Chin - Teng Lin and C.S George Lee - Neural
Fuzzy systems - Book is to the Chiao-Tung University
Centennial 1996.
[12] D. Psaltis, A Sideris, A. A Yamamura – A
Multilayered neural network controller, International
Conference on Neural Networks, San Diego,
California, June 21-24,, 1987, Vol 4, pp 17 – 21.
[13] D. Psaltis, A Sideris, A. A Yamamura –
Neural controllers, International Conference on
Neural Networks, San Diego, California, June 21-24,,
1987, Vol 4, pp 551 – 558.
[14] Eric Ronco – Incremental polynomial
controller networks: Two self-organising nonliear
controllers, Ph.D. Thesis 1997, Glasgow University,
Faculty of Engineering, Supervised by P.J. Gawthrop.
[15] E.W. McGookin, D.J. Murray-Smith, and Y.
Li - A population minimisation process for genetic
algorithms and its application to controller
optimisation, In Proc. 2nd Int. Conf. Genetic
Algorithms in Eng. Syst.: Innovations and
Applications, Glasgow, pages 79-84, Sept 1997.
[16] M. Rodi, R. Safaric – Syntesis of the Sling
mode NN Controller, Conference Proceding’ 97
Instanbul, 1997.
[17] M. A. Unar, D. J Murray-Smith, S. F. Ali
Shah – Design and Tuning of fixed structure PID
6
Controllers A survay. Centre for Systems and Control