Giáo trình Điều khiển hệ đa tác tử: Phần 2 - Trịnh Hoàng Minh, Nguyễn Minh Hiệu

Chia sẻ: Lăng Mộng Như | Ngày: | Loại File: PDF | Số trang:104

Thêm vào BST

Báo xấu

42
lượt xem 13
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Phần 2 của giáo trình "Điều khiển hệ đa tác tử" tiếp tục trình bày những nội dung về: một số ứng dụng của hệ đa tác tử; điều khiển đội hình; giữ liên kết và tránh va chạm; định vị mạng cảm biến; mô hình động học ý kiến; hệ đồng thuận trọng số ma trận;... Mời các bạn cùng tham khảo!

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Giáo trình Điều khiển hệ đa tác tử: Phần 2 - Trịnh Hoàng Minh, Nguyễn Minh Hiệu

Phần III Một số ứng dụng của hệ đa tác tử
5 Điều khiển đội hình 5.1 Giới thiệu . . . . . . . . . . 72 5.1 Giới thiệu 5.2 Điều khiển đội hình dựa trên vị trí tuyệt đối . . . 76 Điều khiển đội hình1 là một trong những bài toán quan trọng nhất 5.3 Điều khiển đội hình dựa trong điều khiển hệ đa tác tử. Giả sử ta có một hệ gồm 𝑛 tác tử (có trên vị trí tương đối . . . 77 5.3.1 Trường hợp tác tử là thể là UAV, UUV, xe tự lái) và ta mong muốn các phương tiện này khâu tích phân bậc nhất 77 di chuyển như một đội hình mong muốn. Đội hình mong muốn, hay 5.3.2 Trường hợp tác tử là còn gọi là đội hình mục tiêu, có thể được cho bởi một tập các biến về khâu tích phân bậc hai . 79 khoảng cách, vector hướng, hay góc lệch giữa vị trí các tác tử trong 5.4 Điều khiển đội hình dựa hệ. trên khoảng cách . . . . . 79 Về ứng dụng, bài toán điều khiển đội hình xuất phát từ ứng dụng về 5.4.1 Lý thuyết cứng khoảng giao thông trên đường cao tốc thông minh, nơi các phương tiện tự thiết cách . . . . . . . . . . . . . . 80 5.4.2 Luật điều khiển đội hình 82 lập các đội xe sao cho khoảng cách giữa các xe là không đổi và vận tốc của các xe là như nhau [44]. Khi đội hình đã được thiết lập, việc di 5.5 Điều khiển đội hình dựa chuyển của đội xe với tốc độ cao được đảm bảo an toàn (các xe không trên vector hướng . . . . 88 5.5.1 Lý thuyết cứng hướng bị va chạm với nhau) và việc không cần thay đổi vận tốc quá nhiều trên ℝ 𝑑 . . . . . . . . . . . 88 giúp tiết kiệm được nhiên liệu. Sự phát triển gần đây của công nghệ 5.5.2 Điều khiển đội hình cứng UAV nảy sinh những ứng dụng mới như thăm dò địa chất, tìm kiếm hướng vi phân . . . . . . . 90 cứu nạn, giám sát khu vực,. . . Những ứng dụng này có thể được thực 5.6 Ghi chú và tài liệu tham hiện hiệu quả và dễ dàng hơn nếu các UAV bay theo một đội hình định khảo . . . . . . . . . . . . . . 97 trước [7]. Cuối cùng, một số biến thể của bài toán điều khiển đội hình 5.7 Bài tập . . . . . . . . . . . . 98 có thể được dùng để mô phỏng, phân tích và giải thích các hiện tượng tụ bầy ở động vật trong tự nhiên [26]. Để giải quyết bài toán điều khiển đội hình, rất nhiều phương pháp đã 1: formation control được đưa ra. Nhìn chung, tất cả các phương pháp điều khiển đội hình hiện tại đều đòi hỏi các tác tử đo một số biến hình học về đội hình, hay trao đổi thông tin với các tác tử khác trong đội hình, từ đó di chuyển sao cho các biến này đạt tới giá trị mong muốn. Trong quá trình thiết [44]: Fax andothers (2004), “Informa- lập đội hình, đôi khi có một số tác tử đặc biệt được chọn làm tham tion flow and cooperative control of chiếu (tác tử dẫn đàn) cho các tác tử khác thực hiện việc điều khiển vehicle formations” hình dạng của toàn bộ hệ. Hiện nay, các bài toán điều khiển đội hình thường được phân loại dựa [7]: Anderson andothers (2008), trên cơ sở là các biến đo, biến điều khiển, và điều kiện về đồ thị mô “Rigid graph control architectures for tả luồng thông tin giữa các tác tử. Bảng 1 phân loại các bài toán điều autonomous formations” khiển đội hình theo cách phân loại này [88, 2]. Phương Biến đo Biến Điều kiện Tài liệu tham khảo [26]: Bullo (2019), Lectures on net- work systems pháp điều đồ thị khiển Dựa Vị trí Vị trí [69, 156] trên vị [88]: Oh andothers (2015), “A survey trí of multi-agent formation control” [2]: Ahn (2019), Formation Control: Dựa Sai lệch Sai lệch Liên thông [44, 65, 72] Approaches for Distributed Agents trên sai lệch
5.1 Giới thiệu 73 Dựa Sai lệch Sai lệch Liên thông [86, 77, 67, 68] trên cục bộ, cục bộ khoảng góc định và góc cách hướng định hướng Dựa Tọa độ Đồ thị [42, 63, 127, 85, 78, trên tương cứng 123] tọa độ đối địa khoảng tương phương cách đối địa phương Tọa độ Tọa độ Đồ thị [36, 93, 101] tương tương không đối địa đối địa cứng phương phương khoảng cách Khoảng Khoảng Đồ thị [6, 28, 124] cách cách cứng khoảng cách Vector Góc Đồ thị đơn [16, 21, 20, 170, 171] Dựa hướng giản 𝐶3 , trên địa 𝐶4 hoặc vector phương 𝐶𝑛 hướng Vector Góc Đồ thị [25, 64, 59] hướng cứng yếu địa phương Vector Vector Đồ thị [22, 40, 115, 132, 165, hướng hướng cứng 144, 139] hướng trong ℝ 𝑑 Vector Vector Đồ thị [46, 160, 114, 76] hướng hướng cứng địa địa hướng phương phương trong và Góc và góc 𝑆𝐸(𝑑) định định hướng hướng tương tương đối đối Vector Vector Đồ thị [165, 135, 136] hướng hướng cứng địa địa hướng phương phương trong ℝ 𝑑 và góc và góc định định hướng hướng tương tương đối đối
74 5 Điều khiển đội hình Vị trí Vị trí Đồ thị [168, 166] tương tương cứng đối đối hướng trong ℝ 𝑑 Kết hợp Vector Vector Đồ thị [23, 43, 122, 100, 94, vector hướng, hướng, cứng yếu 64] hướng, góc góc góc lệch và lệch và lệch và khoảng khoảng khoảng cách cách cách Các biến trạng thái của một tác tử phân tán bao gồm một số đại lượng viết trong một hệ qui chiếu gắn với tác tử đó. Thông thường, các biến trạng thái được chọn gồm vị trí và vận tốc của tác tử cùng với hướng của các hệ tọa độ tham chiếu (gọi chung là định hướng của tác tử trong không gian). Để so sánh các giá trị của tác tử, vị trí và định hướng của tác tử cần phải được cho dưới cùng một hệ tọa độ tham chiếu. Trong không gian ℝ 𝑑 , định hướng của một tác tử 𝑖 được cho bởi một ma trận R𝑖 ∈ 𝑆𝑂(𝑑), trong khi định hướng và vị trí được thể hiện bởi các phần tử trong 𝑆𝐸(𝑑). Do mỗi tác tử có một hệ tọa độ tham chiếu riêng, định hướng của các tác tử thường có sai lệch so với nhau cũng như so với hệ tham chiếu toàn cục. Trên hình 5.1, hệ qui chiếu toàn cục được kí hiệu bởi 𝑔 Σ, còn các hệ Hình 5.1: Hệ qui chiếu toàn cục ( 𝑔 Σ), qui chiếu cục bộ/địa phương được kí hiệu bởi 𝑖 Σ và 𝑗 Σ. Các trục tọa độ hệ qui chiếu chung (𝑐 Σ), và các hệ qui của tác tử 𝑖 và 𝑗 không trùng nhau cũng như không trùng với hệ tọa chiếu cục bộ (𝑖 Σ và 𝑗 Σ). độ toàn cục. Ma trận R𝑖 ∈ 𝑆𝑂(𝑑) mô tả phép chuyển tọa độ từ hệ tọa độ 𝑔 Σ tới 𝑖 Σ. Ma trận để chuyển từ 𝑗 Σ tới 𝑖 Σ được cho bởi R𝑖𝑗 = R𝑖 R−𝑗 1 . Như vậy, ma trận R−𝑖 1 mô tả phép chuyển từ hệ tọa độ địa phương 𝑖 Σ tới hệ tọa độ toàn cục 𝑔 Σ. Kí hiệu Σ∗ là một hệ qui chiếu chung, không nhất thiết phải trùng với 𝑔 Σ. Một hệ tọa độ với các trục trùng với Σ∗ được gọi là một hệ qui chiếu chung 𝑐 Σ. Chú ý rằng hệ qui chiếu Σ∗ ≠ 𝑐 Σ do gốc tọa độ của Σ∗ và 𝑐 Σ có thể khác nhau. Trong nhiều bài toán điều khiển đội hình, ta thường mong muốn các tác tử có thể xác định vị trí và hướng dựa trên một hệ qui chiếu chung 𝑐 Σ. Ma trận R ∈ 𝑆𝑂(3) mô tả phép chuyển tọa độ từ 𝑔 Σ sang 𝑐 Σ. Nếu 𝑐 như hướng của các tác tử được điều chỉnh sao cho 𝑖 Σ = 𝑗 Σ = 𝑐 Σ thì ta nói rằng các tác tử được đồng thuận về hướng. Với mỗi tác tử 𝑖, ta kí hiệu vị trí của tác tử này trên hệ tham chiếu toàn cục là p𝑖 ∈ ℝ 𝑑 . Với hai tác tử 𝑖 và 𝑗, vector sai lệch z𝑖𝑗 = p𝑖 − p 𝑗 là một vector viết trong hệ tham chiếu toàn cục 𝑔 Σ. Vector này cũng có thể 𝑗 𝑗 𝑗 𝑗 biểu diễn bởi z𝑖𝑖𝑗 = p𝑖𝑖 − p𝑖𝑗 = −p𝑖𝑗 trong 𝑖 Σ hoặc là z𝑖𝑗 = p 𝑗 − p𝑖 = −p𝑖 𝑗 trong 𝑖 Σ do p𝑖𝑖 = p 𝑗 = 0. Chú ý rằng vector z𝑖𝑗 có hướng từ 𝑗 tới 𝑖, 𝑗 𝑗 trong khi z 𝑗𝑖 có hướng từ 𝑖 tới 𝑗. Chú ý rằng z 𝑗𝑖 = p𝑖 (vị trí của 𝑖 đo bởi 𝑗 trong hệ qui chiếu 𝑗 Σ) hay z𝑖𝑗𝑖 = −p𝑖𝑗 (vị trí của 𝑗 đo bởi 𝑖 trong hệ qui chiếu 𝑖 Σ). Mặc dù p 𝑗 − p𝑖 = z 𝑗𝑖 = −z𝑖𝑗 = −(p𝑖 − p 𝑗 ), do hệ qui
5.1 Giới thiệu 75 𝑗 chiếu của các tác tử khác nhau, ta có p𝑖 ≠ −p𝑖𝑗 do 𝑗 𝑗 z 𝑗𝑖 = p𝑖 = R 𝑗 R−𝑖 1 z𝑖𝑗𝑖 = R 𝑗𝑖 (−p𝑖𝑗 ). Nhận xét rằng mặc dù có hướng và hệ qui chiếu khác nhau, các vector 𝑗 𝑗 z𝑖𝑖𝑗 , z𝑖𝑗𝑖 , z𝑖𝑗 , và z 𝑗𝑖 đều có độ dài như nhau và bằng khoảng cách giữa hai tác tử 𝑖 và 𝑗. Ta kí hiệu khoảng cách từ tác tử 𝑖 tới tác tử 𝑗 bởi 𝑗 𝑑 𝑖𝑗 = k p𝑖 − p 𝑗 k = k z𝑖𝑖𝑗 k = k z𝑖𝑗 k = k z𝑖𝑗 k = 𝑑 𝑗𝑖 . Một đại lượng (tương đối) khác có thể được đo đạc giữa hai tác tử 𝑖 và p −p 𝑗 là vector (đơn vị) hướng g𝑖𝑗 = k p 𝑗 −p𝑖 k với giả thuyết rằng p𝑖 ≠ p 𝑗 . Dễ 𝑗 𝑖 𝑗 thấy k g𝑖𝑖𝑗 k = k g𝑖𝑗 k = 1. Chú ý rằng g𝑖𝑗 = −g 𝑗𝑖 , tuy nhiên g𝑖𝑖𝑗 ≠ −g 𝑗𝑖 với cùng lý do như với các vector vị trí tương đối. Với mỗi tác tử 𝑖, ta giả thuyết rằng tác tử 𝑖 có mô hình tích phân bậc nhất p¤ 𝑖 = u𝑖 , 𝑖 = 1 , . . . , 𝑛, (5.1) với u𝑖 là tín hiệu điều khiển. Phương trình (5.1) được viết trên hệ qui chiếu 𝑔 Σ. Ta có thể biến đổi (5.1) như sau R𝑖 p¤ 𝑖 = R𝑖 u𝑖 hay, p¤ 𝑖𝑖 = u𝑖𝑖 , (5.2) với u𝑖𝑖 là tín hiệu điều khiển biểu diễn trên hệ qui chiếu địa phương 𝑖 Σ gắn với tác tử 𝑖. Tiếp theo, ta định nghĩa khái niệm về các cấu trúc (tập cạnh) mô tả tương tác giữa các tác tử trong hệ, bao gồm: đo đạc, điều khiển, và truyền tin. Định nghĩa 5.1.1 (Cấu trúc đo đạc, điều khiển, truyền tin) Nếu tác tử 𝑖 đo một biến tương đối nào đó với tác tử 𝑗 thì tác tử 𝑗 là một láng giềng-ra của 𝑖 trong đồ thị đo đạc 𝐺 𝑠 , kí hiệu bởi 𝑗 ∈ 𝑁𝑖𝑜 , và (𝑖, 𝑗) ∈ 𝐸 𝑠 . Nếu tín hiệu điều khiển của tác tử 𝑖 dựa trên chuyển động của tác tử 𝑗 thì 𝑗 là một láng giềng ra của 𝑖 trong đồ thị điều khiển 𝐺 𝑎 , kí hiệu bởi (𝑖, 𝑗) ∈ 𝐸 𝑎 . Nếu tác tử 𝑗 gửi một biến thông tin tới tác tử 𝑖 thì 𝑗 là một láng giềng-ra của tác tử 𝑖 trong đồ thị thông tin 𝐺 𝑐 , kí hiệu bởi (𝑖, 𝑗) ∈ 𝐸 𝑐 . Như vậy, trong một bài toán điều khiển đội hình tổng quát, các cấu trúc về đo đạc, điều khiển, cũng như truyền tin là khác nhau: 𝐸 𝑠 ≠ 𝐸 𝑎 ≠ 𝐸 𝑐 . Khi nói đến một cấu trúc của một đội hình mà không nói gì thêm, ta ngầm nói đến cả ba cấu trúc này. Khi một tác tử 𝑖 đo vị trí tương đối với tác tử 𝑗, 𝑖 có thể không cập nhật vị trí của mình dựa trên vị trí tương đối mà chỉ dựa trên khoảng cách giữa hai tác tử, hay dựa trên vector hướng từ 𝑖 tới 𝑗. Trong tài liệu này, ta sử dụng thuật ngữ điều khiển đội hình dựa trên “X” nếu như các tác tử trong hệ điều khiển vị trí của mình dựa trên biến “X” và không tính tới việc các tác tử đo đạc hay truyền tin các biến nào khác. Với qui ước này, ta sẽ lần lượt xét các phương pháp điều khiển đội hình dựa trên vị trí tuyệt đối, vị trí tương đối, khoảng cách và vector
76 5 Điều khiển đội hình hướng. Đây là các phương pháp điều khiển đội hình đã và đang được quan tâm nghiên cứu gần đây. 5.2 Điều khiển đội hình dựa trên vị trí tuyệt đối Khi tất cả các tác tử đều có thể nhận thông tin vị trí của mình từ hệ tham chiếu toàn cục 𝑔 Σ, bài toán điều khiển đội hình trở nên khá đơn giản. Cụ thể, khi mỗi tác tử 𝑖 biết được p𝑖 và mong muốn đạt tới vị trí đặt p∗𝑖 thì luật điều khiển đội hình (5.1) viết cho mỗi tác tử có thể thiết kế đơn giản dưới dạng p¤ 𝑖 = u𝑖 = −𝑘 𝑝 (p𝑖 − p∗𝑖 ), 𝑖 = 1 , . . . , 𝑛, (5.3) với 𝑘 𝑝 > 0 là hằng số dương. Kí hiệu p = vec(p1 , . . . , p𝑛 ), p∗ = vec(p∗1 , . . . , p∗𝑛 ), và đặt e𝑝 , p − p∗ thì ta viết chung được (5.3) dưới dạng e¤ 𝑝 = −𝑘 𝑝 e𝑝 . (5.4) Rõ ràng, từ phương trình. (5.4), ta có e𝑝 (𝑡) → 0 , 𝑡 → +∞ theo hàm mũ. Điều này tương đương với việc, p(𝑡) → p∗ , 𝑡 → +∞ theo hàm mũ. Để cải thiện chất lượng điều khiển, ta có thể giả thiết rằng các tác tử có thể trao đổi thông tin về vị trí với nhau qua đồ thị 𝐺 và thêm vào luật điều khiển đội hình (5.3) thành phần 𝑗∈𝑁𝑖 𝑎 𝑖𝑗 (p 𝑗 − p∗𝑗 ) − (p𝑖 − p∗𝑖 ) P để được luật điều khiển mới cho bởi: X u𝑖 = −𝑘 𝑝 (p𝑖 − p∗𝑖 ) + 𝑎 𝑖𝑗 (p 𝑗 − p∗𝑗 ) − (p𝑖 − p∗𝑖 ) , 𝑖 = 1 , . . . , 𝑛, (5.5) 𝑗∈𝑁𝑖 trong đó 𝑎 𝑖𝑗 > 0 là trọng số ứng với (𝑣 𝑗 , 𝑣 𝑖 ) ∈ 𝐸(𝐺). Ta có thể viết lại phương trình (5.5) dưới dạng p¤ = −𝑘 𝑝 (p − p∗ ) − (L ⊗ I𝑑 )(p − p∗ ), (5.6) trong đó L là ma trận Laplace của 𝐺. Lại đặt 𝜹 , p − p∗ , thì phương trình vi phân đối với sai lêch 𝜹 được cho dưới dạng: 𝜹¤ = −𝑘 𝑝 𝜹 − (L ⊗ I𝑑 )𝜹 = − (𝑘 𝑝 I𝑛 + L) ⊗ I𝑑 𝜹 (5.7) Giả sử rằng 𝐺 là một đồ thị có gốc-ra thì theo Định lý 2.2.4, các trị riêng của ma trận 𝑘 𝑝 I𝑛 + L đều lớn hơn hoặc bằng 𝑘 𝑝 , điều này chứng tỏ thành phần điều khiển từ trao đổi thông tin có thể làm tăng tốc độ đạt được đội hình. Ví dụ 5.2.1 Mô phỏng điều khiển đội hình gồm 20 tác tử dựa trên vị trí tuyệt đối trong 2D và 3D được cho ở Hình 5.2. Với luật điều khiển đã cho, các tác tử di chuyển trực tiếp tới vị trí đặt trong không gian (các đỉnh của một đa giác đều gồm 20 đỉnh).
5.3 Điều khiển đội hình dựa trên vị trí tương đối 77 Code MATLAB của ví dụ 5.2.1 (mô phỏng đội hình trên 2D) được cho dưới đây, trong đó hàm PlotFormation dùng để biểu diễn đội hình được dùng chung trong các ví dụ ở mục này được cho ở Phụ lục C.1. 1 % Tham s o mo phong 2 n = 20; d = 2; o = 1; 3 global P k 4 P = z e r o s ( 2 , n ) ; % Vi t r i dat 5 f o r i =0:1:n -1 6 P ( : , i +1) = 5 * [ c o s ( i * p i / 1 0 ) ; s i n ( i * p i / 1 0 ) ] ; 7 % Doi hinh dat ( duong t r o n ) 8 end 9 P = P(:) ; (a) Đội hình trong không gian 2 chiều 10 k = 1; 11 % control gain 12 p0 = 2 5 * ( rand ( 4 0 , 1 ) - 0 . 5 ) ; 13 % Dieu k i e n dau 14 [ t , p ] = ode45 ( @control_lawC , [ 0 : 0 . 0 0 1 : 5 ] , p0 ) ; 15 Pl otF orm ation ( n , d , t , p ’ , H, o ) 16 17 % Ham t i n h l u a t d i e u k h i e n d o i hinh 18 f u n c t i o n dpdt = control_lawC ( t , x i ) 19 global P k 20 dpdt = - k * ( x i -P) ; 21 end (b) Đội hình trong không gian 3 chiều Hình 5.2: Mô phỏng thuật toán điều 5.3 Điều khiển đội hình dựa trên vị trí tương đối khiển đội hình dựa trên vị trí tuyệt đối. Trong phương án điều khiển dựa trên vị trí tương đối, hệ các tác tử cần thỏa mãn các giả thuyết sau: Biến đo Các tác tử có các hệ qui chiếu cục bộ được định hướng như nhau và giống như hệ qui chiếu toàn cục. Tuy nhiên, các tác tử không cần biết gốc tọa độ của hệ qui chiếu toàn cục này. Trong hệ tham chiếu địa phương, các tác tử có thể đo vị trí tương đối (vector sai lệch vị trí) và vận tốc tương đối (đối với tác tử bậc hai) của một số tác tử láng giềng. Chú ý rằng do các hệ qui chiếu địa phương là cùng hướng với hệ qui chiếu toàn cục, vector vị trí tương đối đo trong các hệ qui chiếu đều như nhau. Đồ thị tương tác Tương tác về đo đạc giữa các tác tử được cho bởi đồ thị vô hướng 𝐺, với giả thuyết 𝐺 = (𝑉 , 𝐸) là một đồ thị liên thông. Đội hình đặt được cho bởi một tập các vector sai lệch vị trí mong muốn giữa các tác tử tương ứng với 𝐺. 5.3.1 Trường hợp tác tử là khâu tích phân bậc nhất Xét hệ gồm 𝑛 tác tử trong đó mỗi tác tử trong đội hình có mô hình là khâu tích phân bậc nhất: p¤ 𝑖 = u𝑖 , 𝑖 = 1 , . . . , 𝑛. (5.8) Ở đây, p𝑖 ∈ ℝ 𝑑 và u𝑖 ∈ ℝ 𝑑 lần lượt là vị trí và tín hiệu điều khiển của tác tử 𝑖 viết trên hệ qui chiếu toàn cục 𝑔 Σ.
78 5 Điều khiển đội hình Từ giả thuyết về đo đạc ở trên, mỗi tác tử 𝑖 có thể đo được z𝑖𝑗 = p 𝑗 − p𝑖 , ∀𝑗 ∈ 𝑁𝑖 . Đội hình đặt được cho bởi tập Γ = {z∗𝑖𝑗 }(𝑖,𝑗)∈𝐸 , và mục tiêu của mỗi tác tử là đạt được đội hình thỏa mãn tất cả các vector sai lêch vị trí mong muốn đều được thỏa mãn z𝑖𝑗 = p 𝑗 − p𝑖 = z∗𝑖𝑗 , (𝑖, 𝑗) ∈ 𝐸. Tập Γ = {z∗𝑖𝑗 }(𝑖,𝑗)∈𝐸 được gọi là khả thi nếu như tập Ep∗ , {p ∈ ℝ 𝑑𝑛 | p 𝑗 − p𝑖 = z∗𝑖𝑗 , ∀(𝑖, 𝑗) ∈ 𝐸}, (5.9) là khác tập rỗng. Ngược lại, nếu Ep∗ = ∅, ta gọi Γ là không khả thi. Trong mục này, ta giả sử Γ là khả thi và xét p∗ = vec(p∗1 , . . . , p∗𝑛 ), là một phần tử trong Ep∗ . Hơn nữa, ta giả sử rằng mỗi tác tử chỉ biết được một số vector sai lêch đặt z∗𝑖𝑗 = p∗𝑗 − p∗𝑖 , ∀𝑗 ∈ 𝑁𝑖 chứ không biết được p∗𝑖 và p∗𝑗 . Bài toán đặt ra là đưa p tới một đội hình sai khác với p∗ bởi một phép tịnh tiến, hay là đưa p(𝑡) hội tụ tới tập Ep∗ khi 𝑡 → +∞. Với bài toán này, luật điều khiển đội hình được thiết kế như sau: X u𝑖 = 𝑘 𝑝 𝑎 𝑖𝑗 (z𝑖𝑗 − z∗𝑖𝑗 ) (5.10) 𝑗∈𝑁𝑖 X = 𝑘𝑝 𝑎 𝑖𝑗 (p 𝑗 − p𝑖 − (p∗𝑗 − p∗𝑖 )), (5.11) 𝑗∈𝑁𝑖 trong đó 𝑘 𝑝 > 0. Với 𝜹 = p∗ − p, ta có phương trình 𝜹¤ = −𝑘 𝑝 (L ⊗ I𝑑 )𝜹. (5.12) Theo lý thuyết về hệ đồng thuận, với 𝐺 là một đồ thị liên thông thì ¯ trong đó 𝜹¯ = 1 P𝑛 (p∗ (0) − p𝑖 (0)) là một vector 𝜹(𝑡) → 𝜹∗ = 1𝑛 ⊗ 𝜹, 𝑛 𝑖=1 𝑖 hằng. Do đó, p∗ − p(𝑡) → 𝜹 ∗ , 𝑡 → +∞, hay p(𝑡) → p∗ − 𝜹 ∗ , 𝑡 → +∞, (5.13) (a) tức là p(𝑡) hội tụ tới tập Ep∗ . Phân tích hệ trong trường hợp tập Γ không khả thi sẽ được xét trong bài tập 5.7.1. Ví dụ 5.3.1 Ta mô phỏng điều khiển đội hình dựa trên vị trí tương đối cho hệ gồm 20 tác tử với đồ thị tương tác là chu trình 𝐶20 và đội hình đặt là các đỉnh của một đa giác đều 20 cạnh. Kết quả mô phỏng được cho trong Hình 5.2. Các tác tử dần tạo thành đội hình đặt khi 𝑡 → +∞. 1 % Tham s o mo phong (b) 2 global P k L d Hình 5.3: Mô phỏng thuật toán điều 3 n = 20; d = 3; o = 1; khiển đội hình dựa trên vị trí tương 4 H = - eye ( n ) ; % Ma t r a n l i e n thuoc đối trong 2D và 3D. 5 for i = 1 : 1 : n-1 6 H( i , i +1) = 1 ; 7 end 8 H( n , 1 ) = 1 ; 9
5.4 Điều khiển đội hình dựa trên khoảng cách 79 10 L = H’ *H; % Ma t r a n L a p l a c e 11 P = zeros (d , n) ; 12 f o r i =0:1:n -1 13 P ( : , i +1) = 5 * [ c o s ( i * p i / 1 0 ) ; s i n ( i * p i / 1 0 ) ; 0 ] ; % Doi hinh dat ( Duong t r o n ) 14 end 15 P = P(:) ; 16 k = 1; % He s o d i e u k h i e n 17 p0 = 2 0 * ( rand ( d*n , 1 ) - 0 . 5 ) ; % Dieu k i e n dau 18 [ t , p ] = ode45 ( @control_lawC , [ 0 : 0 . 0 0 1 : 3 0 ] , p0 ) ; 19 Pl otF orm ation ( n , d , t , p ’ , H, o ) 20 21 % Tinh l u a t d i e u k h i e n 22 f u n c t i o n dpdt = control_lawC ( t , x i ) 23 global L P d 24 dpdt = - kron (L , eye ( d ) ) * ( x i -P) ; 25 end 5.3.2 Trường hợp tác tử là khâu tích phân bậc hai Xét hệ gồm 𝑛 tác tử được mô hình là khâu tích phân bậc hai: p¤ 𝑖 = v𝑖 , v¤ 𝑖 = u𝑖 , 𝑖 = 1 , . . . , 𝑛. (5.14) Ở đây, p𝑖 , v𝑖 , và u𝑖 ∈ ℝ 𝑑 lần lượt là vị trí, vận tốc, và tín hiệu điều khiển của tác tử 𝑖 viết trên 𝑔 Σ. Luật điều khiển viết cho từng tác tử: X u𝑖 = −𝑘 1 (p𝑖 − p 𝑗 − (p∗𝑖 − p∗𝑗 )) − 𝑘 2 v𝑖 , 𝑖 = 1 , . . . , 𝑛, (5.15) 𝑗∈𝑁𝑖 trong đó 𝑘1 và 𝑘 2 là các hệ số thực dương. Thực hiện phép đổi biến 𝜹 = p𝑖 − p∗𝑖 , ta thu được phương trình 𝜹¤ 𝑖 = v𝑖 , X v¤ 𝑖 = −𝑘 1 (𝜹 𝑖 − 𝜹 𝑗 ) − 𝑘 2 v𝑖 , 𝑖 = 1 , . . . , 𝑛. (5.16) 𝑗∈𝑁𝑖 Đối chiếu lại với phần thiết kế hệ đồng thuận với tác tử tích phân bậc hai ở mục trước, hệ (5.16) tiến tới đồng thuận 𝜹 𝑖 → 𝛿∗ , v𝑖 → 0𝑑 . Điều này tương đương với việc p𝑖 (𝑡) → p∗𝑖 + 𝜹∗ , 𝑡 → +∞. 5.4 Điều khiển đội hình dựa trên khoảng cách Phương án điều khiển dựa trên khoảng cách (hay điều khiển đội hình dựa trên vị trí tương đối trong hệ tọa độ riêng), hệ các tác tử cần thỏa mãn các giả thuyết sau:
80 5 Điều khiển đội hình I Mô hình tác tử: Các tác tử được mô hình hóa bởi khâu tích phân bậc nhất: p¤ 𝑖𝑖 = u𝑖𝑖 , 𝑖 = 1 , . . . , 𝑛, (5.17) trong đó p𝑖𝑖 ∈ ℝ 𝑑 và u𝑖𝑖 ∈ ℝ 𝑑 lần lượt là vị trí và tín hiệu điều khiển của tác tử 𝑖 viết trên viết trong hệ qui chiếu địa phương 𝑖 Σ. I Biến đo: Các tác tử có các hệ tham chiếu riêng được định hướng khác nhau và không có thông tin về hệ tham chiếu toàn cục. Trong hệ tham chiếu riêng, các tác tử có thể đo vị trí tương đối (vector sai lệch vị trí) p𝑖𝑖𝑗 = p𝑖𝑗 − p𝑖𝑖 của các tác tử láng giềng 𝑗 ∈ 𝑁𝑖 . I Đồ thị tương tác: Tương tác về đo đạc giữa các tác tử được cho bởi đồ thị vô hướng 𝐺, với giả thuyết 𝐺 là một đồ thị cứng (rigid). Đội hình đặt được cho bởi một tập các khoảng cách mong muốn Γ = {𝑑 ∗𝑖𝑗 = k p∗𝑗 − p∗𝑖 k}(𝑖,𝑗)∈𝐸 . Mặc dù các tác tử trong hệ đo được vị trí tương đối của các tác tử khác trong ℝ 𝑑 , do các vector vị trí tương đối này không được biểu diễn trên cùng một hệ tọa độ chung, việc điều khiển đội hình dựa trên sai lệch vị trí là không khả thi. Thay vào đó, biến điều khiển lúc này được chọn là khoảng cách giữa các tác tử. Dễ thấy, khoảng cách giữa các tác tử có thể đo được dễ dàng từ vector sai lệch cục bộ và hoàn toàn không phụ thuộc vào các hệ qui chiếu. Do ta chỉ điều khiển tập các khoảng cách tương đối, một câu hỏi đặt ra là cần chọn bao nhiêu biến khoảng cách và cần chọn các biến này như thế nào để khi các biến này được thỏa mãn thì đội hình thu được chỉ sai khác đội hình đặt bởi một phép tịnh tiến và một phép quay. Lời giải cho câu hỏi này có ở lý thuyết cứng, một nhánh nghiên cứu của toán học thường được ứng dụng trong nghiên cứu về cơ học hay cấu trúc phân tử hóa học [153, 10, 53, 32]. 5.4.1 Lý thuyết cứng khoảng cách Xét đồ thị vô hướng 𝐺 = (𝑉 , 𝐸), trong đó 𝑉 = {1 , . . . , 𝑛} gồm 𝑛 đỉnh và 𝐸 ⊂ 𝑉 × 𝑉 gồm 𝑚 cạnh. Ứng với mỗi đỉnh 𝑖 ∈ 𝑉 ta có tương ứng 2: formation hoặc network một điểm p𝑖 ∈ ℝ 𝑑 (𝑑 ≥ 2). Một đội hình (hay một mạng)2 được định nghĩa bởi (𝐺, p), trong đó vector p = vec(p1 , . . . , p𝑛 ) ∈ ℝ 𝑑𝑛 gọi là một 3: configuration, realization, hoặc cấu hình3 của 𝐺 trên ℝ 𝑑 . Lưu ý rằng các điểm p𝑖 đều được cho trên embedding một hệ qui chiếu toàn cục. Xét một tập khoảng cách Γ = {𝑑 𝑖𝑗 > 0 | (𝑖, 𝑗) ∈ 𝐸}. Tập Γ gọi là khả thi nếu tồn tại ít nhất một cấu hình p sao cho k p 𝑗 − p𝑖 k = 𝑑 𝑖𝑗 , ∀(𝑖, 𝑗) ∈ 𝐸. Nếu không tồn tại cấu hình nào thỏa mãn tất cả các khoảng cách trong Γ thì ta nói Γ là không khả thi. Cấu hình p thỏa mãn mọi ràng buộc khoảng cách trong Γ được gọi là một hiện thực hóa của Γ trên ℝ 𝑑 . Ngược lại, mỗi cấu hình p∗ cho ta một tập khoảng cách dẫn xuất Γ = {𝑑∗𝑖𝑗 = k p∗𝑗 − p∗𝑖 k}(𝑖,𝑗)∈𝐸 . Xét hai cấu hình p và q của cùng một đồ thị 𝐺 trên ℝ 𝑑 . Hai cấu 4: distance equivalency hình p và q là tương đương về khoảng cách4 nếu như k p𝑖 − p 𝑗 k = 5: distance congruency k q𝑖 − q 𝑗 k, ∀(𝑖, 𝑗) ∈ 𝐸, và là tương đồng về khoảng cách5 nếu như k p𝑖 − p 𝑗 k = k q𝑖 − q 𝑗 k, ∀𝑖, 𝑗 ∈ 𝑉 , 𝑖 ≠ 𝑗.
5.4 Điều khiển đội hình dựa trên khoảng cách 81 Một cấu hình p của 𝐺 là cứng 6 nếu như tồn tại 𝜖 > 0 sao cho mọi 6: rigid cấu hình q của 𝐺 thỏa mãn ∈ 𝐵 𝜖 , {q ∈ ℝ 𝑑𝑛 | k q − p k < 𝜖} và q tương đương về khoảng cách với p thì q cũng tương đồng về khoảng cách với p. Đội hình (𝐺, p) là cứng khoảng cách toàn cục7 nếu như mọi cấu hình 7: global rigidity q tương đương về khoảng cách với p thì cũng tương đồng về khoảng cách với p. Việc xét trực tiếp liệu một cấu hình p có là cứng khoảng cách hay không dựa trên định nghĩa là không đơn giản khi số đỉnh 𝑛 lớn. Để đơn giản hóa việc xác định tính cứng của đồ thị, ta có khái niệm cứng 8: infinitesimal rigidity khoảng cách vi phân8 - một xấp xỉ bậc nhất về tính cứng của p. Đánh số các cạnh của đồ thị từ 1 tới 𝑚, với kí hiệu 𝑒 𝑘 ≡ 𝑒 𝑘 𝑖𝑗 ≡ (𝑖, 𝑗), ta có các vector sai lệch vị trí tương ứng z 𝑘 ≡ z𝑖𝑗 = p 𝑗 − p𝑖 , 𝑘 = 1 , . . . , 𝑚. Ta định nghĩa hàm (bình phương các) khoảng cách: > f𝐺 (p) , k z1 k 2 , . . . , k z𝑚 k = [. . . , k z𝑖𝑗 k 2 , . . .]> ∈ ℝ 𝑚 . (5.18) Ma trận cứng (rigidity matrix) của đội hình (𝐺, p) được định nghĩa là: 1 𝜕f𝐺 (p) R(p) = . (5.19) 2 𝜕p Kí hiệu z = vec(z1 , . . . , z𝑚 ) = (H ⊗ I𝑑 )p = Hp ¯ và Z = blkdiag(z1 , . . . , z𝑚 ), > > ta có thể viết lại f𝐺 (p) = Z Z1𝑚 = Z z. Từ đó, ta viết được: (a) Đội hình không cứng R(p) = Z> H ¯ (5.20) Chú ý rằng ma trận cứng luôn có ít nhất 𝑑 + 𝑑(𝑑 − 1)/2 = 𝑑(𝑑 + 1)/2 vector riêng tương ứng với giá trị riêng 0. Các vector riêng này tương ứng với các chuyển động bảo toàn tính cứng của đội hình, cụ thể là phép tịnh tiến và phép quay theo các trục tọa độ của 𝑔 Σ. (b) Đội hình cứng Ví dụ 5.4.1 Ma trận cứng của đồ thị trên hình 5.4(b) được cho như sau:  (p1 − p2 )> (p2 − p1 )> 0> 0>  (p1 − p3 )> (p3 − p1 )>    0> 0>  (p1 − p4 )> (p4 − p1 )>   R (p) =  0> 0>  (p2 − p3 )> (p3 − p2 )>   0> 0>  (c) Đội hình cứng (p3 − p4 )> (p4 − p3 )>     0> 0>   toàn cục Hình 5.4: Một số ví dụ minh họa lý Có thể nhận xét rằng, ma trận cứng có cấu trúc khá tương tự như thuyết cứng khoảng cách. ma trận liên thuộc. Tuy nhiên, ở hàng thứ 𝑘 tương ứng với cạnh (𝑖, 𝑗) thì (p𝑖 − p 𝑗 )> được thay cho −1, (p𝑖 − p 𝑗 )> được thay cho 1, và 0> được thay cho 0. Đồ thị 𝐺 là cứng phổ quát trong ℝ 𝑑 nếu như hầu hết mọi cấu hình của 𝐺 trong ℝ 𝑑 đều là cứng, ngoại trừ một tập con của ℝ 𝑑 với độ đo Lebesgue bằng 0. Để đơn giản, người ta cũng gọi tắt 𝐺 là đồ thị cứng với ý rằng 𝐺 là cứng phổ quát. Dựa vào ma trận cứng, nếu tồn tại một cấu hình p của 𝐺 sao cho rank(R(p)) = 𝑑𝑛 − 𝑑(𝑑+ 2 1) thì 𝐺 là đồ thị cứng. Cấu hình p của 𝐺 thỏa 𝑑(𝑑+1) mãn rank(R(p)) = 𝑑𝑛 − 2 gọi là một cấu hình với các tọa độ ở vị
82 5 Điều khiển đội hình trí tổng quát, hay gọi tắt là một cấu hình tổng quát. Ngược lại, cấu hình p của 𝐺 mà ở đó rank(R(p)) < 𝑑𝑛 − 𝑑(𝑑+ 2 1) gọi là một cấu hình suy biến. Nếu đồ thị 𝐺 là cứng và có số cạnh đúng bằng 𝑑𝑛 − 𝑑(𝑑 + 1)/2 thì 𝐺 được gọi là cứng tối thiểu. Dễ thấy, khi 𝑑 = 2, đồ thị cứng tối thiểu có 2𝑛 − 3 cạnh. Hơn nữa, trong trường hợp 𝑑 = 2, mọi đồ thị cứng tối thiểu đều là đồ thị Laman. Định nghĩa 5.4.1 (Đồ thị Laman) Một đồ thị 𝐺 = (𝑉 , 𝐸) là Laman khi và chỉ khi: I 𝐺 có 2𝑛 − 3 cạnh, I Với mỗi tập con gồm 𝑘 đỉnh của 𝑉 thì đồ thị con dẫn xuất của 𝐺 từ 𝑘 đỉnh đó có không quá 2 𝑘 − 3 cạnh. Trên không gian hai chiều, mọi đồ thị Laman đều là đồ thị cứng tổng quát. Chứng minh cụ thể của phát biểu này có thể tham khảo từ bài [66]: Laman (1970), “On graphs and rigidity of plane skeletal structures” báo của Laman [66] và sẽ không được trình bày trong tài liệu này. Henneberg đề xuất phương pháp xây dựng các đồ thị Laman trong hai chiều như sau: bắt đầu từ một đồ thị gồm hai đỉnh (1 và 2) và một cạnh (1 , 2). Với mỗi bước, ta mở rộng đồ thị nhờ một trong hai toán tử sau đây: 1. Cộng đỉnh: Thêm một đỉnh 𝑘 và hai cạnh nối 𝑘 với hai đỉnh 𝑖, 𝑗 hiện có trong đồ thị. 2. Chia cạnh: Xóa một cạnh (𝑖, 𝑗) hiện có trong đồ thị và thêm vào một đỉnh 𝑘 cùng ba cạnh (𝑘, 𝑖), (𝑘, 𝑗), (𝑘, 𝑙), trong đó 𝑙 là một đỉnh trong đồ thị hiện tại khác 𝑖, 𝑗. Đồ thị thu được từ xây dựng Henneberg là một đồ thị Laman. Ngược lại, người ta cũng chứng minh được rằng mọi đồ thị Laman trong không gian hai chiều đều có thể thu được nhờ xây dựng Henneberg. Định nghĩa 5.4.1 cho ta một phương án để kiểm tra các đồ thị là cứng phổ quát với số cạnh tối thiểu. Tuy nhiên, cách kiểm tra này đòi hỏi phải xét mọi tập con của đồ thị,do đó việc kiểm tra sẽ yêu cầu khối lượng tính toán cao. Một số điều kiện tương đương khác để kiểm tra một đồ thị cứng tối thiểu với độ phức tạp thấp hơn là dựa trên định lý Crapo và định lý Récski [34, 17]. 5.4.2 Luật điều khiển đội hình Với các khoảng cách được cho từ một đội hình đặt p∗ = vec(p∗1 , . . . , p∗𝑛 ) ∈ ℝ 𝑑𝑛 , ta định nghĩa các biến sai lệch khoảng cách 𝜎𝑖𝑗 = k p𝑖 −p 𝑗 k 2 −(𝑑∗𝑖𝑗 )2 = (𝑑 𝑖𝑗 )2 − (𝑑∗𝑖𝑗 )2 , ∀(𝑖, 𝑗) ∈ 𝐸 và 𝝈 = [. . . , 𝜎𝑖𝑗 , . . .]> = [𝜎1 , . . . , 𝜎𝑚 ]> = f𝐺 (p) − f𝐺 (p∗ ) ∈ ℝ 𝑚 . Chọn hàm thế: 1 X 2 1 1 𝑉(𝜎) = 𝜎𝑖𝑗 = k𝝈 k 2 = k f𝐺 (p) − f𝐺 (p∗ )k 2 , (5.21) 4 (𝑖,𝑗)∈𝐸 4 4
5.4 Điều khiển đội hình dựa trên khoảng cách 83 là tổng các sai lệch khoảng cách mong muốn giữa các tác tử trong hệ thì luật điều khiển đội hình thiết kế theo phương pháp gradient được viết trên hệ tọa độ của tác tử 𝑖 như sau: p¤ 𝑖𝑖 = −∇p𝑖 𝑉 = − 𝑑2𝑖𝑗 − (𝑑∗𝑖𝑗 )2 (p𝑖𝑗 − p𝑖𝑖 ), ∀𝑖 = 1 , . . . , 𝑛. X (5.22) 𝑖 𝑗∈𝑁𝑖 Dễ thấy rằng luật điều khiển (5.22) là một luật phân tán, và luật này chỉ sử dụng các biến đo được bởi tác tử 𝑖 trong 𝑖 Σ. Chuyển phương trình (5.22) sang hệ quy chiếu toàn cục 𝑔 Σ, ta có: X 𝑑2𝑖𝑗 − (𝑑∗𝑖𝑗 )2 (p 𝑗 − p𝑖 ), ∀𝑖 = 1 , . . . , 𝑛. p¤ 𝑖 = − (5.23) 𝑗∈𝑁𝑖 Ta viết lại luật điều khiển đội hình (5.23) dưới dạng ma trận như sau: p¤ = −∇p 𝑉 1 𝜕f𝐺 (p) > f𝐺 (p) − f𝐺 (p∗ ) =− 2 𝜕p = −R(p)> 𝝈. (5.24) Chú ý rằng f𝐺 (p) = blkdiag(z> )z = blkdiag(z> ¯ = D(z)> Hp )Hp ¯ = 𝑖 𝑖 R(p)p, ta có: p¤ = −R(p)> R(p)p + R(p)> f𝐺 (p∗ ). (5.25) Dễ thấy, với luật điều khiển (5.25) thì (1𝑛 ⊗ I2 )> p¤ = 0 nên trọng tâm của đội hình là bất biến theo thời gian. Kết hợp với quan hệ p> (I𝑛 ⊗ J)p¤ = 0, ta suy ra momen động lượng p> (I𝑛 ⊗ J)p của hệ cũng là không đổi theo thời gian [121]. Để phân tích sự hội tụ của hệ, ta định nghĩa các tập hợp: Q = {p ∈ ℝ 𝑑𝑛 | p¤ = 0}, (5.26) 𝑑𝑛 D = {p ∈ ℝ | 𝝈 = 0}, (5.27) U = Q \ D, (5.28) trong đó Q chứa các điểm cân bằng của (5.24), D là tập các điểm cân bằng mong muốn (tập các đội hình thỏa mãn mọi khoảng cách đặt 𝑑∗𝑖𝑗 ), và U là những điểm cân bằng không mong muốn. Sự tồn tại của tập U = {p ∈ ℝ 𝑑𝑛 | R(p)> 𝝈 = 0𝑑𝑛 , 𝝈 ≠ 0𝑚 } gây khó khăn cho việc xét tính ổn định của các đội hình tương ứng với một đồ thị cứng bất kỳ. Ta xét trường hợp (𝐺, p∗ ) là cứng khoảng cách vi phân (rank(R(p∗ )) = 2𝑛 − 3 = 𝑚). Chuyển phương trình (5.25) sang dạng phương trình theo 𝝈, ta thu được: 𝝈¤ = −2D(z)> H ¯H¯ > D(z)𝝈 = −2R(p)R(p)> 𝝈 (5.29) Với hàm Lyapunov được cho bởi 𝑉(𝝈) = 14 𝝈 > 𝝈 thì dọc theo một quỹ đạo của (5.29), ta có: 𝑉¤ = −𝝈 > R(p)R(p)> 𝝈 = −k R(p)> 𝝈 k 2 ≤ 0. (5.30)
84 5 Điều khiển đội hình Từ bất đẳng thức (5.30), ta suy ra 𝝈 là bị chặn và tồn tại lim𝑡→+∞ 𝑉. Do 𝜎 𝑘 = k z 𝑘 k 2 − 𝑑∗𝑘 nên suy ra k z 𝑘 k = k p 𝑗 − p𝑖 k, ∀(𝑖, 𝑗) ∈ 𝐸 cũng bị chặn. Từ bất đẳng thức tam giác, ta suy ra k p 𝑗 − p𝑖 k, ∀𝑖, 𝑗 ∈ 𝑉 là bị chặn, tức là 𝑑max = max𝑖≠𝑗 k p𝑖 − p 𝑗 k bị chặn. Bất đẳng thức sau luôn thỏa mãn: 𝑛k p¯ − p𝑖 k = k p1 − p𝑖 + . . . + p𝑛 − p𝑖 k ≤ k p1 − p𝑖 k + . . . + k p𝑛 − p𝑖 k 𝑛 X = k p 𝑗 − p𝑖 k (5.31) 𝑗=1 Lấy tổng các bất phương trình (5.31) theo 𝑖 = 1, . . . , 𝑛, ta thu được: 𝑛 X 𝑛 X X 𝑛 𝑛 k p¯ − p𝑖 k ≤ k p 𝑗 − p𝑖 k 𝑖=1 𝑖=1 𝑗=1 k p − 1𝑛 ⊗ p¯ k ≤ 𝑛𝑑max ≤ 𝑛𝑑max (0) (5.32) Bất phương trình (5.32) chứng tỏ rằng k p − 1𝑛 ⊗ p¯ k là bị chặn. Do p¯ là không thay đổi và chỉ phụ thuộc vào p(0), ta suy ra p là bị chặn. Do đó, tồn tại 𝑅 = 𝑅(p¯ (0)) sao cho tập compact 𝐵(p¯ (0), 𝑅) = {p ∈ ℝ2𝑛 | k p − 1𝑛 ⊗ p¯ k ≤ 𝑅} chứa p(𝑡), ∀𝑡 ≥ 0. Giao của 𝐵(p¯ (0), 𝑅(p¯ (0))) với các tập Q, D, Q do đó cũng là các tập bị chặn. Đạo hàm cấp hai của 𝑉 là một hàm phụ thuộc vào p, z, 𝝈 nên cũng là một hàm bị chặn. Từ đây, theo bổ đề Barbalat, ta có 𝑉¤ → 0, hay R> 𝝈 → 0𝑚 . Điều này chứng tỏ p → Q, khi 𝑡 → +∞. Định nghĩa 𝛾 = minp∈ U 𝑉(𝝈(𝑡)) > 0. Số họ cấu hình trong U (không tính tới phép quay và tịnh tiến) là một số hữu hạn nên 𝛾 là hoàn toàn được định nghĩa. Từ đây, nếu đội hình ban đầu được chọn thỏa mãn 𝑉(𝝈(0)) < 𝛾 thì rõ ràng, do 𝑉 không tăng, p không thể hội tụ tới tập U. Do p → Q = D ∪ U, U ∩ D = ∅, nên phải có p → D. Do p → D, p bị chặn nên không thể tồn tại khả năng p → +∞ khi 𝑡 → +∞. Mặt khác, luật điều khiển thu được từ gradient của hàm thế 9: limit cycle 𝑉, nên không tồn tại khả năng p hội tụ tới một chu trình khép kín 9 trong D. Điều này dẫn đến việc p(𝑡) → p∗ , với p∗ ∈ D ∩ 𝐵(p¯ (0), 𝑅). Chú ý rằng 𝜎 𝑘 = k z 𝑘 k 2 − k z∗𝑘 k 2 nên ta có 𝑚 X 𝑚 X 𝑚 X 𝜎𝑘 = k z𝑘 k 2 − k z∗𝑘 k 2 = k z k − k z∗ k 2 . (5.33) 𝑘=1 𝑘=1 𝑘=1 Do
2
X 𝑚
X𝑚 𝜎𝑘
≤ 𝑚 𝜎2𝑘 = 4𝑚𝑉(𝝈(𝑡)), (5.34)