GIỚI THIỆU CHUNG VỀ WMR
Giới thiệu về WMR và ứng dụng
Robot di động bánh xe (WMR) là loại robot có khả năng di chuyển trên bề mặt nhờ vào các bánh xe được gắn trên thân robot WMR có thể hoạt động độc lập hoặc dưới sự điều khiển của con người Để hoạt động độc lập, robot cần được trang bị cảm biến để đo đạc các thông số như tọa độ, vị trí, vận tốc, gia tốc và góc hướng Ngoài ra, nó còn cần một máy tính điều khiển để thực hiện các lệnh từ người sử dụng và xử lý tín hiệu phản hồi từ các cảm biến.
Trong tương lai, WMR sẽ được ứng dụng rộng rãi trong các lĩnh vực quân sự và dân sự, đặc biệt là trong các nhiệm vụ yêu cầu di chuyển xa hơn so với robot cố định Với khả năng di chuyển tự do trong không gian làm việc đã được xác định, WMR phù hợp cho các công việc trong môi trường có vật cản, cho phép điều khiển từ xa để xử lý và đo lường trong các môi trường độc hại như chất phóng xạ, hóa chất nguy hiểm WMR cũng có thể được sử dụng cho giám sát an ninh, vận chuyển hàng hóa, do thám trên bề mặt hành tinh khác và trong các kỹ thuật quay phim Nhu cầu ứng dụng WMR ngày càng tăng, dẫn đến nhiều nghiên cứu nhằm nâng cao tính tự trị, linh hoạt và độ tin cậy của nó.
Hình 1-1: Một số dạng phổ biến của WMR a Unicycle mobile robot b.Car-like mobile robot c Omini direction – mobile robot d.Diffirential- Drive mobile robot
Trong luận văn này ta sẽ nghiên cứu về điều khiển Diffirential-Drive mobile robot (DDMR – Robot tự hành 3 bánh)
Các nghiên cứu có liên quan đến lĩnh vực điều khiển DDMR
Để robot hoạt động một cách tự động, cần thiết phải có phần mềm điều khiển trên WMR, với cấu trúc phần mềm được minh họa trong Hình 1-2.
Hình 1-2 : Các nghiên cứu có liên quan đến lĩnh vực điều khiển DDMR
Trong luận văn, ta ngiên cứu về các vấn đề điều khiển quỹ đạo cho DDMR, nằm trong phần mềm điều khiển trên DDMR.
Các nghiên cứu về đã có về điều khiển bám quỹ đạo cho DDMR
Chuyển động bám quỹ đạo của DDMR yêu cầu phải tuân theo một quỹ đạo đã định sẵn, kèm theo các quy định về thời gian Để thực hiện nhiệm vụ này, DDMR cần tính toán sai số giữa quỹ đạo của mình và quỹ đạo tham chiếu, từ đó điều khiển để ổn định sai số quỹ đạo Việc điều khiển phản hồi là phương pháp phổ biến để đạt được yêu cầu chuyển động Mặc dù đã có nhiều phương pháp như điều khiển phản hồi trạng thái, điều khiển trượt và kỹ thuật Backstepping, nhưng chúng thường bỏ qua các ràng buộc động học của DDMR Điều khiển dự báo hoàn toàn khắc phục nhược điểm này, cho phép áp dụng dễ dàng cho hệ thống nhiều vào nhiều ra với các ràng buộc về biến trạng thái và biến điều khiển.
1.3.1 Các phương pháp điều khiển truyền thống
1.3.1.1 Sử dụng bộ điều khiển trượt (Sliding mode control )
Bộ điều khiển trượt đảm bảo tính ổn định Lyapunov cho hệ thống có ràng buộc nonholomonic bằng cách áp dụng và chuyển đổi nhiều luật điều khiển bất biến theo thời gian khác nhau Điều này dẫn đến việc tín hiệu điều khiển từ bộ điều khiển trượt được tạo ra một cách không liên tục.
Trong nghiên cứu [1], luật điều khiển trượt được phát triển nhằm mục tiêu duy trì quỹ đạo và đảm bảo tính ổn định cho robot di động không bánh xe (WMR) Việc áp dụng các kỹ thuật điều khiển tiên tiến là cần thiết để đạt được hiệu quả tối ưu trong quá trình vận hành của WMR.
3 lý thuyết của điều khiển trượt, một bộ phản hồi trạng thái được tác giả đưa ra làm thỏa mãn tính ổn định tiệm cận của toàn hệ thống
Một bất lợi của phương pháp điều khiển trượt là yêu cầu trạng thái đầu của hệ thống phải nằm trong một miền xác định, điều này hạn chế khả năng áp dụng kỹ thuật trong các tình huống thực tế Thêm vào đó, tín hiệu điều khiển từ bộ điều khiển trượt thường không liên tục, gây khó khăn cho việc tìm kiếm cơ cấu có khả năng đáp ứng được sự không liên tục này.
Phương pháp điều khiển trượt mang lại lợi ích chính là tính bền vững của hệ thống trước nhiễu tác động bên ngoài và độ chính xác cao của bộ điều khiển Tuy nhiên, bộ điều khiển này cũng gặp phải vấn đề nhạy cảm với sự thay đổi tham số và chuyển đổi đột ngột, dẫn đến biến đổi tần số cao và hiện tượng chattering.
1.3.1.2 Điều khiển dựa trên luật điều khiển phản hồi trạng thái phụ thuộc thời gian (Time -Varying) và luật điều khiển dựa trên phản hồi động học
Trong tài liệu [2], ba bộ điều khiển được đưa ra để điều khiển bám quỹ đạo và đảm bảo tính ổn định tư thế của WMR:
Bộ điều khiển phi tuyến dựa trên mô hình tuyến tính hóa
Simple linear feedback design of an input to linearize the error dynamic around a reference trajectory
Thiết kế phản hồi phi tuyến dựa trên hàm Lyapunov cho thấy bộ điều khiển tuyến tính hóa phản hồi trạng thái hiệu quả trong việc điều khiển bám quỹ đạo Nghiên cứu chỉ ra rằng các điều kiện ban đầu có ảnh hưởng đến khả năng bám quỹ đạo, đặc biệt khi đầu vào vận tốc khác 0, dẫn đến sai lệch lớn trong quá trình bám quỹ đạo Một trong những nhược điểm chính của các bộ điều khiển này là khó khăn trong việc kiểm soát các ràng buộc đầu vào và trạng thái trong hệ thống Hơn nữa, yêu cầu về quỹ đạo tham chiếu phải là hàm trơn gây khó khăn khi quỹ đạo thay đổi đột ngột, làm tăng độ sai lệch tại các điểm không trơn Để giảm thiểu sai lệch này, cần tăng cường ảnh hưởng của bộ điều khiển PD Mặc dù việc tăng tham số PD có thể giảm sai lệch, nhưng nó cũng làm tăng độ trễ của hệ thống và tín hiệu điều khiển Ngoài ra, tính ổn định bền vững trước nhiễu tác động của bộ điều khiển cũng chưa được đảm bảo trong các nghiên cứu hiện tại.
Về ổn định tư thế, 4 bộ điều khiển khác nhau được đưa ra ở [2]
Non- smooth time varying stabilization
Thiết kế dựa trên hệ tọa độ cực
Phản hồi trạng thái động học
Nghiên cứu chỉ ra rằng, bộ điều khiển thời gian biến smooth và non-smooth làm giảm tốc độ ổn định của hệ thống Ngược lại, bộ điều khiển phản hồi và bộ điều khiển thiết kế dựa trên hệ tọa độ cực mang lại đáp ứng nhanh hơn cho hệ thống.
Các luật điều khiển hybrid kết hợp bộ điều khiển liên tục và rời rạc nhằm đảm bảo tính ổn định cho vòng kín của hệ thống Hệ thống điều khiển bao gồm hai tầng, trong đó bộ điều khiển tầng trên là bộ điều khiển rời rạc, có nhiệm vụ đóng – ngắt các bộ điều khiển liên tục ở tầng dưới Các bộ điều khiển này được áp dụng cho cả dạng chuỗi (chained form).
Phương pháp này gặp khó khăn trong việc kiểm soát đầu ra của bộ điều khiển, do bộ điều khiển đóng-ngắt hoạt động không liên tục Việc đóng-ngắt được thiết kế dựa trên trạng thái đầu vào, và vì trạng thái này thay đổi liên tục, dẫn đến tần số cao trong hoạt động của bộ điều khiển.
1.3.1.4 Robust and Adaptive control law
Trong tài liệu [7], đã đề xuất một luật điều khiển thích nghi bền vững cho việc bám quỹ đạo và lực Mô hình động học và động lực học được chuyển đổi sang dạng chained form Bộ điều khiển bao gồm hai vòng: vòng ngoài đảm bảo bám quỹ đạo, trong khi vòng trong điều khiển mô-men cho động cơ Phương pháp này có ưu điểm là tính bền vững trước nhiễu tác động, nhưng vẫn chưa tính toán đến các ràng buộc đầu vào và đầu ra.
1.3.2 Sử dụng phương pháp điều khiển dự báo
Có 3 lý do chính để thiết kế bộ điều khiển dự báo như sau:
Dễ dàng kiểm soát được tín hiệu điều khiển của WMR
Kiểm soát được đầu ra của hệ thống giúp chất lượng điều khiển tốt hơn Tính ổn định với nhiễu
Nguyên lý điều khiển dự báo sử dụng mô hình chính xác của hệ thống để dự đoán đầu ra tương lai, như được minh họa trong Hình 1 Thuật toán này tính toán tín hiệu điều khiển dựa trên mô hình đối tượng và hàm mục tiêu, nhằm tối ưu hóa hàm mục tiêu trong khi thỏa mãn các ràng buộc của hệ thống Trong chuỗi tín hiệu điều khiển được tính toán cho tương lai, chỉ tín hiệu điều khiển đầu tiên tại thời điểm t_k được áp dụng vào hệ thống thực, trong khi các tín hiệu còn lại sẽ bị loại bỏ.
Trong quá trình điều khiển, với mỗi chu kỳ trích mẫu δ, bộ điều khiển cần lặp lại chu trình tính toán tối ưu Điều này đảm bảo rằng các quyết định được cập nhật liên tục theo từng chu kỳ, giúp duy trì hiệu suất và độ chính xác của hệ thống.
Hình 1-3 Nguyên lý của điều khiển dự báo
Khi hệ thống có mô hình tuyến tính, bài toán tối ưu có thể được phân loại thành bài toán QP lồi nếu hàm mục tiêu sử dụng chuẩn l2 và tập ràng buộc là tập lồi, hoặc là bài toán tối ưu tuyến tính nếu sử dụng chuẩn l1 hoặc l∞ Điểm chung là điểm tối ưu toàn cục có thể tính toán chính xác trong một số trường hợp Đối với hệ thống mô hình là hàm truyền rời rạc hoặc phương trình sai phân, có thể áp dụng phương pháp GPC hoặc AGPC Tuy nhiên, nhiều hệ thống thực tế có mô hình phi tuyến, khiến MPC tuyến tính không khả thi, do đó cần sử dụng mô hình dự báo phi tuyến Điều này dẫn đến bài toán tối ưu không còn là bài toán tối ưu tuyến tính hoặc bậc 2, và có thể không phải là bài toán tối ưu lồi Hiện tại, không có phương pháp giải tối ưu nào đủ nhanh và tin cậy cho các bài toán này, vì vậy nhiều nghiên cứu đã được thực hiện để phát triển các thuật toán MPC phi tuyến nhằm tránh giải bài toán tối ưu phi tuyến online Một phương pháp khả thi là sử dụng mô hình tuyến tính hóa hoặc áp dụng nhiều mô hình tuyến tính hóa để giải bài toán bậc 2 online, bên cạnh đó, nhiều thiết kế điều khiển dự báo phi tuyến cũng đã sử dụng mạng Neural.
Một hệ phi tuyến được mô tả theo công thức sau:
Trong đó x t ( )và u t ( )lần lượt là trạng thái và tín hiệu điều khiển Ký hiệu n , m
Trong thuật toán điều khiển dựa trên mô hình phi tuyến (NMPC), các tập hợp trạng thái và biến điều khiển được ký hiệu lần lượt là X và U, cho phép xác định các tín hiệu điều khiển phù hợp cho hệ thống.
6 thống thường được tính toán qua bài toán tối ưu vòng hở với cửa sổ dự báo hữu hạn sau:
Trong bài toán điều khiển tối ưu, L x( ( ), ( )) u = x Qx u Ru T + T được thiết lập với T p là độ dài của cửa sổ dự báo và T c là độ dài của cửa sổ điều khiển (T c T p) Khi T p = , bài toán trở thành bài toán với cửa sổ dự báo vô hạn, ngược lại, khi T p hữu hạn, ta có bài toán với cửa sổ dự báo hữu hạn Hàm phạt V x t T( ( + )) p thường được gọi là hàm phạt cuối cùng (Terminal penalty) và là điều kiện cuối (Terminal region) Trong đó, Q và R là hai ma trận xác định dương.
Thông thường, thuật toán MPC được thực hiện như sau:
1.Tại thời điểm t k , xác định trạng thái của hệ thống
2 Tính toán tín hiệu điều khiển tối ưu u ( ) ,[ , + ]t t T c bằng cách giải bài toán tối ưu 1-2 thỏa mãn điều kiện 1-3 ta được dãy tín hiệu điều khiển u*( , + )t t T c
3 Chỉ lấy phần tín hiệu điều khiển đầu tiên u t( ) k =u*( ,t t+)với
= + − là thời gian trích mẫu
MÔ HÌNH ĐỘNG HỌC CỦA DDMR
Phương trình động học
Trong phần này, ta sẽ xây dựng mô hình động học (kinematic model) của DDMR
Mô hình động học của một WMR (Robot di chuyển không người lái) bao gồm các phương trình toán học thể hiện mối quan hệ giữa vận tốc, vận tốc góc, vị trí và góc hướng của robot.
Hình 2-1: DDMR và các thông số mô hình
Ta sẽ sử dụng một số giả sử sau để hạn chế được các lớp DDMR khác nhau:
Trong mô hình động học của DDMR, cần lưu ý rằng DDMR không có thành phần giảm xóc, mỗi bánh xe sau chỉ có một thành phần dẫn động, trong khi bánh xe trước không có Các trục dẫn động được bố trí vuông góc với mặt phẳng dọc theo thân DDMR và song song với mặt phẳng của thân DDMR DDMR di chuyển trên một mặt phẳng hoàn toàn phẳng với các bánh xe có bán kính bằng nhau, và các bánh xe chỉ thực hiện chuyển động quay thuần túy mà không có hiện tượng trượt tịnh tiến Để mô tả chính xác mô hình này, cần định nghĩa hai hệ tọa độ khác nhau.
1 Hệ quy chiếu quán tính (Inertial Coordinate Frame) OX I Y I : Có trục Y I hướng về phía Bắc và trục X I hướng về phía Đông
2 Hệ tọa độ gắn với tâm khối lượng của DDMR (Body Frame) 𝑂 𝐵 𝑋 𝐵 𝑌 𝐵 Được định nghĩa như trong hình 2.1
Như trong Hình 2-1, vị trí của robot trên Inertial Frame và góc hướng của nó được định nghĩa là:
Vị trí của robot trên Body frame và góc hướng của nó được định nghĩa là :
Giả sử rằng góc sai lệch giữa hai hệ tọa độ chỉ có sai lệch của góc hướng (heading – yaw), mối liên hệ giữa vị trí và góc hướng của DDMR trên hai hệ tọa độ sẽ được xác định.
Trong đó định nghĩa là góc giữa 2 hệ tọa độ Inertial và Body, và R ( ) là ma trận xoay:
Do hệ tọa độ inertial ta chọn chiều các trục trùng với hệ tọa độ NED (North - East
- Down) nên góc hướng của DDMR bằng với
Trong bài viết này, ta xem xét các vận tốc liên quan đến bánh xe trái và phải trên DDMW, ký hiệu là v_r và v_l Vận tốc tại tâm bánh xe được ký hiệu là v, trong khi ω đại diện cho vận tốc góc của DDMR Từ Hình 2-1, chúng ta có thể xác định mối quan hệ giữa các vận tốc này, cụ thể là v_r, v_l, và v.
Cộng trừ lần lượt các vế của phương trình trên ta được:
Giả sử 1.d, DDMR di chuyển trên một mặt phẳng hoàn toàn phẳng với bán kính bánh xe bằng nhau, do đó các thành phần góc roll và pitch đều bằng 0.
Ta có: Vận tốc của điểm A trên DDMR so với hệ tọa độ Inertial frame biểu diễn trên hệ tọa độ Inertial frame là: cos( ) sin( ) x v y v
Kết hợp với = , hệ phương trình động học mô tả vị trí và góc hướng của DDMR tại điểm A liên quan đến vận tốc dài v và vận tốc góc .
Xét điểm D tại mũi của DDMR, ta có vị trí điểm D được tính là: cos( ) sin( )
Dạo hàm 2 vế của phương trình trên ta có: cos( ) sin( ) sin( ) cos( )
2-2 Để cho dễ nhìn ta đổi x D , y D thành x y , và đặt p = x y T , ta có phương trình động học của DDMR tương ứng với điểm D là:
Ràng buộc Non-holonomic
Hình 2-2: Hình mô tả ràng buộc non-holonomic của DDMR.
Với một giả sử là không có hiện tượng trượt của bánh xe, ta có ràng buộc nonholonomic của robot R được cho bởi:
Tính điều khiển được của DDMR
2.3.1 Tính điều khiển được tại một điểm
Xét tính điều khiển được tại mô hình ứng với điểm A của DDMR Tuyến tính hóa quanh điểm làm việc tại bất kỳ một điểm q e ta có : cos( ) 0 sin( ) 0
Hệ sau khi tuyến tính hóa là không điều khiển được, cho thấy rằng bộ điều khiển tuyến tính không thể đảm bảo sự ổn định cho hệ thống Để đánh giá tính điều khiển của DDMR, cần áp dụng công cụ điều khiển phi tuyến được trình bày trong tài liệu [16].
Ta có phương trình 2-5 trở thành:
Dựa vào tài liệu [16], ta cần tính accessibility rank condition:
là đạo hàm lie của g 2 dọc theo g 1
Khi sin( ) =0, ta có : cos( ) 0 sin( ) 1 0 0 sin( ) 0 cos( ) 0 0 1 3
Khi sin( ) 0 và cos( ) 0, ta có:
2 2 cos( ) 0 sin( ) cos( ) sin( ) 0 sin ( ) sin( ) 0 cos( ) cos( ) sin( ) 0 cos ( )
0 1 0 0 1 0 cos( ) sin( ) 0 sin ( ) cos( ) sin( ) sin ( ) 0
Tổng kết lại ta đều có rank g 1 g 2 g g 1 , 2 = = 3 n với n là số biến trạng thái Theo tài liệu [16] ta có thể kết luận rằng hệ là điều khiển được
Tính điều khiển được tại một điểm của DDMR cho thấy có khả năng tồn tại một tín hiệu điều khiển, giúp hệ thống từ trạng thái ban đầu (x, y, s, s, θ) chuyển đến mọi điểm trong không gian.
DDMR thực hiện quá trình di chuyển bằng cách đầu tiên quay để góc hướng trùng với góc giữa hai vector (x y s, s) và (x g, y g) Tiếp theo, DDMR di chuyển đến vị trí (x g, y g) và cuối cùng điều chỉnh góc hướng để phù hợp với g.
2.3.2 Tính điều khiển được trên một quỹ đạo
Xét quỹ đạo mà DDMR cần bám theo là: q d (t) = ( x d (t), y (t), d d (t) )
Với điều kiện q d (t) = ( x d (t), y (t), d d (t) ) thỏa mãn rằng buộc 2-4,
(t) (t), y (t), (t) d d d d q = x tương ứng với giá trị đặt cho vận tốc tịnh tiến và vận tốc góc ( v d (t), d (t) ) Đặt: q= −q q d , v= −v v d , = − d
Tuyến tính hóa quanh điểm làm việc ta có hệ:
2-6 Đặt: cos( ) sin( ) 0 sin( ) cos( ) 0
Khi mà v d , d là hằng số
Có thể nhận thấy rằng C=3 khi một trong hai biến [vd, ωd] khác 0 Điều này cho phép kết luận rằng hệ thống có khả năng ổn định tiệm cận thông qua việc áp dụng phản hồi tuyến tính với giá trị đặt của vận tốc tịnh tiến và vận tốc góc là hằng số.
Mô hình Leader-Follower
Hình 2-3: A leader -follower formation scheme
Robot R j cần được điều khiển để theo sát robot dẫn đường R i, duy trì khoảng cách L d ij và góc bearing d.
ij và góc heading ij d
Trên hình, p i = x i y i i T là vị trí và góc hướng thực tế của robot dẫn đường R i
Robot Rj có vị trí và góc hướng được biểu diễn bằng p j = [x j, y j, θ j] T, trong khi trạng thái của robot ảo Rd j được biểu diễn bằng p d j = [x d j, y d j, θ d j] T Mục tiêu của bài toán là điều khiển robot Rj theo sát robot dẫn đường Ri, với khoảng cách L d ij và góc bearing ψ ij d cùng với góc heading θ ij d, nhằm đảm bảo rằng vị trí và góc hướng của robot Rj trùng khớp với robot ảo Rd j.
Gọi L ij và ij lần lượt là khoảng cách giữa robot R i ,R j và góc bearing giữa chúng
Ta có thể dễ dàng tính được vị trí của robot ảo R d j là:
( ) ( ) cos cos sin cos d d d i i ij ij i j d d d d j j i i ij ij i d d j i x d L x p y y d L
Tương tự ta có vị trí và góc hướng của robot R j được tính từ robot R i và khoảng cách L ij , góc bearing ij là:
( ) ( ) cos cos sin cos d i i ij ij i j d j j i i ij ij i j j x d L x p y y d L
Ta sẽ phân tích khoảng cách giữa 2 robot L ij thành 2 thành phần vuông góc tương ứng trên trục x và y làL ij x , L ij y Trong đó:
Ta có thể tính L ij x , L ij y từ tọa độ của robot R j và R i như sau: cos( ) cos( ) sin( ) sin( ) ij x i j i ij ij i ij y i j i ij ij i
Lấy đạo hàm 2 phương trình của 2-11 và kết hợp với hệ 2-4 ta có: sin( ) cos( ) cos( ) sin( ) cos( ) sin( ) sin( ) sin( ) cos( ) ijx i j i i i i j j j j ijy i j i i ij ij i i i j j j j
Lấy đạo hàm của 2-10 và kết hợp với phương trình 2-11, 2-12ta có:
1 sin( ) cos( ) cos( ) cos( ) sin( ) ij ijx ijx ijy ijy ijx ijy i ijx i ijy i ij j ijx j ijy j ij j ijx j ijy j ij i ij j ij j ij
Trong đó ta đã đặt: ij = ij + − i j
Sử dụng các đẳng thức sau đây: cos( ), sin( ), cos( ), sin( ), cos( ), sin( ), cos( ), sin( ), cos( ), sin( ), cos( ), cos( ), arctan ijx i ijy i ij ij, ijx i ijy i ij ij, ijx j ijy j ij ij, ijx j ijy j ij ij, ijy ij i ijx.
2-14 Đạo hàm của góc bearing ij được tính bằng : arctan ijy / ij i ijx d L dt
Kết hợp với 2-12 ta có:
1 sin( ) sin( ) cos( ) ij i ij j ij j ij i ij v v d
Từ 2-13 và 2-16 ta có hệ phương trình mô tả leader- follower formation là:
1 sin( ) sin( ) cos( ) ij i ij j ij j ij ij i ij j ij j ij i ij
Nhiệm vụ điều khiển
Nhiệm vụ của bài toán là tìm tín hiệu điều khiển v j và j sao cho:
→ − Điều đó tương đương với: ( d j j ) 0
Ràng buộc đầu vào điều khiển của DDMR
Với v L và v R lần lượt là vận tốc bánh xe trái và bánh xe phải của DDMR Ta có:
Giả sử v L , v R bị giới bạn bởi cơ cấu chấp hành: v R a m s( / ) và v L a m s( / )
Từ đó ta suy ra : v 1 a b
THIẾT KẾ BỘ ĐIỀU KHIỂN DỰ BÁO CHO DDMR
Thiết lập mô hình sai lệch động học
Để đạt được giới hạn khi thời gian tiến tới vô hạn, ta cần đảm bảo rằng sự khác biệt giữa vị trí của robot R j và robot ảo R d j bằng 0 Điều này có thể đạt được bằng cách tìm các tín hiệu điều khiển v j và j phù hợp, sao cho Lim p t → ( d j − p j ) = 0 Đầu tiên, chúng ta cần xác định mô hình trạng thái sai lệch giữa hai robot này.
Sai lệch p e thể hiện sự khác biệt về vị trí và góc hướng của robot R j so với robot R d j trong hệ tọa độ NED Để phân tích sai lệch này, ta cần xem xét sự khác biệt giữa robot R j và robot R d j trong hệ tọa độ gắn liền với robot R j.
0 0 1 cos( ) cos( ) sin( ) sin( ) d je j j j j d j j e je j j j j d je j j d d ij ij ij ij ij ij d d ij ij ij ij ij ij d j j x x x e R p y y y
Do yêu cầu của bài toán điều khiển là L d ij và ij d là hằng số nên ta có L d ij =0 và d 0
ij = Đạo hàm lần lượt từng thành phần của 3-2 và kết hợp ij = ij + − i j = ij + ij ta có:
The article appears to contain a series of mathematical functions and variables that lack coherent meaning in a typical context To provide a meaningful paragraph, please clarify the intended topic or context for the rewrite.
The expression involves a complex combination of sine and cosine functions, indicating interactions between various variables It suggests a detailed mathematical relationship where different sine and cosine terms interact with each other across multiple dimensions This intricate formulation may represent phenomena in physics or engineering, requiring careful analysis to understand the underlying principles.
It seems that the content provided is not coherent or meaningful as it primarily consists of mathematical functions and symbols If you could provide a more structured text or clarify the topic, I would be happy to help you rewrite it into a coherent paragraph that adheres to SEO guidelines.
The article discusses the mathematical relationships involving trigonometric functions such as cosine and sine, emphasizing their applications in various equations It highlights the interactions between different variables and indices, illustrating the complexity of these functions in a structured manner The content also touches on the integration of these functions within specific limits, showcasing their relevance in advanced mathematical concepts Overall, the focus is on the intricate connections between trigonometric identities and their implications in broader mathematical frameworks.
The article discusses the intricate relationships between trigonometric functions such as cosine and sine, highlighting their roles in various mathematical contexts It emphasizes the significance of these functions in understanding complex equations and their applications in fields like physics and engineering By analyzing the patterns and interactions among these functions, the article illustrates how they contribute to solving problems involving angles and periodic phenomena.
= s( ) sin( ) cos( ) cos( ) sin( ) sin( ) cos( ) sin( ) cos( ) d ij ij i ij ij i ij ij j d d ij j ij ij ij j ij d d i ij j je j ij i ij ij v v d
Tổng hợp 2 phương trình 3-3 và 3-4 lại ta có sai lệch giữa robot R j so với robot d
Robot R j trên hệ tọa độ có phương trình vi phân thể hiện mối quan hệ giữa các thành phần chuyển động Cụ thể, phương trình này liên quan đến các hàm sin và cos, cho phép xác định vị trí và vận tốc của robot Thông qua các biến d và L, ta có thể mô tả sự thay đổi trong không gian của robot R j, từ đó phân tích được các yếu tố ảnh hưởng đến chuyển động của nó.
Thiết kế bộ điều khiển dự báo
3.2.1 Thiết kế bài toán điều khiển tối ưu cho bộ điều khiển dự báo
Do hệ có ràng buộc nonholomonic 2-3, khi robot Rj bắt đầu bám R i, không thể chọn ngay góc hướng θdj = θi Do đó, từ phương trình 2-4 và tài liệu tham khảo [10], ta có thể lựa chọn θjd có đạo hàm như sau:
( i sin( ij ) d ij i sin( ij d ij ) 2 2 je ) d j v L k y d
Sở dĩ ta có thể chọn như vậy là do ràng buộc 2-4 và ta sẽ chọn thêm sao cho d j có thể bám theo i khi hệ thống đã ổn định
Từ đó ta có thể viết lại hệ sai lệch 3-5 thành:
2 cos( ) sin( ) sin( ) cos( ) sin( ) sin( ) 2 /
, , , d d je i ij j je j ij i ij ij d d j je i ij j je j ij i ij ij d d je i ij ij i ij ij je j je je j x v y v L e y v x d L v L k y d f x y u t
3-7 Đặt: cos( ) sin( ) sin( ) cos( ) d d e j i ij ij i ij ij e d d e j i ij ij i ij ij v v v L u d v L
2 cos( ) sin( ) sin( ) cos( ) sin( ) sin( ) 2 /
2 / d d je i ij j je j ij i ij ij d d je i ij j je j ij i ij ij d d je i ij ij i ij ij je j j je e j je e je e x v y v L y v x d L v L k y d y v x k y d
Ta đặt hàm mục tiêu tại thời điểm trích mẫu t k là:
Ta định nghĩa bài toán tối ưu như sau:
Bài toán tối ưu 1: Tìm:
Với 0 < λ < 1 và k ∈ {1, 2, k3} > 0, hệ số thiết kế sẽ được xác định Quỹ đạo của rang buộc a trong Bài toán tối ưu 1 tương ứng với tín hiệu điều khiển u ∈ U Lưu ý rằng, điều kiện e(tj | kt) = e(tj) là giá trị đầu vào cho mô hình dự báo, và giá trị này được lấy từ giá trị thực tế tại thời điểm mẫu tk.
Hàm mục tiêu 3-11 chứa thành phần k ( ( | ), ( | ) ) k t T j k e k t
có cửa sổ dự báo hữu hạn và thành phần hàm phạt (terminal) g e t ( j ( k + T t | ) k ) Điều kiện
Trong bài toán tối ưu, việc sử dụng các yếu tố như j, k, e, t và T sẽ giúp điều chỉnh quỹ đạo trạng thái dự báo, đưa nó đến vùng lân cận Ω Điểm cuối cùng trong quỹ đạo này sẽ được xác định rõ ràng, tạo ra một kết quả tối ưu cho quá trình dự báo.
là terminal region của bài toán tối ưu Ta sẽ chọn sao cho nó là bất biến ứng với một tín hiệu điều khiển phản hồi ( ) u
Nghiệm của Bài toán tối ưu 1 tại thời điểm lấy mẫu t k là:
( ) ( | ) : , j k j k k k u t = u t t t + T tương ứng với nó là tín hiệu dự báo tối ưu:
Ta định nghĩa thuật toán điều khiển như sau:
1 Tại thời điểm t k , xác định các trạng thái của leader và follower gồm: u j ,u i ,p j
2 Giải Bài toán tối ưu 1 để xác định được tín hiệu điều khiển tối ưu u t j ( ) k
3 Đưa tín hiệu u t j ( ) k vào follower chỉ trong khoảng t t k , k + 1 )
4 Cho k→ +k 1 rồi quay lại bước 1
3.2.2 Xét tính feasibility của bài toán tối ưu và chứng minh tính ổn định của hệ thống Định lý 1: Xét hệ sai lệch 3-9 sử dụng Thuật toán điều khiển 1, nếu Bài toán tối ưu 1 feasible tại thời điểm 𝑡 0 thì :
1 Nó cũng feasible tại mọi thời điểm 𝑡 > 𝑡 0
2 Hệ sai lệch ổn định tiệm cận
Để chứng minh Định lý 1, chúng ta sẽ sử dụng một số bổ đề và định nghĩa quan trọng Định nghĩa 1 chỉ ra rằng trong hệ sai lệch 3-9, các thành phần và u j được xác định là vùng kết thúc (terminal region) và bộ điều khiển kết thúc (terminal controller) của bài toán tối ưu Cụ thể, nếu ban đầu có e t j (k + T t|) với k thuộc , thì đối với mọi thuộc khoảng (t k + T t, k + 1 + T], điều kiện u j (| t k + 1) = u j (| t k + 1) sẽ được thỏa mãn.
Bổ đề 1: Xét hệ 3-9 tại thời điểm t k , cho u j U, i 2 u a
= thì = p e : k x 1 je + k 2 y je + k 3 je a (1 − r ) sẽ là terminal region cho terminal controller:
1 sin( ) cos( ) d d je i ij ij i ij ij j d d i ij ij i ij ij je je k x v L u v L k y k d
Với các hệ số p q i , i thỏa mãn: 1 1 1 p q 4, 1 1 1 1 1
Trong đó p q i , i lần lượt là số trên đường chéo của ma trận P và Q được cho bởi
Chứng minh: Đầu tiên, với terminal controller cho như công thức 3-12, ta có:
1 cos( ( )) sin( ( )) sin( ) sin( ( )) d d j j je i ij ij i ij ij d d i ij ij i ij ij je je je je je d d i ij ij i ij ij d d i ij ij i ij ij v k x v k L k a b a v k L k k y k a k x k y k v k L k a v L k
(1 ) cos( ( )) sin( ( )) sin( ( )) sin( ( )) r i ij ij d d d ij i ij ij ij ij v k k
Dễ thấy: cos( ) +sin( ) 2 , nên:
Do đó ta có thể thấy u j ( | ) t k U nếu ta cho u j ( | t k + 1 )=u j ( | t k + 1 ),
+ + + Định nghĩa 1.1 được thỏa mãn
Tiếp theo, để chứng minh e j ( | ) t k khi có e t j ( k +T t| ) k , ( t k +T t, k + 1+T
Ta chọn hàm g e t ( j ( k + T t | k ) ) là hàm ứng viên Lyapunov Khi cho
( | ) ( | ) j k j k u t + =u t + , ( t k +T t, k + 1+T ta có hệ sai lệch 3-9 trở thành:
3 2 je j je je je j je je je je je je x y k x y x k y k k k y d
= Đạo hàm g e t ( j ( k + T t | k ) ) trên quỹ đạo trạng thái e j = f x ( je , y je , u t j , ) ta có:
0 j k k je je je je je je je je je je je je je je je je g e t T t x x y y dk k k x k y k y k k y k k x k y k
Có nghĩa là là tập bất biến với u j ( | ) t k U, do đó e t j ( k +T t| ) k sẽ đúng với mọi t k một khi đã có e t j ( | ) k t k Định nghĩa 1.2 được thỏa mãn
Cuối cùng, với e j ( | ) t k , ta có:
( ) (2 ) (2 j k j k e k je je je je je je je je je e e je je je je je je je je je je je g e t L e t u t x x y y q x q y q p v p k x k y k q x q y q p k x p k y k p k k q x p k k q y
Nên ta sẽ có : g e( ( | )) j t k +L e( ( | ), j t k u e ( | )) t k 0 Định nghĩa 1.3 được thỏa mãn, do đó Bổ đề 1 được chứng minh
Bây giờ chúng ta sẽ quay lại chứng minh Định lý 1:
1 Theo Bổ đề 1, với r 2 D max( i ) a u
= + + − là terminal region ứng với terminal controller:
1 sin( ) cos( ) d d je i ij ij i ij ij j d d i ij ij i ij ij je je k x v L u v L k y k d
Giả sử rằng Bài toán tối ưu 1 tại thời điểm t_k không có nghiệm tối ưu u_t^* (k) Do Bài toán tối ưu 1 có ràng buộc e_t^j (k + T_t|) ∈ Ω, khi tín hiệu này được đưa vào hệ sai lệch e_j = f(x_je, y_je, u_t^j), ta sẽ có e_t^j* (k + T_t|) ∈ Ω Theo Thuật toán 1, tín hiệu điều khiển trong khoảng thời gian [t_k, k + 1) được đưa vào hệ sai lệch 3-9, dẫn đến e_t^j(k + 1) = e_t^j* (k + 1 |)t_k Điều này có nghĩa là e_t^j* (k + 1 |)t_k sẽ là trạng thái ban đầu khả thi cho Bài toán tối ưu 1 tại thời điểm t_k + 1 Để giải bài toán tối ưu mở tại thời điểm t_k + 1, ta sẽ chọn chuỗi điều khiển khả thi như sau:
Với u j được cho trong Bổ đề 1 Do là tập bất biến với ứng với u j (| t k )U và
( | ) j k k e t +T t nên: e t j ( k + 1 +T t| k + 1 ) Từ đó ta có thể suy ra một khi bài toán tối ưu feasible tại thời điểm t 0 thì nó sẽ feasible tại mọi thời điểm t k t 0
2 Để chứng minh Định lý 1.2, ta xét hàm Lyapunov sau: V t ( ) k = J e t ( j ( ), k u t j ( ) k )
2 k k k k k k t T j k t je k k je k k je k k t t T j k Q j k P j k Q j k P t t T je k k je k k je k u t d x t T t y t T t dk t T t k e t u t d e t u t d x t T t y t T t dk t k
Tích phân Định nghĩa 1.3 từ t k + T đến t k + 1 + T ta có:
( | ) ( | ) 0 k k je k k je k k je k k je k k je k k je k k t T j k Q j k P t T x t T t y t T t dk t T t k x t T t y t T t dk t T t k e t u t d
Thay vào bất đẳng thức trên ta có:
0V(0)với là hằng số nên ró ràng tích phân 0 ( j ( ) 2 j ( ) 2 )
là bị chặn Lại có V 0nên dãy số V t ( ) k = J e t ( j ( ), k u t j ( ) , k ) k = 1, là dãy giảm và bị chặn dưới bởi 0 nên sẽ tồn tại giới hạn hữu hạn lim ( ) k k
→ = , do đó ta có hệ sai lệch 3-9 ổn định tiệm cận tại gốc tọa độ Ta có Định lý 1.2 được chứng minh
3.2.3 Kết quả mô phỏng khi chạy thuật toán trên Matlab
Mô phỏng được thực hiện trên phần mềm Matlab-Simulink R2018a, sử dụng công cụ giải tối ưu Yalmip
Thông số của DDMR được cho như sau:
Vận tốc tối đa của mỗi bánh xe của DDMR: a=2(m s/ )
Khoảng cách từ tâm đến mũi DDMR:d =0.1( )m
Vị trí ban đầu của DDMR R i và R j : p i (0) = 0 0 / 2 T , p j (0) = 1 − 1 / 2 T
Ta sẽ mô phỏng trên 2 trường hợp: Khi DDMR di chuyển thẳng và khi di chuyển theo 1 đường tròn
3.2.3.1 Khi di chuyển trên một đường thẳng
Vận tốc tịnh tiến và vận tốc góc của Leader được cho như sau:
Các giá trị đặt: L d ij =0.5( ),m ij d =3 / 2
Ta có kết quả mô phỏng như sau:
Hình 3-1: Qũy đạo trạng thái của DDMR 𝑅 𝑖 và 𝑅 𝑗
Hình 3-2: Tín hiệu điều khiển đặt vào DDMR 𝑅 𝑗
Hình 3-3: Sai lệch giữa tín hiệu đặt của DDMR 𝑅 𝑗 𝑑 và 𝑅 𝑗
Hình 3-4: Giá trị của 𝐿 𝑖𝑗 và 𝜓 𝑖𝑗 so với giá trị đặt
Hình 3-5: Ràng buộc điều khiển của 𝑣, 𝜔
3.2.3.2 Khi di chuyển trên một đường tròn
Vận tốc tịnh tiến và vận tốc góc của Leader được cho như sau:
Các giá trị đặt: L d ij =0.5( ),m ij d =3 / 2
Ta có kết quả mô phỏng như sau:
Hình 3-6 : Qũy đạo trạng thái của DDMR 𝑅 𝑖 và 𝑅 𝑗
Hình 3-7:Tín hiệu điều khiển đặt vào robot 𝑅 𝑗
Hình 3-8: Sai lệch giữa giá trị đặt của DDMR 𝑅 𝑗 𝑑 và 𝑅 𝑗
Hình 3-9: Giá trị của 𝐿 𝑖𝑗 và 𝜓 𝑖𝑗 so với giá trị đặt
Hình 3-10: Ràng buộc của tín hiệu điều khiển 𝑣, 𝜔
Hình 3-1 và Hình 3-6 biểu diễn quỹ đạo của robot theo thời gian thực khi sử dụng
Thuật toán điều khiển 1 cho DDMR R j cho phép robot R j bám sát robot R i hiệu quả, bất kể R i di chuyển theo đường thẳng hay đường tròn.
Hình 3-2 và Hình 3-7 minh họa tín hiệu vận tốc tuyến tính và vận tốc góc của robot R j trong hai tình huống: khi robot R i di chuyển trên quỹ đạo thẳng và khi di chuyển trên quỹ đạo tròn Trong trường hợp di chuyển thẳng, robot R j cần bám theo robot R i với khoảng cách L d ij = 0.5 m và góc bearing 3.
= nên ta phải có khi mà vào trạng thái ổn định rồi thì v j =v i và j i
= , trên Hình 3-2 có thể thấy khi vào trạng thái ổn định j i =0(rad s/ )và
0.15( / ) j i v =v m s Trong trường hợp theo quỹ đạo hình tròn, do 3
= nên ta cần có khi vào trạng thái ổn định thì : v j v i và j = i Ở đây ta có v ji 0.17(m s/ ) và j i =0.04(rad s/ )
Hình 3-3 và Hình 3-8 cho thấy sai lệch trạng thái của DDMR Rj và quỹ đạo đặt ảo Rdj gần như bằng 0 Tương tự, Hình 3-4 và Hình 3-9 cho phép so sánh khoảng cách đặt Ldij và góc bearing ψij d, cho thấy sự tương đồng rõ rệt giữa chúng.
Hình 3-5 và Hình 3-10 cho ta thấy rang buộc của tín hiệu điều khiển Ở đây ta cần có v j j 1 a b
+ Điều này luôn được thỏa mãn trong suốt quá trình hoạt động của DDMR R j
THIẾT KẾ BỘ ĐIỀU KHIỂN DỰ BÁO BỀN VỮNG
Lập mô hình sai lệch khi hệ cho nhiễu
Do trên thực tế, hệ sẽ bị tác động bởi nhiễu ngoài:
Với cách làm hoàn toàn tương tự như trong Chương 2, ta có thể thiết lập mô hình sai lệch giữa Robot R j và tín hiệu điều khiển ảo choR d j là:
, , , , d d je i ij j je j ij i ij ij d d j je i ij j je j ij i ij ij j n d je j j je je j n x v y v L e y v x d L R d g x y u t d
Thiết kế bộ điều khiển dự báo bền vững cho hệ
Chúng tôi sẽ thiết kế một thuật toán điều khiển dự báo bền vững cho hệ 4-2 nhằm đưa e j về gần gốc tọa độ Hệ 4-2 thiếu thành phần R ( ) j d n không thể dự đoán trước, do đó, chúng tôi sẽ xây dựng một bài toán tối ưu dựa trên mô hình danh định không có nhiễu.
Tại thời điểm trích mẫu t k , ta chọn hàm mục tiêu như sau:
Ta định nghĩa bài toán tối ưu như sau:
Bài toán tối ưu 2: Tìm:
( | ) j k j j j k e k u t j j je je j j k j k k j k tube j k k tube u v arc J e t u t s t e g x y u t p t p t t P u t U e t T t
: 1 2 3 ( ) tube e j k x je k y je k je a tube r
Với 0 r 1, k k 1 , 2 , k 3 0, tube sẽ là hệ số được thiết kế
Nghiệm của Bài toán tối ưu 2 tại thời điểm lấy mẫu t k là:
( ) ( | ) : , j k j k k k u t = u t t t + T tương ứng với nó là tín hiệu dự báo tối ưu:
Việc sử dụng tín hiệu điều khiển tối ưu u t j ( ) k trong khoảng thời gian t thuộc đoạn [t k , k + 1) sẽ không đảm bảo rằng quỹ đạo trạng thái của hệ thống thực trùng khớp với quỹ đạo trạng thái tối ưu của mô hình dự báo, do ảnh hưởng của nhiễu.
Sai lệch của DDMR so với hệ danh định tại thời điểm t t t k , k + 1 )sẽ là:
Lấy đạo hàm 4-3 theo thời gian ta có :
là ma trận giả nghịch đảo của M ( )
Ta đưa ra thuật toán điều khiển dự báo bền vững như sau:
1 Tại thời điểm t k , xác định các trạng thái của leader và follower gồm: u j ,u i
2 Giải Bài toán tối ưu 2 để xác định được tín hiệu điều khiển tối ưu u t j ( ) k
3 Tính tín hiệu điều khiển cho robot R j theo công thức 4-5
4 Đưa tín hiệu vừa tím được vào robot R j chỉ trong khoảng t t k , k + 1 )
5 Cho k→ +k 1 rồi quay lại bước 1 Đạo hàm 4-5 ta có:
Bổ đề 3: Trạng thái của hệ thống thực nằm trong tập T = p * j P với P được cho trong Bài toán tối ưu 2
Nghiệm của phương trình này được cho bởi:
Sử dụng điều kiện đầu của Bài toán tối ưu 2 và điều kiện nhiễu bị chặn ta có :
Theo công thức 4-3, ta có p j thuộc p * j cộng P T Điều này cần được chứng minh Tiếp theo, chúng ta sẽ xác định điều kiện cho U tube và tube, nhằm đảm bảo rằng khi sử dụng công thức điều khiển 4-5, luôn có u j thuộc U.
* * cos( ) cos( ) cos( ) sin( ) cos( ) ( ) sin( ) sin( ) sin( ) cos( ) sin( ) ( ) cos( ) sin( ) cos( ) ( ) sin( ) ( ) cos( ) sin( j j j j j j j x j j j j j j j j y j j j j j j j j x j j j y j j j v v d k x x v d k y y v d k x x k y y v e d e
2 sin( ) cos( ) sin( ) sin( ) sin( ) ( ) 1 cos( ) sin( ) cos( ) cos( ) cos( ) ( ) 1
Ta cần tìm điều kiện của v * j , * j sao cho v j j 1 a b
Từ Bài toán tối ưu 2, ta có:
+ Điều này tương đương với : v * j + d * j a tube
2 2 cos( ) sin( ) cos( ) sin( ) sin( ) cos( ) sin( ) cos( ) 1
1 cos( ) sin( ) cos( ) sin( ) sin( ) cos( ) 1
1 cos( ) sin( ) sin( ) cos( ) cos( ) sin( ) sin( ) cos( ) j x x j y y j j j j tube k e k e k e d v e d e v e d e
Với: H = cos( j ) k e x x + sin( j ) k e y y + sin( j ) k e x x + cos( j ) k e y y
* * * * cos( ) sin( ) sin( ) cos( ) 2 j j tube v e + d e + v e + d e a 4-12
Hoàn toàn tương tự và kết hợp với p e − / k x −/ k y −/ k ta có: cos( j ) x x sin( j ) y y sin( j ) x x cos( j ) y y 2
Từ đó ta suy ra :
Từ đó ta cận chọn a tube sao cho:
Từ đó ta suy ra
Bổ đề 4: Sử dụng công thức điều khiển 4-5 thì sẽ luôn thỏa mãn: u j Ukhi mà
Định lý 2 chứng minh rằng, trong hệ sai lệch 4-2 với việc áp dụng Thuật toán điều khiển 2, nếu Bài toán tối ưu 2 khả thi tại thời điểm 𝑡 0, thì các kết quả sẽ được trả về tương tự như trên.
1 Nó cũng feasible tại mọi thời điểm 𝑡 > 𝑡 0
2 Hệ sai lệch ổn định ISS Định nghĩa 2 : Hệ (2.9) là Input-to-state stable (ISS) nếu tồn tại hàm Kappa-Ell
→ và một hàm Kappa (.) thỏa mãn : với mọi t0 hệ đảm bảo được : p e ( p t e ( ) , ) 0 t + ( ) Với t 0 là initial time , và được đề cập ở 4-1
Bổ đề 5: Xét hệ 4-2 tại thời điểm t k , cho u j U, i 2 u a
= thì = p e : k x 1 je + k 2 y je + k 3 je a ( tube − r ) sẽ là terminal region cho terminal controller:
1 sin( ) cos( ) d d je i ij ij i ij ij j d d i ij ij i ij ij je je k x v L u v L k y k d
Với các hệ số p q i , i thỏa mãn: 1 1 1 p q 4, 1 1 1 1 1
Trong đó p q i , i lần lượt là số trên đường chéo của ma trận P và Q được cho bởi
Chứng minh: Đầu tiên, với terminal controller cho như công thức 4-15, ta có:
1 cos( ( )) sin( ( )) sin( ) sin( ( )) d d j j je i ij ij i ij ij d d i ij ij i ij ij je je je je je d d i ij ij i ij ij d d i ij ij i ij ij v k x v k L k a b a v k L k k y k a k x k y k v k L k a v L k
( ) cos( ( )) sin( ( )) sin( ( )) sin( ( )) tube r i ij ij d d d ij i ij ij ij ij v k k
Lại có: cos( ) +sin( ) 2 , nên:
0 0 j j d tube r i ij i d ij i tube r i tube v v L a b a
Do đó ta có thể thấy u j ( | ) t k U nếu ta cho u j ( | t k + 1 )=u j ( | t k + 1 ),
+ + + Định nghĩa 1.1 được thỏa mãn
Tiếp theo, để chứng minh e j ( | ) t k khi có e t j ( k +T t| ) k , ( t k +T t, k + 1+T
Ta chọn hàm g e t ( j ( k + T t | k ) ) là hàm ứng viên Lyapunov Khi cho
( | ) ( | ) j k j k u t + =u t + , ( t k +T t, k + 1+T ta có hệ sai lệch 4-2 trở thành:
3 2 je j je je je j je je je je je je x y k x y x k y k k k y d
= Đạo hàm g e t ( j ( k + T t | k ) ) trên quỹ đạo trạng thái e j = f x ( je , y je , u t j , ) ta có:
0 j k k je je je je je je je je je je je je je je je je g e t T t x x y y dk k k x k y k y k k y k k x k y k
Có nghĩa là là tập bất biến với u j ( | ) t k U, do đó e t j ( k +T t| ) k sẽ đúng với mọi t k một khi đã có e t j ( | ) k t k Định nghĩa 1.2 được thỏa mãn
Cuối cùng, với e j ( | ) t k , ta có:
( ) (2 ) (2 j k j k e k je je je je je je je je je e e je je je je je je je je je je je g e t L e t u t x x y y q x q y q p v p k x k y k q x q y q p k x p k y k p k k q x p k k q y
Nên ta sẽ có : g e( ( | )) j t k +L e( ( | ), j t k u e ( | )) t k 0 Định nghĩa 1.3 được thỏa mãn, do đó Bổ đề 5 được chứng minh
Bây giờ chúng ta sẽ quay lại chứng minh Định lý 2:
Theo Bổ đề 5, với r 2 D max( i ) a u
= + + − là terminal region ứng với terminal controller:
1 sin( ) cos( ) d d je i ij ij i ij ij j d d i ij ij i ij ij je je k x v L u v L k y k d
Giả sử rằng Bài toán tối ưu 2 tại thời điểm t_k không có nghiệm tối ưu u_t^* (k) Do Bài toán tối ưu 2 có ràng buộc e_t^j (k + T_t|) ∈ Ω_tube, khi tín hiệu này được đưa vào hệ sai lệch e_j = f_x (je, y_je, u_t^j), ta sẽ có e_t^j* (k + T_t|) ∈ Ω_tube Theo Thuật toán 2, tín hiệu điều khiển trong khoảng thời gian [t_k, k + 1) được đưa vào hệ sai lệch 4-2, do đó theo Bổ đề 3, trạng thái của hệ thống thực tại thời điểm t_k + 1 sẽ thỏa mãn p_t^*(k) ∈ p_t ⊕ P, nghĩa là p_t^j*(k + 1|) t_k sẽ là trạng thái khởi đầu khả thi.
Bài toán tối ưu 2 tại thời điểm t k + 1 Từ đó để giải open-loop optimization tại thời điểm t k + 1 , ta sẽ chọn feasible control sequence như sau:
Với u j được xác định trong Bổ đề 2, tập tube là tập bất biến đối với u j ( | t k )U tube và e t j ( k +T t| ) k, do đó e t j ( k + 1 +T t| k + 1 ) tube Điều này dẫn đến kết luận rằng nếu bài toán tối ưu là khả thi tại thời điểm t 0, thì nó cũng sẽ khả thi tại mọi thời điểm t k t 0.
2 Để chứng minh Định lý 2.2, ta xét hàm Lyapunov sau: V t ( ) k = J e t ( j ( ), k u t j ( ) k )
2 k k k k k k t T j k t je k k je k k je k k t t T j k Q j k P j k Q j k P t t T je k k je k k je k u t d x t T t y t T t dk t T t k e t u t d e t u t d x t T t y t T t dk t k
Tích phân Định nghĩa 1.3 từ t k + T đến t k + 1 + T ta có:
( | ) ( | ) 0 k k je k k je k k je k k je k k je k k je k k t T j k Q j k P t T x t T t y t T t dk t T t k x t T t y t T t dk t T t k e t u t d
Thay vào bất đẳng thức trên ta có:
0V(0)với là hằng số nên ró ràng tích phân 0 ( j ( ) 2 j ( ) 2 )
41 chặn Lại có V 0nên dãy số V t ( ) k = J e t ( j ( ), k u t j ( ) , k ) k = 1, là dãy giảm và bị chặn dưới bởi 0 nên sẽ tồn tại giới hạn hữu hạn lim ( ) k k
Hệ sai lệch được xác định là ổn định tiệm cận tại gốc tọa độ, từ đó tồn tại hàm Kappa-Ell là β(ã, ã) thỏa mãn các điều kiện nhất định.
Hơn nữa, vỡ p e P với t t 0 nờn sẽ tồn tại hàm Kappa là γ (ã) thỏa món :
+ Để ý rằng: p t e ( ) 0 0 Từ đó ta suy ra: e t j ( ) ( e t j ( ), t ) 0 + ( ) , t t 0 , từ đó theo Định nghĩa 2 ta có hệ 4-2 ổn định ISS.
Kết quả mô phỏng
Tương tự như 3.2.3, ta cũng mô phỏng thuật toán trên 2 trường hợp: R i di chuyển trên một đường thẳng và R i di chuyển trên một đường tròn
4.3.1.1 Khi di chuyển trên đường tròn
Vận tốc tịnh tiến và vận tốc góc của Leader được cho như sau:
Các giá trị đặt: L d ij =0.5( ),m ij d =3 / 2
Và: = e j : k x 1 je + k y 2 je + k 3 je a ( tube − r ) , tube = 0.56, r = 0.12
Ta có kết quả mô phỏng như sau:
Hình 4-1: Quỹ đạo trạng thái Leader – follower
Hình 4-2: Sai lệch điều khiển của DDMR 𝑅 𝑗 và 𝑅 𝑖 𝑑
Hình 4-3: Khoảng cách 𝐿 𝑖𝑗 , góc 𝜓 𝑖𝑗 và giá trị đặt
Hình 4-4Tín hiệu điều khiển
Hình 4-5: Ràng buộc của tín hiệu điều khiển 𝑣, 𝜔
4.3.1.2 Khi 𝑅 𝑖 di chuyển trên một đường thẳng
Vận tốc tịnh tiến và vận tốc góc của Leader được cho như sau:
Các giá trị đặt: L d ij =0.5( ),m ij d =3 / 2
Và: = e j : k x 1 je + k y 2 je + k 3 je a ( tube − r ) , tube = 0.56, r = 0.12
Ta có kết quả mô phỏng như sau:
Hình 4-6: Quỹ đạo trạng thái của leader – follower
Hình 4-7 Sai lệch điều khiển của DDMR 𝑅 𝑗 và 𝑅 𝑖 𝑑
Hình 4-8 Tín hiệu điều khiển cho robt 𝑅 𝑗
Hình 4-9 :Khoảng cách 𝐿 𝑖𝑗 , góc 𝜓 𝑖𝑗 và giá trị đặt
Hình 4-10 Ràng buộc cho tín hiệu điều khiển 𝑣, 𝜔
Từ các đồ thị ta có thể thấy robot 𝑅 𝑗 có thể bám theo robot 𝑅 𝑖 với khoảng cách 0.5( ), 3 / 2 d d ij ij
L = m = ngay cả khi trong trường hợp có nhiễu Các sai lệch là rất nhỏ và điều kiện rang buộc cho tín hiệu điều khiển của DDMR 𝑅 𝑗 là j j 1 v a b