TỔNG QUAN MÔ HÌNH TRACTOR-TRAILER
Cấu tạo và nguyên lý hoạt động
Hệ xe kéo bao gồm một Tractor và một Trailer thụ động, trong đó Tractor được điều khiển trực tiếp, còn Trailer được dẫn động hoàn toàn bởi Tractor Hình 1.1 minh họa cấu trúc của hệ xe kéo này.
Xe kéo được thiết kế với hai bánh xe gắn trên trục, mỗi bánh có thiết bị truyền động độc lập, cùng với một bánh xe tự do giúp xe duy trì sự cân bằng và khả năng di chuyển đa hướng.
Xe thay đổi hướng chuyển động bằng cách thay đổi vận tốc góc tương đối giữa các bánh xe
Trailer có thiết kế gồm hai bánh xe và một bánh cân bằng, tất cả đều là bánh thụ động Chuyển động của trailer hoàn toàn phụ thuộc vào xe kéo (Tractor) thông qua khớp nối tại điểm Q.
Hình 1.1: Cơ cấu hệ xe kéo
P 0 , P 1 Trung điểm hai bánh xe của hai xe, và được quy ước là tọa độ của xe
C 0 , C 1 Trọng tâm của hai xe d 0 , d 1 Khoảng cách từ P 0 và P 1 tới khớp nối Q
Chương 1: Tổng quan mô hình tractor-trailer
4 a 0 , a 1 Khoảng cách từ P 0 , P 1 lần lượt tới C 0 và C 1 r Bán kính bốn bánh xe
2b Khoảng cách giữa hai bánh Tractor m 0 , m 1 Trọng lượng của Tractor và Trailer
I 0 , I 1 Mômen quán tính của hai xe qua trọng tâm của xe
Bảng 1.1: Tham số của hệ xe kéo Đối với hệ xe kéo được tìm hiểu trong đồ án, có Q P 0 , tức là d 0 0 Ký hiệu d d 1
Với C C 0 , 1 là trọng tâm của Tractor và Trailer, P 1 ( , )x y là gốc tọa độ của hệ tọa độ gắn vào Trailer Như vậy các biến của hệ được xác định:
- Biến cần điều khiển: Tọa độ x y, của Trailer
- Biến điều khiển: Mômen r , l cấp cho hai bánh của Tractor
- Các biến trạng thái: vận tốc dài u 1 của Trailer, tốc độ góc u 2 và góc quay
Hệ được thiết kế dựa trên sách lược điều khiển tầng, vì vậy mô hình đối tượng được xác định:
- Vòng ngoài: đầu vào là vector vận tốc u u 1 u 2 T , đầu ra là quỹ đạo biến khớp
- Vòng trong: đầu vào là mômen cấp cho hai bánh Tractor, đầu ra là vector vận tốc u
Mô hình động lực học u S q ( ) q q ®k
Chương 1: Tổng quan mô hình tractor-trailer
Hình 1.2: Mô hình đối tượng hệ xe kéo
Mô hình của Tractor-Trailer
1.2.1 Mô hình vòng ngoài (vòng động học)
Giả sử các bánh xe lăn mà không trượt, thì vector vận tốc của từng xe tại các điểm P0 và P1 sẽ song song với phương của xe, dẫn đến việc hình thành các ràng buộc nhất định.
Trong đó x,y là vận tốc của Trailer,
P 0 y là vận tốc của Tractor theo 2 trục Ox và Oy của hệ trục tọa độ gốc
Thay vào phương trình (1.1) ta được
( sin sin sin ) ( cos cos cos ) 0 sin cos cos( ) 0 x d y d x y d
Từ (1.1) và (1.4) ta có được ràng buộc về quỹ đạo của hệ xe kéo:
(1.6) được gọi là ma trận ràng buộc Ràng buộc này thuộc loại ràng buộc non – holonomic (không tích phân được)
Trở về công việc mô hình hóa, do ràng buộc (1.1), ta có được các phương trình:
Chương 1: Tổng quan mô hình tractor-trailer
Kết hợp các phương trình trên, ta xác định được mô hình vòng ngoài của hệ với các biến trạng thái x y, , , 1 0 :
Trong đó u 1 và u 2 chính là đầu vào của hệ Như vậy hệ (1.9) được coi là hụt cơ cấu chấp hành
1.2.2 Mô hình vòng trong (vòng động lực học)
Vòng động lực học mô tả mối liên hệ giữa các lực tác dụng và quỹ đạo của biến khớp Hệ xe kéo có nhiều lực liên kết không sinh công, làm cho việc phân tích theo định luật Newton trở nên phức tạp Phương pháp hiệu quả thường được áp dụng là mô hình Euler – Lagrange.
Với điều kiện ràng buộc non-holonomic ở phương trình (1.5)
- r l T là vector mômen cấp đầu vào
- d dr dl T là vector thể hiện thành phần nhiễu bất định bị chặn
Chương 1: Tổng quan mô hình tractor-trailer
- M q ( ) 4 4 là ma trận quán tính đối xứng, xác định dương
- C q q ( , ) 4 4 là ma trận thể hiện thành phần mômen nhớt và lực hướng tâm
- B q ( ) R 4 2 là ma trận chuyển đổi đầu vào
- R 2 1 là tích số ràng buộc Lagrange Giá trị A q T ( ) là vector lực ràng buộc ảnh hưởng từ mặt đất tiếp xúc tới bánh xe
Các ma trận trong công thức (1.1) được xác định:
( ) sin( ) cos( ) cos( ) sin( ) cos( ) cos( )
Phương trình (1.9) có thể viết gọn lại thành:
S d Đạo hàm phương theo thời gian ta được:
Chương 1: Tổng quan mô hình tractor-trailer
Bằng cách thay vào phương trình (1.1) và nhân cả hai vế với S T, chúng ta có thể loại bỏ thành phần khó đo đạc trong thực tế Như vậy, phương trình động lực học của hệ sẽ được chuyển đổi về dạng đơn giản hơn.
1.2.3 Mô hình vòng trong trong trường hợp tham số bất định
Do ảnh hưởng của tham số bất định, các ma trận M q 1 ( ) , M q 2 ( ) không thể tính chính xác được, nên cần phải sử dụng các ma trận ước lượng:
Trong đó M q 1 ( ),M q 2 ( ) là các ma trận ước lượng của M q 1 ( )vàM q 2 ( )
(1.15) Đánh giá tính chặn trên của thành phần nhiễu và bất định
Từ hai phương trình (1.14), (1.15), khử thành phần u khó đánh giá ta được:
Chương 1: Tổng quan mô hình tractor-trailer
Chuyển vế và rút gọn lại, phương trình trở thành:
Sử dụng chuẩn Euclid cho các vector và ma trận ở vế phải, được gọi là chuẩn phổ đối với ma trận, giúp giới hạn thành phần bất định 1 theo bất phương trình.
A a là chuẩn Frobenius của ma trận A Các vector và ma trận sẽ được đánh giá qua các hằng số i như sau:
Theo đặc tính cơ học của xe chuẩn của ma trận S(q) bị chặn trên bởi hằng số: S q( ) 2
Chương 1: Tổng quan mô hình tractor-trailer
Nhiễu bị chặn trên bởi: d 4
Trong hệ thống robot, mômen đầu vào sinh ra bởi các cơ cấu chấp hành bị chặn trên:
5 6 q 7 q hay có thể viết lại thành
Từ các giả thiết trên, kết hợp với các phép đổi biến (1.12), ta có được các quan hệ sau:
Từ đó, chuẩn của thành phần bất định bị chặn trên bởi:
Trong đó: J 1 q u 2 S u là các thành phần phụ thuộc biến khớp,
T , 0 1 2 3 T là các hằng số phụ thuộc vào tham số của hệ
Giả thiết 1: Các tham số i (i 1 4) luôn nằm trong một giới hạn min, max i i đã biết.
Chương 2: Tổng quan về điều khiển dự báo
TỔNG QUAN VỀ ĐIỀU KHIỂN DỰ BÁO
Khái niệm chung về phương pháp luận MPC
Điều khiển dự báo dựa trên mô hình (Model Predictive Control, MPC) là một phương pháp phản ánh biểu hiện của con người, cho phép chúng ta lựa chọn cách thức hành động dẫn đến kết quả tốt nhất Để thực hiện điều này, MPC sử dụng một mô hình để mô tả gần đúng hành vi của đối tượng, từ đó dự báo đầu ra và đầu vào tương lai của đối tượng, và quyết định tín hiệu điều khiển dựa trên mô hình này Quá trình này được thực hiện thông qua việc tối ưu hóa một hàm mục tiêu, phụ thuộc vào từng đối tượng quá trình, để đạt được kết quả tốt nhất.
Hình 2.1: Mô tả điều khiển dự báo trên mô hình
Trong khoảng thời gian dự báo [t, t + N u], giá trị tín hiệu điều khiển u được tính toán bằng cách tối ưu hóa một hàm mục tiêu để giá trị đầu ra của quá trình y (biến được điều khiển) trong khoảng [t, t + N y] bám sát giá trị đặt (set point) một cách tốt nhất.
Chương 2: Tổng quan về điều khiển dự báo
Trong quá trình dự báo tín hiệu điều khiển, giá trị đầu tiên của dãy tín hiệu dự báo tại thời điểm t được sử dụng để tác động vào đối tượng ở thời điểm t+1 Các tín hiệu điều khiển dự báo khác sẽ bị bỏ qua hoặc được sử dụng làm điều kiện đầu cho quá trình tối ưu trong lần dự báo tiếp theo Khi bước sang thời điểm t+1, việc tính toán lai sẽ bắt đầu và các giá trị của u và y sẽ được cập nhật với khoảng thời gian dự báo không đổi.
Lùi tầm dự báo (Receding horizon)
Tầm dự báo cho biến đầu vào N u và tầm dự báo cho biến đầu ra N y :
Tại mỗi thời điểm trích mẫu, ta dự báo N u giá trị tín hiệu điều khiển cho N u lần trích mẫu tiếp theo dựa vào mô hình của đối tượng và tối ưu một hàm mục tiêu Sau khi có mảng giá trị điều khiển dự báo, ta tính toán được N y giá trị tín hiệu đầu ra cho N y lần trích mẫu tiếp theo Lưu ý rằng N u và N y không thay đổi tại mỗi lần trích mẫu, trong khi lớp dự báo được lùi xa thêm một chu kỳ trích mẫu.
Mô hình đối tượng
Mô hình là nền tảng của kiểm soát dự đoán (MPC), giúp dự đoán hành vi tương lai của quá trình Để đạt được điều này, cần có một mô hình mô tả cách thức hoạt động của quá trình, đặc biệt là chỉ ra sự phụ thuộc của đầu ra vào các biến đo được hiện tại, cũng như các biến đầu vào hiện tại và tương lai.
Chương 2: Tổng quan về điều khiển dự báo
Mô hình dự báo trong hệ thống chỉ cần đủ đơn giản để đảm bảo độ chính xác, với khả năng sử dụng mô hình tuyến tính hoặc phi tuyến tùy thuộc vào yêu cầu tính toán Trong bối cảnh MPC, việc tính toán lớp dự báo diễn ra tại các thời điểm trích mẫu, do đó, mô hình gián đoạn trở thành lựa chọn chính Chúng ta sẽ tập trung vào các mô hình gián đoạn của đối tượng để đạt được kết quả dự báo tối ưu.
Mô hình mô tả mối quan hệ giữa các đầu ra và đầu vào đo được, trong đó tín hiệu đầu vào có thể là biến điều khiển hoặc nhiễu đo Khi đối tượng hoặc quá trình chịu ảnh hưởng của nhiễu không đo được hoặc sai lệch mô hình, cần xem xét mô hình nhiễu để phản ánh đầy đủ động học của quá trình Do đó, mô hình được chia thành hai loại: mô hình quá trình và mô hình nhiễu, cả hai đều cần thiết cho thuật toán dự báo MPC.
Mô hình liên tục mô tả mối quan hệ giữa các tín hiệu liên tục trong hệ thống, bao gồm biến vào, biến ra và biến trạng thái Ngược lại, mô hình gián đoạn phản ánh giá trị tín hiệu tại các thời điểm trích mẫu Trong đồ án này, chúng ta sẽ tập trung vào các hệ trích mẫu đồng bộ với chu kỳ trích mẫu cố định.
Quan hệ giữa dãy giá trị đầu vào và dãy giá trị đầu ra của một hệ tuyến tính có thể được biểu diễn dưới dạng:
Vì có sự tương tự trong phương trình vi phân trong hệ liên tục, nó còn được gọi là phương trình sai phân tuyến tính
Chương 2: Tổng quan về điều khiển dự báo
Tính y t( 1), (y t2), theo y t( ) và biến sai phân:
=> ta đi tới phương trình sai phân “thực”:
Mô hình phương trình sai phân cũng có thể mở rộng một cách dễ dàng cho hệ đa biến bằng các thay sử dụng các ma trận tham số:
2.2.2 Mô hình trạng thái a) Mô hình trạng thái điển hình
Ta có mô hình gián đoạn tuyến tính với n biến trạng thái của một đối tượng SISO trên không gian trạng thái như sau:
Chương 2: Tổng quan về điều khiển dự báo
Ở đây: x t( 1) : vector trạng thái: kích cỡ (n,1) y t( ): Đầu ra quá trình được điều khiển: kích cỡ (1,1) u t( ) : Đầu vào quá trình: kích cỡ (1,1) t+1 được dùng với ý nghĩa t+1 chu kỳ trích mẫu
Ma trận A, B, C, D được định nghĩa lần lượt là ma trận chuyển tiếp, ma trận đầu vào, ma trận đầu ra và ma trận liên thông Trong mô hình tham số hằng, các phần tử của các ma trận này là hằng số, trong khi đối với mô hình tham số biến thiên, chúng là hàm theo thời gian.
Chương 2: Tổng quan về điều khiển dự báo
Mô hình trạng thái gián đoạn tuyến tính có thể được phát triển từ dạng liên tục tương ứng cho từng loại khâu giữ trễ Xem xét mô hình trạng thái liên tục tuyến tính:
Ký hiệu T đại diện cho chu kỳ trích mẫu, trong đó tín hiệu u(t) được duy trì ổn định trong khoảng thời gian từ tT đến tT + T nhờ vào khâu giữ trễ bậc 0, còn được gọi là khâu ZOH (Zero Order Hold).
Nếu biết trạng thái x và đầu vào u tại thời điểm tT, chúng ta có thể xác định trạng thái tại thời điểm tT + T bằng cách sử dụng công thức đáp ứng trạng thái và đáp ứng đầu ra.
AT A t d d x t x t T e x tT e Bu d e x tT e d Bu tT e x tT e dtBu tT A x t B u t
Trong hầu hết các trường hợp, y(t) được đo trước khi u(t) tác động vào quá trình, dẫn đến D = 0 Khác với mô hình liên tục, thời gian trễ của quá trình có thể được mô hình hóa trực tiếp trong mô hình trích mẫu ZOH, ảnh hưởng đến bậc của mô hình (số biến).
Chương 2: Tổng quan về điều khiển dự báo
17 trạng thái) sẽ tăng lên đúng bằng thời gian trễ tính theo số nguyên lần chu kỳ trích mẫu
Lưu ý rằng, các ma trận A d và B d có thể được tính gọn trong một bước hàm lũy thừa ma trận exp( )
Mô hình trạng thái gián đoạn có thể được đo bằng nhiều phương pháp khác nhau, không chỉ thông qua trích mẫu từ mô hình trạng thái liên tục Ma trận A d đóng vai trò quan trọng trong diễn biến trạng thái của hệ thống Để hệ ổn định, điều kiện cần và đủ là toàn bộ giá trị riêng của A d nằm trong vòng tròn đơn vị Cặp ma trận (A B d, d) thể hiện tính điều khiển được của trạng thái.
A C ) nói lên tính quan sát được của hệ thống
2.2.3 Mô hình hàm truyền đạt gián đoạn
Các mô hình hàm truyền đạt gián đoạn sử dụng biến phức z, với phép biến đổi Z tương tự như phép biến đổi Laplace trong mô hình liên tục Điều này cho phép phân tích và thiết kế hệ gián đoạn dựa trên hàm phức Thông tin chi tiết về phép biến đổi Z và Laplace có thể tham khảo trong tài liệu [3], [5].
Chọn một tín hiệu gián đoạn f kT( ) với k = 0, 1, và T là chu kỳ trích mẫu của tín hiệu Ảnh Z của tín hiệu này là một hàm theo biến phức z, được định nghĩa một cách cụ thể.
Hàm truyền đạt gián đoạn được xác định là tỷ lệ giữa ảnh Z của tín hiệu đầu ra y kT( ) và ảnh Z của tín hiệu vào u kT( ), với điều kiện là sơ kiện bằng 0.
Hàm truyền đạt gián đoạn có thể viết lại được dưới dạng phân thức hữu tỷ:
Chương 2: Tổng quan về điều khiển dự báo
Đa thức A z( ) được xem là đa thức đặc tính của hệ thống, với các nghiệm của đa thức tử số là điểm không và các nghiệm của đa thức mẫu số là điểm cực Hệ thống được coi là gián đoạn ổn định khi và chỉ khi tất cả các điểm cực đều nằm trong vòng tròn đơn vị trên mặt phẳng z.
Hàm truyền đạt gián đoạn thể hiện đặc tính vào-ra của hệ gián đoạn thực, như bộ điều khiển số hoặc hệ trích mẫu Mối quan hệ giữa hàm truyền đạt liên tục của quá trình và hàm truyền đạt gián đoạn của hệ trích mẫu tương ứng với khâu bậc 0 (zero-order hold, ZOH) được minh họa rõ ràng trong hình 2.2.
Hình 2.2: Hàm truyền đạt gián đoạn qua hệ trích mẫu
Hàm mục tiêu
Trong thuật toán điều khiển dự báo cơ sở, GPC (Generalized Predictive Control) tối ưu hóa một hàm mục tiêu J để tính toán giá trị tín hiệu điều khiển dự báo Hàm mục tiêu J được định nghĩa để giảm thiểu sai lệch tín hiệu điều khiển Δu, nhằm đưa giá trị đầu ra tiệm cận gần nhất với giá trị đặt.
Điều kiện ràng buộc
Tiêu chí này đóng vai trò quan trọng không chỉ trong việc điều khiển dự báo mà còn trong tất cả các thuật toán điều khiển khác Trong lĩnh vực công nghiệp, việc hạn chế các yếu tố không mong muốn là rất cần thiết.
Chương 2: Tổng quan về điều khiển dự báo
Trong hệ thống điều khiển, luôn tồn tại 21 tín hiệu điều khiển hoặc tín hiệu đầu ra để đảm bảo không vượt quá giới hạn cho phép, nhằm bảo vệ an toàn cho con người và hệ thống Tuy nhiên, những ràng buộc này có thể gây cản trở cho hiệu suất của hệ thống, như tốc độ tính toán tối ưu hay quỹ đạo của tín hiệu điều khiển Nếu ràng buộc quá khắt khe, nó có thể dẫn đến sự mất ổn định của hệ thống Do đó, trong quá trình tính toán, cần cân nhắc kỹ lưỡng để đạt được tín hiệu điều khiển tốt nhất mà vẫn đảm bảo an toàn cho toàn bộ hệ thống.
Ưu điểm và phạm vi ứng dụng
MPC rất phù hợp cho các bài toán điều khiển quá trình đa biến với động học phức tạp, bao gồm cả trễ và tương tác mạnh Nhờ vào sự phát triển của kỹ thuật xử lý số và hiệu năng tính toán ngày càng cao của vi xử lý, MPC đang được áp dụng rộng rãi vào các bài toán điều khiển thực tế Thuật toán MPC không chỉ dễ hiểu đối với kỹ sư và nhà quản lý công nghệ mà còn dễ dàng cài đặt trên các hệ thống số hiện nay, đồng thời có khả năng xử lý các điều kiện ràng buộc về giá trị tín hiệu vào ra.
Hiện nay, phương pháp luận MPC đã được mở rộng để áp dụng cho các hệ phi tuyến Phương pháp này sử dụng điều khiển dự báo dựa trên mô hình mờ và mạng neuron nhân tạo, nhằm điều khiển hiệu quả các đối tượng có nhiều đầu vào và đầu ra, cũng như các đối tượng phi tuyến.
Chương 3: Điều khiển dự báo mô hình phi tuyến
ĐIỀU KHIỂN DỰ BÁO MÔ HÌNH PHI TUYẾN
Động lực học phi tuyến
Động lực học phi tuyến xuất hiện trong hầu hết các ứng dụng kỹ thuật, nhưng việc phát triển mô hình phi tuyến đầy đủ gặp nhiều khó khăn Không có phương pháp mô hình rõ ràng nào phù hợp để đại diện cho các quá trình phi tuyến tổng quát Thực tế cho thấy, việc xây dựng mô hình phi tuyến có thể khó khăn, cho dù là từ dữ liệu đầu vào/đầu ra tương quan hay thông qua các nguyên tắc đầu tiên dựa trên định luật bảo toàn khối lượng và năng lượng.
Ước lượng dịch tầm dự báo
Hình 3.1: Ước lượng dịch tầm dự báo
Khi áp dụng mô hình phi tuyến và xem xét các yếu tố ràng buộc trong ước lượng, việc tính toán mật độ phụ thuộc theo đệ quy trở nên không khả thi, tương tự như khi sử dụng bộ lọc Kalman Ngoài ra, bài toán bình phương tối thiểu cũng không thể giải quyết theo cách đệ quy Để sử dụng phương pháp bình phương tối thiểu, cần phải tối ưu hóa đồng thời tất cả các trạng thái trong quỹ đạo x T để có được trạng thái ước lượng, điều này làm cho bài toán tối ưu hóa trở nên phức tạp hơn.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Khi thời gian T được tăng lên, phương pháp ước lượng dịch tầm dự báo (MHE) giúp loại bỏ khó khăn bằng cách chỉ xem xét khoảng thời gian gần nhất để đo đạc Phương pháp này tìm ra N giá trị gần nhất của quỹ đạo trạng thái, như minh họa trong hình 3.1 Biến trạng thái được ước lượng sẽ được xác định từ các giá trị này.
, , x N T x TN x T và ước lượng đầu ra
Các dữ liệu hệ thống được chia thành hai phần
Giả định rằng T ≥ -N 1 nhằm loại bỏ các chu kỳ ban đầu, trong đó cửa sổ ước lượng được lấp đầy hoàn toàn bằng các phép đo và luôn duy trì trạng thái đầy đủ.
Công thức đơn giản nhất của ước lượng dịch tầm dự báo theo công thức bình phương tối thiểu
Trong đó hàm mục tiêu là
Tác giả sử dụng công thức trên để nhấn mạnh rằng hàm mục tiêu ước lượng dịch tầm dự báo chỉ xem xét dữ liệu từ thời điểm T−N đến T, thay vì toàn bộ thông tin từ 0 đến T Điều này cho thấy ước lượng dịch tầm dự báo của phương pháp bình phương tối thiểu Đồng thời, cần lưu ý rằng phương pháp quy hoạch động sử dụng đệ quy để viết lại hàm mục tiêu bình phương tối thiểu một cách đầy đủ.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Hàm mục tiêu V T N được xác định tại thời điểm T N, cho thấy rằng hàm mục tiêu đơn giản nhất cho ước lượng dịch tầm dự báo tương đương với việc chọn V T N 0 Qua việc thiết lập mối liên kết giữa bình phương tối thiểu và mật độ phụ thuộc, chúng ta có thể viết lại hàm bình phương tối thiểu đầy đủ, đồng thời cho thấy nó tương đương với việc cực đại hóa hàm mật độ phụ thuộc, biểu diễn bằng max | | .
Với hàm mật độ ở thời điểm trước đó
Hằng số c không ảnh hưởng đến nghiệm của bài toán tối ưu Từ công thức (3.1), khi đặt V T N 0 trong hàm tối giản nhất của ước lượng dịch tầm dự báo tương đương cho phương sai vô hạn, chúng ta thấy rằng mật độ phụ thuộc của x T N | y T N 1 cho thấy việc bỏ qua thông tin trước của biến trạng thái x T N và các thông tin trước giá trị đo là hợp lý.
Để đơn giản hóa bài toán ước lượng dịch tầm dự báo, chúng ta sẽ sử dụng hàm phát cho trạng thái đầu tiên, nhằm loại bỏ thông tin liên quan đến y T N 1 .
Chương 3: Điều khiển dự báo mô hình phi tuyến
Trong trường hợp hàm Gauss tuyến tính, việc loại bỏ thông tin không có thành phần xấp xỉ có thể được giải thích bằng cách sử dụng hàm tương đương với hàm V T N , giống như hàm loga âm của mật độ phụ thuộc tại trạng thái được đo từ các giá trị trước đó Điều này cho thấy rằng không cần thiết phải sử dụng ước lượng dịch tầm dự báo, vì chúng ta có khả năng giải bài toán Gauss tuyến tính một cách đầy đủ theo phương pháp đệ quy.
Mô hình điều khiển dự báo
Điều khiển dự báo theo mô hình là một giải pháp cho bài toán điều khiển tối ưu vòng hở, sử dụng phương pháp quy hoạch động để tìm nghiệm tối ưu dựa trên trạng thái đầu Khi xuất hiện thành phần bất định và biến trạng thái có thể ước lượng nhờ bộ quan sát, điều khiển phản hồi sẽ hiệu quả hơn so với điều khiển vòng hở Bài toán điều khiển tối ưu được giải trực tuyến, cho phép áp dụng phương thức điều khiển phản hồi để đạt được nghiệm tương ứng với phương pháp quy hoạch động.
Bài toán điều khiển tối ưu với tầm dự báo N là N * x
Biến quyết định điều khiển là chuỗi các luật điều khiển, trong khi biến quyết định điều khiển u k là chuỗi tín hiệu điều khiển Điều khiển dự báo theo mô hình sử dụng sách lược điều khiển phản hồi để so sánh với đáp ứng của điều khiển dự báo theo mô hình thông thường Cả hai phương thức điều khiển đều cung cấp phản hồi tín hiệu điều khiển, phụ thuộc vào biến trạng thái hiện tại Luật điều khiển áp dụng có thể phụ thuộc vào việc bài toán điều khiển tối ưu được giải theo vòng hở, có thể là chuỗi điều khiển hoặc phản hồi, hoặc sách lược điều khiển phản hồi.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Trong điều khiển dự báo theo mô hình có phản hồi thì nghiệm tối ưu ứng với bài toán tối ưu N * x là sách lược điều khiển
Những luật điều khiển cấu thành hạn chế việc áp dụng phương pháp tối ưu quy hoạch động, và điều này phụ thuộc vào điều kiện đầu x(k) Theo quan điểm này, chỉ có thành phần đầu tiên là duy nhất.
Luật điều khiển μ0(x) ứng với trạng thái đầu xk cần được xác định, trong khi các luật điều khiển tiếp theo chỉ cần được xác định trong một khoảng giới hạn.
Điều khiển dự báo theo mô hình có phản hồi hiệu quả hơn khi có thành phần bất định, nhưng làm cho bài toán tối ưu trở nên phức tạp hơn so với bài toán tối ưu thông thường Biến quyết định điều khiển μ là chuỗi các luật điều khiển với số chiều không giới hạn, và mỗi luật có thể được biểu diễn theo nhiều cách khác nhau Tính phức tạp trong việc giải bài toán tối ưu bằng phương pháp quy hoạch động khiến việc tìm nghiệm tối ưu trở nên khó khăn khi có thành phần bất định Do đó, để nghiên cứu hiệu quả việc áp dụng điều khiển dự báo theo mô hình có phản hồi, cần đơn giản hóa bài toán bằng cách bỏ yếu tố tối ưu Giống như điều khiển thích nghi, có nhiều đề xuất khác nhau cho việc thực hiện điều khiển dự báo theo mô hình bền vững, với việc thực thi đơn giản hơn so với việc áp dụng nghiệm tối ưu từ phương pháp quy hoạch động.
Các giải thuật tối ưu tiêu chuẩn có thể được áp dụng để tìm nghiệm tối ưu cho chuỗi điều khiển vòng hở trong bài toán điều khiển tối ưu Tuy nhiên, hiện nay vẫn còn thiếu nhiều giải thuật hiệu quả để giải quyết vấn đề này.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Giải thuật "second variation" không chỉ cung cấp một chuỗi tín hiệu điều khiển tối ưu duy nhất mà còn đưa ra các luật phản hồi khu vực thay đổi theo thời gian Cụ thể, chuỗi tín hiệu điều khiển tối ưu vòng hở được biểu diễn bởi v(k) và chuỗi trạng thái tối ưu vòng hở tương ứng là z(k), với công thức v(k) = v(k+K(k)(x(k) - z(k))).
Sách lược điều khiển cung cấp tín hiệu phản hồi nhằm đưa biến trạng thái x(k) gần hơn với biến trạng thái lý tưởng z(k) Tuy nhiên, giải thuật "second variation" quá phức tạp để áp dụng cho điều khiển dự báo theo mô hình thông thường, vì nó yêu cầu tính đạo hàm cấp hai theo (x(t), u(t)) của hàm f(·).
Trong hệ tuyến tính, hàm mục tiêu được biểu diễn dưới dạng toàn phương với thành phần nhiễu Luật điều khiển tối ưu cho dự báo vô hạn không có ràng buộc được xác định là u(x) = Kx(t) Kết quả này cho phép xây dựng luật điều khiển có khả năng thay đổi theo thời gian.
u k v k K k x k z k với chuỗi trạng thái và chuỗi điều khiển z k và v k thỏa mãn phương trình lý tưởng sai phân: z k 1 Az k Bv k ,
v z Kz k , chuỗi z k và v k là nghiệm tối ưu của vòng hở cho hệ không có nhiễu và trạng thái đầu Luật điều khiển theo thời gian
Công thức u k = v k + K k x k - z k cho thấy rằng nó tối ưu trong trường hợp hệ không có yếu tố ràng buộc Hơn nữa, nó vẫn giữ tính tối ưu ngay cả khi có yếu tố ràng buộc, miễn là các điểm z k và v k nằm trong miền ràng buộc tương ứng.
Có một số lý luận rằng sách lược điều khiển theo thời gian
, u x k v k K xz k có thể là đầy đủ, ít nhất là khi hàm f là tuyến tính
Chuỗi tín hiệu điều khiển và biến trạng thái ước lượng, v k và z k , có thể được xác định thông qua việc giải bài toán tối ưu vòng hở Việc áp dụng điều khiển dự báo theo mô hình cùng với ma trận phản hồi K được tính toán offline cho thấy rằng công thức điều khiển dự báo theo mô hình bền vững có độ khó tính toán tương đương.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Trong bài viết này, chúng tôi đề cập đến việc áp dụng phương pháp điều khiển tối ưu online cho hệ thống xác định thông thường, trong đó công thức cần được điều chỉnh để đơn giản hóa các ràng buộc, đồng thời xem xét sự xuất hiện của thành phần nhiễu Điều này cho phép ràng buộc quỹ đạo trạng thái của hệ thống chứa các yếu tố bất định nằm trong "tube" trung tâm của quỹ đạo ước lượng Tính toán offline được sử dụng để xác định các thay đổi về ràng buộc và ma trận phản hồi K Ngoài ra, chúng tôi cũng trình bày sự thay đổi của quá trình "tube-based" cho hệ phi tuyến, với chiến lược phản hồi khu vực phi tuyến được áp dụng.
Điều khiển dự báo theo mô hình tube-based
Trong hình 3.1, “Tube” ứng với tín hiệu điều khiển tối ưu u u o x và điều kiện đầu x1, là X X X 0, 1, 2,X 3 trong đó X 0 1 , với mỗi i
Trong bài toán điều khiển hệ có thành phần bất định, các trạng thái tại thời điểm i được tạo ra bởi các thành phần nhiễu, với ràng buộc của biến trạng thái cần được thỏa mãn trong mỗi quỹ đạo trạng thái trong "tube" Việc điều khiển các "tube" được xem là phương pháp tối ưu hơn so với việc điều khiển quỹ đạo, cho phép người thiết kế lựa chọn "tube" cho từng điều kiện đầu, đảm bảo rằng tất cả các quỹ đạo trạng thái được điều khiển đều nằm trong phạm vi đó Qua việc lựa chọn hợp lý "tube", có thể đảm bảo sự thỏa mãn các yếu tố ràng buộc của biến trạng thái và biến điều khiển trong mỗi lần thực thi của chuỗi thành phần nhiễu.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Hình 3.2: Quỹ đạo vòng hở
Xác định chính xác "tube" tương ứng với điều kiện đầu và sách lược điều khiển là một thách thức lớn, đặc biệt đối với các hệ phi tuyến Để đơn giản hóa các "tube", tác giả đề xuất một phương pháp nhằm giới hạn tất cả các trường hợp có thể xảy ra của quỹ đạo trạng thái Đối với hệ tuyến tính với ràng buộc lồi, "tube" được xác định với mỗi i, X_i là một "polytope", và Z là một tập bất biến dương, giúp giới hạn toàn bộ trường hợp quỹ đạo trạng thái "Tube" chính xác sẽ nằm bên trong việc xấp xỉ đơn giản đó Phương pháp này khi áp dụng cho điều khiển dự báo theo mô hình bền vững được thiết kế để giảm thiểu khối lượng tính toán cần thiết cho hệ đã xác định.
Chương 3: Điều khiển dự báo mô hình phi tuyến
3.4.2 Tube-based cho điều khiển dự báo theo mô hình a) Giới thiệu Để thiết lập thuật toán trong thực tế chúng ta cần bỏ qua tính tối ưu để đơn giản hơn, đã có nhiều phương thức để làm điều đó Tác giả đưa ra tiếp theo đây một quy trình để đạt được mục tiêu và kết quả tốt cho điều khiển dự báo theo mô hình bền vững bằng cách giải online bài toán điều khiển tối ưu, nó có độ khó tương đương với bài toán điều khiển dự báo theo mô hình thông thường Chúng ta làm đơn giản hóa biến điều khiển, lý tưởng hóa, là một sách lược bằng cách thay thế nó với một tham số hữu hạn chiều, nó bao gồm chuỗi điều khiển vòng hở và bộ điều khiển phản hồi khu vực đơn giản Thêm vào đó, ta thay thế “tube” (được xác định chính xác rất khó) bằng một “tube” đơn giản hơn và bao ngoài “tube” chính xác, do đó ý tưởng sau đây khá đơn giản Ta tạo ra vị trí trung tâm của “tube” bằng cách sử dụng bộ điều khiển dự báo theo mô hình thông thường với ràng buộc chặt lên mô hình hệ thống tối ưu, hạn chế kích thước của “tube” bằng cách sư dụng phản hồi khu vực để cố gắng lái tất cả quỹ đạo trạng thái của hệ thống có thành phần bất định tới quỹ đạo trung tâm Bộ điều khiển tổng hợp có thể được coi như một bộ điều khiển hai bậc tự do Phản hồi khu vực xung quanh quỹ đạo ước lượng đó là vòng trong và nhiễu tắt dần trong khi điều khiển dự báo theo mô hình được áp đụng trong vòng ngoài
Chúng ta sẽ nghiên cứu về điều khiển dự báo theo mô hình bền vững của hệ tuyến tính với yếu tố ràng buộc, áp dụng lý thuyết đại số Đầu tiên, chúng ta định nghĩa các khái niệm cơ bản liên quan đến hai tập A và B trong không gian n Tập tổng được xác định là A ⊕ B = {a + b | a ∈ A, b ∈ B}, tập hiệu là A \ B = {x ∈ n | x ⊕ A ⊆ B}, và tập tích được định nghĩa cho K ∈ m×n, K A = {Ka | a ∈ A}.
Chương 3: Điều khiển dự báo mô hình phi tuyến
31 d) Khoảng cách Hausdorff d H giữa hai tập con A và B của n được đinh nghĩa như sau:
Trong đó d x S , được định nghĩa là khoảng cách của một điểm x n tới tập S n , được định nghĩa là:
Trong những định nghĩa đó, x là bao gồm những điểm đơn lẻ x and
x B , do vậy ký hiệu tập x b b | B ; tập hợp A B là một hợp C lớn nhất mà B C A Mỗi chuỗi x i được gọi là hội tụ tới tập S nếu có
, 0 d x i S khi i Nếu d H A B , , khoảng cách của mỗi điểm bB tới tập Alà nhỏ hơn hoặc bằng Ta nói rằng chuỗi các tập A i là hội tụ tới tập
Trong không gian Hausdorff, nếu khoảng cách d H(Ai, B) tiến gần đến 0 khi i tiến đến vô cực, thì đây là những khái niệm cơ bản để thiết lập "tube" bao ngoài Những lý thuyết này rất hữu ích và đã được trình bày trong nghiên cứu của Kolmanovsky và Gilber (1998) Bên cạnh đó, "tube" bao ngoài cũng được áp dụng cho hệ tuyến tình kết hợp thành phần nhiễu.
Xét mô hình hệ thống tuyến tính
Trong bài viết này, chúng ta xem xét tập con lồi và compact w, bao gồm cả điểm gốc Chúng ta giả định rằng điểm gốc nằm bên trong tập hoặc nếu không, w sẽ bằng G, với thuộc p và p nhỏ hơn n, nằm trong tập lồi compact có chứa điểm gốc Hơn nữa, cặp ma trận (A, G) được coi là điều khiển được.
Chương 3: Điều khiển dự báo mô hình phi tuyến
32 nghiệm của phương trình x k 1 Ax k Bu k w k tại thời điểm i nếu trạng thái đầu (thời điểm 0 ) và x 0 và biến điều khiển u k , chuỗi nhiễu w k
Mô hình lý tưởng được mô tả như sau
Gọi i z u ; , là nghiệm của phương trình z k 1 Az k Bu k tại thời điểm i với trạng thái đầu tại thời điểm 0 là z 0 Định nghĩa e k : x k z k như là sai lệch giữa trạng thái thực tế x k và trạng thái lý tưởng z k , thỏa mãn phương trình sai phân tương ứng.
Từ đó ta sẽ tính được tại thời điểm thứ i
Trong đó e 0 x 0 z 0 Nếu có e 0 0 , e i S i và tập S i được định nghĩa là:
Trong ký hiệu phép lấy tổng, ký hiệu đại diện cho phép tính tập tổng, như đã được định nghĩa trước đó Giả thiết cho rằng tập hợp S i bao gồm điểm gốc bên trong cho toàn bộ i ≥ n Đầu tiên, ta xem xét “tube” X x u, được lấy ra từ chuỗi tín hiệu điều khiển vòng hở u với trạng thái đầu x(0) = z(0) = x.
0 0 e Dễ dàng nhận thấy ràng X x u , X 0, x X , 1; , x u , , X N x u ; , trong đó
Trạng thái tại thời điểm i của hệ thống lý tưởng được biểu diễn bởi hàm z(i) = φ(i, x, u), với "tube" là trung tâm của hệ thống này Việc xác định chính xác "tube" là tương đối dễ dàng.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Nếu hệ thống là tuyến tính và thành phần nhiễu bị chặn, điều khiển vòng hở cung cấp khả năng tính toán tập hợp S i Khi G là một tập lồi, S i cũng sẽ là lồi cho mọi giá trị i Nếu thêm vào đó các giá trị gốc và cặp ma trận A G là điều khiển được, thì S i sẽ bao gồm cả giá trị gốc cho mọi giá trị i.
Nếu A là ma trận bền, với lý thuyết đã được trình bày của Kolmanovsky và
tồn tại và là bất biến dương cho
Trong hệ thống động lực học, phương trình x(k+1) = Ax(k) + w(k) với x thuộc tập S∞ cho thấy rằng (Ax + w) cũng thuộc tập S∞ cho mọi w Hơn nữa, S_i chuyển tiếp đến S∞ trong không gian Hausdorff khi i tiến đến vô cùng Tập S∞ được xác định là tập bất biến dương bền vững tối thiểu cho x(k+1) = Ax(k) + w(k), với w thuộc W Đặc biệt, S_i nằm trong S_(i+1) và S_(i+1) nằm trong S∞ cho mọi giá trị của i, tạo thành một cấu trúc "tube".
Trong đó S S là “tube” bao ngoài với mặt cắt ngang hằng số S cho
Mặt cắt hằng số "tube" bao ngoài X x u ˆ ; , có thể được áp dụng thay cho "tube" chính xác X x u để thuận tiện hơn trong việc phân tích Khi giới hạn xem xét trong khoảng 0, N , ta có thể tính đến tác động của điều khiển dự báo theo mô hình Đặt S S N sẽ giúp giảm thiểu tính bảo toàn và tạo ra mặt cắt ràng buộc cho khoảng thời gian này.
Mặc dù "tube" chính xác X x u và "tube" bao ngoài X x u ˆ có thể dễ dàng nhận diện, việc áp dụng chúng vào bài toán sẽ gặp một số hạn chế Điều này xuất phát từ lý do trước đó, khi tập S i có thể lớn nhưng không nhất thiết phải đơn giản.
Chương 3: Điều khiển dự báo mô hình phi tuyến
34 vì một chuỗi điều khiển vòng hở hơn là sách lược điều khiển phản hồi được dẫn ra từ “tube” Ví dụ, nếu 1,1 và x k 1 x k u k w k , với
Khi i tăng lên, tập S i cũng tăng nhưng không bị chặn Để đưa ra khâu phản hồi bao hàm kích thước của tập S i , cần có một cách tiếp cận đơn giản, vì việc tối ưu hóa cho một sách lược bất kỳ là không được phép Sách lược phản hồi mà chúng tôi đề xuất sẽ giúp giải quyết vấn đề này.
Trong đó x k là trạng thái hiện thời của hệ thống
Hệ thống lý tưởng được mô tả bởi phương trình x k+1 = Ax k + Bu k + w k, trong đó z k biểu thị trạng thái hiện tại và v k là tín hiệu đầu vào Khi áp dụng sách lược phản hồi, trạng thái x k sẽ thỏa mãn phương trình sai phân liên quan.
MÔ PHỎNG ĐIỀU KHIỂN DỰ BÁO MÔ HÌNH PHI TUYẾN
Cấu trúc điều khiển NMPC cho hệ xe kéo
Mô hình hóa hệ xe kéo theo chương 1 cho phép điều khiển hệ thống qua hai vòng: vòng gia tốc - vận tốc và vòng vận tốc - vị trí Trong đó, vòng gia tốc - vận tốc có đầu vào là mô men của hai bánh và đầu ra là vận tốc dài của xe kéo (tractor) cùng với vận tốc góc của xe kéo theo (trailer) Vòng vận tốc - vị trí nhận đầu vào từ đầu ra của vòng gia tốc - vận tốc, và đầu ra sẽ là vị trí của các biến khớp q Đồ án này tập trung áp dụng MPC cho vòng ngoài, với giả định rằng bộ điều khiển vòng trong là lý tưởng, tức là u* = u Cấu trúc điều khiển được mô tả trong hình dưới đây.
Hình 4.1: Sơ đồ điều khiển hệ xe kéo
Do giả thiết u * = u nên mô hình hệ thống lúc này viết lại dưới dạng:
Ta chọn tầm dự báo N y = 2 dẫn đến hàm mục tiêu trong bài này có dạng :
Chương 4: Mô phỏng điều khiển dự báo mô hình phi tuyến cho hệ xe kéo
Để giải bài toán (4.1) với mô hình dự báo (4.2), chúng ta áp dụng phương pháp gradient Vì bài toán này thuộc dạng toàn phương, nên có thể khẳng định rằng tồn tại nghiệm duy nhất Bước đầu tiên là xác định grad(Qk).
Tính đạo hàm của Q k theo vecto u, đặt:
Chương 4: Mô phỏng điều khiển dự báo mô hình phi tuyến cho hệ xe kéo
Trong bài viết này, chúng ta sẽ tiến hành thành lập bộ ước lượng MHE cho hệ xe kéo Như đã trình bày trong chương 3, bộ ước lượng dịch cửa sổ dự báo sẽ tính toán giá trị tương đối để đưa vào bộ NMPC Ở chương 4, chúng ta sẽ xây dựng bộ MHE với tầm dự báo N = 3 và xác định hàm mục tiêu tương ứng.
Chương 4: Mô phỏng điều khiển dự báo mô hình phi tuyến cho hệ xe kéo
Với mô hình ước lượng:
Kết quả mô phỏng
Tiến hành tìm grad(Q k ) như trên ta thu được kết quả mô phỏng dưới đây
Hình 4.2: Đồ thị vị trí Trailer
Chương 4: Mô phỏng điều khiển dự báo mô hình phi tuyến cho hệ xe kéo
Hình 4.3: Đồ thị vị trí ước lượng
Hình 4.4: Đồ thị góc Tractor
Chương 4: Mô phỏng điều khiển dự báo mô hình phi tuyến cho hệ xe kéo
Hình 4.5: Đồ thị góc Trailer
Hình 4.6: Đồ thị tín hiệu điều khiển
Kết luận và kiến nghị
Kết luận, mô hình tham chiếu điều khiển thích nghi được đề xuất để điều khiển máy kéo theo quỹ đạo thẳng với nhiều rơ móc khác nhau Cả hai hệ thống điều khiển đều dựa trên mô hình động học của hệ thống, nhưng với giả định góc lái nhỏ để theo quỹ đạo cong, điều khiển dự báo phi tuyến (NMPC) được áp dụng Kết quả từ các bước triển khai và mô phỏng cho thấy NMPC hiệu quả trong việc giúp hệ xe kéo bám theo quỹ đạo đã định về cả vị trí lẫn góc.
Việc đo lường tất cả các biến trạng thái trong hệ thống NMPC là không khả thi, do đó, cần ước lượng một số biến hoặc tham số trực tiếp Luận văn áp dụng phương pháp ước lượng dịch tầm dự báo (MHE) để xử lý các biến trạng thái và tham số, đồng thời đảm bảo khả năng giải quyết các ràng buộc, điều này rất quan trọng trong bài toán xe kéo.
Mô hình phi tuyến cho mỗi hệ con bao gồm biến trạng thái và tín hiệu điều khiển, nhưng không phản ánh các tương tác giữa các hệ con, dẫn đến sự không đồng bộ giữa mô hình ước lượng và thực tế Trong điều khiển phi tập trung, ảnh hưởng từ các hệ con khác được coi là nhiễu, gây ra hiệu quả kém Để khắc phục vấn đề này, phương pháp tube-based cho NMPC được giới thiệu, với mục tiêu đảm bảo hiệu quả bền vững cho hệ thống Luận văn sẽ tập trung phát triển phương pháp này trong tương lai.