M U
Lý do ch n đ tài
Hệ thống SLAM (Simultaneous Localization and Mapping) được phát triển để giúp tàu thuyền tự hành thực hiện nhiệm vụ điều hướng trong điều kiện thiếu GPS, bằng cách kết hợp công nghệ camera và LiDAR Trong bối cảnh các vùng sông ở Việt Nam, nơi có nhiều đoạn sông khó xác định, hệ thống này cung cấp thông tin quan trọng về môi trường tự nhiên hai bên sông và theo dõi sự thay đổi của các điểm sinh học theo mùa SLAM được thiết kế theo hướng module hóa, cho phép đồng bộ hóa các module trong thời gian thực, sử dụng công nghệ chùm tia quét và quản lý bản đồ theo hướng gia tăng Qua thử nghiệm, SLAM đã được tích hợp vào phần mềm trên máy tính nhúng của tàu, cung cấp dữ liệu định vị và hỗ trợ tàu hoàn thành các tác vụ một cách hiệu quả.
M c tiêu nghiên c u
Lu n v n bao g m nh ng m c tiêu sau:
• Phát tri n gi i thu t c l ng đ d i t th gi a 2 khung nh c a camera
• Phát tri n gi i thu t c l ng t th gi a đám mơy LiDAR vƠ b n đ
• Phát tri n gi i thu t k t h p c l ng t camera vƠ LiDAR
• Tích h p các gi i thu t đư phát tri n, k t h p v i m t s th vi n khác đ hoƠn ch nh h th ng SLAM vƠ hi n th c hoá thƠnh ph n m m
• Xơy d ng môi tr ng mô ph ng sông ngòi đ trích xu t t p d li u riêng
• Ti n hƠnh ch y h th ng SLAM trên các t p d li u sông ngòi
• M r ng kh o sát ch t l ng h th ng SLAM trên các t p d li u môi tr ng khác
Các k t qu s đ c trình bƠy vƠ đánh giá thông qua mô ph ng vƠ th c nghi m
T NG QUAN TÀI LI U
S c n thi t ti n hành nghiên c u
(Các s li u th ng kê, n u không chú thích thêm, đ c l y t [1])
Môi tr ng n c t i các l u v c sông đang ph i ch u s c ép không nh t quá trình đô th hoá n c ta, ph n các đô th l n t p trung d c theo các sông l n (HƠ
Nhu cầu sử dụng nước tại TP Hồ Chí Minh bên sông Sài Gòn đang gia tăng, với mức tiêu thụ bình quân đầu người đạt 3.840m3/người/năm, thấp hơn mức tiêu chuẩn 4.000m3/người/năm của Tổ chức Nước Quốc tế (IWRA) Điều này dẫn đến áp lực lớn lên các nguồn nước, bao gồm sông, kênh mương và rạch thoát nước, trong bối cảnh quy hoạch hiện hành chưa đáp ứng kịp thời Báo cáo từ Bộ Tài nguyên & Môi trường chỉ ra rằng việc tích hợp các giải pháp quản lý nước là cần thiết để đảm bảo nguồn nước cho sinh hoạt và phát triển bền vững.
Hình 2.1 Tình tr ng ô nhi m n c Vi t Nam [2]
Nhằm nâng cao tình trạng nước trên các lưu vực sông, các địa phương đang tích cực triển khai các chương trình quan trọng định kỳ Tuy nhiên, hoạt động này vẫn gặp nhiều khó khăn Theo số liệu thống kê, hiện tại toàn quốc có tổng số 420 trạm quan trắc đang hoạt động, nhưng chủ yếu tập trung tại những địa phương có hoạt động công nghiệp, xử lý chất phát triển mạnh như Bà Rịa - Vũng Tàu, Bình Dương, Hà Nội, và TP Hồ Chí Minh Tại các làng nghề, nông thôn, do hạn chế về kinh phí, nhân lực, trang thiết bị, các cơ quan chuyên trách của địa phương phải sử dụng các phương pháp thủ công.
Việc áp dụng các phương pháp thô sơ để đánh giá chất lượng nước không đạt yêu cầu về độ chính xác Dù đã được thực hiện trong một khoảng thời gian nhất định, các phương pháp này vẫn chưa phản ánh đúng chất lượng nước theo không gian, thời gian và hình thái trên dòng sông Hơn nữa, việc khảo sát nhằm phát hiện nguồn gốc ô nhiễm vẫn phụ thuộc vào nhiều yếu tố như sức khỏe con người, thời gian khảo sát, và cách tiếp cận, điều này ảnh hưởng đến sức khỏe con người khi hoạt động trong môi trường bị ô nhiễm.
Những chiếc thuyền t hành đóng vai trò quan trọng trong công tác quản trị tại nhiều quốc gia trên thế giới So với phương pháp truyền thống, thuyền t hành có ưu điểm là không cần người lái, giúp tiết kiệm chi phí và giảm thiểu rủi ro Nhờ vào khả năng hoạt động tự động, thuyền có thể thực hiện nhiều nhiệm vụ chuyên biệt và đáp ứng nhiều tiêu chí khác nhau cùng lúc Điều này không chỉ giúp giảm chi phí nhân công mà còn tối ưu hóa hiệu suất làm việc, đặc biệt khi có nhiều thuyền hoạt động đồng thời Thuyền t hành còn có khả năng tích hợp cảm biến siêu âm để quét đáy, từ đó cải thiện khả năng giám sát và đảm bảo an toàn lao động cho con người.
Hình 2.2 Thuy n ME120 (trái) đ c s d ng đ đo n ng đ ph t-pho (ph i) trên khúc sông dài 3.5km t i Chi t Giang, Trung Qu c [3]
Nhìn chung, các m u thuy n t hƠnh hi n t i s d ng công ngh đ nh v GPS/INS đ xác đ nh v trí vƠ h ng c a mình trong b n đ Ph ng pháp nƠy phù h p khi
Trong vùng núi rừng, việc định vị thuyền gặp khó khăn do địa hình cao và ít bạch n Tại nhiều khu vực sông Việt Nam, đặc biệt là những đoạn sông trong rừng ngập mặn, tán cây có thể che phủ toàn bộ vùng trời, dẫn đến sai lệch đáng kể trong dữ liệu GPS Để cải thiện độ chính xác trong định vị thuyền, các phương pháp sử dụng lidar hoặc camera đã được đề xuất, giúp xác định vị trí và hướng đi thông qua hình ảnh môi trường xung quanh, từ đó giảm thiểu rủi ro mất sóng GPS trong khu vực kín Mặc dù việc sử dụng camera hỗ trợ cho hệ thống GPS/INS đã mang lại nhiều kết quả khả quan khi di chuyển trong môi trường đô thị, nhưng việc định vị trong môi trường sông hồ trong rừng núi vẫn là một thách thức lớn do tính phân tán cao từ tán lá hai bên.
Canoe tích hợp camera stereo và IMU đã được triển khai trên sông Sangamon, bang Illinois, nhằm thu thập dữ liệu về cấu trúc 3D của môi trường hai bên sông Công nghệ này được phát triển cao hơn, áp dụng kỹ thuật SLAM để xác định và định vị trong thời gian thực.
6 th ng d ng vƠo kh o sát s thay đ i c a các đ c đi m sinh h c c a cơy c i theo mùa, cung c p thêm thông tin cho công tác truy v t nguyên nhơn gơy ô nhi m ngu n n c khu v c
Hình 2.4 Thuy n Kingfisher tích h p PTZ camera (hình a) đ đ nh v và tái t o c u trúc 3D c a môi tr ng ven b (hình b, c, d) [5].
Tình hình nghiên c u trong vƠ ngoƠi n c
Việc sử dụng camera để hiện thực hóa SLAM đang trở nên phổ biến nhờ vào những ưu điểm như kích thước nhỏ gọn, giá thành thấp và khả năng tích hợp dễ dàng Các hệ thống visual SLAM thường giải quyết vấn đề định vị và bản đồ bằng cách bám sát vị trí các điểm mốc trong không gian Hệ thống nổi tiếng PTAM sử dụng bộ phát hiện điểm mạnh FAST, nhưng vẫn gặp hạn chế khi FAST không phát hiện được vòng lặp, dẫn đến sai số tích lũy nhanh chóng, đặc biệt trong môi trường ánh sáng yếu.
[8] b sung b SURF [9] đ phát hi n vòng, đ ng th i đ xu t t i u 2 l p đ th : đ
ORB-SLAM là một hệ thống SLAM tiên tiến sử dụng đặc trưng ORB để nhận diện và phát hiện vòng lặp trong môi trường, giúp tạo ra bản đồ 3D chính xác Hệ thống này có khả năng hoạt động hiệu quả trong các môi trường rộng lớn và phức tạp, cho phép định vị và theo dõi đối tượng một cách đáng tin cậy.
Hình 2.5 c tr ng đ c trích xu t và k t n i gi a 2 nh (trái), b n đ thu đ c là t p h p v trí
Quá trình trích xuất và bám địa hình trong môi trường nhiều góc cạnh thường gặp khó khăn, do đó kỹ thuật căn chỉnh hình ảnh cần được cải thiện LSD-SLAM đã phát triển một bản đồ địa hình, mở ra nhiều ứng dụng trong robotics, nhưng việc cập nhật bản đồ riêng lẻ còn hạn chế và chất lượng không cao so với các hệ thống truyền thống DSO cải thiện vấn đề này bằng cách tích hợp chất lượng hình ảnh vào quy trình duy trì bản đồ, giúp nâng cao chất lượng định vị đáng kể.
Hình 2.6 sâu c a đ c c l ng theo t ng nh (hình a, b), khi n b n đ thu đ c dày đ c (hình c) [12]
Nh m gi m thi u sai s tích lu , LDSO [14] s d ng đ c tr ng đ phát hi n vòng hay D3VO [15] tích h p m ng neuron sơu đ c l ng đ sơu, t th camera vƠ đ b t đ nh
LiDAR đóng vai trò quan trọng trong các cảm biến phổ biến nhất đối với SLAM So với camera, LiDAR cung cấp độ chính xác cao hơn về khoảng cách, không bị ảnh hưởng bởi điều kiện ánh sáng và có khả năng quét 360 độ Một trong những hệ thống kinh điển sử dụng LiDAR là Gmapping, tận dụng bộ lọc RBPF để lập bản đồ Tuy nhiên, SLAM dựa trên bộ lọc này không hoạt động hiệu quả trực tuyến Do đó, các kỹ sư Google đã phát triển Cartographer, hoạt động dựa trên kỹ thuật chùm tia quét với bản đồ động Thay vì chia thành nhiều bản đồ tĩnh, nhiều hệ thống đề xuất cách biểu diễn bản đồ mới như hồi quy GP, (O)NDT và surfel Một giải pháp khác đáng chú ý là LOAM, tận dụng công nghệ tính toán song song, chia phần định vị thành 2 luồng riêng biệt Cuối cùng, LiDAR SLAM dựa trên kỹ thuật scan matching, kết nối 2 chùm tia quét liên tiếp để tạo ra định vị chính xác ICP và NDT là 2 kỹ thuật scan matching kinh điển theo kiểu scan-to-scan, nổi bật với tốc độ tính toán nhanh, nhưng thường gặp khó khăn trong việc xử lý các điểm mù.
Scan-to-map matching, tiêu bi u nh CSM [24], kh c ph c nh c đi m trên, tuy nhiên kh i l ng tính toán khá l n Dù s d ng k thu t scan matching nƠo, sai s
Hình 2.7 Trong khi Cartographer (trái [16]) s d ng scan-to-submap matching, LOAM t n d ng k t h p scan-to-scan matching và scan-to-map matching (ph i [17])
9 tích luỹ điều không thể tránh khỏi Để đạt được điều này, cần thiết phải phát hiện vòng kín để tối ưu hóa quá trình Trong khi các nhà bản đồ sử dụng kỹ thuật tìm kiếm nhánh và ranh giới để tối ưu hóa, nhiều kỹ thuật dựa trên trích xuất từ hoạt động histogram cũng cho thấy hiệu quả cao Phân tích Elastic LiDAR Fusion cho phép đánh giá biến động của bề mặt đất mà không cần phải đóng vòng.
Ngày nay, việc kết hợp nhiều công nghệ khác nhau để giải quyết một bài toán cụ thể không còn là hiếm gặp Visual SLAM và LiDAR SLAM đại diện cho những hướng đi riêng biệt Trong khi visual SLAM phụ thuộc vào điều kiện ánh sáng và thường gặp khó khăn trong môi trường tối, LiDAR SLAM lại sử dụng chùm tia quét để xử lý thông tin trong điều kiện di chuyển nhanh, từ đó giảm thiểu độ trễ Do đó, việc kết hợp camera và LiDAR giúp bù trừ những khuyết điểm của nhau, mặc dù vẫn còn một số thách thức Một ví dụ điển hình cho sự kết hợp này là DEMO, nơi sử dụng LiDAR để xác định vị trí 3D của các đối tượng trong hình ảnh.
LIMO [31] c i thi n ch t l ng c a DEMO b ng cách c i thi n b l c d li u LiDAR đ trích xu t thƠnh công nh ng đ sơu b n v ng h n Tuy nhiên, c DEMO vƠ LIMO
Hình 2.8 Hai h th ng Visual-LiDAR SLAM đi n hình: trong khi V-LOAM (hình a) [28] s d ng trích xu t đ c tr ng, DVL-SLAM (hình b, c) [29] tr c ti p t i u trên c ng đ sáng c a nh
V-LOAM sử dụng dữ liệu từ camera và LiDAR để cải thiện độ chính xác trong quản lý bản đồ, giúp giảm thiểu sai số đáng kể và đạt vị trí top-1 trong bảng xếp hạng KITTI odometry benchmark hiện tại Việc áp dụng tiêu cựng ánh sáng thay cho trích xuất đặc trưng truyền thống giúp SLAM hoạt động hiệu quả hơn trong các điều kiện nghèo nàn Đồng thời, DVL-SLAM kết hợp dữ liệu từ LiDAR và DSO, đồng thời phát hiện vòng lặp thông qua DBoW, đảm bảo tính nhất quán toàn cầu khi di chuyển trong môi trường đô thị phức tạp.
SLAM đã đạt được nhiều thành công trong môi trường nhân tạo, nhưng hiệu quả của các giải thuật SLAM trong môi trường tự nhiên như rừng núi và sông hồ vẫn còn hạn chế Trong tự nhiên, đặc điểm của các cảnh quan thường rất phức tạp, với sự phân tán cao (lá cây, bờ rừng), ít tính chất đồng nhất ở các đặc trưng nhấp nhô, và cảnh vật biến đổi liên tục Để giải quyết vấn đề này, nhiều hệ thống phụ thuộc vào các kỹ thuật xử lý offline, như chia chùm tia quét thành các cảm biến khác nhau, sử dụng phương pháp ICP để căn chỉnh bề mặt, và cải tiến bản đồ offline thông qua việc đóng vòng thành công.
Online SLAM trong môi trường rừng sử dụng LiDAR và camera đã đạt được những kết quả đáng chú ý, nhưng vẫn gặp khó khăn trong việc xác định vị trí từng điểm riêng biệt Việc sử dụng camera, như trong hệ thống Google Tango, đã giúp nhóm tác giả đạt được thành công trong việc dựng lại khung cảnh rừng, mặc dù chỉ ở quy mô nhỏ Hơn nữa, việc kết hợp LiDAR với GNSS/INS đã được thực hiện, nhưng chỉ hoạt động hiệu quả trong những khu vực nhất định.
Hình 2.9 T i sông ngòi t nhiên, SLAM truy n th ng ph i xét y u t môi tr ng có đ ph n chi u l n (trái [33] ) hay c ng đ sáng thay đ i đ t ng t (ph i [5])
Bài viết đề cập đến 11 quang mới nhằm tránh mất tín hiệu GNSS, trong đó một số hệ thống cần sử dụng thêm tập hình ảnh chi tiết từ trên cao để lập bản đồ Nghiên cứu chỉ ra rằng việc điều chỉnh hệ thống có thể giúp cải thiện khả năng thích nghi với ánh sáng xung quanh, đặc biệt trong điều kiện ánh sáng yếu Tại những khu vực có địa hình phức tạp, việc kết hợp camera với IMU được khuyến nghị để đo đạc chính xác hơn, giúp tạo ra bản đồ địa hình hiệu quả hơn.
Việc sử dụng SLAM trong các môi trường khó khăn như sông hồ, đại dương trên tàu hình (ASV) và tàu lặn hình (AUV) đang trở nên phổ biến Do tính chất khắc nghiệt của các môi trường này, các hệ thống SLAM thường phải kết hợp nhiều cảm biến khác nhau, không chỉ dựa vào LiDAR hay camera SUNFISH là một AUV cao cấp, được trang bị MBE, DVL, IMU và cảm biến áp suất, giúp giảm thiểu rủi ro khi sử dụng thực địa Để tiết kiệm chi phí, Aqua2 không sử dụng DVL mà thay thế bằng các công nghệ khác.
Hình 2.10 Thuy n Roboat t n d ng k t h p LiDAR, GNSS vƠ IMU đ t o ra h th ng SLAM ph c v vi c đ nh v và l p b n đ khu v c lòng kênh đô th [42]
Camera được sử dụng để khám phá các khu vực, công trình và vật thể dưới nước Việc tích hợp LiDAR, DVL và IMU với ASV đã thành công trong việc tạo ra bản đồ 3D cho các khu vực và giàn khoan, hỗ trợ công tác kiểm tra và đánh giá chất lượng các hệ thống công trình trên mặt nước Tích hợp MBE, DVL và AHRS trong khảo sát đáy sông đã giúp cải thiện quy trình nghiên cứu địa chất Trong điều kiện tín hiệu GPS yếu hoặc bị chặn, Radar SLAM đã được áp dụng cho các phương tiện thủy chuyên chở khách trên các dòng sông Mô hình thuyền Roboat kết hợp công nghệ LiDAR, camera và IMU, cùng với EKF SLAM, đã nâng cao khả năng định vị và điều hướng, sau đó tích hợp thêm GPS để tối ưu hóa hiệu suất.
C S LÝ THUY T
Lý thuy t Lie
(Tài li u tham kh o chính c a ph n này là [50])
Trong toán học, đa tạp trơn (smooth manifold) là một không gian topo mà tại mỗi điểm có thể xác định tính vi phân bằng một không gian vector tại điểm đó Ví dụ điển hình về đa tạp trơn là các siêu mặt phẳng và siêu mặt cong nhúng trong không gian đa chiều Tại mỗi điểm của một đa tạp trơn, luôn tồn tại duy nhất một không gian tiếp tuyến, thể hiện rõ tính vi phân tại điểm đó.
Hình 3.1 Luôn t n t i m t không gian vector , ti p tuy n v i đa t p tr n t i đi m , x p x tuy n tính [50]
Trong toán h c, nhóm (group) là m t t p h p đ c trang b m t phép h p (composition operation): tho mãn các tiên đ sau :
Phép đếm gộp là một phép hợp trong toán học mà không có tính giao hoán Phần tử đơn lẻ trong một nhóm bất kỳ được gọi là phần tử duy nhất, và tính duy nhất này cũng áp dụng cho nghịch đảo của phần tử bất kỳ trong nhóm.
Nhóm Lie (Lie group) là một cấu trúc toán học quan trọng, trong đó các phần tử có các tính chất của nhóm Nhóm Lie có tính liên tục, cho phép thực hiện các phép toán giải tích và chuyển đổi tính chất truyền thống như biến đổi vector xung quanh một điểm xác định Một phép toán phổ biến trong nhóm Lie là phép tác động (action operation), cho phép chuyển đổi phần tử của các tập hợp khác Phép tác động của một nhóm Lie đối với tập hợp là cách thức biến đổi các phần tử theo các quy tắc nhất định.
3.1.2 Không gian ti p tuy n c a nhóm Lie
Vì c u trúc c a không gian ti p tuy n không ph thu c v trí x p x tuy n tính nên đ c g i chung là đ i s Lie (Lie algebra) c a nhóm Lie :
N là số chiều của không gian vector, trong đó mỗi phần tử thu được có thể được biểu diễn duy nhất thông qua một vector thuộc không gian đó Do đó, ta có thể chuyển đổi qua lại giữa các phần tử thu được thông qua hai phép đồng cấu, trong đó một phép là chuẩn hóa và phép còn lại là ánh xạ Nói cách khác, ánh xạ này chính là tổ chức lại trong không gian của tổ thành các chuẩn hóa Để thực hiện chuyển đổi qua lại giữa các phần tử thu được, ta sử dụng hai ánh xạ: exp và log.
Trong nhiều trường hợp, chúng ta cần chú ý đến phần thuộc không gian tiếp tuyến cụ thể thay vì không gian toàn cục Do đó, việc sử dụng định nghĩa phân biệt loại không gian tiếp tuyến đang được nhấn mạnh Thao tác trực tiếp trên không gian tiếp tuyến thay vì không gian phi tuyến giúp chúng ta định nghĩa thêm hai ánh xạ quan trọng.
Trong nhiều trường hợp, chúng ta cần chuyển đổi đặc điểm tính trong sáng và vững chắc Thuần tính, giới hạn đặc điểm nguyên gốc trong và biểu diễn đặc điểm trong Cũng có thể thấy những hình thức khác nhau: đặc điểm nguyên gốc trong và biểu diễn đặc điểm trong Người ta đã chứng minh điều này rõ ràng.
Trong bài viết này, chúng ta sẽ khám phá khái niệm vector và cách áp dụng phép hợp trong không gian Đặc biệt, do phép hợp không có tính giao hoán, chúng ta sẽ trình bày hai phiên bản: phiên bản cánh phải và phiên bản cánh trái.
Phiên b n cánh ph i nh sau:
Vì nên ta nói đ c bi u di n c c b t i Phiên b n cánh trái nh sau:
Vì vậy, chúng ta có thể nói rằng biểu diễn toàn cục là rất quan trọng Việc biểu diễn này không chỉ ảnh hưởng đến kết quả cuối cùng mà còn giúp tối ưu hóa thu nhập từ việc chuyển đổi qua lại Chúng ta sẽ sử dụng ánh xạ tuyến tính, cụ thể là phép liên kết (adjoint operation) của toán tử để đạt được điều này.
Phép liên kết là một khái niệm quan trọng trong lý thuyết đồ thị, giúp mô tả mối quan hệ giữa các đỉnh trong một đồ thị Trong bài viết này, chúng ta sẽ khám phá phép liên kết cho trường hợp nhóm Lie ma trận Với tính chất của nhóm Lie, phép liên kết cho phép chúng ta chuyển đổi ma trận từ dạng này sang dạng khác một cách hiệu quả.
M t s tính ch t đáng chú ý c a ma tr n li n k nh sau:
Xét m t ánh x gi a hai nhóm Lie, ta định nghĩa đạo hàm cánh phải (hay ma trận Jacobian cánh phải) của một ánh xạ như sau: lim, trong đó và l n l t là s b c t do c a và Chú ý rằng phép chia trong biểu thức trên cần được hiểu là phép lấy đạo hàm (ma trận Jacobian) của vector trong t i vector trong.
Việc định nghĩa đạo hàm trong nhóm Lie liên quan đến cấu trúc phức tạp của các phần tử trong không gian tiếp tuyến Vi phân của một hàm được định nghĩa là vi phân trong các không gian tiếp tuyến có bậc ngẫu nhiên Chúng ta có thể rút ra biểu thức xấp xỉ Taylor bằng cách sử dụng đạo hàm cánh trái, trong đó ma trận Jacobian cánh trái được tính toán từ giới hạn.
17 o hàm cánh trái bi u di n vi phân c a t i trong các không gian ti p tuy n toàn c c t ng ng và X p x Taylor b c nh t khi nh nh sau:
T n d ng tính ch t c a phép li n k , d dàng ch ng minh hai lo i đ o hàm liên h v i nhau thông qua bi u th c sau:
Hôm nay, chúng ta sẽ thảo luận về hàm cánh phải và các đặc điểm của nó Một quy tắc quan trọng khi thực hiện đạo hàm chính là quy tắc chuỗi Điều này cho phép chúng ta thêm một ánh xạ khác giữa hai nhóm Lie Nếu và thì, chúng ta có thể tính toán xấp xỉ Taylor một cách chính xác, từ đó dễ dàng chứng minh quy tắc chuỗi.
Sau đơy, ta rút ra m t s k t qu h u ích khi th c hi n đ o hàm:
M t đa t p ph c h p (c a các nhóm Lie) là h p c a đa t p thành ph n không t ng tác nhau M i ph n t lƠ t p h p các ph n t t các đa t p thƠnh ph n.
Nh m tho các tiên đ c a nhóm, ph n t đ n v , ph n t ngh ch đ o vƠ phép h p c a đa t p ph c h p đ c đ nh ngh a nh sau:
Phép Exp và Log đ c đ nh ngh a t ng t đ th ng nh t kí hi u:
Log Log Log ôm trên các tập hợp phức hợp có thể được tính dựa trên đồ hàm tổng khối đa tập thành phần Xét một ánh xạ giữa hai tập hợp phức hợp và đồ hàm (cánh trái hoặc phải) của chúng có thể được tính dựa trên đồ hàm tổng của các tập hợp thành phần.
Nhóm Lie ma trận (matrix Lie group) là một phần quan trọng trong các bài toán robotics Nhóm Lie ma trận bậc n là nhóm Lie mà các phần tử của nó là các ma trận vuông kích thước n Phép hợp của nhóm được xác định bằng phép nhân ma trận, trong đó phần tử đơn vị là ma trận đơn vị và phần tử nghịch đảo là ma trận nghịch đảo.
Gi s nhóm Lie ma tr n đ c tham s hoá b i bi n T tính ch t ph n t ngh ch đ o c a nhóm, ta suy ra m i ph n t ph i có d ng:
Phép nhân ma trận có ý nghĩa quan trọng, vì nó liên quan đến các phần tử trong ma trận có kích thước nhất định Ánh xạ exp và ánh xạ logarit là hai phép toán tương ứng với phép nhân ma trận và phép logarit ma trận, thể hiện mối quan hệ chặt chẽ giữa chúng: exp và log.
Th c hi n khai tri n Taylor và rút g n t phép m ma tr n, ta thu đ c: exp exp
K t qu trên đ c s d ng đ đ nh ngh a phép li n k cho nhóm Lie ma tr n:
�d i v i nhóm Lie ma tr n, ta rút ra m t s k t qu khi th c hi n đ o hàm:
Bi u di n v trí vƠ góc h ng
(Tài li u tham kh o chính c a ph n này là [50])
3.2.1 Bi u di n góc h ng 3 chi u bi u di n góc h ng c a m t h to đ trong không gian 3 chi u, ta s d ng ma tr n xoay Ng i ta đư ch ng minh là m t nhóm Lie ma tr n
Ta kí hi u đ i s Lie c a là M i ph n t là m t ma tr n đ i x ng xiên (skew-symmetric matrix):
Ma trận liên hợp thú vị là biểu diễn góc-trục xoay (axis-angle) của phép xoay, được thể hiện qua ma trận xoay Khi phân tích, nó thể hiện sự quay quanh trục Người ta chứng minh phép Exp và Log trong không gian tứ phân thông qua công thức Rodrigues kinh điển Để tính ma trận xoay, ta áp dụng phép Exp.
Exp sin cos tính t , ta áp d ng phép Log :
Chú ý khi l p trình, góc có th r t nh , khi n k t qu tr d li u rác ho c nan x lý v n đ này, ta nên s d ng x p x Taylor n u nh : sin
3.2.2 Bi u di n t th 3 chi u bi u di n v trí và góc h ng, hay còn g i lƠ t th (pose), trong không gian
3 chi u, ta s d ng ma tr n thu n nh t :
Người ta đưa ra chứng minh là một nhóm Lie ma trận Ta ký hiệu nhóm Lie của nó là Mỗi phần tử đầu có dạng: trong đó và là thành phần thuộc liên quan tới vị trí và góc hướng Chú ý cần chính là biểu diễn góc-trục xoay (axis-angle) của phép xoay thực hiện bởi ma trận xoay Vì cấu trúc đặc biệt của ma trận thuần nhất và ma trận xoay, ta có thể rút ra các công thức ngắn gọn sau khi tính nghịch đảo và nhân ma trận trên các ma trận thuần nhất.
Công th c t ng minh cho phép Exp và Log trong nh sau:
Trong bài viết này, chúng ta sẽ khám phá các ma trận trung gian và đặc tính của chúng, bao gồm cos và sin Khi lập trình, cần lưu ý rằng góc có thể bị ràng buộc, dẫn đến kết quả không mong muốn hoặc dữ liệu rác Để xử lý vấn đề này, việc sử dụng chuỗi Taylor là một giải pháp hiệu quả, đặc biệt là cho các hàm cos và sin.
Ma tr n li n k c a phép li n k trong có d ng:
Phép tác đ ng c a đ i v i đ c đ nh ngh a nh sau:
21 Ánh x này r t h u ích khi ta c n chuy n to đ các đi m trong không gian Th c hi n l y đ o hƠm, ta thu đ c:
T i u bình ph ng c c ti u phi tuy n
(Tài li u tham kh o chính c a ph n này là [51])
Gi s ta c n t i u bi n thu c m t đa t p b t kì Th c hi n phép đo cho ra các th ng d (residual) ph thu c giá tr K t qu đo t ng h p đ c bi u di n d i d ng vector:
Do nhiều yếu tố khác nhau, các thống kê được phân bố theo một mô hình xác suất hay mô hình đo lường Giới thiệu việc đo đạc các thống kê là một quá trình ngẫu nhiên, khả năng xảy ra kết quả đo được xác định thông qua áp dụng định lý Bayes, khả năng hậu nghiệm được xác định khi biết kết quả đo.
Trong bi u th c trên, th hi n phân ph i tiên nghi m (prior distribution) c a Ta c n tìm sao cho t i đa kh n ng h u nghi m (Maximum a Posteriori ậ MAP): argmax argmax argmax
S d ng logarit t nhiên, bài toán trên tr thành: argmin log log
B qua , th c hi n gi i ph ng trình đ o hàm b ng 0: log log trong đó đ c đ nh ngh a nh sau: log
Hàm đ c g i là hàm tr ng s, thực hiện mục đích h ng c a t ng th ng d trong quá trình t i u Gi s const thì việc giải phương trình đ o hàm trên t ng đ ng được thực hiện bằng toán bình ph ng c c ti u truy n th ng Trong thực t, vì const nên bài toán g c đ c x p x thành bình ph ng c c ti u có tr ng s l p l i (iteratively reweighted least squares – IRLS): việc tính tr ng s và th ng d đ c hoán đ i liên t c t i m i vòng l p đ n khi h i t: argmin.
3.3.2 Thi t k hàm tr ng s đ m b o ch t l ng h i t cho IRLS, ta c n ch n m t mô hình phân ph i phù h p đ bi u di n t t nh t t ng quan đ l n gi a các th ng d Trong tr ng h p lý t ng, tuân theo phân ph i Gauss, d n đ n const, t c bài toán tr v d ng bình ph ng c c ti u truy n th ng Trong th c t , d li u ngo i lai (outlier) là nguyên nhân chính khi n l ch Gauss khá nhi u tri t tiêu nh h ng c a các outlier, phân ph i t (t-distribution) th ng đ c s d ng Phân ph i t có th đ c coi là m r ng c a phân ph i Gauss vì ngoài kì v ng vƠ đ l ch chu n , phân ph i t s d ng thêm b c t do đ tu chnh đ dài c a “đuôi” phơn ph i: trong đó là hàm gamma Khi , phân ph i t ti n t i phân ph i Gauss truy n th ng Giá tr càng nh thì “đuôi” c a phân ph i càng dài, bao quát càng nhi u các
23 outlier, khi n phân ph i tr nên b n v ng h n Mô hình hoá b ng phân ph i t, ta thu đ c d ng hàm tr ng s nh sau:
M t ph ng pháp thông d ng đ l a ch n các thông s c a phân ph i t nh sau: median mad kurtosis kurtosis
Tuy nhiên, trong nhiều trường hợp, phương pháp trên không đạt được kết quả tối ưu Để cải thiện kết quả tìm kiếm, có thể áp dụng thêm các thuật toán tìm kiếm nhanh như Nelder-Mead, giúp tìm kiếm cực trị hiệu quả hơn và phù hợp với tập dữ liệu hiện tại.
Hình 3.2 Khi gi m, “đuôi” c a phân ph i (trái), th hi n rõ h n trên thang log
(ph i), tr nên dƠi h n, khi n phân ph i b n v ng h n v i outlier [54]
Mục đích của nhân bản vững (robust kernel) trong thiết kế hàm trọng số là giảm thiểu ảnh hưởng của các outlier trong quá trình tối ưu Nhân bản vững giúp tạo ra hiệu quả hơn trong việc thiết kế hàm trọng số, đặc biệt khi tập hợp dữ liệu có sự phân bố không đồng nhất, thường không tuân theo các mô hình xác suất truyền thống Sử dụng các công cụ như M-estimator, nhân bản vững cho phép tối ưu hóa mà không bị ảnh hưởng quá nhiều bởi những điểm dữ liệu bất thường.
Nguyên t c ho t đ ng c a nhân b n v ng r t đ n gi n: khi th ng d nh , nhân b n v ng cho giá tr nh L2; khi th ng d t ng, giá tr c a nhơn t ng ch m, th m chí
24 bão hoà, d n đ n nh h ng c a các outlier ti m tàng (có th ng d l n) b gi m T c đ làm gi m nh h ng c a outlier khác nhau s cho ra nhi u lo i nhân khác nhau
Trong gi i h n lu n v n, đ thu n ti n, ta s d ng nhân b n v ng t ng quát Barron
Hôm nay, chúng ta sẽ khám phá khái niệm "nhân" trong ngữ cảnh của sự đánh giá và phân tích Nhân là yếu tố quan trọng, giúp chúng ta nhận diện và hiểu rõ hơn về bản chất của con người và môi trường xung quanh Qua việc tuân thủ các quy tắc và phương pháp đánh giá, chúng ta có thể rút ra nhiều nhận định và hiểu biết sâu sắc về những nhân tố ảnh hưởng đến cuộc sống hàng ngày.
Hình 3.3 HƠm đ c tr ng c a nhân t ng quát Barron (trái) và hàm tr ng s t ng ng v i các giá tr khác nhau [56]
D a vƠo hƠm đ c tr ng, tr ng s t ng ng t ng th ng d đ c tính nh sau:
THI T K GI I THU T
S đ kh i toàn h th ng
Hình 4.1 S đ kh i c a h th ng SLAM
Hệ thống SLAM kết hợp dữ liệu thô từ các cảm biến LiDAR và camera, xử lý để tạo ra mô hình 3D của môi trường theo thời gian thực Sau khi hoàn thành các nhiệm vụ, hệ thống thực hiện các tác vụ như định vị cảm biến và quản lý bản đồ Dữ liệu thô từ LiDAR là đám mây điểm quét, trong khi dữ liệu thô từ camera là ảnh Bayer sử dụng định dạng GRBG Sau khi được debayer, dữ liệu chuyển sang grayscale và được điều chỉnh độ sáng, sau đó được đưa vào hệ thống.
H th ng bao g m các module:
• Sensor Synchronizer: đ ng b 2 lu ng d li u thô t camera (khung nh) vƠ LiDAR (đám mơy) sao cho t i m i l n ng t, d li u t 2 c m bi n có timestamp sát nhau
• Candidate Selector: l a ch n t p đi m nh ch n l c có gradient cao
• Image Aligner: c l ng đ d i t th 3D d a vƠo x p ch ng gi a 2 khung nh liên ti p
• Cloud Registrator: c l ng t th 3D d a vƠo x p ch ng đám mơy hi n t i vƠ b n đ
• Windowed Optimizer: k t h p t th c l ng t camera vƠ LiDAR b ng đ th nhơn t
• Map Manager: c p nh t, truy xu t vƠ l u tr b n đ đám mơy.
Gi i bài toán IRLS trong không gian Lie
Nh c l i, bài toán IRLS đ c phát bi u d i d ng: argmin
Sau khi xây dựng hàm mục tiêu, bước tiếp theo là áp dụng giải thuật tối ưu để tìm giá trị tối ưu Trong giải thuật này, ta sử dụng phương pháp Levenberg-Marquardt (LM) nhằm cải thiện khả năng hội tụ của quá trình tối ưu hóa Ưu điểm chính của LM là giảm thiểu hàm mục tiêu một cách hiệu quả Nếu so sánh, LM gần giống với Gradient Descent, nhưng có khả năng điều chỉnh nhanh hơn trong các trường hợp khó khăn Ngược lại, phương pháp Gauss-Newton mặc dù nhanh nhưng có thể gặp vấn đề với độ ổn định Bằng cách điều chỉnh hệ số, quá trình lặp sẽ được cải thiện liên tục, đảm bảo giá trị hàm mục tiêu luôn giảm.
HƠm n ng l ng trong bƠi toán IRLS có d ng: t diag là ma tr n chéo ch a tr ng s c a các th ng d , hƠm n ng l ng có th vi t g n thành:
Gi s ta có đ c m t c l ng ban đ u c a Nguyên t c c a t i u suy gi m đ d c là t i m i vòng l p, thay vì tìm tr c ti p , ta tìm đ d i t i u
Trong không gian tiếp tuyến, việc tính toán hàm số nhiều biến yêu cầu sử dụng khai triển Taylor bậc nhất để đảm bảo tính chính xác Phương pháp này giúp tối ưu hóa giá trị của hàm số bằng cách giảm thiểu sai số trong quá trình tính toán, phụ thuộc vào các yếu tố như độ phức tạp và tính khả thi của hàm.
Ti p t c khai tri n, ta thu đ c m t đa th c b c hai theo :
Th c hi n gi i ph ng trình đ o hƠm b ng 0, ta thu đ c: trong đó là ma tr n hessian và là bias vector c a bài toán:
Ph ng pháp LM trong không gian Lie đ c tóm t t qua b ng sau:
B ng 4.1 Các b c th c hi n gi i thu t LevenbergậMarquardt. u vào
Chú ý t i b c 5, công th c ch mang tính t ng tr ng: vi c gi i h ph ng trình trong th c t ph i d a trên các gi i thu t phơn tích Cholesky, QR, SVD ch không
28 ph i d a trên ngh ch đ o ma tr n Khi l p trình, đ gi m kh i l ng tính toán, ta có th tính ma tr n hessian và bias vector theo nguyên t c c ng d n:
Xây d ng module Candidate Selector
Để tối ưu hóa quy trình xác định các điểm đám mây hiện tại trong hình ảnh từ camera, trước tiên cần xác định các điểm nhấn theo nguyên tắc: ưu tiên các điểm đầu tiên trong tổ hợp và gradient cao Để đảm bảo chất lượng đánh giá và giảm thời gian tính toán, ta sẽ ưu tiên chọn những điểm nhấn trong vùng gradient cao, đặc biệt là các góc cạnh Đồng thời, cần chọn một vùng với điểm nhấn có gradient yếu hơn bằng cách giảm độ phân giải của ô lưới Cuối cùng, những điểm nhấn có kèm độ sâu sẽ được lựa chọn làm điểm nhấn chính.
Hình 4.2 T p đi m nh tr c (trái) và sau (ph i) ch n l c [29].
Xây d ng module Image Aligner
Mô hình camera pinhole hoạt động dựa trên nguyên lý ánh sáng đi qua một lỗ nhỏ và chiếu lên một bề mặt nhận diện Khi ánh sáng đi qua lỗ này, nó tạo ra hình ảnh của vật thể bên ngoài Do cấu trúc này, camera pinhole có góc nhìn hạn chế (