1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng.

356 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng
Tác giả Nguyễn Thị Hữu Phương
Người hướng dẫn PGS.TS. Đặng Văn Đức, PGS.TS. Nguyễn Trường Xuân
Trường học Học viện Khoa học và Công nghệ
Chuyên ngành Máy tính
Thể loại Luận án tiến sĩ
Năm xuất bản 2022
Thành phố Hà Nội
Định dạng
Số trang 356
Dung lượng 2,57 MB

Cấu trúc

  • 1.1 Kiến trúc hệthốngLiDAR (17)
    • 1.1.1 Khái niệm côngnghệLiDAR (17)
    • 1.1.2 Hoạt động của hệthốngLiDAR (19)
  • 1.2 DữliệuLiDAR (21)
    • 1.2.1 Thu nhận dữ liệu ĐMĐ theo côngnghệLiDAR (21)
    • 1.2.3 Đặc trưng của dữ liệuĐMĐLiDAR (22)
    • 1.2.3 Định dạng dữliệuLiDAR (23)
  • 1.3 Bài toán phân loại dữ liệuĐMĐLiDAR (24)
    • 1.3.1 Bài toán phân loạidữ liệu................Lỗi! Thẻ đánh dấu không được xácđịnh (121)
    • 1.3.2 Các bài toán phân loại ĐMĐ LiDARLỗi! Thẻ đánh dấu không được xác định (121)
  • 1.4 Các công trình nghiên cứuliênquan (30)
    • 1.4.1 Trongnước (30)
    • 1.4.2 Ngoàinước (31)
  • 1.5 Phương phápđềxuất (37)
  • 1.6 Kếtluậnchương (39)
  • CHƯƠNG 2 PHÁT TRIỂN THUẬT TOÁN NÂNG CAO CHẤT LƯỢNG PHÂNLOẠIĐMĐLIDAR (121)
    • 2.1 Cải tiến thuậttoánEM (40)
      • 2.1.1 Mô tả thuậttoánEM (40)
      • 2.1.2 Ý tưởng cải tiến thuậttoánEM (44)
      • 2.1.3 Thực hiệncảitiến (46)
      • 2.1.4 Thử nghiệm và đánh giá thuật toán EM-D (55)
    • 2.2 Cải tiến thuậttoánMCC (63)
      • 2.2.1 Mô tả thuậttoánMCC (63)
      • 2.2.2 Ý tưởng cài tiến thuậttoán MCC (68)
      • 2.2.3 Thực hiệncảitiến (71)
      • 2.2.4 Thử nghiệm và đánh giá thuật toán MCC-D (79)
    • 2.3 Kếtluậnchương (83)
    • 3.1 Lớp phủ khu vực đô thị và khả năng sử dụng của dữ liệu LiDAR trong phân loạilớp phủ bề mặt khu vựcđô thị (84)
    • 3.2 Đề xuất phương pháp xử lý dữ liệu LiDAR trong phân loại lớp phủ bề mặt khuvựcđôthị (122)
      • 3.2.1 Phân loại lớp phủ bề mặt khu vựcđôthị (87)
      • 3.2.2 Phương phápđềxuất (90)
      • 3.2.3 Thửnghiệm (91)
      • 3.2.4 Tạo bộ dữ liệu đầu vào cho DSS trong quy hoạchđấtđai (97)
    • 3.3 Kếtluậnchương (105)

Nội dung

Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng.Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng.Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng.Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng.Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng.Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng.Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng.Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng.

Kiến trúc hệthốngLiDAR

Khái niệm côngnghệLiDAR

LiDAR là một phương pháp viễn thám sử dụng xung tia laser để đo khoảng cách đến bề mặt Trái đất, hoạt động như một cảm biến quang chủ động Thiết bị này phát tia laser tới các mục tiêu trên mặt đất và ghi nhận các tia phản xạ, từ đó tạo ra dữ liệu 3D chính xác về hình dạng và đặc điểm của các đối tượng trên Trái đất LiDAR, còn được gọi là ToF (Time of Flight), là công nghệ hiệu quả trong việc phát hiện và ánh xạ khoảng cách của các đối tượng.

Máy tín hiệu phản xạ ghi lại chính xác quá trình tia laser từ máy phát đến mục tiêu và ngược lại, giúp tính toán khoảng cách giữa chúng Thông tin này, kết hợp với dữ liệu vị trí, cho phép xác định tọa độ 3D thực tế của mục tiêu trong không gian Công nghệ LiDAR cung cấp độ chính xác cao trong việc xác định tọa độ (x, y) và độ cao (z) của các điểm.

The LiDAR system comprises three key components: the Light Amplification by Stimulated Emission of Radiation (laser) system, the Global Navigation Satellite System/Global Positioning System (GNSS/GPS), and the Inertial Navigation System (INS) for navigation and guidance.

Tổ hợp các thiết bị này trong mối quan hệ hữu cơ, tác động chi phối lẫn nhau, tạo nên hệ thống LiDAR [1], [3].

Hệ thống LiDAR sử dụng ánh sáng laser từ các phương tiện di động như ô tô, máy bay và máy bay không người lái để quét qua không khí, thảm thực vật và nước Cơ chế quét của LiDAR được thiết kế nhằm tạo ra các xung laser đồng nhất, với các xung này được phản xạ từ các gương quay hoặc quét.

Hệ thống GNSS cung cấp thông tin địa lý chính xác về vị trí của cảm biến (vĩ độ, kinh độ, chiều cao) và IMU xác định hướng chính xác của cảm biến (Pitch, Roll, Yaw) Dữ liệu từ GPS và IMU được ghi lại để tạo thành các điểm tĩnh, là cơ sở cho ĐMĐ ánh xạ 3D GPS cung cấp vị trí chính xác, trong khi IMU ghi lại tọa độ X, Y, Z của máy quét và bao gồm cảm biến gia tốc kế, con quay hồi chuyển và cảm biến từ kế để đo vận tốc, định hướng và lực hấp dẫn.

Sau khi tiến hành khảo sát, dữ liệu được tải xuống và xử lý bằng phần mềm LIDAR Kết quả đầu ra bao gồm kinh độ (X), vĩ độ (Y) và độ cao (Z) cho từng điểm dữ liệu Dữ liệu điểm độ cao này cho phép tạo ra bản đồ địa hình chi tiết cho khu vực nghiên cứu.

Hoạt động của hệthốngLiDAR

Cảm biến LiDAR, được gắn trên máy bay hoặc ô tô, hoạt động bằng cách phát ra chuỗi xung laser Những xung này sẽ được gửi đến bề mặt hoặc mục tiêu và đo thời gian mà chúng quay trở lại Nguyên lý làm việc của LiDAR dựa trên việc tính toán thời gian đi và về của các xung laser.

- Phát xung laser xuống bề mặt tráiđất

- Thu nhận tia laser phản xạ trở lại nguồn xung LiDAR bằng các cảmbiến

- Đo thời gian đi củalaser

- Tính toán thực tế để đo khoảng cách một photon ánh sáng trở lại đã đi tới và từ một vật thể được tính bằng công thức (1)[3]:

Khoảng cách D từ bộ phát đến đối tượng, tốc độ ánh sáng S của tia laser, và thời gian T cho phép xác định các đối tượng như nhà, đường, hay thực vật Dữ liệu độ cao thu thập được từ quá trình này được sử dụng để xây dựng các mô hình DEM, DSM, và DTM cho bề mặt.

Hình 1.2 Cách hoạt động của các thành phần trong hệ thống LiDAR

Xung laser được phát xuống mặt đất từ một độ cao nhất định và phản hồi từ các bề mặt như cây, đường, hoặc nhà Mỗi xung laser cho phép đo thời gian đi và về của tín hiệu, từ đó tính toán khoảng cách từ nguồn phát đến đối tượng Qua các phép đo tổng hợp, vị trí của các điểm trên bề mặt trái đất có thể được xác định Đồng thời, dữ liệu về định hướng không gian của tia quét được ghi lại nhờ hệ thống INS/IMU, sử dụng thông tin tọa độ không gian từ phản hồi cuối cùng.

Echo được sử dụng để xây dựng mô hình số độ cao của bề mặt thực, trong đó mô hình DSM áp dụng phản hồi đầu tiên (First Pulse - FP) và phản hồi cuối cùng (Last Pulse - LP) để đảm bảo tính chính xác và độ tin cậy.

Cường độ và năng lượng thu nhận từ các tia phản xạ được xác định thông qua tọa độ không gian X, Y, Z của điểm địa vật hay địa hình, dựa vào độ dài (D) và góc phương vị (ψ) trong hệ thống tọa độ GPS, thường là WGS 84 Tại Việt Nam, hệ tọa độ chính được sử dụng là Hệ quy chiếu và Hệ tọa độ quốc gia VN-2000, múi chiếu 30, theo quy định tại Thông tư số 973/2001/TT-TCĐC ngày 20 tháng 6 năm 2001 của Tổng cục Địa chính.

Hình 1.4 Nguyên lý quét của LiDAR

Hình 1.5 ĐMĐ sau khi được thu nhận và xử lý

DữliệuLiDAR

Thu nhận dữ liệu ĐMĐ theo côngnghệLiDAR

Sản phẩm của LiDAR là tập hợp các điểm có độ dày đặc và độ cao chính xác, thường được gọi là ĐMĐ LiDAR Những điểm này có thể được sử dụng để tạo ra các mô hình 3D của bề mặt Trái đất và các đặc trưng của nó ĐMĐ được hình thành từ dữ liệu thô quét từ các đối tượng vật lý như tòa nhà, nhà máy và địa hình Sau khi thu thập, dữ liệu thô cần được chuyển đổi thành các tệp máy tính có thể đọc được.

Hình 1.6 Nguyên lý thu thập dữ liệu của hệ thống LiDAR

Bộ thu phát LiDAR hoạt động nhờ vào cụm gương quét gắn dưới thiết bị, với gương gập 450 phản chiếu các xung laser đến một gương chuyển động, giúp định hướng xung laser tới bề mặt Trái đất Xung laser phản hồi đầu tiên là phản xạ đáng kể nhất, liên quan đến các đặc điểm cao nhất trong cảnh quan như ngọn cây hoặc đỉnh tòa nhà Các tia phản xạ ở giữa cung cấp thông tin về cấu trúc thảm thực vật, trong khi phản xạ cuối cùng giúp tạo ra các mô hình địa hình chính xác của Trái đất.

Dữ liệu LIDAR được xử lý để xác định thời gian phản hồi của mỗi xung laser từ cảm biến, từ đó tính toán khoảng cách thay đổi từ cảm biến đến bề mặt đất Độ cao của tia phản xạ phụ thuộc vào hình dạng và kích thước của các vật thể, cho phép phân loại các điểm thành nhiều lớp khác nhau như cây cao, mặt đất, cỏ, đường giao thông, và tòa nhà.

Hình 1.7 ĐMĐ khi chưa được xử lý

Đặc trưng của dữ liệuĐMĐLiDAR

Công nghệ LiDAR thu thập thông tin về hình dạng và đặc trưng của Trái đất thông qua các ĐMĐ Mỗi điểm trong ĐMĐ chứa lượng thông tin lớn, giúp tạo ra mô hình 3D về bề mặt Trái đất và các đối tượng trên đó Khi kết hợp với thông tin màu sắc, ĐMĐ sẽ trở thành 4D.

Các thuộc tính thành phần trong ĐMĐ cung cấp thông tin bổ sung quan trọng để nâng cao độ cao, đồng thời cho phép người dùng tạo ra các sản phẩm raster tùy chỉnh như mô hình chiều cao tán cây hoặc lưới cường độ.

Các đặc trưng của ĐMĐ LiDAR [6]:

Các xung laser phản xạ từ các vật thể trên bề mặt như tòa nhà, cây cối và thảm thực vật khác Số lượng xung phản xạ nhiều giúp dữ liệu LiDAR được sử dụng để phân tách địa hình khỏi các đặc điểm bề mặt Mỗi đối tượng sẽ phản xạ một lượng ánh sáng nhất định, và lượng ánh sáng này sẽ được cảm biến phát hiện và ghi lại.

- Tọa độ (X, Y, Z) chỉ ra vị trí cũng như độ cao của điểm, điểm riêng lẻ có thể có các thuộc tính bổsung

- Thứ tự phản hồi: mỗi điểm trong ĐMĐ sẽ có một thứ tự tia phản hồi tương ứng

- Số điểm trên m 2 : số điểm trung bình trênm 2

- Mật độ điểm: số lượng phép đo trên một khu vực mà bề mặt Trái đất được lấymẫu

- Số điểm: Tổng số điểm trong ĐMĐ

Tùy vào từng bài toán cụ thể, các đặc trưng của ĐMĐ sẽ được sử dụng phù hợp.

Định dạng dữliệuLiDAR

Với kích thước lớn của dữ liệu LiDAR, định dạng nhị phân LAS đã được áp dụng để quản lý và chuẩn hóa tổ chức cũng như phân phối dữ liệu Tệp LAS chứa nhiều thông tin hơn và cho phép đọc hiệu quả hơn Đây là định dạng công nghiệp do Hiệp hội Chụp ảnh và Viễn thám Hoa Kỳ (ASPRS) phát triển và duy trì, được công nhận là tiêu chuẩn để trao đổi dữ liệu LiDAR.

Mỗi tệp LAS chứa siêu dữ liệu LiDAR với một khối tiêu đề và các bản ghi cho từng xung laser Phần tiêu đề cung cấp thông tin quan trọng như phạm vi dữ liệu, ngày và thời gian bay, số lượng bản ghi điểm, số điểm trả về, cũng như các bù dữ liệu và hệ số tỷ lệ áp dụng Đối với từng xung laser, các thuộc tính như vị trí x, y, z, tem thời gian GPS, cường độ, số trả về, thứ tự tia, giá trị phân loại điểm, góc quét, giá trị RGB, hướng quét, cạnh đường bay, dữ liệu người dùng, ID điểm và thông tin dạng sóng được duy trì trong tệp LAS.

Mặc dù bộ dữ liệu LiDAR rất lớn và chứa nhiều thông tin hữu ích, nhưng nếu không áp dụng phương pháp xử lý và sử dụng phù hợp, giá trị của nó sẽ bị giảm Để tận dụng dữ liệu LiDAR cho các ứng dụng khác nhau, NCS đã chọn phương pháp phân loại để gán nhãn cho các điểm trong bộ dữ liệu LiDAR.

Bài toán phân loại dữ liệuĐMĐLiDAR

Các công trình nghiên cứuliênquan

Trongnước

Từ năm 2006, LiDAR đã được áp dụng rộng rãi tại Việt Nam, bắt đầu từ các thử nghiệm của Công ty AAMHATCH tại Đồng Nai và Cần Thơ Nhiều công trình nghiên cứu khoa học cho thấy ưu điểm vượt trội của LiDAR trong việc nghiên cứu bề mặt địa hình Gần đây, cùng với sự phát triển công nghệ thông tin, các Bộ, Ban, Ngành đã tích cực áp dụng công nghệ tiên tiến vào sản xuất Trong lĩnh vực Khoa học Trái đất, các Công ty, Xí nghiệp đang thử nghiệm ứng dụng LiDAR Tại Công ty TNHH MTV Tài nguyên và Môi trường Việt Nam, dữ liệu LiDAR được xử lý bằng phần mềm Global Mapper và ENVI LiDAR để tạo ra DEM, DSM và nội suy đường bình độ.

Nghiên cứu của tác giả Vũ Quốc Lập tại Công ty Đo đạc và Khoáng sản cho thấy dữ liệu LiDAR đáp ứng tốt yêu cầu đo vẽ hiện trạng các hệ thống hầm lò Công nghệ LiDAR đã chứng minh khả năng tạo lập DEM/DSM hiệu quả, đặc biệt khi áp dụng tại vùng bãi bồi ven biển, cho phép xây dựng cơ sở dữ liệu địa hình với độ chính xác tương đương bản đồ tỷ lệ 1:5000 Các nghiên cứu khác cũng chỉ ra rằng việc kết hợp dữ liệu LiDAR với UAV mang lại thông tin tích hợp giá trị cho khảo sát và thiết kế công trình Hơn nữa, dữ liệu LiDAR đã được sử dụng để cập nhật lớp cơ sở dữ liệu giao thông tại thành phố Hồ Chí Minh, giúp quá trình này diễn ra nhanh chóng và chính xác hơn.

Các nghiên cứu đã sử dụng thuật toán phân loại từ phần mềm thương mại để xử lý dữ liệu bay quét LiDAR, phân chia điểm thành hai lớp: Ground và Non-Ground Hai lớp điểm này được dùng để xây dựng DEM và DTM, phục vụ cho nghiên cứu bề mặt địa hình Tuy nhiên, phần mềm đi kèm với thiết bị LiDAR có giá thành cao và chỉ hỗ trợ dữ liệu đầu vào định sẵn cùng thuật toán phân loại bán tự động Với khối lượng dữ liệu lớn từ quét LiDAR, việc chỉ phân loại thành hai lớp Ground và Non-Ground chưa tận dụng hết tiềm năng của dữ liệu, khiến kết quả chỉ dừng lại ở việc tạo DEM/DTM, tạo ra rào cản cho việc áp dụng công nghệ LiDAR rộng rãi trong ngành Khoa học trái đất tại Việt Nam.

Ngoàinước

LiDAR đã được áp dụng từ những năm 90 của thế kỷ XX, khi NASA sử dụng công nghệ này để nghiên cứu địa hình Đến nay, nhiều nghiên cứu đã công bố về ứng dụng LiDAR, cùng với những cải tiến công nghệ và thuật toán xử lý dữ liệu liên tục được các nhà khoa học công bố Các hướng nghiên cứu và ứng dụng của LiDAR rất đa dạng và phong phú.

A Áp dụng thuật toán K-means trong phânloại

Trong nghiên cứu về phân loại ĐMĐ LiDAR, Zhang và cộng sự đã áp dụng thuật toán K-means để phân loại theo mật độ điểm Họ đề xuất sử dụng các số liệu dựa trên giá trị riêng cùng với K-means để thực hiện phân loại Tham số mật độ của ĐMĐ được sử dụng để xác định số lượng cụm và điều kiện hội tụ Phương pháp phân tích thành phần chính giúp thu được các giá trị riêng và số liệu dẫn xuất, trong khi K-means phân loại điểm thành hai lớp: edge và non-edge Bốn khu vực thử nghiệm với mức độ phức tạp khác nhau đã được lựa chọn để đánh giá phương pháp Kết quả phân tích cho thấy quy trình phân loại mang lại độ hoàn chỉnh và độ chính xác trên 92% cho lớp non-edge và từ 61% đến 98% cho lớp edge.

Việc áp dụng thuật toán K-means kết hợp với Mạng nơ ron nhân tạo (ANN) trong nghiên cứu [32] và sử dụng K-means dựa trên phân đoạn ĐMĐ trong tài liệu [33] đã chứng minh rằng K-means có những ưu điểm nổi bật trong việc phân loại ĐMĐ LiDAR.

B Phương pháp phân loại dựa trên đặc trưng củađiểm Điểm LiDAR với đặc trưng độ cao, cường độ phản xạ, hình thái điểm đã được các tác giả sử dụng trong các nghiên cứu phân loại ĐMĐ LiDAR Các đặc trưng của điểm được coi như là đầu vào rất quan trọng giúp tăng độ chính xác của kết quả phân loại Trong nghiên cứu [34] dựa trên sự thay đổi về độ lệch của mật độ dữ liệu LiDAR từ các tín hiệu phản hồi Với khu vực thử nghiệm ở phía nam của Đức và trung tâm thành phố Stuttgart, các tác giả đã đề xuất cách tiếp cận thống kê để phân loại điểm ground dựa trên mối quan hệ mật độ trong ĐMĐ LiDAR Kết quả phân loại được sử dụng để tạo ra DTM, DSM và CHM (Canopy Height Model) Trong khi đó, nghiên cứu [35] sử dụng thuật toán phát hiện điểm để phát hiện và phân loại các đối tượng đô thị và cây cối từ dữ liệu 3D MLS (Mobile Laser Scanning) và TLS (Terrestrial LaserScanning) Phương pháp bao gồm cả việc phân đoạn tự động để loại bỏ đi những phần không liên quan đến quá trình phân đoạn dọc đối tượng Thuật toán được kiểm tra với hai ĐMĐ được thu nhận bằng hai bộ cảm khác nhau Với khu vực thử nghiệm các tác giả nhận thấy rằng với thuật toán phát hiện các điểm dị thường cho kết quả chính xác khoảng 95% với hai lớp được phân loại là cây cối và công trình nhân tạo như hồnước.Nghiên cứu [36] thực hiện quá trình phân loại ĐMĐ bằng việc phân chia ĐMĐ3D thành các đoạn (segment) độc lập, dựa trên các đặc trưng của đối tượng, cuối cùng các điểm sẽ được tự động phân loại theo các đặc trưng này Kết quả chỉ ra rằng sự tương thích của kết quả phân loại khi sử dụng OBC (Object-Based Classification) và nhận dạng của con người, các thông tin không gian như đặc trưng củađiểmđượccungcấpbởiĐMĐcóthểcungcấplàđadạng,phongphúvàmạnh mẽ như là cơ sở của phân loại Với nghiên cứu [37], điểm LiDAR đơn lẻ được phân tích theo các tính năng của chúng chẳng hạn như chiều cao, thứ tự trả về, v.v sau đó tự động được gán cho lớp mà chúng thuộc về.

C Phương pháp phân loại truyền thống và sử dụng phép nộisuy

Quá trình lọc điểm đóng vai trò quan trọng trong hầu hết các ứng dụng của ĐMĐ LiDAR Việc áp dụng các thuật toán lọc điểm cùng với việc điều chỉnh cài đặt tham số và tăng ngưỡng hội tụ sẽ nâng cao độ chính xác của quá trình này Dựa trên những ý tưởng này, các nghiên cứu [41], [44] và [45] đã được thực hiện.

Thuật toán EM được sử dụng để phân loại dữ liệu LiDAR dựa trên các đặc trưng như độ cao, sự thay đổi độ cao, cường độ tia phản xạ laser và ảnh cường độ Nghiên cứu đã đạt được độ chính xác 94% cho khu vực rộng 8 dặm vuông Kết quả cho thấy sai số trên lớp điểm non-ground chỉ là 4.48%, và sai số của thuật toán EM thấp hơn 16.78% so với phương pháp PTD truyền thống, đồng thời giảm lỗi hệ thống xuống còn 31.95%.

Nghiên cứu [43] đã áp dụng mô hình GMM trong việc phân loại ĐMĐ LIDAR, xác định trong lớp huấn luyện của phân loại không giám sát và định nghĩa các lớp trung gian Kết quả thử nghiệm cho thấy hệ thống đề xuất đạt độ chính xác từ 0.8 đến 0.89 trên hai bộ dữ liệu khác nhau.

Nghiên cứu đã đề xuất một thuật toán phân loại ĐMĐ dựa trên mối quan hệ ngữ nghĩa nhiều mức để xây dựng mô hình 3D cho khu vực khảo sát Việc lựa chọn thuật toán phù hợp là cần thiết khi làm việc với bộ dữ liệu có mật độ điểm cao và nhiều nhiễu Thuật toán sử dụng ĐMĐ qua các phép biến đổi dựa trên ràng buộc về sự đồng nhất của điểm và các điểm lân cận, cho phép phân loại các điểm với độ chính xác đạt 93.55% Tuy nhiên, thuật toán vẫn còn hạn chế trong việc xử lý triệt để nhiễu trong dữ liệu đầu vào.

Thuật toán CRF (Conditional Random Field) được giới thiệu trong [46] cung cấp một phương pháp sử dụng thông tin ngữ cảnh làm dữ liệu đầu vào cho bài toán phân loại Bài toán này được mô hình hóa bằng GMM, với các tham số được tối ưu hóa thông qua thuật toán cực đại hóa kỳ vọng CRF sẽ được áp dụng để phân tích thông tin ngữ cảnh trong dữ liệu Kết quả thử nghiệm cho thấy độ chính xác của phân loại phụ thuộc vào bài toán phân loại với GMM-EM.

Nghiên cứu [47] cho thấy sự kết hợp giữa RF và SVM trên dữ liệu thu thập tại khu vực đô thị và rừng đạt được độ chính xác ấn tượng, với hơn 80% cho dữ liệu đô thị và trên 93% cho dữ liệu rừng, đây là kết quả tốt nhất được ghi nhận trong tài liệu hiện có, không phụ thuộc vào phương pháp phân loại nào.

Nghiên cứu [48], [49] đã áp dụng thuật toán MCC để phân loại dữ liệu LiDAR, trong đó sử dụng phép nội suy TPS nhằm loại bỏ các điểm không thuộc nhóm ground, từ đó tạo ra DEM cho khu vực khảo sát TPS giúp đánh giá trạng thái giữa các điểm, kiểm soát khoảng cách mẫu ảnh hưởng đến bề mặt ước lượng Phương pháp MCC-RGB [49] sử dụng bộ phân loại SVM để phân biệt thảm thực vật và các điểm trên bề mặt dựa vào màu sắc Các tác giả đã khảo sát tại hai địa điểm với lớp phủ thực vật khác nhau, chứng minh rằng các kỹ thuật học máy đơn giản có thể cải thiện khả năng phân loại ĐMĐ trong các ứng dụng địa mạo phức tạp Nghiên cứu [50] so sánh hiệu quả của hai thuật toán MCC và BCAL trong việc phân loại dữ liệu LiDAR để xây dựng DTM, với độ chính xác được đánh giá qua hơn 7000 điểm đo Kết quả cho thấy BCAL phù hợp với khu vực có mật độ điểm dày đặc, trong khi MCC cho độ chính xác cao hơn ở những nơi có độ dốc thay đổi.

D Phương pháp phân loại dựa trên mô hình họcmáy

Với sự phát triển của học máy, SVM đã trở thành một trong những bộ phân loại phổ biến cho việc xử lý dữ liệu có chiều cao với lượng mẫu nhỏ Học tập kết hợp, thông qua việc kết hợp nhiều bộ phân loại cơ sở, giúp cải thiện khả năng phân biệt, nhất là khi có sự khác biệt nhỏ về tính năng giữa các loại dữ liệu Nghiên cứu [53], [54], [55] đã chỉ ra hiệu quả của phương pháp này trong việc nâng cao độ chính xác của các mô hình phân loại.

[26] đã chỉ ra những ưu điểm của SVM trong bài toán phân loại Trong

Các tác giả đã áp dụng SVM tuyến tính kết hợp với cây quyết định để tối ưu hóa phân loại, cho phép các đặc trưng thu được có thể áp dụng cho từng lớp đối tượng Trong khi đó, một phương pháp biến thể của SVM được đề xuất để phân loại dữ liệu LiDAR thành các lớp nhà cao tầng và cây cối Phương pháp này chia khu vực theo mật độ điểm đo LiDAR, xác định các điểm lân cận cho mỗi khu vực được chọn, với mỗi vector bao gồm ba thành phần Tuy nhiên, các điểm nằm ở biên vẫn gặp lỗi trong phân loại và không phù hợp với dữ liệu LiDAR từ khu vực đô thị.

Nghiên cứu [55] áp dụng thuật toán Surface Growing để phân đoạn ĐMĐ thành các cụm khác nhau, trong khi phương pháp phân loại SVM với hàm cơ bản xuyên tâm (RBF) đạt độ chính xác lần lượt là 98%, 92% và 94% trên hai bộ dữ liệu được lựa chọn Độ chính xác này có ý nghĩa trong việc xây dựng DTM và phát hiện nhà cao tầng tại khu vực đô thị Tuy nhiên, SVM có thể dẫn đến hiện tượng thiếu khớp hoặc quá phù hợp, làm giảm hiệu suất tổng quát hóa Để khắc phục, nghiên cứu [26] đã sử dụng các hàm nhân dựa trên phân tích wavelet để phát triển các SVM wavelet (WSVM) nhằm cải thiện tính không đồng nhất của hệ thống tổng hợp Kết quả thực nghiệm cho thấy phương pháp này mạnh mẽ và hiệu quả, có thể áp dụng cho nhiều công việc thực tế.

Các tác giả đã áp dụng mô hình học máy, bao gồm thuật toán k-NN và CNN, để giải quyết bài toán phân loại ĐMĐ LiDAR trong các nghiên cứu của họ.

Phương phápđềxuất

Nghiên cứu của NCS đã thử nghiệm các thuật toán MCC, k-NN, K-means và PCA, mỗi thuật toán có ưu nhược điểm riêng Kết quả cho thấy các thuật toán này gặp khó khăn trong khu vực có phân bố phức tạp, trong khi MCC cho khả năng phân loại tốt giữa lớp ground và non-ground trong môi trường có thực vật che phủ Phương pháp MCC sử dụng bộ lọc nội suy lặp lại, với phép lặp TPS có thể kết hợp GMM để nâng cao độ chính xác NCS đề xuất sử dụng thuật toán cực đại hóa kỳ vọng nhằm cải thiện độ chính xác cho MCC trong phân loại dữ liệu ĐMĐ LiDAR, từ đó phát triển thuật toán EM và MCC.

Phương pháp đề xuất tập trung vào việc cải tiến thuật toán EM và MCC trong phân loại ĐMĐ, vì cả hai đều phù hợp với các khu vực có sự phân bố phức tạp của đối tượng Thuật toán EM có khả năng nâng cao hiệu quả của kết quả phân loại, góp phần vào sự chính xác trong quá trình phân tích dữ liệu.

Khi áp dụng thuật toán EM trong phân loại ĐMĐ LiDAR, nó cho kết quả tốt với dữ liệu phản xạ, trong khi MCC lại phù hợp hơn với dữ liệu tán xạ Việc kết hợp hai thuật toán này sẽ tối ưu hóa việc sử dụng toàn bộ dữ liệu LiDAR.

Phép nội suy TPS trong MCC có thể được cải tiến bằng cách áp dụng mô hình RPM – GMM (Robust Point Matching – Gaussian Mixture Model) Việc cải tiến thuật toán EM và tích hợp vào mô hình RPM – GMM sẽ nâng cao hiệu quả của phép nội suy TPS, giúp thuật toán MCC khắc phục những hạn chế đã nêu trong phần kết luận của mục 1.4.

Phương pháp đề xuất được trình bày trong hình 1.14, bao gồm hai hướng chính Hướng đầu tiên, NCS tiến hành cải tiến thuật toán EM (gọi là thuật toán EM – D) và áp dụng những cải tiến này để nâng cao hiệu quả của thuật toán.

Thuật toán EM – D được áp dụng trong phân loại dữ liệu ĐMĐ phản xạ LiDAR nhằm cải thiện phép nội suy TPS, chuyển đổi thành thuật toán MCC – D Việc sử dụng MCC – D trong phân loại dữ liệu ĐMĐ tán xạ LiDAR giúp khắc phục tình trạng hội tụ chậm của thuật toán EM với các bộ dữ liệu lớn và giảm thiểu ảnh hưởng của tham số khởi tạo của MCC đến độ chính xác phân loại Phương pháp này cũng cho phép phân loại hiệu quả nhóm non-ground, những nhóm bị loại bỏ sau khi phân loại với MCC.

Thực hiện phương pháp đề xuất và thử nghiệm được tiến hành trong chương 2.

Hình 1.12 Các bước thực hiện phương pháp đề xuất

Kếtluậnchương

Phân loại dữ liệu ĐMĐ LiDAR là bước quan trọng trong xử lý dữ liệu LiDAR, giúp xác định nhãn cho điểm và phục vụ nhiều ứng dụng khác nhau Chương I đã trình bày tổng quan về công nghệ LiDAR, bài toán phân loại điểm và phân tích các thuật toán phân loại hiện có, từ đó xác định rõ bài toán phân loại dữ liệu ĐMĐ LiDAR.

CHƯƠNG2 CHƯƠNG 2 PHÁT TRIỂN THUẬT TOÁN NÂNG CAO

CHẤT LƯỢNG PHÂN LOẠI ĐMĐLIDAR

Trong chương 2, NCS đã cải tiến thuật toán EM và MCC nhằm nâng cao hiệu quả phân loại ĐMĐ LiDAR Các thử nghiệm được thực hiện để đánh giá độ chính xác của kết quả phân loại thông qua các chỉ số Precision, Recall và F1.

Expectation Maximization (EM) is an algorithm proposed by Hartley in 1958 Dempster and colleagues early implemented this method for maximum likelihood estimation in situations with missing data.

Thuật toán EM, được phát triển vào năm 1976, là công cụ mạnh mẽ trong việc ước tính khả năng ước lượng tối đa cho các mô hình tham số khi dữ liệu không đầy đủ hoặc có các biến tiềm ẩn không quan sát được Nó có khả năng tìm ra mô hình tham số ngay cả trong những bộ dữ liệu thiếu hụt Thuật toán này bắt đầu bằng cách chọn giá trị ngẫu nhiên cho dữ liệu bị thiếu và sử dụng những dự đoán này để tính toán một bộ dữ liệu thứ hai Các giá trị mới được tạo ra sẽ cải thiện dự đoán cho tập dữ liệu ban đầu, và quá trình này sẽ tiếp tục lặp lại cho đến khi thuật toán hội tụ EM là một thuật toán kinh điển trong lĩnh vực học máy và thống kê.

Thuật toán EM (Expectation-Maximization) bao gồm bốn bước chính Đầu tiên, bước khởi tạo thiết lập một tập hợp giá trị ban đầu cho các tham số và đưa vào một tập dữ liệu quan sát không đầy đủ, giả định rằng dữ liệu này đến từ một mô hình cụ thể Tiếp theo, trong bước kì vọng (E), dữ liệu quan sát được sử dụng để ước tính giá trị của dữ liệu bị thiếu Sau đó, bước cực đại hóa (M) sử dụng dữ liệu đầy đủ từ bước E để cập nhật các tham số Cuối cùng, bước hội tụ kiểm tra xem các giá trị đã hội tụ hay chưa; nếu có, thuật toán kết thúc, nếu chưa, lặp lại các bước E và M cho đến khi đạt được sự hội tụ.

Pseudocode của thuật toán được biểu diễn như sau :

Mô hình𝑃 = (𝑥, 𝑦, 𝜃), với xX, yY, tham số𝜃

Ω tập tham số cho mô hình Tập dữ liệu huấn luyện x i Đầu ra:Tham số𝜃 T (T là số lần lặp)

Trong bước E, chúng ta tính toán giá trị kỳ vọng cho các cụm, trong khi bước M tập trung vào việc xác định khả năng xảy ra tối đa mới cho giả thuyết Thuật toán EM sử dụng dữ liệu quan sát sẵn có để ước lượng dữ liệu thiếu, sau đó cập nhật giá trị các tham số dựa trên dữ liệu này.

Theo giả thuyết, có hai biến ngẫu nhiên X thuộc R n và Y từ tập rời rạc {1…m}, với mô hình xác suất được tham số hóa bởi θ Mối quan hệ giữa dữ liệu, tham số và mô hình được thể hiện qua hàm khả năng cùng với hàm phân bố tương ứng.

Hàm phân bố được biểu diễn bởi công thức \(P(x,y|\theta)=P(x|y,\theta)P(y|\theta)\), trong đó \(\theta\) là tham số của hàm phân bố và \(\theta \in \Theta\) Giả sử chúng ta có một tập mẫu \(T_X = \{x_1, \ldots, x_n\}\) độc lập được rút ra từ hàm phân bố Từ đó, ta có thể xác định hàm ước lượng tối đa cho thuật toán EM.

ℓ(𝜃|𝑇 𝑋 )= 𝑃(𝑇 𝑋 |𝜃)=∏𝑛 𝑃(𝑥 𝑖 |𝜃)=∏𝑛 ∑𝑃(𝑥 𝑖 |𝑦, 𝜃)𝑃(𝑦|𝜃) (2.2) với kì vọng của tham số.

Trong công thức (2.2), một biên dưới của hàm khả năng l() được tạo ra và sau đó được tăng dần để nâng cao giá trị của l() Hình 2 - 1 minh họa quá trình của thuật toán EM, với đường cong màu đen biểu thị hàm khả năng l() và đường cong màu đỏ là cận dưới tương ứng Nhiều cận dưới khác nhau của l() sẽ được tạo ra, và trong bước E của thuật toán, cận dưới gần nhất với l() sẽ được lựa chọn.

Trong bước M cận dưới sẽ được cực đại hóa Khi giá trị l() lớn hơn cận dưới, l() sẽ được tăng lên [58].

Thuật toán EM là một phương pháp hiệu quả trong bài toán phân loại, giúp ước tính khả năng xảy ra của các biến tiềm ẩn Quá trình này bắt đầu bằng việc ước lượng giá trị cho các biến tiềm ẩn, sau đó tối ưu hóa mô hình thông qua hai bước lặp đi lặp lại: bước E (ước lượng) và bước M (tối đa hóa) cho đến khi hội tụ Thuật toán này rất hữu ích trong việc ước tính mật độ dữ liệu bị thiếu, đặc biệt là trong các thuật toán phân loại như GMM Bằng cách tạo ra các điểm dữ liệu đại diện cho biến tiềm ẩn không thể quan sát được, thuật toán EM tối ưu hóa các tham số phân phối xác suất để nắm bắt tốt nhất mật độ của dữ liệu Quá trình này tiếp tục cho đến khi đạt được một tập hợp giá trị tiềm ẩn và khả năng tối đa hóa phù hợp với dữ liệu mới.

Theo giả thuyết, dữ liệu tương tự từ một lớp nào đó được tạo ra từ các thành phần Gaussian Giá trị của biến ngẫu nhiên Y sẽ được xác định dựa trên lớp tương ứng, và quá trình phân loại sẽ được áp dụng để phân tích.

1 Ước tính mô hình Gaussian Mixture Model (GMM) bởi thuật toánEM

2 Phân loại dữ liệu dựa trên mô hìnhGMM

Thuật toán phân loại EM không dựa vào khoảng cách để phân loại Thay vào đó, nó tính xác suất cho mỗi quan sát thuộc về từng lớp dựa trên phân bố đã được chọn Mục tiêu chính của thuật toán này là tìm ra các giải pháp phân loại nhằm tối đa hóa hiệu quả phân loại.

Trong bài toán phân loại, phương pháp EM cho phép xác suất chung cho dữ liệu phân loại với số lớp yêu cầu Điều này có nghĩa là bất kỳ sự sai khác nào trong phạm vi của biến được chọn cho các phân tích sẽ không ảnh hưởng đến kết quả phân loại.

Mô hình GMM (Gaussian Mixture Model) được xây dựng từ thuật toán EM (Expectation-Maximization) và yêu cầu xác định trước giá trị k (số thành phần) GMM được biểu diễn như một tổng trọng số của các mật độ Gaussian thành phần, với các tham số được ước lượng qua quá trình huấn luyện dữ liệu Độ chính xác của ước lượng số thành phần k phụ thuộc vào cách khởi tạo thuật toán EM Thông thường, lựa chọn mô hình bắt đầu bằng việc khởi tạo giá trị k trong khoảng [k min, k max], với k max có thể là vô hạn Để tối ưu hóa tiêu chí lựa chọn mô hình, cần thực hiện ước tính số thành phần theo công thức đã được đề cập.

Thuật toán EM cho GMM bắt đầu bằng việc chọn tham số mô hình hợp lý dựa trên dữ liệu Sau đó, hai bước E và M sẽ được lặp lại cho đến khi các ước lượng tham số hội tụ.

PHÁT TRIỂN THUẬT TOÁN NÂNG CAO CHẤT LƯỢNG PHÂNLOẠIĐMĐLIDAR

Ngày đăng: 07/06/2022, 17:51

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w