CHƯƠNG I TỔNG QUAN
Nguyên lý thu nhận dữ liệu viễn thám
Viễn thám là công nghệ dùng để xác định và nhận diện đối tượng cũng như các điều kiện môi trường, dựa vào những đặc trưng riêng của phản xạ và bức xạ.
Sóng điện từ phản xạ hoặc bức xạ từ vật thể cung cấp thông tin quan trọng về đặc tính của đối tượng Ảnh viễn thám cung cấp dữ liệu về các vật thể dựa trên năng lượng bức xạ tương ứng với từng bước sóng Việc đo lường và phân tích năng lượng phản xạ từ ảnh viễn thám cho phép tách biệt thông tin hữu ích về các loại lớp phủ mặt đất khác nhau, nhờ vào sự tương tác giữa bức xạ điện từ và vật thể.
Hình 1.1 Sơ đồ hệ thống viễn thám
Hệ thống viễn thám bao gồm bảy yếu tố quan trọng, bắt đầu với nguồn năng lượng chiếu sáng, thường là bức xạ mặt trời, để cung cấp năng lượng cho đối tượng mục tiêu Nguồn năng lượng này sẽ tương tác với khí quyển khi đi qua, và có thể xảy ra sự tương tác thứ hai khi năng lượng được phản xạ từ đối tượng trở lại bộ cảm biến Khi năng lượng xuyên qua khí quyển và tiếp xúc với đối tượng, mức độ tương tác phụ thuộc vào đặc tính của đối tượng và sóng điện từ, dẫn đến sự phản xạ khác nhau giữa các vật thể Cuối cùng, bộ cảm biến sẽ ghi lại năng lượng sóng điện từ được phản xạ hoặc bức xạ từ các đối tượng này.
Bộ cảm biến, bao gồm máy chụp ảnh và máy quét, được lắp đặt trên các vật mang như máy bay, khinh khí cầu, tàu con thoi hoặc vệ tinh Dữ liệu ghi nhận từ bộ cảm biến sẽ được truyền đến trạm thu nhận và xử lý, nơi mà dữ liệu này được chuyển đổi thành ảnh dưới dạng hardcopy hoặc ảnh kỹ thuật số Hình ảnh thu được sau đó sẽ được giải đoán và phân tích thông qua các chương trình tự động hoặc nhờ vào kinh nghiệm của các chuyên gia, nhằm trích xuất thông tin về đối tượng mục tiêu Những thông tin này sẽ giúp chúng ta hiểu rõ hơn về đối tượng mục tiêu, từ đó đưa ra các ứng dụng cụ thể để giải quyết các vấn đề.
Phân loại viễn thám
a Phân loại theo nguồn tín hiệu
Viễn thám chủ động là phương pháp thu thập dữ liệu từ môi trường bằng cách sử dụng năng lượng riêng, với nguồn tia sáng phát ra từ các thiết bị nhân tạo, thường là máy phát được lắp đặt trên các phương tiện bay Các hệ thống Radar và Lidar là những ví dụ tiêu biểu cho viễn thám chủ động, giúp cung cấp thông tin chính xác về địa hình và đối tượng.
Viễn thám bị động (passive): nguồn phát bức xạ là mặt trời hoặc từ các vật chất tự nhiên [7] b Phân loại theo đặc điểm quỹ đạo
Căn cứ vào đặc điểm quỹ đạo vệ tinh, có thể chia ra hai nhóm vệ tinh là:
Vệ tinh địa tĩnh là loại vệ tinh có tốc độ quay đồng bộ với trái đất, cho phép nó duy trì vị trí cố định so với bề mặt trái đất trong suốt 24 giờ.
Vệ tinh quỹ đạo cực (hay gần cực) là vệ tinh có quỹ đạo nghiêng một góc gần
90° so với mặt phẳng xích đạo của trái đất [7] Góc nghiêng đó gần như không đổi trong suốt quá trình hoạt động
Tốc độ quay của vệ tinh được thiết kế khác biệt so với tốc độ quay của trái đất, đảm bảo thời gian thu ảnh trên mỗi khu vực đất liền trùng với giờ địa phương và thời gian thu lặp lại cố định cho từng vệ tinh Mặc dù vệ tinh quỹ đạo không thể quan sát liên tục như vệ tinh tĩnh, nhưng với độ cao gần trái đất, chúng cung cấp thông tin chi tiết hơn.
Các tham số quỹ đạo của vệ tinh, như độ cao và góc nghiêng, được xác định dựa trên các yếu tố quan trắc, cơ học quỹ đạo và nghiên cứu kỹ thuật Ngoài ra, vệ tinh cũng được phân loại theo bước sóng.
Viễn thám trong dải sóng nhìn thấy (𝜆 = 0,4 ÷ 0,7𝜇𝑚)và hồng ngoại (𝜆 = 0,7 ÷ 3𝜇𝑚) sử dụng nguồn năng lượng chủ yếu là bức xạ mặt trời
Viễn thám hồng ngoại nhiệt (𝜆 = 3 ÷ 4𝜇𝑚) là phương pháp ghi nhận bức xạ nhiệt trong dải sóng từ 3 đến 14 μm Do cường độ bức xạ nhiệt yếu và dễ bị hấp thụ bởi khí quyển, việc thu nhận tín hiệu nhiệt yêu cầu thiết bị quét nhiệt có độ nhạy cao.
Viễn thám siêu cao tần: Viễn thám siêu cao tần sử dụng bức xạ siêu cao tần có bước sóng từ một đến vài chục centimet.
Các đặc trưng cơ bản của ảnh viễn thám
1.1.3.1 Khái niệm ảnh số Ảnh số được biểu diễn bởi một mảng hai chiều tập hợp hữu hạn các điểm ảnh (pixel) có cùng kích thước với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật.Mỗi điểm ảnh được xác định bởi toạ độ hàng (m), cột (n) và giá trị mức xám (g) [8].Toạ độ hàng và cột của mỗi pixel đều là các số nguyên
Độ phân giải của ảnh được xác định bởi số điểm ảnh, và ảnh có độ phân giải cao sẽ thể hiện rõ nét hơn các đặc điểm của hình ảnh, giúp cho bức ảnh trở nên thực tế và sắc nét hơn.
1.1.3.2 Khái niệm ảnh vệ tinh Ảnh vệ tinh hay còn gọi là ảnh viễn thám thường được lưu dưới dạng ảnh số, trong đó năng lượng sóng phản xạ (theo vùng phổ đã được xác định trước) từ các vị trí tương ứng trên mặt đất, được bộ cảm biến thu nhận và chuyển thành tín hiệu số xác định giá trị độ sáng của mỗi pixel Ứng với các giá trị này, mỗi pixel sẽ có độ sáng khác nhau thay đổi từ đen đến trắng để cung cấp thông tin về các vật thể Tùy chọn vào kênh phổ được sử dụng, ảnh vệ tinh được ghi lại theo những dải phổ khác nhau (từ cực tím đến sóng radio) nên người ta gọi là dữ liệu đa phổ, đa kênh, đa băng tần hoặc nhiều lớp
1.1.3.3 Độ phân giải không gian Độ phân giải không gian cho ta biết diện tích nhỏ nhất trên mặt đất mà bộ cảm có thể phân biệt được Ảnh có độ phân giải không gian càng cao khi có kích thước của pixel càng nhỏ Độ phân giải không gian cũng được gọi là độ phân giải mặt đất khi hình chiếu của một pixel tương ứng với một đơn vị chia mẫu trên mặt đất Ví dụ khi nói rằng ảnh vệ tinh có kích thước pixcel là 20 x 20m có nghĩa là một pixcel trên ảnh tương ứng với diện tích 20x20m trên mặt đất [9] Độ phân giải không gian của một ảnh vệ tinh được quyết định bởi hai thông số góc nhìn FOV và góc nhìn tức thì IFOV – được thiết kế sẵn cho mỗi đầu thu
Thông số FOV (Field of View) cho thấy phạm vi không gian mà đầu thu có thể nhận sóng điện từ từ đối tượng Vệ tinh với góc nhìn lớn sẽ thu được hình ảnh rộng hơn.
Thông số IFOV (Instantaneous Field of View) xác định phạm vi không gian mà đầu thu vệ tinh có khả năng nhận sóng điện từ tại một độ cao và thời điểm cụ thể Đầu thu không thể phát hiện các đối tượng nhỏ hơn trong góc nhìn IFOV, và khu vực thu nhận trên mặt đất sẽ ảnh hưởng đến độ phân giải không gian tối đa của thiết bị Các giá trị bức xạ từ đối tượng trong cùng một thời điểm được ghi nhận dưới dạng điểm ảnh Khi góc IFOV nhỏ, khả năng phân biệt các đối tượng trong không gian sẽ tăng, dẫn đến giá trị pixel giảm và phạm vi ảnh ghi nhận trở nên hẹp hơn.
Hình 1.2: Minh họa thông số FOV và IFOV
1.1.3.4 Độ phân giải quang phổ
Các đối tượng khác nhau dưới mặt đất phản xạ các bước sóng điện từ một cách khác nhau, dẫn đến việc các đối tượng cùng lớp có phổ (độ đen) khác nhau trong các băng phổ khác nhau Hơn nữa, các đối tượng thuộc các lớp khác nhau cũng sẽ thể hiện phổ khác biệt trên cùng một băng phổ.
Không phải tất cả các sóng điện từ đều được sử dụng trong thu nhận ảnh viễn thám Mỗi loại đầu thu được thiết kế đặc biệt để thu nhận sóng điện từ trong những khoảng bước sóng nhất định, tùy thuộc vào mục đích thu thập thông tin Các khoảng bước sóng này được gọi là các kênh ảnh.
Ảnh chụp đối tượng trên các kênh khác nhau sẽ mang lại thông tin khác nhau Số lượng kênh ảnh, hay còn gọi là độ phân giải phổ, ảnh hưởng trực tiếp đến lượng thông tin thu thập được Độ phân giải phổ càng cao, tức là số lượng kênh ảnh càng nhiều, thì thông tin thu thập từ đối tượng càng phong phú.
1.1.3.5 Độ phân giải bức xạ Độ phân giải bức xạ của ảnh được định nghĩa là sự thay đổi nhỏ nhất về độ xám có thể phát hiện được bởi bộ thu, thể hiện độ nhạy tuyến tính của bộ cảm biến trong khả năng phân biệt sự thay đổi nhỏ nhất của cường độ phản xạ sóng từ các vật thể Theo lý thuyết độ phân giải bức xạ của hệ thống viễn thám phụ thuộc vào tỷ số giữa tín hiệu và nhiễu Tuy nhiên, trên thực tế độ phân giải bức xạ của ảnh số được xác định bởi số bậc được sử dụng để biểu diễn giá trị độ xám của mỗi pixel [9] Hiện nay, người ta sử dụng 8bit (256 bậc) để biểu thị giá trị độ xám của mỗi pixel Ảnh có độ phân giải bức xạ càng cao thì sử dụng càng nhiều bậc để biểu diễn giá trị độ xám của pixel và cho phép phân biệt được những thay đổi nhỏ hơn về độ xám của các đối tượng
1.1.3.6 Độ phân giải thời gian
Vệ tinh viễn thám hoạt động trên quỹ đạo và chụp ảnh Trái đất, sau một khoảng thời gian nhất định, thường từ vài ngày đến vài tuần, nó sẽ quay lại để chụp lại khu vực đã ghi hình Khoảng thời gian này được gọi là độ phân giải thời gian của ảnh vệ tinh, giúp cung cấp thông tin chính xác và hỗ trợ giải quyết các vấn đề liên quan đến sự biến động của khu vực nghiên cứu.
Một số loại dữ liệu viễn thám nghiên cứu trong luận văn
1.1.4.1 Ảnh vệ tinh DMSP – OLS
Từ những năm 1970, lực lượng không quân của Hoa Kỳ đã vận hành chương trình Phòng thủ Vệ tinh khí tượng (Defense Meteorological Satellite Program - DMSP): có
18 vệ tinh quỹ đạo cực có khả năng quan sát mây và các hiện tượng thời tiết khác trong bước sóng hồng ngoại và ánh sáng nhìn thấy Năm 1973, vệ tinh DMSP đã được trang bị hệ thống OLS (DMSP Operational Linescan System), cho phép quan sát Trái Đất ngay cả vào ban đêm.
Vệ tinh DMSP-OLS là hệ thống vệ tinh quỹ đạo cực, hoạt động ở độ cao 850 km và có thời gian quỹ đạo khoảng 101 phút Chức năng chính của các vệ tinh này là thu thập dữ liệu về bầu khí quyển, đại dương và môi trường mặt trời-địa vật lý của Trái Đất.
Hệ thống OLS là một máy đo phóng xạ dao động, có khả năng theo dõi sự phân bố của đám mây và nhiệt độ trên đám mây hai lần mỗi ngày, vào ban ngày và ban đêm Hệ thống sử dụng hai dải phổ, bao gồm bước sóng nhìn thấy và hồng ngoại nhiệt, với sự hỗ trợ của hai kính thiên văn và một ống quang tử (PMT) Ống quang tử này có khả năng phát hiện bức xạ trong vùng bước sóng VIS và hồng ngoại gần từ 0.47-0.95 𝜇𝑚, ngay cả trong điều kiện ánh sáng rất yếu, giúp tạo ra những hình ảnh ánh sáng ban đêm rõ nét.
Vệ tinh DMSP-OLS là một máy quét bức xạ với hai dải quang phổ VIS và TIR, có độ phân giải 2,7 km và độ rộng quét 3000 km Dải VIS ghi nhận bức xạ nhìn thấy và cận hồng ngoại với độ rộng tối đa 0,58 - 0,91 µm, trong khi dải TIR nằm trong khoảng 10,3-12,9 µm Vệ tinh cung cấp dữ liệu toàn cầu bốn lần mỗi ngày vào các thời điểm bình minh, ban ngày, hoàng hôn và ban đêm, với thời gian chụp ảnh ban đêm là 19:30 Để nâng cao khả năng thu thập dữ liệu ban đêm, dải VIS sử dụng ống quang tử PMT, chuyển đổi photon thành dòng điện và khuếch đại hàng trăm triệu lần, cho phép phát hiện nguồn sáng, đám mây, ánh đèn thành phố, khí cháy và ngọn lửa.
Dữ liệu DMSP-OLS được tính trung bình theo khối 5×5 và ảnh được lượng tử hóa với độ sâu 6 bit Thông số kỹ thuật của vệ tinh DMSP-OLS được trình bày trong bảng 1.1.
Bảng 1.1Một số thông số của vệ tinh DMSP-OLS [12]
Quỹ đạo Vệ tinh quỹ đạo cực, độ cao khoảng
850km, nghiêng 98,8 độ, chu kì quỹ đạo
102 phút Độ rộng của giải quét (Swath) 3000km
Thời điểm chụp ban đêm ~19:30
Tớn hiệu ỏnh sỏng yếu Toàn sắc từ 0.5 - 0.9 àm
Vùng phủ trên mặt đất 5km*5km tại điểm thấp nhất
Cỏc dải quang phổ khỏc Hồng ngoại nhiệt (10 àm)
Sự bão hòa Phổ biến ở lõi đô thị
Giới hạn phát hiện ánh sáng yếu nhất ~5E-10 Watts/cm2/sr
Hiệu chỉnh Không cho hình ảnh với ánh sáng yếu
Vào giữa năm 1992, Cục Quản lý Đại dương và Khí quyển Quốc gia (NOAA) đã thành lập một kho lưu trữ kỹ thuật số cho chương trình DMSP tại Trung tâm Dữ liệu Địa Vật lý Quốc gia (NGDC), cho phép sản xuất hình ảnh kỹ thuật số DMSP-OLS bằng cách kết hợp các dải thu hẹp từ các quỹ đạo thu được vào những thời điểm khác nhau.
NGDC đã phát triển một phương pháp hiệu quả để thu thập, chỉnh sửa và tổng hợp một lượng lớn ảnh ban đêm từ DMSP-OLS Phương pháp này sử dụng chuỗi thời gian để phân biệt giữa ánh sáng nhân tạo ổn định từ các thành phố, thị trấn và cơ sở công nghiệp với ánh sáng tạm thời như lửa, pháo sáng và tia sét Đồng thời, ảnh cũng được lọc để loại bỏ dữ liệu nhiễu do mây che phủ.
Các ảnh tổng hợp có độ phân giải 30 giây cung (~1000𝑚) Được tổng hợp theo năm (từ năm 1992 – 2013, khi hệ thống DMSP- OLS dừng hoạt động)
Dữ liệu ảnh ánh sáng ban đêm DMSP-OLS do NOAA tổng hợp đã nâng cao khả năng tiếp cận và nghiên cứu, đặc biệt trong việc ứng dụng vào các nghiên cứu đô thị.
Một số các ứng dụng nghiên cứu sử dụng dữ liệu ảnh vệ tinh DMSP-OLS
Dữ liệu ánh sáng ban đêm DMSP-OLS là công cụ hữu ích để ước tính và cập nhật thông tin nhân khẩu học cũng như kinh tế xã hội tại các quốc gia Việc áp dụng dữ liệu này góp phần nâng cao độ chính xác cho cơ sở dữ liệu dân số toàn cầu, được phát triển trong Dự án Dân số Toàn cầu của LandScan (Dobson và cộng sự, 2000).
Dữ liệu ánh sáng ban đêm từ DMSP-OLS có mối liên hệ chặt chẽ với tổng sản phẩm quốc nội (GDP) và mức tiêu thụ điện năng, qua đó giúp xác định mức độ phát triển kinh tế của quốc gia Ngoài ra, dữ liệu này cũng được sử dụng như một công cụ để đo lường khí thải nhà kính, đặc biệt là CO2, ở mức cao.
1.1.4.2 Dữ liệu ảnh bề mặt không thấm nước ISA
Bộ dữ liệu vệ tinh bề mặt không thấm nước (Impervious Surface Area - ISA) năm 2010 do NOAA phát triển cung cấp thông tin quan trọng về các bề mặt nhân tạo như đường xá, bãi đỗ xe, tòa nhà, lối đi bộ và vỉa hè Dữ liệu này không chỉ hữu ích cho quản lý và quy hoạch đô thị, bao gồm xây dựng cơ sở hạ tầng và phát triển đô thị bền vững, mà còn hỗ trợ trong việc quản lý môi trường, như đánh giá chất lượng nước và khí thải.
Phương pháp xây dựng bộ dữ liệu ISA năm 2010 được cải tiến từ phiên bản dữ liệu năm 2000-01, tập trung vào khu vực bề mặt không thấm nước tại Hoa Kỳ Quá trình xây dựng bộ dữ liệu ISA bắt đầu bằng việc thu thập các đầu vào cần thiết.
Ảnh vệ tinh ánh sáng ban đêm DMSP/OLS có độ phân giải không gian khoảng 1km, được xây dựng trên lưới 30 giây cung và thu thập theo năm dương lịch Dữ liệu này được tổng hợp bởi Trung tâm Dữ liệu Địa Vật lý Quốc gia (NGDC) thông qua việc loại bỏ các giá trị nhiễu và lấy giá trị trung bình.
Dữ liệu LandScan 2004 là một bộ dữ liệu ước tính phân bố dân cư, được tổng hợp bởi Phòng thí nghiệm Quốc gia Oak Ridge thuộc Bộ Năng lượng Hoa Kỳ.
Dữ liệu được hiệu chỉnh với lưới có độ phân giải không gian 1km, trong đó dữ liệu ISA được ước lượng thông qua phương trình hồi quy tuyến tính Chỉ những ô lưới có mật độ dân số từ 3 trở lên được đưa vào phân tích hồi quy, trong khi các khu vực sân bay, khu vực có mật độ dân số cao (trên 3000/km²) và khu vực có ánh đèn cực sáng (DN lớn hơn 800) bị loại bỏ khỏi quá trình này.
% bề mặt không thấm nước=0.0795 (radiance) + 0.00868 (population count)
Một số vấn đề trong tiền xử lý dữ liệu ảnh vệ tinh
Quá trình tiền xử lý dữ liệu ảnh vệ tinh thường bao gồm các bước chính: Hiệu chỉnh ảnh, biến đổi ảnh và phân loại hình ảnh
Hình 1.3: Các bước xử lý ảnh vệ tinh thông thường
Hiệu chỉnh ảnh vệ tinh là quá trình quan trọng nhằm khắc phục các lỗi hình ảnh do nhiều yếu tố như cảm biến, vật mang, khí quyển, thời tiết và mây che phủ Mục tiêu chính của việc này là giảm thiểu sai sót trong thu thập dữ liệu, bởi vì các sai lệch trong cấp độ xám của ảnh có thể ảnh hưởng đến phân tích, diễn giải và trích xuất dữ liệu.
Phục hồi hình ảnh là quá trình chỉnh sửa các lỗi như sọc viền và mất dữ liệu theo dải, thường xảy ra do sự cố với bộ cảm biến hoặc quá trình lưu trữ dữ liệu, dẫn đến việc mất thông tin của một dòng pixel.
Hiệu chỉnh bức xạ: quá trình sử dụng các công thức để chuyển đổi giá trị số (DN) của ảnh thành giá trị phản xạ
Hiệu chỉnh khí quyển: loại bỏ các hiệu ứng do khí quyển gây ra (tán xạ, hấp thụ)
Hiệu chỉnh hình học là quá trình cần thiết để khắc phục các lỗi méo hình học của ảnh vệ tinh, do các yếu tố như đặc tính của bộ cảm, vật mang và sự quay của trái đất gây ra Quá trình này bao gồm việc lựa chọn lưới chiếu, mô hình phù hợp và nắn chỉnh ảnh bằng các phương pháp nội suy để đảm bảo độ chính xác về vị trí và tỷ lệ giữa tọa độ ảnh và thực tế.
Mosaic: quá trình kết hợp nhiều ảnh thành 1 ảnh duy nhất
Để đáp ứng nhu cầu sử dụng hình ảnh có độ phân giải cao, cần thực hiện quá trình biến đổi hình ảnh, bao gồm nâng cao chất lượng và tăng cường độ tương phản Việc chuyển đổi hệ tọa độ cũng rất quan trọng để phù hợp với các bài toán thực tế, bên cạnh đó, nén dữ liệu giúp tạo ra bản đồ chuyên đề và cơ sở dữ liệu hiệu quả hơn.
Phân loại hình ảnh: sử dụng các phương pháp phân lớp, phân đoạn, gắn nhãn, học máy, kết hợp
Các phương pháp nội suy ảnh đóng vai trò quan trọng trong việc hiệu chỉnh hình học ảnh vệ tinh và nâng cao độ phân giải hình ảnh, từ đó cải thiện chất lượng hình ảnh phục vụ cho phân tích và giải đoán Trong bối cảnh hiện nay, khi nguồn dữ liệu ảnh vệ tinh có độ phân giải cao thường có chi phí rất cao, việc sử dụng các phương pháp nội suy để tái chia mẫu từ dữ liệu vệ tinh có độ phân giải thấp (thường miễn phí hoặc giá rẻ) không chỉ nâng cao chất lượng hình ảnh mà còn mang lại lợi ích kinh tế đáng kể.
Trong các bài toán thực tế, việc sử dụng dữ liệu vệ tinh từ nhiều nguồn và với các độ phân giải khác nhau là cần thiết Áp dụng quá trình nội suy ảnh để đồng nhất độ phân giải là một yêu cầu bắt buộc nhằm giải quyết hiệu quả các vấn đề liên quan.
Bài toán phân loại lớp phủ đô thị ở Việt Nam và các vấn đề trong tiền xử lý dữ liệu ảnh đầu vào
dữ liệu ảnh đầu vào
Quá trình đô thị hóa nhanh chóng và sự gia tăng dân số đã gây ra nhiều tác động mạnh mẽ đến các tỉnh thành ở Việt Nam, đặc biệt là tại các thành phố lớn và các trung tâm văn hóa, chính trị, kinh tế, xã hội của đất nước.
Quá trình đô thị hóa không chỉ thúc đẩy tăng trưởng kinh tế và chuyển dịch cơ cấu lao động mà còn làm thay đổi phân bố dân cư Tuy nhiên, đô thị hóa cũng gây ra nhiều vấn đề tiêu cực như ô nhiễm môi trường và gia tăng tệ nạn xã hội.
Theo dõi sự biến động của lớp phủ đô thị trong thời gian dài là cần thiết cho các cơ quan quản lý nhằm giám sát và định hướng phát triển Bản đồ phân loại lớp phủ đô thị giúp mô tả đặc điểm tăng trưởng kinh tế của quốc gia, hỗ trợ giám sát môi trường, dự đoán tốc độ tăng dân số, điện năng tiêu thụ, tổng sản phẩm quốc nội (GDP) và quy hoạch thành phố hiệu quả.
Trên toàn cầu, nhiều dự án và nghiên cứu đã ứng dụng dữ liệu viễn thám cùng với dữ liệu dân số để xây dựng bản đồ lớp phủ đô thị.
Nghiên cứu của Alimujiang Kasimu và Ryutaro Tateishi năm 2010 đã sử dụng phương pháp phân loại lớp phủ toàn cầu (GLCMNO) và biểu đồ kỹ thuật số (DCW) để phân tích lớp phủ đô thị và tác động của nó lên lớp phủ mặt đất tại Trung Quốc.
Nghiên cứu của Alimujiang KASIMU và Ryutaro TATEISHI vào năm 2008 đã áp dụng phương pháp GLCMNO để lập bản đồ đô thị toàn cầu, sử dụng dữ liệu đầu vào từ bản đồ mật độ dân số, ảnh ánh sáng ban đêm DMSP-OLS và ảnh MODIS-NDVI Nghiên cứu này cũng tiến hành xác nhận và so sánh các bản đồ đô thị mới với các dữ liệu hiện có như Landsat ETM+, DMSP, DCW, MOD12Q1, GLC2000 và GRUMP.
Nghiên cứu của Dengsheng Lu và Qihao Weng năm 2006 đã sử dụng dữ liệu bề mặt không thấm nước để phân loại lớp phủ đô thị, tập trung vào khu vực quận Marion, thành phố Indianapolis, Indiana, Hoa Kỳ.
Tại Việt Nam, còn khá ít nghiên cứu về phân loại đô thị sử dụng dữ liệu vệ tinh với phạm vi hạn chế, chẳng hạn như:
Nghiên cứu của Trần Thị Vân tại Viện Tài Nguyên Môi Trường, ĐHQG HCM vào năm 2006 đã phân tích mối quan hệ giữa nhiệt độ bề mặt và các loại phủ đất tại thành phố Hồ Chí Minh, sử dụng cảm biến hồng ngoại nhiệt để thu thập dữ liệu.
Nghiên cứu ứng dụng ảnh vệ tinh trong khảo sát sử dụng đất ở thành phố Đà Nẵng vởi Trần Thị An, Vũ Anh Tuấn,2008 [27]
Nghiên cứu của Thi Dong-Binh Tran, Anne Puissant, Dominique Badariotti và Christiane Weber (2011) tập trung vào việc tối ưu hóa độ phân giải không gian của hình ảnh nhằm phát hiện các hình thức đô thị, đặc biệt trong bối cảnh Pháp và Việt Nam, với khu vực nghiên cứu cụ thể là Đà Nẵng Nghiên cứu này nhấn mạnh tầm quan trọng của việc cải thiện chất lượng hình ảnh để nâng cao khả năng nhận diện và phân tích đô thị, góp phần vào việc quản lý phát triển đô thị bền vững.
Nghiên cứu của Phạm Tuấn Dũng về phương pháp GLCMNO (Global Land Cover by National Mapping Organizations) mở rộng nhằm phân loại lớp phủ đô thị Việt Nam đã được trình bày tại Hội nghị Quốc tế lần thứ 8 KSE Phương pháp này được cải thiện và tối ưu hóa để phù hợp với tình hình thực tế tại Việt Nam, cho ra kết quả bản đồ lớp phủ đô thị cho các năm 2008 và 2015, mang lại nhiều ý nghĩa quan trọng trong khoa học và thực tiễn hiện nay.
Phương pháp GLCMNO mở rộng đã định nghĩa lớp phủ đô thị tại Việt Nam, xác định khu vực đô thị có mật độ dân cư tối thiểu 2000 người/km2 Các yếu tố như tỷ lệ bề mặt không thấm nước và ánh sáng ban đêm được xem xét dựa trên các ngưỡng cụ thể, trong khi lớp thực vật và bề mặt nước không được tính vào diện tích đô thị.
Phương pháp xác định lại các ngưỡng phân lớp cho các chỉ số như ánh sáng ban đêm, chỉ số thực vật, mật độ dân số và tỷ lệ bề mặt không thấm nước Việc tính toán ngưỡng được thực hiện dựa trên một tập mẫu điểm ảnh, với số lượng pixel mẫu của mỗi lớp (trừ lớp đô thị) phụ thuộc vào phần trăm của các lớp trong phương pháp GLCMNO Lớp đô thị được ưu tiên cao hơn trong việc xác định ngưỡng, trong khi ngưỡng mật độ dân số dựa trên hệ thống phân loại đô thị tại Việt Nam.
1.2.1 Dữ liệu đầu vào trong bài toán phân loại lớp phủ đô thị tại Việt Nam
Bài toán sử dụng năm loại dữ liệu ảnh vệ tinh đầu vào, bao gồm bản đồ mật độ dân số, dữ liệu ảnh vệ tinh ánh sáng ban đêm, ảnh vệ tinh chỉ số thực vật NDVI, ảnh vệ tinh bề mặt không thấm nước, và ảnh vệ tinh bề mặt chứa nước.
Bảng 1.2 Dữ liệu sử dụng trong bài toán phân lo ại lớp phủ đô thị Việt Nam theo phương pháp GLCMNO mở rộng
Dữ liệu Tên viết tắt Độ phân giải không gian Độ phân giải thời gian
Bản đồ mật độ dân số Worldpop 100m 2009
Dữ liệu ảnh vệ tinh ánh sáng ban DMSP-OLS 1km 2008 đêm NPP-VIIRS/
Dữ liệu vệ tinh chỉ số thực vật MOD13Q1 250m 2008
Dữ liệu vệ tinh bề mặt không thấm nước
EstISA 1km 2010 Ảnh vệ tinh bề mặt chứa nước MOD44W 250m
1.2.2 Các vấn đề trong tiền xử lý ảnh bài toán phân loại lớp phủ đô thị tại Việt Nam Đầu vào bài toán phân loại lớp phủ đô thị ở Việt Nam là năm dữ liệu ảnh vệ tinh khác nhau về nguồn ảnh và độ phân giải Do đó, để đưa ra được bản đồ phân loại lớp phủ đô thị độ phân giải 500m, ta cần có quá trình tiền xử lý ảnh đầu vào, đưa ảnh về cùng độ phân giải 500m
Việc điều chỉnh độ phân giải không gian của ảnh yêu cầu thực hiện quá trình tái chia mẫu (Resampling) để đảm bảo thông tin ảnh được giữ nguyên và sai số dữ liệu được giảm thiểu.
Hình 1.4: Quy trình tiền xử lý dữ liệu bài toán phân loại lớp phủ đô thị Việt Nam theo phương pháp GLCMNO mở rộng
Bài toán nghiên cứu đặt ra trong luận văn
1.3.1 Một số nghiên cứu về phương pháp nội suy
Luận văn được phát triển dựa trên nền tảng các nghiên cứu, bài báo khoa học trong nước và quốc tế về các phương pháp nội suy ảnh như:
Các nghiên cứu trên thế giới
Nghiên cứu của Jency Titus và Sebastian Geroge vào năm 2013 đã so sánh các phương pháp nội suy trên dữ liệu ảnh vệ tinh, bao gồm nội suy láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba Qua thực nghiệm với hai ảnh vệ tinh có kích thước khác nhau, nghiên cứu đã đánh giá và so sánh chất lượng ảnh trước và sau nội suy bằng mắt thường cũng như thời gian thực hiện thuật toán Kết quả cho thấy phương pháp nội suy song tuyến tính có thời gian thực hiện nhanh nhất, trong khi phương pháp nội suy xoắn bậc ba mặc dù chậm hơn nhưng lại mang lại chất lượng ảnh tốt nhất theo đánh giá bằng mắt thường.
Bài viết phân tích các phương pháp tái chia mẫu ảnh tại quận Coimbatore, được thực hiện bởi Dr.S Santhosh Baboo và M.Renuka Devi vào năm 2013 Nghiên cứu so sánh các phương pháp nội suy như láng giềng gần nhất, song tuyến tính và nội suy xoắn bậc ba, kết luận rằng nội suy xoắn bậc ba mang lại chất lượng ảnh tốt nhất khi đánh giá bằng mắt thường Đồng thời, nghiên cứu của Vaishali Patel và Giáo sư Kinjal Mistree cũng vào năm 2013 đã đánh giá các phương pháp nội suy không thích ứng và thích ứng, bao gồm nội suy hướng cạnh mới (NEDI), dữ liệu phụ thuộc tam giác (DDT) và nội suy lặp lại dựa trên độ cong (ICBI) Kết quả so sánh dựa trên chỉ số PSNR cho thấy rằng phương pháp nội suy xoắn bậc ba vượt trội hơn so với nội suy láng giềng gần nhất và nội suy song tuyến tính.
Năm 2013, Ranjeet Roy, Maninder Pal và Tarun Gulati đã nghiên cứu các phương pháp nội suy để phóng to ảnh kỹ thuật số, bao gồm bộ lọc lý tưởng, nội suy láng giềng gần nhất, B-splines, Cubic Splines và nội suy ảnh hai chiều Họ đã tiến hành so sánh và đánh giá hiệu quả của các phương pháp này thông qua việc nội suy hai ảnh CT cắt lớp đầu và xương cổ Kết quả cho thấy phương pháp nội suy láng giềng gần nhất mang lại hiệu suất tốt hơn so với nội suy song tuyến tính và các phương pháp khác, được đánh giá dựa trên chỉ số PSNR.
Bài viết của Dianyuan Han năm 2013 so sánh các phương pháp nội suy ảnh, bao gồm nội suy láng giềng gần nhất, nội suy song tuyến tính, nội suy xoắn bậc ba và nội suy Cubic B-Spline Nghiên cứu tiến hành bằng cách giảm độ phân giải của một bức ảnh xuống 1/2, sau đó áp dụng các kỹ thuật nội suy để phục hồi độ phân giải Kết quả được đánh giá qua hai khía cạnh: chủ quan (so sánh bằng mắt thường) và khách quan (chỉ số tín hiệu nhiễu SNR) Kết quả cho thấy phương pháp nội suy xoắn bậc ba mang lại hiệu quả tốt nhất trong việc phục hồi ảnh.
Tại Việt Nam, cũng đã có một số đề tài nghiên cứu về các phương pháp nội suy như:
Luận văn Thạc sĩ “Nội suy ảnh và ứng dụng” của Nguyễn Thị Nguyệt tại Đại học Thái Nguyên năm 2009 nghiên cứu về xử lý ảnh và các kỹ thuật nội suy, bao gồm nội suy láng giềng gần nhất, nội suy tam giác, nội suy song khối, nội suy tuyến tính, song tuyến tính, và tam tuyến tính Luận văn cũng trình bày hai ứng dụng chính của nội suy ảnh: tạo ra hình ảnh trung gian từ một ảnh nguồn và một ảnh đích, giúp tạo thành video với các khung hình liên tục; và ứng dụng nội suy trong việc nắn chỉnh hình ảnh.
Luận văn Thạc sĩ của Nguyễn Văn Hạt tại Học viện Công Nghệ Bưu Chính Viễn Thông năm 2012 nghiên cứu các kỹ thuật nội suy ảnh, bao gồm nội suy dựa vào các điểm láng giềng, nội suy tuyến tính, và nội suy sử dụng hàm cơ sở bán kính Tác giả trình bày chi tiết về các phương pháp như nội suy láng giềng xem xét lại, nội suy dựa trên dẫn xuất hình ảnh thứ 2, và các kỹ thuật nội suy lặp đi lặp lại Luận văn cũng đề xuất ứng dụng trong việc biểu diễn khuôn mặt 3D ở trạng thái cân bằng và trạng thái tâm lý cần thể hiện.
Nghiên cứu của Phan Thị San Hà và Lê Minh Sơn, đăng trên Tạp chí Phát triển Khoa học và Công Nghệ năm 2007, tập trung vào việc ứng dụng phương pháp nội suy Kriging để khảo sát sự phân bố của các tầng đất yếu thuộc thời kỳ Holocene tại khu vực nội thành Thành phố Hồ Chí Minh Nghiên cứu này không chỉ cung cấp cái nhìn sâu sắc về đặc điểm địa chất của khu vực mà còn hỗ trợ trong việc quản lý và phát triển đô thị bền vững.
Dựa trên các nghiên cứu trong và ngoài nước, bài viết này trình bày yêu cầu trong quá trình tiền xử lý dữ liệu ảnh vệ tinh ánh sáng ban đêm DMSP và ảnh vệ tinh bề mặt không thấm nước ISA, nhằm phân loại lớp phủ đô thị tại Việt Nam bằng phương pháp GLCMNO mở rộng.
Câu hỏi đặt ra đối với luận văn bao gồm:
Có những phương pháp nội suy ảnh vệ tinh nào?
Các phương pháp nội suy ảnh có tác động như thế nào đối với ảnh vệ tinh?
Các phương pháp nội suy ảnh cho dữ liệu vệ tinh ánh sáng ban đêm DMSP-OLS và ảnh vệ tinh bề mặt không thấm nước ISA có thể khác nhau trong việc xác định ngưỡng phân lớp, ảnh hưởng đến kết quả phân loại lớp phủ đô thị Việc lựa chọn phương pháp phù hợp là rất quan trọng để đạt được độ chính xác cao trong phân tích lớp phủ đô thị từ dữ liệu vệ tinh.
Phương pháp nội suy ảnh vệ tinh nào phù hợp nhất cho bài toán phân loại lớp phủ đô thị?
Luận văn này nghiên cứu và đánh giá các phương pháp nội suy ảnh vệ tinh, nhằm xác định phương pháp tối ưu nhất cho việc phân loại lớp phủ đô thị.
Cụ thể, luận văn tiến hành:
Ảnh vệ tinh là công cụ quan trọng trong việc thu thập dữ liệu địa lý, với những đặc trưng cơ bản như độ phân giải và khả năng quan sát Một số loại dữ liệu vệ tinh nổi bật bao gồm ảnh vệ tinh ánh sáng ban đêm DMSP-OLS, giúp theo dõi hoạt động con người, và ảnh vệ tinh bề mặt không thấm nước EstISA, hỗ trợ trong nghiên cứu môi trường và quản lý tài nguyên nước.
Tái chia mẫu ảnh và các phương pháp nội suy ảnh là những kỹ thuật quan trọng giúp nâng cao độ phân giải của ảnh vệ tinh Trong quá trình nội suy ảnh, có một số vấn đề cần lưu ý để đảm bảo chất lượng hình ảnh Để đánh giá và so sánh chất lượng ảnh, các chỉ số đánh giá phù hợp sẽ được sử dụng nhằm xác định hiệu quả của các phương pháp này.
Bài viết này so sánh và đánh giá tác động của ba phương pháp nội suy ảnh phổ biến: nội suy láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba, áp dụng cho ảnh vệ tinh Thực nghiệm được thực hiện trên ảnh vệ tinh ánh sáng ban đêm DMSP-OLS nhằm phân tích hiệu quả của từng phương pháp trong việc cải thiện chất lượng ảnh.
2013 và ảnh vệ tinh bề mặt không thấm nước ISA 2010 có cùng độ phân giải 1km
Trong quá trình tiền xử lý dữ liệu cho bài toán phân loại lớp phủ đô thị tại Việt Nam, cần áp dụng các phương pháp nội suy khác nhau Việc tính toán lại ngưỡng phân lớp phù hợp với từng phương pháp nội suy ảnh là rất quan trọng Bài viết sẽ so sánh và đánh giá các phương pháp nội suy ảnh vệ tinh, từ đó đề xuất phương pháp tối ưu nhất cho bài toán này.
Việc nghiên cứu và đánh giá hiệu quả của các phương pháp nội suy ảnh viễn thám mang ý nghĩa về mặt khoa học:
Dữ liệu ảnh vệ tinh ánh sáng ban đêm DMSP/OLS (từ năm 1992 đến 2013) và ảnh vệ tinh bề mặt không thấm nước EstISA (bộ dữ liệu duy nhất trên thế giới được NOAA phát hành năm 2010) với độ phân giải 1km đã được áp dụng trong nhiều nghiên cứu Tuy nhiên, do độ phân giải không cao, các bài toán thực tế thường yêu cầu quá trình tăng độ phân giải ảnh Việc tìm hiểu các phương pháp nội suy phù hợp là cần thiết để đảm bảo rằng quá trình này không làm mất quá nhiều thông tin từ ảnh.
Kết luận
Chương 1 của luận văn trình bày khái quát về viễn thám, các đặc trưng cơ bản của ảnh viễn thám Bài toán phân loại lớp phủ đô thị tại Việt Nam theo phương pháp GLCMNO mở rộng với các vấn đề đặt ra trong bước tiền xử lý dữ liệu Đưa ra bài toán đặt ra đối với luận văn: Nghiên cứu và đánh giá các phương pháp nội suy ảnh viễn thám cho bài toán phân loại lới phủ đô thị tại Việt Nam Mục đích và ý nghĩa khoa học, ý nghĩa thực tiễn của bài toán
Trong Chương 2, luận văn sẽ trình bày khái niệm và đặc điểm của nội suy ảnh, cùng với các phương pháp phổ biến như nội suy láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba Bên cạnh đó, sẽ có phần tìm hiểu về các chỉ số đánh giá chất lượng ảnh sau nội suy, bao gồm chỉ số sai số bình phương trung bình (MSE), chỉ số tín hiệu cực đại trên nhiễu (PSNR) và chỉ số so sánh sự tương đồng cấu trúc (SSIM) Chương 3 sẽ tập trung vào quá trình thực nghiệm và đánh giá kết quả.
Chương 2 CÁC PHƯƠNG PHÁP NỘI SUY ẢNH
Các khái niệm trong nội suy ảnh
2.1.1 Điểm ảnh Ảnh trong thực tế là một ảnh liên lục về không gian và về giá trị độ sáng Để có thể xử lý ảnh bằng máy tính cần có quá trình số hóa ảnh giúp biển đổi tín hiệu liên tục thành rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa thành phần giá trị (rời rạc hóa biên độ giá trị) Trong quá trình này người ta sử dụng khái niệm điểm ảnh [4] Điểm ảnh (Pixel Element) là một phần tử của ảnh số có toạ độ (x, y) có giá trị độ xám hoặc màu nhất định Một ảnh bao gồm tập hợp các điểm ảnh có kích thước và khoảng cách được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Ảnh khi được số hoá, nó thường được biểu diễn bởi mảng hai chiều hay ma trận hai chiều I(n,p): mỗi phần tử có một giá trị nguyên hoặc là một véctơ cấu trúc màu, n dòng và p cột Người ta thường ký hiệu I(x,y) để chỉ một điểm ảnh
Mức xám của điểm ảnh là cường độ sáng được gán giá trị số qua quá trình lượng tử hóa Ảnh đa mức xám được biểu diễn dưới dạng ma trận hai chiều, trong đó mỗi phần tử (điểm ảnh) thể hiện mức xám tại vị trí (x,y) cụ thể.
Mã hóa hình ảnh thường sử dụng các mức như 16, 32 hoặc 64, nhưng mã hóa 256 mức là phổ biến nhất nhờ vào lý do kỹ thuật Cụ thể, với 256 mức (tương đương với 2^8 = 256), mỗi pixel sẽ được mã hóa bằng 8 bit.
2.1.3 Độ phân giải điểm ảnh Độ phân giải là mật độ điểm ảnh hiển thị trên một ảnh số Trong đó, khoảng cách giữa các điểm ảnh phải được đảm bảo sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bố chính là độ phân giải, và được phân bố theo trục x, y trong không gian hai chiều [6]
Hình 2.1Minh họa ảnh có độ phân giải tăng dần
2.1.4 Quan hệ giữa các điểm ảnh
Một ảnh số có thể được biểu diễn bằng hàm f(x, y), trong đó tập con các điểm ảnh được ký hiệu là S Các điểm ảnh này có các mối quan hệ lân cận, bao gồm quan hệ 4 điểm lân cận và quan hệ 8 điểm lân cận Cụ thể, điểm 4 lân cận của điểm ảnh P(i,j) bao gồm những điểm gần nhất theo chiều dọc và ngang, tương ứng với 4 hướng chính: Đông, Tây, Nam, và Bắc.
Các điểm 4 láng giềng theo cột và hàng của điểm P(i,j) là N 4 (P) = {(i-1, j); (i+1, j); (i, j-1); (i, j+1)}
Hình 2.2: Minh họa bốn điểm láng giềng theo chiều đứng và ngang của điểm
Các điểm 4 láng giềng theo đường chéo của điểm P(i,j) (Có thể coi lân cận chéo là 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc là: ND(P) = (i+1, j+1), (i+1, j-1), (i-1, j+1), (i-1, j-1) }
Hình 2.3: Minh họa bốn điểm láng giềng theo đường chéo của điểm P(i,j)
Các điểm 8 láng giềng của điểm P(i,j): N 8 = N 4 (P) N D (P)
Hình 2.4:Minh họa tám điểm láng giềng của P(i,j)
2.1.5 Khoảng cách giữa các điểm ảnh
Khoảng cách D(p,q) giữa hai điểm ảnh p toạ độ (x,y), q toạ độ (s,t) là hàm khoảng cách (Distance) hoặc Metric nếu [1]:
1 D(p,q) ≥ 0 với D(p,q)=0 nếu và chỉ nếu p=q
3 D(p,z) ≤ D(p,q) + D(q,z) Z là một điểm ảnh khác
Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x,y) và q(s,t) được định nghĩa như sau:
Khoảng cách khối: Khoảng cách D 4 (p,q) được gọi là khoảng cách khối đồ thị (City- Block Distance) và được xác định như sau:
Khoảng cách D 8 (p,q) còn gọi là khoảng cách bàn cờ (Ches-Board Distance) giữa điểm ảnh p,q được xác định như sau:
Hai điểm ảnh bất kỳ được gọi là láng giềng 4 nếu chúng có khoảng cách D4=1 từ mỗi điểm ảnh
Hai điểm ảnh được coi là láng giềng 8 nếu khoảng cách giữa chúng là D8 = 1 Việc xác định khoảng cách giữa các điểm ảnh giúp chúng ta tìm ra các điểm ảnh láng giềng.
2.1.6 Khái niệm tái chia mẫu ảnh (Image Resampling) Ảnh số bao gồm một lưới hình chữ nhật của các điểm ảnh đều nhau.Mỗi điểm ảnh có tọa độ và mức xám (màu) riêng Tái chia mẫu ảnh là quá trình sửa dụng các kỹ thuật toán học để tạo ra các phiên bản mới của hình ảnh với độ phân giải điểm ảnh khác nhau Mỗi điểm ảnh được tạo ra sau quá trình tái chia mẫu thông qua hệ tọa độ cơ sở, được gán một giá trị mới (cường độ, cấp độ xám,…) dựa trên giá trị cấp độ xám của các điểm ản ban đầu
Sự khác nhau giữa quá trình tái chia mẫu ảnh và thay đổi kích thước ảnh (Image Resizing)
Thay đổi kích thước ảnh (resize) là quá trình điều chỉnh kích thước của hình ảnh mà không làm thay đổi số điểm ảnh (pixel) có trong bức ảnh, đồng thời cũng không ảnh hưởng đến độ phân giải của ảnh.
Tái chia mẫu ảnh (resampling): Thay đổi và làm ảnh hưởng đến số lượng điểm ảnh (thêm hoặc bớt các pixel) Làm thay đổi độ phân giải của ảnh
Tái chia mẫu gồm hai quá trình: tăng độ phân giải ảnh (upsampling) và giảm độ phân giải của ảnh của ảnh (downsampling)
Tăng độ phân giải ảnh (upsampling) là quá trình làm tăng số lượng điểm ảnh trong hình ảnh, dẫn đến kích thước của từng điểm ảnh giảm và giúp hình ảnh trở nên mịn màng hơn Phương pháp nội suy ảnh thường được áp dụng trong quá trình này để cải thiện chất lượng hình ảnh.
Giảm độ phân giải ảnh, hay còn gọi là downsampling, là quá trình giảm số lượng điểm ảnh bằng cách thay thế một nhóm điểm ảnh bằng một điểm ảnh đơn Kết quả là kích thước của điểm ảnh sẽ tăng lên, khiến cho ảnh trở nên thô và mờ hơn so với ảnh gốc.
2.1.7 Khái niệm nội suy ảnh
Nội suy là kỹ thuật dùng để ước lượng giá trị của các điểm dữ liệu chưa biết trong một tập hợp rời rạc, dựa trên các điểm dữ liệu đã biết.
Trong khoa học kỹ thuật, việc thu thập dữ liệu từ các mẫu thực nghiệm thường dẫn đến những điểm dữ liệu có giá trị đã biết Những điểm này đại diện cho một hàm số liên quan đến biến độc lập với số lượng giá trị hạn chế Do đó, chúng ta thường phải thực hiện nội suy để ước tính giá trị của hàm số cho các giá trị trung gian của biến độc lập.
Nội suy ảnh là quá trình ước lượng giá trị mức xám hoặc màu sắc của các điểm ảnh mới dựa trên các điểm ảnh cũ gần kề Quá trình này dựa vào mối quan hệ không gian giữa các điểm ảnh, với các điểm gần nhau có xu hướng tương đồng hơn Kết quả là hình ảnh sau khi nội suy sẽ trở nên mịn màng hơn so với hình ảnh gốc Kỹ thuật nội suy thường được áp dụng trong các tác vụ xử lý ảnh như bóp méo, nắn chỉnh, lấp lỗ hổng và tăng độ phân giải.
Hình 2.5: Minh họa quá trình nội suy
Kỹ thuật nội suy là một phương pháp quan trọng trong tiền xử lý ảnh vệ tinh, giúp cải thiện chất lượng ảnh bị ảnh hưởng bởi các yếu tố nhiễu như thời tiết, vật mang và bộ cảm biến Việc áp dụng nội suy không chỉ giúp nắn chỉnh hình học của ảnh mà còn nâng cao độ chính xác trong phân tích dữ liệu vệ tinh.
Xử lý ảnh bị méo hình học và thiếu dữ liệu do hiện tượng line dropout, sọc, hoặc viền là rất quan trọng Đối với các ảnh vệ tinh có độ phân giải thấp, quá trình nội suy ảnh giúp nâng cao chất lượng hình ảnh, từ đó cải thiện kết quả trong việc giải đoán và phân tích.
Hình 2.6: Minh họa việc sử dụng phương pháp nội suy trong nắn chỉnh ảnh
Một số vấn đề trong nội suy ảnh
Nội suy không tạo mới dữ liệu
Khi phóng to ảnh, quá trình nội suy chỉ thêm điểm ảnh (pixel) mà không tạo ra dữ liệu mới, dẫn đến số lượng điểm ảnh tăng lên Điều này khiến cho thông tin của bức ảnh được phân bố đều hơn, nhưng hình ảnh nội suy sẽ không giống như hình ảnh gốc Nội suy chủ yếu giúp khắc phục hiện tượng răng cưa và làm mịn hình ảnh, mà không giữ nguyên trạng thái ban đầu của bức ảnh.
Nội suy khắc phục hiện tượng răng cưa
Răng cưa là thuật ngữ mô tả các đường thẳng hoặc đường cong không mượt mà, xuất hiện do bản chất của ảnh kỹ thuật số Mỗi ảnh kỹ thuật số được tạo thành từ các điểm ảnh, vì vậy các đường thẳng và đường cong trong hình ảnh thực chất là mô hình răng cưa của các điểm ảnh.
Hiện tượng răng cưa thường khó nhận thấy ở các ảnh nhỏ khi nhìn bằng mắt thường, nhưng khi phóng to ảnh, hiện tượng này sẽ trở nên rõ ràng hơn.
Nội suy là kỹ thuật gia tăng số lượng điểm ảnh từ các điểm ảnh gốc, giúp làm mịn hình ảnh và khắc phục hiện tượng răng cưa thường gặp khi phóng to ảnh.
Nội suy có thể làm mất độ sắc nét của ảnh, đặc biệt là với những bức ảnh có giá trị màu thay đổi liên tục và rõ nét Khi quá trình nội suy diễn ra, số lượng điểm ảnh tăng lên, khiến cho bức ảnh trở nên mịn màng hơn Tuy nhiên, điều này cũng dẫn đến việc độ sắc nét bị giảm do các giá trị của điểm ảnh mới được tính toán trung bình từ các điểm ảnh xung quanh.
Hình 2.6: Ví dụ phương pháp nội suy láng giềng gần nhất, nội suy song tuyến tính và nội suy xoắn bậc ba làm mất độ sắc nét của ảnh
Nội suy không sinh ra hình ảnh thực sự tự nhiên
Dưới tác động của các phương pháp nội suy, hình ảnh có thể không tự nhiên khi đánh giá bằng mắt thường Ví dụ, khi áp dụng nội suy trong kỹ thuật nắn chỉnh hình ảnh, việc thay đổi điểm nhìn hoặc tư thế của vật thể trở nên phức tạp Kết quả là những biến đổi hình ảnh ba chiều đơn giản như chuyển dịch hoặc xoay chiều trở nên vô cùng khó khăn.
Một số phương pháp nội suy ảnh
2.3.1 Nội suy láng giềng gần nhất - Nearest Neighbor Interpolation
Nội suy láng giềng gần nhất là phương pháp nội suy đơn giản và phổ biến, trong đó điểm ảnh mới nhận giá trị từ điểm ảnh gốc gần nhất mà không xem xét các giá trị của các điểm lân cận khác Khoảng cách giữa hai điểm thường được đo bằng khoảng cách Euclid hoặc khoảng cách Minkowski với k = 2.
Hình 2.7: Minh họa nội suy láng giềng gần nhất
Hàm nhân của phương pháp nội suy láng giềng gần nhất [29]:
Trong đó, x là khoảng cách giữa điểm nội suy và điểm lưới
Ví dụ điểm ảnh (u,v) với bốn điểm láng giềng ( i, j ) , ( i, j + 1) , ( i+ 1, j ) và ( i+ 1,j +
1) và các giá trị f(i, j ) , f( i, j + 1) , f( i+ 1, j ), f( i+ 1,j + 1) Khoảng cách giữa (u,v) và ( i, j ) , ( i, j + 1) , ( i+ 1, j ), ( i+ 1,j + 1) sẽ được tính toán, giá trị tại(u,v) sẽ được gán bằng giá trị mức xám của điểm gần nó nhất
Hình 2.8 Minh họa việc tính toán điểm ảnh mới (u,v) bằng phương pháp nội suy láng giềng gần nhất
Nội suy láng giềng gần nhất có ưu điểm là thời gian xử lý nhanh, tuy nhiên, nó thường gây ra hiệu ứng răng cưa khi hình ảnh được phóng lớn Vì vậy, phương pháp này thường được áp dụng trong các tình huống mà tốc độ tính toán quan trọng hơn độ chính xác.
2.3.2 Nội suy song tuyến tính - Bilinear Interpolation
Nội suy song tuyến (Bilinear interpolation) là một phương pháp mở rộng từ nội suy tuyến tính, sử dụng bốn điểm ảnh gần nhất để tính toán giá trị của điểm ảnh mới Giá trị nội suy được xác định bằng cách tính trung bình có trọng số của bốn điểm gần nhất, trong đó trọng số được tính dựa trên khoảng cách giữa các điểm với điểm cần nội suy.
Hình 2.9: Minh họa nội suy song tuyến tính Hàm toán học của phương pháp nội suy song tuyến tính[29]:
0 1 ≤ |𝑥| (2.5) Trong đó, x là khoảng cách giữa điểm nội suy và điểm lưới Để tính giá trị tại điểm ảnh mới P(x,y) biết bốn điểm gần nhất là Q 11 = (x 1 , y 1 ), Q 12 (x 1 , y 2 ), Q 21 = (x 2 , y 1 ), and Q 22 = (x 2 , y 2 )
Hình 2.10: Nội suy song tuyến tính cho điểm P(x,y)
Bước 1: Nội suy tuyến tính giá trị tại điểm R 1 và R 2 f(R 1 ) ≈ 𝑥 2 −𝑥
𝑥 2 −𝑥 1 𝑓(𝑄 22 ) 𝑣ớ𝑖 𝑅 2 = (𝑥, 𝑦 2 ) (2.7) Bước 2: Từ hai điểm R1 và R 2, nội suy tuyến tính giá trị tại điểm P f(𝑃) ≈ 𝑦 2 −𝑦
Nội suy song tuyến tính có thời gian thực hiện và độ phức tạp cao hơn so với nội suy láng giềng gần nhất, nhưng lại giảm thiểu sự biến dạng hình ảnh khi phóng to và làm mờ đường viền hình ảnh Phương pháp này mang lại hiệu quả thị giác tốt hơn so với nội suy láng giềng gần nhất.
2.3.3 Nội suy xoắn bậc ba – Cubic Convolution (Bicubic)
Nội suy xoắn bậc ba là phương pháp tính toán giá trị của điểm ảnh mới dựa trên giá trị trung bình của 16 điểm ảnh gốc gần nhất (4 x 4)
Hình 2.11: Minh họa nội suy xoắn bậc ba Hàm toán học của phương pháp nội suy xoắn bậc ba [29]:
Trong đó, x là khoảng cách giữa điểm nội suy và điểm lưới Để tính toán điểm nội suy P’ từ 8 điểm ban đầu P(1,1), P(1,2),…P(4,4) Theo chiều ngang của lưới ta:
Theo chiều dọc của lưới, điểm P’ được tính nội suy từ 4 điểm P’(1), P’(2), P’(3), P’(4)[15] Việc tính toán được mô tả như hình 2.11 dưới đây
Hình 2.12: Mô tả việc tính toán trong nội suy xoắn bậc ba
Phương pháp nội suy xoắn bậc ba, mặc dù tốn nhiều thời gian và bộ nhớ, thường được áp dụng trong các trường hợp không yêu cầu xử lý nhanh Phương pháp này được sử dụng rộng rãi trong các phần mềm xử lý ảnh phổ biến như Photoshop và After Effects.
Các chỉ số đánh giá, so sánh chất lượng ảnh
2.4.1 Sai số bình phương trung bình (MSE)
Sai số bình phương trung bình (MSE) là một chỉ số quan trọng trong thống kê, dùng để đánh giá chất lượng của các ước lượng hoặc yếu tố dự báo MSE tính toán bằng cách lấy trung bình của bình phương các sai số, tức là sự chênh lệch giữa các ước lượng và giá trị thực tế Thông qua MSE, người dùng có thể xác định độ chính xác của các mô hình toán học trong việc dự đoán các tham số dân số từ dữ liệu mẫu.
Chỉ số MSE (Mean Squared Error) được sử dụng để đánh giá sự khác biệt giữa các điểm ảnh của ảnh đã qua xử lý và ảnh gốc Chỉ số này được tính toán dựa trên độ lệch bình quân của các giá trị pixel, giúp xác định mức độ sai khác một cách chính xác.
Trong đó x( i ,j) là ảnh so sánh, y( i,j) là ảnh sau chỉnh sửa hoặc tái cấu trúc
Các chỉ số pixel 1≤ i ≤ M và 1≤ j ≤ N, cỡ ảnh N×M pixel và n bit/pixel
2.4.2 Tỷ số tín hiệu cực đại/ nhiễu (PSNR)
PSNR (Peak Signal to Noise Ratio) là chỉ số đo lường tỉ lệ giữa năng lượng tối đa của một tín hiệu và năng lượng nhiễu ảnh hưởng đến độ chính xác của thông tin Chỉ số này thường được sử dụng để đánh giá chất lượng tín hiệu khôi phục từ các thuật toán nén dữ liệu có mất mát, chẳng hạn như nén ảnh Trong ngữ cảnh này, tín hiệu đại diện cho dữ liệu gốc, trong khi nhiễu là các lỗi phát sinh trong quá trình nén.
Tỷ số tín hiệu đỉnh trên nhiễu giữa hai ảnh Được đo bằng đơn vị decibels(dB) Chỉ số PSRN được tính toán như sau [18]:
Sai số bình phương trung bình (MSE) được định nghĩa là giá trị tối đa của pixel trên ảnh, ký hiệu là MAX I Đối với các pixel được biểu diễn bằng 8 bits, giá trị này là 255 Trong trường hợp tổng quát, khi tín hiệu được biểu diễn bằng B bits, MAX I được tính là 2^B – 1 PSNR (Tỷ số tín hiệu trên nhiễu) có đơn vị là Decibel (dB), và khi PSNR lớn hơn một giá trị nhất định (ví dụ: >@ dB), sự khác biệt giữa hai ảnh sẽ khó nhận thấy bằng mắt thường Giá trị PSNR càng cao cho thấy hai ảnh so sánh càng giống nhau.
Chỉ số PSNR là một biện pháp phổ biến trong việc đánh giá chất lượng hình ảnh, tuy nhiên nó không phải là phương pháp lý tưởng Điều này bởi vì cường độ tín hiệu được tính toán chỉ là ước lượng, không phản ánh chính xác tín hiệu thực tế của hình ảnh Hơn nữa, chỉ số này đôi khi không tương thích với cách mà con người nhận thức hình ảnh.
2.4.3 So sánh sự tương đồng cấu trúc (SSIM)
Khác với các chỉ số MSE và PSNR, SSIM so sánh giá trị dựa trên sự khác biệt giữa các pixel SSIM là một chỉ số đánh giá quan trọng, được xây dựng dựa trên hệ thống thị giác của con người (HVS).
SSIM (Chỉ số Tương đồng Cấu trúc) là một phương pháp so sánh sự tương đồng giữa hai hình ảnh dựa trên thông tin về cấp độ xám, độ tương phản và cấu trúc Giá trị của SSIM nằm trong khoảng từ -1 đến 1, trong đó giá trị SSIM bằng 1 cho thấy hai hình ảnh so sánh hoàn toàn giống nhau.
Chỉ số SSIM được tính toán theo công thức dưới đây [33]:
𝑥̅ là trung bình của ảnh x, 𝑦̅ là trung bình của ảnh y
σ x , σ y là độ lệch chuẩn giữa các hình ảnh sau nội suy và ảnh so sánh
C 1 , C 2 là hằng số dương được lựa chọn theo kinh nghiệm chuyên gia
SSIM, hay chỉ số tương đồng cấu trúc, là một trong những phương pháp phổ biến nhất trong xử lý hình ảnh Nó được ứng dụng rộng rãi, chẳng hạn như trong bộ giải mã H.264 codec x.264 và trong các hệ thống nhận dạng giọng nói cũng như các thuật toán nén.
SSIM, mặc dù vượt trội hơn MSE, vẫn có những hạn chế Một ví dụ điển hình là biến thể cơ bản không hiệu quả khi xử lý các hình ảnh bị dịch, thu phóng hoặc xoay, ngay cả khi chất lượng của chúng tương đồng với hình ảnh tham chiếu Hạn chế này đã được nghiên cứu một phần thông qua Complex Wavelet SSIM (CW-SSIM) [Wang và Simoncelli, 2005] Bản chất của SSIM là so sánh tín hiệu theo phương pháp điểm ảnh, do đó nó vẫn giữ được sự tương đồng với MSE.