4.3.1. Thu thập tư liệu
- Ảnh vệ tinh
Nguồn ảnh sử dụng trong nghiên cứu này là ảnh vệ tinh được download trực tiếp từ trang web http://earthexplorer.usgs.gov của Hội khảo sát địa chất Hoa Kỳ cho khu vực thành phố Hà Nội cho hai thời điểm nghiên cứu năm 2005 và 2014.
Bảng 4.5. Nguồn dữ liệu ảnh vệ tinh
Năm Ảnh vệ
tinh Tên dữ liệu
Ngày thu nhận Độ phân giải Path/Row 2005 Landsat 5 LT51270452005282BKT00 09/10/2005 30m 127 / 45 2014 Landsat 8 LC81270452014182LGN00 02/10/2014 30m 127 / 45 - Dữ liệu khác
+ Bản đồ hiện trạng sử dụng đất năm 2005 khu vực nghiên cứu. + Bản đồ hiện trạng sử dụng đất năm 2014 khu vực nghiên cứu.
+ Các tài liệu, số liệu về kinh tế, xã hội, thống kê, kiểm kê đất đai huyện Hoài Đức.
4.3.2. Nhập ảnh
Nhập ảnh là công đoạn chuyển ảnh từ các khuôn dạng khác nhau về khuôn dạng của chương trình ErDAS để tiến hành các bước tiếp theo.
Thông thường dữ liệu viễn thám được lưu dưới ba dạng cơ bản: - Dạng BSQ: Các kênh được ghi nối tiếp nhau;
- Dạng BIP: ghi lần lượt liên tiếp các pixel của các kênh; - Dạng BIL: ghi lần lượt liên tiếp các dòng của các kênh.
Sau khi nhập ảnh do số kênh phổ của 2 thế hệ vệ tinh là khác nhau và dữ liệu tải về là các ảnh đơn kênh nên phải tiến hành cộng gộp các kênh ảnh. Vì vậy với Landsat 5 lựa chọn kênh 1, 2, 3, 4, 5, 7, Landsat 8 lựa chọn kênh 1, 2, 3, 4, 5, 6, 7. Việc cộng gộp các kênh được thực hiện bởi công cụ Layer Stack trên phần mềm ErDAS 2014.
Hình 4.3. Cộng gộp kênh ảnh Landsat 5 - 2005
Hình 4.4. Cộng gộp kênh ảnh Landsat 8 - 2014 4.3.3. Tăng cường chất lượng ảnh
Tăng cường chất lượng ảnh là nhằm tăng tính dễ đọc và tạo ra ảnh có chất lượng tốt hơn, các đối tượng trên ảnh sẽ có độ tương phản cao hơn phục vụ công tác giải đoán ảnh. Sau khi tăng cường các đối tượng trên ảnh có độ tương phản cao hơn.
4.3.4. Nắn chỉnh tư liệu ảnh
Ảnh vệ tinh Landsat thu thập đã được xử lý ở mức 1T (Level 1T - Terrain Corrected) nghĩa là đã hiệu chỉnh về bức xạ, khí quyển, hình học và khắc phục sai số do địa hình gây ra.
ảnh đo và hệ tọa độ quy chiếu chuẩn, nghĩa là phải đưa ảnh về một hệ tọa độ quy chuẩn. Tuy nhiên ảnh vệ tinh Landsat năm 2005 và năm 2014 đều đã được hiệu chỉnh phổ và hiệu chỉnh hình học chính xác về hệ tọa độ WGS 84, phép chiếu UTM và múi chiếu 48.
- Cắt ảnh
Từ file ranh giới hành chính huyện Hoài Đức thu thập được với hệ tọa độ WGS 84, phép chiếu UTM và múi chiếu 48 có định dạng là *.shp tiến hành chuyển
đổi sang định dạng *aoi, sau đó sử dụng công cụ Create Subset Image để cắt ảnh.
Hình 4.5. Ảnh cắt Landsat 5 – 2005 huyện Hoài Đức
4.3.5. Phân loại ảnh vệ tinh thành lập bản đồ sử dụng đất:
4.3.5.1. Xác định các loại hình sử dụng đất:
Vì tư liệu ảnh vệ tinh luôn phản ánh trung thực, khách quan bề mặt đất tại thời điểm chụp ảnh, nên bản đồ xây dựng được sau khi giải đoán là bản đồ lớp phủ thực vật. Để phục vụ cho việc xây dựng khoá giải đoán ảnh, trước tiên cần xác định các loại đất theo mục đích sử dụng trên khu vực nghiên cứu. Căn cứ vào hiện trạng sử dụng đất, đặc điểm của tư liệu ảnh vệ tinh, độ phân giải ảnh, xây dựng được bảng phân loại các loại hình sử dụng đất sau:
Bảng 4.6. Phân loại các loại hình sử dụng đất huyện Hoài Đức
STT Loại đất Mô tả
1 Đất trồng lúa Đất trồng lúa nước
2 Đất trồng màu Đất trồng rau, hoa, cấy ăn quả, cây hàng năm khác
3 Đất xây dựng
Đất ở, đất khu công nghiệp, đất cơ sở sản xuất kinh doanh, công trình sự nghiệp, trụ sở an ninh, quốc phòng, đường giao thông liên tỉnh, liên xã…
4 Đất mặt nước Đất có mặt nước, ao hồ nuôi trồng thủy sản, Đất kênh
mương thoát nước, đất sông…
4.3.5.2. Chọn vùng mẫu
Việc chọn vùng mẫu có tính chất quyết định tới kết quả phân loại. Để đảm bảo độ chính xác khi lựa chọn vùng mẫu phải chú ý các yêu cầu sau:
+ Số lượng các vùng lấy mẫu của mỗi loại đối tượng cần phải phù hợp. Số lượng vùng mẫu quá ít sẽ không đảm bảo độ chính xác, ngược lại nếu nhiều quá sẽ làm tăng khối lượng tính toán lên rất nhiều, đôi khi làm nhiễu kết quả tính toán;
+ Diện tích các vùng lấy mẫu đủ lớn, đồng thời các vùng mẫu không được nằm gần ranh giới giữa các lớp đối tượng với nhau;
+ Vùng mẫu được chọn phải đặc trưng cho đối tượng phân loại và phân bố đều trên khu vực nghiên cứu với số lượng 40 mẫu;
+ Tính toán chỉ số thống kê vùng mẫu: Sau khi chọn mẫu xong tiến hành tính toán chỉ số thống kê vùng mẫu và sự khác biệt giữa các mẫu.
Cụ thể như sau:
- Xây dựng tệp mẫu tại vùng nghiên cứu: từ số liệu điều tra thực địa, bản đồ hiện trạng sử dụng đất, bảng mẫu giải đoán tiến hành chọn mẫu phân loại bằng cách khoanh vẽ trực tiếp lên trên ảnh cần phân loại.
Bảng 4.7. Mẫu giải đoán ảnh vệ tinh STT Loại đất Ảnh 2005 Ảnh 2014 Ảnh thực địa 1 Đất trồng lúa 2 Đất trồng màu 3 Đất xây dựng 4 Đất mặt nước
Sử dụng công cụ Signature Editor kết hợp với Polygon để chọn vùng mẫu
trên ảnh. Hộp thoại Signature Editor xuất hiện cho phép ta đánh tên từng loại hình
sử dụng đất cần lấy mẫu và tự động gán màu cho từng lớp.
Kết quả của xây dựng tệp mẫu đối với ảnh Landsat 8 năm 2014 ta tiến hành lựa chọn được 40 mẫu trong đó bao gồm: Đất trồng lúa nước (8 mẫu), đất trồng cây ăn quả (3 mẫu), đất trồng hoa (2 mẫu), đất trồng rau (3 mẫu), đất trồng nông nghiệp còn lại (2 mẫu), đất xây dựng nhà ở (4 mẫu), đất giao thông (2 mẫu), đất khu công nghiệp (2 mẫu), đất xây dựng trụ sở cơ quan (3 mẫu), đất an ninh – quốc phòng (2 mẫu), đất nuôi trồng thủy sản (2 mẫu), đất sông (5 mẫu), đất thủy lợi (2 mẫu) (Hình 4.7).
Từ tệp mẫu xây dựng được trên hai ảnh năm 2005, 2014 sử dụng công cụ
Merge để gộp thành 4 lớp, sau đó tiến hành xử lý và đổi mầu (Hình 4.8 và Hình 4.9).
Hình 4.8. Kết quả gộp lớp cho ảnh Landsat 5 – 2005
Hình 4.9. Kết quả gộp lớp cho ảnh Landsat 8 - 2014
4.3.5.3. Phân loại ảnh:
Có 02 phương pháp: phân loại không kiểm định và phân loại có kiểm định.
- Phương pháp phân loại không kiểm định: kỹ thuật phân loại này chỉ sử dụng thuần tuý thông tin phổ do ảnh cung cấp và đòi hỏi người phân tích phải có kinh nghiệm về việc chỉ định số cụm phổ ban đầu.
- Phương pháp phân loại có kiểm định: đây là một hình thức phân loại mà các chỉ tiêu phân loại được xác lập dựa trên các vùng mẫu và dùng luật quyết định dựa trên thuật toán thích hợp để gắn nhãn pixel ứng với từng vùng phủ cụ thể. Các
vùng mẫu là những khu vực trên ảnh tương ứng với từng loại mà người giải đoán biết được đặc trưng phổ. Dựa trên dữ liệu vùng mẫu thu được trên từng vùng mẫu, các tham số thống kê được xác định. Từ đó, các chỉ tiêu phân loại được sử dụng trong quá trình chỉ định pixel thuộc vào từng loại cụ thể.
Trong đề tài này, phương pháp được lựa chọn để phân loại ảnh là phương pháp phân loại có kiểm định theo thuật toán xác suất cực đại (Maximum likelihood).
Phân loại theo phương pháp Maximum likelihood coi số liệu thống kê của mỗi lớp trong mỗi kênh ảnh được phân tán một cách thông thường và phương pháp này có tính đến khả năng một pixel thuộc một lớp nhất định. Nếu không chọn một ngưỡng xác suất thì phải phân loại tất cả các pixel. Mỗi pixel được gán cho một lớp có độ xác suất cao nhất. Theo phương pháp này các band phổ có sự phân bố chuẩn và các pixel sẽ được phân loại vào lớp mà nó có xác suất cao nhất. Đây là phương pháp phân loại chính xác nhưng lại mất nhiều thời gian tính toán và phụ thuộc sự phân bố chuẩn của dữ liệu.
Từ menu cửa sổ chính của ErDAS sử dụng công cụ Supervised
Classification. Trên màn hình xuất hiện hộp thoại Supervised Classification cho phép lựa chọn ảnh cần phân loại, tệp mẫu xây dựng, tên và đường dẫn xuất của ảnh phân loại. Lựa chọn phương pháp phân loại theo thuật toán xác xuất cực đại (Maximum likelihood).
Hình 4.10. Kết quả phân loại và lọc nhiễu ảnh phân loại Landsat 5 – 2005
Sau khi có được ảnh phân loại năm 2005 và năm 2014, ta tiến hành lọc nhiễu
kết quả phân loại được. Sử dụng công cụ Neighborhood với pháp sử dụng ở đây là
Majority để gộp những pixel lẻ tẻ hoặc phân loại lẫn trong các lớp vào chính lớp chứa nó.
Hình 4.11. Kết quả lọc nhiễu ảnh phân loại Landsat 8 – 2014
4.3.5.4. Đánh giá độ chính xác phân loại ảnh
Độ chính xác phân loại ảnh không những phụ thuộc vào độ chính xác các vùng mẫu mà còn phụ thuộc vào mật độ và sự phân bố các ô mẫu. Sau khi phân loại dựa trên tệp mẫu đã đạt độ chính xác và kết quả là lớp phủ bề mặt. Vậy để đánh giá độ chính xác kết quả phân loại này, ta tiến hành làm như sau:
- Đối với kết quả ảnh phân loại năm 2014, tiến hành sử dụng thiết bị đo
GPS cầm tay của hãng Garmin đã được cài đặt hệ tọa độ WGS 84, phép chiếu UTM để đối soát thực địa 100 điểm đối với tất cả các loại đất phân bố ngẫu nhiên trên địa bàn huyện, sau đó lưu file dưới dạng *.txt.
- Đối với kết quả ảnh phân loại năm 2005, ta kết hợp điều tra thực địa và bản đồ hiện trạng sử dụng đất năm 2005 để xây dựng file tọa độ có định dạng *.txt với với 100 điểm. Trong đó cột 1 là số thứ tự, cột 2 là hoành độ X, cột 3 là tung độ Y tương ứng trên ảnh phân loại.
Kết quả đánh giá độ chính xác phân loại ảnh được thể hiện bằng ma trận sai số. Ma trận này thể hiện sai số nhầm lẫn sang lớp khác (được thể hiện theo hàng) và sai số do bỏ sót của lớp mẫu (được thể hiện theo cột). Do vậy để đánh giá hai nguồn sai số này có hai độ chính xác phân loại tương ứng: độ chính xác phân loại có tính đến sai số nhầm lẫn (do sai số nhầm lẫn gây nên) và độ chính xác phân loại có tính đến sai số bỏ sót (do sai số bỏ sót gây nên). Để đánh giá tính chất của các sai sót phạm phải trong quá trình phân loại người ta dựa vào chỉ số Kappa (κ), chỉ số này nằm trong phạm vi từ 0 đến 1 và biểu thị sự giảm theo tỷ lệ về sai số được thực hiện bằng một yếu tố phân loại hoàn toàn ngẫu nhiên
Hình 4.12. File tọa độ đánh giá phân loại ảnh - 2014 và 2005 ∑ ∑ ∑ = + + = = + + − − = r i i i r i r i i i ii x x N x x x N 1 2 1 1 ) . ( ) . ( κ
Trong đó: N - Tổng số điểm lấy mẫu; r - Số lớp đối tượng phân loại;
xii - Số điểm thực địa đúng trong lớp thứ 1;
xi+ - Tổng điểm thực địa của lớp thứ i của mẫu;
x+i - Tổng điểm thực địa của lớp thứ i sau phân loại.
Sử dụng kết quả ảnh phân loại sau khi lọc và file tọa độ đánh giá năm 2005
và 2014, tiến hành sử dụng chức năng Accurency Assesment để đánh giá độ chính
xác kết quả phân loại:
Hình 4.13. Hiển thị điểm thực địa lên ảnh phân loại Landsat 5 – 2005
Hình 4.15. Kết quả đánh giá độ chính xác ảnh phân loại Landsat 8 - 2014
Trên hình bao gồm các bảng:
- ERROR MATRIX (Bảng ma trận sai số), với:
+ Các số liệu trên đường chéo là số pixel phân loại đúng tương ứng của các loại đất, các số còn lại trong các hàng là số pixel phân loại nhầm sang loại đất khác;
+ Row Total (Tổng hàng): là tổng số điểm phân loại đúng và số điểm phân loại nhầm lẫn của các loại đất;
+ Column Total (Tổng cột): là tổng số điểm từng loại đất sau phân loại bao gồm số điểm phân loại đúng và số điểm bỏ sót.
- ACCURACY TOTALS (Bảng đánh giá độ chính xác theo chỉ số phần trăm (%)), trong đó:
+ Reference Totals: là tổng số điểm thực địa có được của mỗi loại đất trong file tọa độ đánh giá;
+ Classified Totals: là tổng số điểm thực địa có được tương ứng với mỗi loại đất trên ảnh phân loại;
+ Number Correct: là số điểm đúng trên tổng số điểm thực địa có được của mỗi loại đất trong file tọa độ đánh giá (Reference Totals);
+ Producers Accuracy: là chỉ số phần trăm đúng của số điểm đúng (Number Correct) trên tổng số điểm thực địa có được của mỗi loại đất trong file tọa độ đánh giá (Reference Totals);
+ Users Accuracy: là chỉ số phần trăm đúng của số điểm đúng (Number Correct) trên tổng số điểm thực địa có được tương ứng với mỗi loại đất trên ảnh phân loại (Classified Totals).
- KAPPA (K^) STATISTICS (Bảng thống kê chỉ số kappa), với:
+ Overall Kappa Statistics: là kết quả đánh giá độ chính xác ảnh phân loại; + Conditional Kappa for each Category: là kết quả đánh giá độ chính cho mỗi loại đất trên ảnh phân loại.
+ Đối với kết quả đánh giá độ chính xác của ảnh phân loại Landsat 8-2014:
Bảng 4.8. Đánh giá độ chính xác bản đồ sử dụng đất năm 2014 Loại đất (1) (2) (3) (4) Tổng hàng Độ chính xác nhầm lẫn (%) Đất trồng lúa (1) 16 2 1 19 84,2 Đất trồng màu (2) 1 26 1 28 92,8 Đất xây dựng (3) 38 1 39 97,4 Đất mặt nước (4) 1 1 12 14 85,7 Tổng cột 18 26 42 14 100 Độ chính xác bỏ sót (%) 88,8 100 90,5 85,7 92
- Tổng hàng: số điểm kiểm tra của các loại đất.
- Ô chữ đậm (đường chéo): số điểm kiểm tra đúng; các ô còn lại: các điểm kiểm tra nhầm lẫn sang loại đất khác.
- Độ chính xác nhầm lẫn (%): số điểm kiểm tra đúng/số điểm kiểm tra tương ứng của các loại đất x 100.
(Độ chính xác nhầm lẫn (%) = số điểm đúng/tổng hàng x 100) - Tổng cột: số điểm trên thực tế của các loại đất khi đi kiểm tra.
- Độ chính xác bỏ sót (%): số điểm kiểm tra đúng/số điểm trên thực tế của loại đất đó x 100.
Độ chính xác bỏ sót (%) = số điểm đúng/tổng cột x100.
- Độ chính xác bản đồ: là tỷ số giữa tổng số điểm kiểm tra đúng với tổng số điểm kiểm tra.
Tổng số điểm đúng : 92
Tổng số điểm kiểm tra : 100
Độ chính xác bản đồ (%)= 92/100*100 = 92%.
Chỉ số Kappa = 0,8873.
- Đất trồng màu: có 28 điểm thực địa thì đúng 26 điểm, bị lẫn 01 điểm sang đất xây dựng, 01 điểm sang đất trồng lúa.
- Đất mặt nước : có 14 điểm thực địa thì đúng 12 điểm, bị lẫn 01 điểm sang đất xâbby dựng, 01 điểm sang đất trồng lúa.
- Đất trồng lúa : có 19 điểm thực địa thì đúng 16 điểm, bị lẫn 02 điểm sang đất xây dựng, 01 điểm sang đất mặt nước.
- Đất xây dựng : có 39 điểm thực địa thì đúng 38 điểm và bị nhầm 01 điểm sang đất mặt nước.
- Từ đó ta thấy rằng, với:
+ Đối với kết quả đánh giá độ chính xác của ảnh phân loại Landsat 5-2005: - Đất trồng màu: có 31 điểm thực địa thì đúng 31 điểm.
- Đất mặt nước : có 14 điểm thực địa thì đúng 12 điểm, bị lẫn 01 điểm sang đất xây dựng, 01 điểm sang đất trồng lúa.
- Đất trồng lúa : có 22 điểm thực địa thì đúng 20 điểm, bị lẫn 01 điểm sang