1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám

103 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Cải Tiến Một Số Mô Hình Học Máy Trong Nhận Dạng Đối Tượng Trên Ảnh Viễn Thám
Tác giả Hồ Trọng Ánh
Người hướng dẫn TS. Trần Ngọc Thăng
Trường học Đại học Bách Khoa Hà Nội
Chuyên ngành Toán Tin
Thể loại luận văn thạc sĩ
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 103
Dung lượng 11,68 MB

Nội dung

ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu cải tiến số mơ hình học máy nhận dạng đối tượng ảnh viễn thám HỒ TRỌNG ÁNH Anh.HT211306M@sis.hust.edu.vn Chuyên ngành : Toán Tin Giảng viên hướng dẫn Bộ môn : TS Trần Ngọc Thăng : Viện : Chữ ký GVHD Toán Tin Toán Ứng Dụng Và Tin Học Hà Nội, 3-2023 Lời cảm ơn Kính gửi thầy cơ, gia đình, đồng nghiệp, bạn bè Em xin tỏ lòng biết ơn sâu sắc tới tất người giúp đỡ hỗ trợ em q trình nghiên cứu hồn thành luận văn thạc sĩ Đầu tiên, em xin gửi lời cảm ơn đến thầy hướng dẫn giảng viên Tiến Sĩ Trần Ngọc Thăng Những lời dẫn, gợi ý hướng dẫn quý báu thầy giúp em vượt qua khó khăn q trình nghiên cứu hồn thành luận văn em cách tốt Em muốn gửi lời cảm ơn tới gia đình Những lời động viên, quan tâm hỗ trợ giúp em vượt qua thời điểm trở ngại trình nghiên cứu đối mặt với khó khăn Em xin gửi lời cảm ơn tới đồng nghiệp bạn bè Sự hỗ trợ chia sẻ kinh nghiệm bạn giúp có nhiều ý tưởng thơng tin bổ ích Và cuối lời cảm ơn đến Nhà trường cung cấp cho em môi trường học tập nghiên cứu chuyên nghiệp Các giảng viên nhân viên Nhà trường hỗ trợ em nhiều trình thực luận văn Trân trọng, Hồ Trọng Ánh i Giảng viên hướng dẫn : TS Trần Ngọc Thăng Hồ Trọng Ánh Tóm tắt luận văn Luận văn “Nghiên cứu cải tiến số mơ hình học máy nhận dạng đối tượng ảnh viễn thám” tập trung vào việc nghiên cứu cải tiến số mô hình học máy để cải thiện độ xác việc nhận dạng đối tượng ảnh viễn thám Trong luận văn, sử dụng phương pháp tiền xử lý liệu để cải thiện chất lượng liệu ảnh Sau đó, chúng tơi tiến hành nghiên cứu đánh giá mơ hình học máy Mạng nơ ron tích chập (CNN), Unet, U2-Net, Mask R-CNN, tập liệu ảnh viễn thám Sau đánh giá so sánh hiệu mơ hình, chúng tơi đề xuất số cải tiến để tăng độ xác mơ hình nhận dạng đối tượng Chúng đề xuất sử dụng kết hợp đa mơ hình (Multi-Model) để cải thiện kết trích xuất móng nhà, kết cơng bố tạp chí hội nghị ICISN 2022 [2] Tiếp theo, luận văn này, có thêm đề xuất sử dụng mơ hình tăng cường độ phân giải kết hợp với học đa nhiệm (Multi-Task Learning) để áp dụng cho vùng liệu móng nhà khó ảnh có chất lượng độ phân giải quy hoạch chưa tốt cộng với mật độ dày đặc khu nhà ổ chuột Từ kết đó, chúng tơi hướng đến mục tiêu mở rộng để áp dụng cho toán khác tốn phát ranh giới nơng trang ảnh độ phân giải thấp (Sentinel 10m) cách chỉnh sửa, cải tiến mơ hình tăng cường độ phân giải Real-ESRGAN từ lần (4X) lên đến lần (8X) Để chứng minh cho tính hiệu đề xuất trên, chúng tơi thực thí nghiệm để kiểm chứng thấy cải tiến đưa cải thiện đáng kể độ xác mơ hình giúp nâng cao khả nhận dạng đối tượng ảnh viễn thám giúp mở hướng giúp ứng dụng hiệu nguồn liệu mở thường có chất lượng liệu thấp cho toán thực tế ii Mục lục Tóm tắt Danh sách hình ảnh ii v Danh sách bảng vii Giới thiệu chung toán nhận dạng đối tượng ảnh viễn thám 1.1 Các lớp toán thường gặp nhận dạng đối tượng ảnh viễn thám 1.1.1 Bài toán phân đoạn ảnh 1.1.2 Bài toán phân loại ảnh 1.1.3 Bài toán nhận dạng cạnh 1.1.4 Bài toán nhận diện đối tượng 1.2 Một số toán đề cập nghiên cứu 1.2.1 Bài tốn trích xuất móng nhà 1.2.2 Bài tốn trích xuất ranh giới nơng trang Cơ sở lý thuyết 10 2.1 Mạng nơ ron 2.1.1 Nơ ron 2.1.2 Lớp tích chập 2.1.3 Hàm kích hoạt 2.1.4 Pooling 2.1.5 Các số đánh giá 2.1.6 Hàm mát 2.1.7 Lan truyền ngược 2.1.8 Các thuật tốn tối ưu hóa 2.1.9 Chuẩn hóa theo lơ 2.1.10 2.2 10 12 14 17 19 20 23 24 25 28 Tăng cường liệu 29 Viễn Thám 30 iii 2.2.1 Ảnh vệ tinh 2.2.2 Ảnh hàng không 2.2.3 Các số quang phổ 2.2.4 Cấu trúc liệu ảnh viễn thám shapefile 2.2.5 Tính liên kết hình học hệ thống thông tin địa lý Một số mơ hình học máy q trình nghiên cứu Mơ hình U-Net 3.1.1 Thông tin mơ hình 3.1.2 Hàm mát tiêu chí đánh giá 3.1.3 Xử lý liệu vào 3.1.4 Huấn luyện mơ hình 3.1.5 Đánh giá ưu, nhược điểm 3.2 Mơ hình U2-net 3.2.1 Thông tin mơ hình 3.2.2 Hàm mát tiêu chí đánh giá 3.2.3 Đánh giá ưu, nhược điểm 3.3 Mơ hình Mask-RCNN 3.3.1 Thơng tin mơ hình 3.3.2 Hàm mát tiêu chí đánh giá 3.3.3 Xử lý liệu vào 3.3.4 Đánh giá ưu, nhược điểm 3.4 Mơ hình Real-ESRGAN 3.4.1 Ý tưởng cho việc tăng cường độ phân giải ảnh 3.4.2 Thông tin mơ hình 3.4.3 Hàm mát tiêu chí đánh giá Nghiên cứu đề xuất số phương pháp giúp nâng cao kết nhận diện 30 31 32 33 35 37 3.1 37 37 40 40 43 43 44 44 46 47 47 47 50 51 52 53 53 54 56 ảnh viễn thám 4.1 Phát biểu toán 4.2 Phương pháp kết hợp đa mơ hình 4.2.1 Giới thiệu đa mơ hình 4.2.2 Các vùng liệu 4.2.3 Tiêu chí đánh giá 4.2.4 Kết đạt 4.2.5 Đánh giá ưu nhược điểm kết hợp đa mơ hình 4.3 Phương pháp học đa nhiệm 4.3.1 Giới thiệu học đa nhiệm 59 59 60 60 61 62 62 64 65 65 iv 4.3.2 Ứng dụng học đa nhiệm cho tốn trích xuất móng nhà 4.3.3 Mơ hình mạng phân đoạn đa nhiệm 4.3.4 Mơ hình Frame Field Learning 4.3.5 Triển khai mơ hình Frame Field Learning 4.3.6 Kết thử nghiệm Frame Field Learning 4.4 Ứng dụng cải tiến mơ hình Real-ESRGAN giúp nâng cao chất lượng liệu 4.4.1 Thử nghiệm mơ hình Real-ESRGAN 4X 4.4.2 Nâng cấp mơ hình Real-ESRGAN lên 8X 4.4.3 Triển khai huấn luyện mơ hình REAL-ESRGAN 8X 4.4.4 Ứng dụng nâng cao hiệu sử dụng nguồn liệu mở 4.5 Mơ hình tổng hợp sử dụng cho nhận dạng ảnh chất lượng thấp mật độ đối tượng dày đặc 4.5.1 Nguồn liệu 4.5.2 Triển khai thử nghiệm 4.5.3 Kết thử nghiệm Kết luận 66 66 67 69 69 Tài liệu tham khảo 94 v 72 72 78 79 81 85 86 86 88 91 Danh sách hình vẽ 2.1.1 2.1.2 2.1.3 2.1.4 2.1.5 2.1.6 2.1.7 2.1.8 2.2.1 3.1.1 Nơ ron sinh học nhân tạo Multilayer perceptron (MLP) Tích chập N tích chập Padding and stride Dilation Tích chập chuyển vị Max pooling Phép chiếu từ ảnh viễn thám Kiến trúc mơ hình U-Net 12 13 15 15 16 17 17 20 34 39 3.1.2 3.1.3 3.2.1 3.2.2 3.3.1 3.3.2 3.4.1 3.4.2 3.4.3 4.2.1 Hình ảnh tạo mask từ shapefile Phép trượt trình xử lý ảnh viễn thám Kiến trúc mơ hình U-2net Cấu tạo khối RSU Kiến trúc mơ hình Mask-RCNN ROI Align Mạng sinh mơ hình Real-ESRGAN Mạng phân biệt U-Net Real-ESRGAN Q trình hạ cấp mơ hình Real-ESRGAN Kết hợp đa mơ hình 41 42 45 46 48 49 55 55 56 61 4.2.2 Kết số đa mơ hình 4.2.3 So sánh kết móng nhà sử dụng đa mơ hình 4.3.1 Sơ đồ ứng dụng mơ hình mạng phân đoạn đa nhiệm giúp cải thiện kết nắn chỉnh [13] 4.3.2 Cấu trúc mô hình Frame Field Learning 4.3.3 Đồ thị số đánh giá mơ hình Frame Fields Learning 4.3.4 Ảnh kết mơ hình Frame Fields Learning Tập VN UAV 63 64 vi 67 68 70 71 4.4.1 4.4.2 4.4.3 4.4.4 4.4.5 4.4.6 4.4.7 4.4.8 4.4.9 4.4.10 4.4.11 4.4.12 4.5.1 4.5.2 4.5.3 4.5.4 4.5.5 Hình ảnh số ảnh mức độ phân giải khác Tạo ảnh đa tỉ lệ File index chứa tất đường dẫn đến ảnh thư mục Hình ảnh lúc khởi tạo training mơ hình Real-ESRGAN Một số kết tăng cường độ phân giải Mơ hình 4X để tăng độ phân giải ảnh sentinel Hình ảnh summary input output mơ hình Real-ESRGAN 8X Tham số hạ cấp liệu Kết mơ hình 8X để tăng độ phân giải ảnh sentinel Quy trình trích xuất liệu ranh giới nông trang Trích xuất nơng trang ảnh Sentinel Đối chiếu kết trích xuất nơng trang ảnh Sentinel Google Maps Dữ liệu ảnh có chất lượng thấp mật độ cao Dữ liệu ảnh vùng ổ chuột Mumbai Ví dụ tăng độ phân giải cho Mumbai Đồ thị đánh giá mơ hình tổng hợp Kết trích xuất mơ hình tổng hợp cho ảnh Mumbai vii 73 74 74 75 76 77 78 78 80 82 83 84 85 86 87 89 90 Danh sách bảng 2.2.1 Thông tin ảnh Sentinel 4.2.1 Kết đa mơ hình 31 62 4.3.1 Kết số mơ hình Frame Fields Learning 4.5.1 Kết mơ hình tổng hợp 69 88 viii Chương Giới thiệu chung toán nhận dạng đối tượng ảnh viễn thám Viễn thám (Remote sensing) hiểu việc thu thập thông tin đối tượng, khu vực tượng thông qua việc phân tích tư liệu thu nhận phương tiện mà không tiếp xúc trực tiếp với đối tượng, khu vực tượng nghiên cứu Phương tiện thường sử dụng sóng điện từ để chuyển tải thơng tin từ vật cần nghiên cứu tới thiết bị thu nhận thông tin Cụ thể hơn, viễn thám việc nghiên cứu đối tượng giải đốn tách lọc thơng tin từ liệu ảnh chụp từ xa, chẳng hạn ảnh hàng không ảnh vệ tinh Viễn thám sử dụng nhiều lĩnh vực, bao gồm địa lý, khảo sát đất đai hầu hết ngành Khoa học Trái đất Thuật ngữ viễn thám (Remote sensing) - điều tra từ xa, xuất từ năm 1960 nhà địa lý người Mỹ E.Pruit đặt (Thomas, 1999) Ngày kỹ thuật viễn thám phát triển ứng dụng nhanh hiệu nhiều lĩnh vực Như viễn thám thông qua kỹ thuật đại không tiếp cận với đối tượng mà xác định qua thơng tin ảnh chụp từ xa khơng Để sử dụng liệu viễn thám ta phải có khả tách thơng tin có ý nghĩa từ ảnh Đó nhiệm vụ việc xử lý ảnh viễn thám Nói cách khác phải diễn giải phân tích ảnh viễn thám Phân tích ảnh viễn thám thực nhận biết, đo đối tượng khác ảnh để tách thơng tin hữu ích chúng Xử lý ảnh số viễn thám thực loạt thủ tục bao gồm lập khuôn mẫu, hiệu chỉnh liệu, nâng cao chất lượng để dễ dàng giải đoán hay phân lớp tự động đối tượng máy tính Để xử lý số

Ngày đăng: 04/06/2023, 13:07

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Abien Fred Agarap. Deep learning using rectified linear units (relu). arXiv preprint arXiv:1803.08375, 2018 Sách, tạp chí
Tiêu đề: Deep learning using rectified linear units (relu)
Tác giả: Abien Fred Agarap
Nhà XB: arXiv
Năm: 2018
[4] Vincent Dumoulin and Francesco Visin. A guide to convolution arithmetic for deep learning, 2018 Sách, tạp chí
Tiêu đề: A guide to convolution arithmetic for deep learning
Tác giả: Vincent Dumoulin, Francesco Visin
Năm: 2018
[5] Nicolas Girard, Dmitriy Smirnov, Justin Solomon, and Yuliya Tarabalka. Polygonal building segmentation by frame field learning, 2021 Sách, tạp chí
Tiêu đề: Polygonal building segmentation by frame field learning
Tác giả: Nicolas Girard, Dmitriy Smirnov, Justin Solomon, Yuliya Tarabalka
Năm: 2021
[6] Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning. MIT Press, 2016. http://www.deeplearningbook.org Sách, tạp chí
Tiêu đề: Deep Learning
Tác giả: Ian Goodfellow, Yoshua Bengio, Aaron Courville
Nhà XB: MIT Press
Năm: 2016
[7] Jun Han and Claudio Moraga. The influence of the sigmoid function parameters on the speed of backpropagation learning. In José Mira and Francisco Sandoval, editors, From Natural to Artificial Neural Computation, pages 195–201, Berlin, Heidelberg, 1995. Springer Berlin Heidelberg. ISBN 978-3-540-49288-7 Sách, tạp chí
Tiêu đề: From Natural to Artificial Neural Computation
[8] K. He, G. Gkioxari, P. Dollar, and R. Girshick. Mask r-cnn. In 2017 IEEE In- ternational Conference on Computer Vision (ICCV), pages 2980–2988, 2017. doi:10.1109/ICCV.2017.322 Sách, tạp chí
Tiêu đề: Mask r-cnn
Tác giả: K. He, G. Gkioxari, P. Dollar, R. Girshick
Nhà XB: 2017 IEEE International Conference on Computer Vision (ICCV)
Năm: 2017
[9] Long P. Hoang, Dung D. Le, Tran Anh Tuan, and Tran Ngoc Thang. Improving pareto front learning via multi-sample hypernetworks, 2023 Sách, tạp chí
Tiêu đề: Improving pareto front learning via multi-sample hypernetworks
Tác giả: Long P. Hoang, Dung D. Le, Tran Anh Tuan, Tran Ngoc Thang
Năm: 2023
[10] Justin Johnson, Alexandre Alahi, and Li Fei-Fei. Perceptual losses for real-time style transfer and super-resolution. CoRR, abs/1603.08155, 2016. URL http://arxiv. org/abs/ 1603 . 08155 Sách, tạp chí
Tiêu đề: CoRR
[11] Kaggle. 2018 data science bowl. 2018. URL https://www.kaggle.com/competitions/data-science-bowl- 2018 /overview/evaluation . (visited on 2018-12-02) Sách, tạp chí
Tiêu đề: 2018 data science bowl
Tác giả: Kaggle
Năm: 2018
[13] Weijia Li, Wenqian Zhao, Huaping Zhong, Conghui He, and Dahua Lin. Joint semantic-geometric learning for polygonal building segmentation. Proceedings of the AAAI Conference on Artificial Intelligence, 35, 05 2021. doi: 10 . 1609 /aaai.v 35 i 3 . 16291 Sách, tạp chí
Tiêu đề: Joint semantic-geometric learning for polygonal building segmentation
Tác giả: Weijia Li, Wenqian Zhao, Huaping Zhong, Conghui He, Dahua Lin
Nhà XB: Proceedings of the AAAI Conference on Artificial Intelligence
Năm: 2021
[14] Shijie Looi. Rotated mask r-cnn: From bounding boxes to rotated bounding boxes.https://github.com/mrlooi/rotated_maskrcnn, 2019 Sách, tạp chí
Tiêu đề: Rotated mask r-cnn: From bounding boxes to rotated bounding boxes
Tác giả: Shijie Looi
Năm: 2019
[15] Microsoft. Understanding scale and resolution. 2023. URL https://learn.microsoft.com/en-us/bingmaps/articles/understanding-scale-and-resolution. (visited on 2023-03-30) Sách, tạp chí
Tiêu đề: Understanding scale and resolution
Tác giả: Microsoft
Năm: 2023
[16] Herbei Mihai Valentin. Topology of spatial data. 06 2011. doi:10 . 5593 /SGEM 2015 / B 22 /S 11 . 146 Sách, tạp chí
Tiêu đề: Topology of spatial data
Tác giả: Herbei Mihai Valentin
Năm: 2011
[17] Anish Mittal, Rajiv Soundararajan, and Alan C. Bovik. Making a “completely blind”image quality analyzer. IEEE Signal Processing Letters, 20(3):209–212, 2013. doi:10.1109/LSP.2012.2227726 Sách, tạp chí
Tiêu đề: completely blind”image quality analyzer. "IEEE Signal Processing Letters
[18] Takeru Miyato, Toshiki Kataoka, Masanori Koyama, and Yuichi Yoshida.Spectral normalization for generative adversarial networks. CoRR, abs/1802.05957, 2018. URL http://arxiv.org/abs/ 1802 . 05957 Sách, tạp chí
Tiêu đề: Spectral normalization for generative adversarial networks
Tác giả: Takeru Miyato, Toshiki Kataoka, Masanori Koyama, Yuichi Yoshida
Nhà XB: CoRR
Năm: 2018
[19] Chigozie Nwankpa, Winifred Ijomah, Anthony Gachagan, and Stephen Marshall.Activation functions: Comparison of trends in practice and research for deep learn- ing. CoRR, abs/1811.03378, 2018. URL http://arxiv.org/abs/ 1811 . 03378 . [20] OSM. Sunnyvale uav labels. 2022. https://www.openstreetmap.org/ Sách, tạp chí
Tiêu đề: Activation functions: Comparison of trends in practice and research for deep learning
Tác giả: Chigozie Nwankpa, Winifred Ijomah, Anthony Gachagan, Stephen Marshall
Nhà XB: CoRR
Năm: 2018
[21] Daniele Panozzo, Enrico Puppo, Marco Tarini, and Olga Sorkine-Hornung. Frame fields: Anisotropic and non-orthogonal cross fields. ACM Transactions on Graphics, 33(4), 2014. ISSN 0730-0301. doi: 10 . 1145 / 2601097 . 2601179 Sách, tạp chí
Tiêu đề: Frame fields: Anisotropic and non-orthogonal cross fields
Tác giả: Daniele Panozzo, Enrico Puppo, Marco Tarini, Olga Sorkine-Hornung
Nhà XB: ACM Transactions on Graphics
Năm: 2014
[22] Michael Plotke. 2d image-kernel convolution animation. 2023. URL https://commons.wikimedia.org/wiki/File: 2 D_Convolution_Animation.gif . [On-line; accessed 30-April-2023] Sách, tạp chí
Tiêu đề: 2d image-kernel convolution animation
Tác giả: Michael Plotke
Năm: 2023
[23] Xuebin Qin, Zichen Zhang, Chenyang Huang, Masood Dehghan, Osmar R. Zaiane, and Martin Jagersand. U2-net: Going deeper with nested u-structure for salient ob-ject detection. Pattern Recognition, 106:107404, Oct 2020. ISSN 0031-3203. doi Sách, tạp chí
Tiêu đề: Pattern Recognition
[24] Seyed Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian D.Reid, and Silvio Savarese. Generalized intersection over union: A metric and A loss for bounding box regression. CoRR, abs/1902.09630, 2019. URL http:// Sách, tạp chí
Tiêu đề: Generalized intersection over union: A metric and A loss for bounding box regression
Tác giả: Seyed Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian D.Reid, Silvio Savarese
Nhà XB: CoRR
Năm: 2019

HÌNH ẢNH LIÊN QUAN

Hình 2.1.1: Thông tin từ các dây thần kinh đến được biểu diễn bởi  x i  . Sức mạnh - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 2.1.1 Thông tin từ các dây thần kinh đến được biểu diễn bởi x i . Sức mạnh (Trang 21)
Hình 2.1.3: Mô tả cách tính toán phần tử thứ hai của hàng đầu tiên. Sau bước - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 2.1.3 Mô tả cách tính toán phần tử thứ hai của hàng đầu tiên. Sau bước (Trang 24)
Hình 2.1.4: Trong một lớp tích chập, N tích chập hoạt động trên đầu vào với các - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 2.1.4 Trong một lớp tích chập, N tích chập hoạt động trên đầu vào với các (Trang 24)
Hình ảnh 2.2.1 minh họa phép chiếu từ ảnh viễn thám lên hệ tọa độ địa lý - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
nh ảnh 2.2.1 minh họa phép chiếu từ ảnh viễn thám lên hệ tọa độ địa lý (Trang 43)
Hình 3.1.1: Kiến trúc mô hình U-Net [25] - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 3.1.1 Kiến trúc mô hình U-Net [25] (Trang 48)
Hình 3.1.2: Mô tả kết quả tạo ra mask từ shapefile - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 3.1.2 Mô tả kết quả tạo ra mask từ shapefile (Trang 50)
Hình 3.1.3: Mô tả phép trượt trong quá trình xử lý ảnh - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 3.1.3 Mô tả phép trượt trong quá trình xử lý ảnh (Trang 51)
Hình 3.2.1: Kiến trúc mô hình U-2net - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 3.2.1 Kiến trúc mô hình U-2net (Trang 54)
Hình 3.2.2: Cấu tạo khối RSU [23] - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 3.2.2 Cấu tạo khối RSU [23] (Trang 55)
Hình 3.3.1: Kiến trúc mô hình Mask-RCNN - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 3.3.1 Kiến trúc mô hình Mask-RCNN (Trang 57)
Hình 3.3.2: ROI Align - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 3.3.2 ROI Align (Trang 58)
Hình 3.4.3: Quá trình giảm chất lượng ảnh và tạo ra mất mát trong mô hình - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 3.4.3 Quá trình giảm chất lượng ảnh và tạo ra mất mát trong mô hình (Trang 65)
Hình 4.2.1: Mask-R CNN và U2-Net kết hợp để tạo thành một đa mô hình - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 4.2.1 Mask-R CNN và U2-Net kết hợp để tạo thành một đa mô hình (Trang 70)
Hình 4.2.2: Giá trị AP tại các ngưỡng IoU trên 3 bộ dữ liệu [2] - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 4.2.2 Giá trị AP tại các ngưỡng IoU trên 3 bộ dữ liệu [2] (Trang 72)
Hình 4.2.3: Hình ảnh trên cùng bên trái đầu tiên là hình ảnh đầu vào, hình - Nghiên cứu cải tiến một số mô hình học máy trong nhận dạng đối tượng trên ảnh viễn thám
Hình 4.2.3 Hình ảnh trên cùng bên trái đầu tiên là hình ảnh đầu vào, hình (Trang 73)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w