Tổng quan về lĩnh vực nghiên cứu, các kết quả nghiên cứu trong và ngoài nước đã công bố
Bệnh ngoài da là một trong những vấn đề sức khỏe phổ biến, ảnh hưởng đến mọi lứa tuổi và giới tính Trên toàn thế giới, có nhiều bệnh nhân mắc các bệnh về da, dẫn đến không ít trường hợp tử vong Đây là một vấn đề toàn cầu nghiêm trọng, đứng thứ 18 trong bảng xếp hạng gánh nặng sức khỏe toàn cầu Theo thống kê năm 2017, bệnh ngoài da chiếm khoảng 1,79% tổng số bệnh tật trên thế giới.
Các bệnh ngoài da như viêm da, mụn trứng cá, mày đay, vẩy nến và ung thư biểu mô đang ngày càng được chú trọng trong việc xác định và phân loại nhờ vào công nghệ hình ảnh y tế Gần đây, hình ảnh bệnh da được phân đoạn và tăng cường để nhận diện chính xác hơn Việc sử dụng ma trận đồng xuất hiện mức xám (GLCM) cho phép trích xuất các đặc trưng quan trọng phục vụ cho bộ phân loại bằng mạng thần kinh nhân tạo Để nâng cao độ chính xác trong phân loại, việc lọc nhiễu và tăng cường hình ảnh là rất cần thiết.
Hình ảnh từ các nguồn khác nhau thường chứa nhiều loại nhiễu, và có nhiều bộ lọc để loại bỏ chúng Để làm sắc nét và loại bỏ nhiễu không mong muốn, bộ lọc thông cao kết hợp Gaussian và Butterworth được áp dụng trong miền tần số Phương pháp phát triển vùng đã được sử dụng để phân đoạn hình ảnh tổn thương da, với thuật toán tự động khởi tạo điểm hạt giống Kết quả phân đoạn giúp trích xuất vùng tổn thương, và được kết hợp với phương pháp SVM và K-NN, đạt độ chính xác 61% Nghiên cứu của chúng tôi sẽ sử dụng bộ lọc thông cao Butterworth để làm sắc nét vùng da bị bệnh trước khi tiến hành phân đoạn Trong xử lý ảnh, thuật toán phân đoạn thường được áp dụng để tách đối tượng khỏi ảnh nhằm phục vụ cho phân tích hoặc nhận dạng, trong đó phương pháp Otsu là một trong những phương pháp phân ngưỡng phổ biến.
Phương pháp phân đoạn Otsu được sử dụng để xác định ngưỡng phát hiện vùng bệnh, giúp phân loại hiệu quả Trong một ứng dụng cụ thể, các tác giả đã áp dụng phương pháp này để tìm các điểm pixel chính, được xem là điểm mầm của da bị bệnh Sau khi thực hiện phân đoạn, các đặc trưng tương ứng với các điểm chính được trích xuất và trở thành đầu vào cho bộ phân loại Trong nghiên cứu này, phương pháp Otsu được áp dụng để phân đoạn các vùng da tổn thương, được gọi là ROI.
Trong lĩnh vực y tế, có nhiều phương pháp lọc hình ảnh nhằm nâng cao chất lượng như bộ lọc trung bình và Bottom Hat, thường được sử dụng để khử nhiễu Nghiên cứu này áp dụng bộ lọc trung vị và Bottom Hat để loại bỏ nhiễu và làm mờ các vùng bệnh ngoài da Để phân đoạn hiệu quả và tách ROI trong ảnh, việc phát hiện cạnh của các đối tượng là cần thiết Các tác giả đã đề xuất sử dụng bộ dò cạnh Canny kết hợp với bộ lọc trung vị lặp lại (IMF) để phát hiện đường viền tổn thương da, cho thấy hiệu quả vượt trội so với các thuật toán phân đoạn truyền thống Bài báo này áp dụng phương pháp Canny để phát hiện các cạnh của vùng bệnh da, nhằm tách ROI một cách chính xác.
Phép toán hình thái học được áp dụng trong xử lý hình ảnh MRI tần số T1 nhằm nâng cao ước lượng thể tích, cho thấy ưu điểm vượt trội so với phương pháp Stereology nhờ yêu cầu ít lát cắt MRI và điểm kiểm tra hơn Trong lĩnh vực học sâu để phân loại tổn thương da, các yếu tố hình thái chính được tích hợp như một mô-đun trong hệ thống phát hiện tự động, đạt độ chính xác 76,00% cho 5 lớp thành phần hình thái và 81,67% cho 3 lớp Nghiên cứu của chúng tôi sử dụng sự giãn nở và xói mòn hình thái học để loại bỏ các mụn nhỏ không mong muốn và kết nối các đường chấm ở vùng da bệnh.
Trong lĩnh vực hình ảnh y tế, việc tách ROI (vùng quan tâm) để trích xuất đặc điểm là rất quan trọng Một phương pháp phân đoạn đơn giản và hiệu quả đã được đề xuất để tách các vùng da mà không tạo ra nhiều vùng nhỏ Phương pháp này cho thấy hiệu suất tốt hơn so với các kỹ thuật hiện đại mà không cần huấn luyện Sau khi tiền xử lý ảnh, phát hiện cạnh Canny được áp dụng để tách ROI nhằm tối ưu hóa việc trích xuất đặc trưng bằng phương pháp GLCM, điều này rất quan trọng trong phân loại bệnh da Nhiều phương pháp đã được áp dụng để phân loại tổn thương da, giúp bác sĩ chẩn đoán và điều trị bệnh sớm hơn Gần đây, trí tuệ nhân tạo (AI) đã trở nên phổ biến trong việc phân loại bệnh da, với việc sử dụng mạng nơ-ron tích chập (CNN) cho kết quả tốt trên hơn 900 hình ảnh bệnh Các mô hình CNN và DNN hiện đại đã được áp dụng để phân loại các bệnh da khác nhau, như vảy nến, với tỷ lệ chính xác cao Sự phát triển của các mô hình AI cho các tập hình ảnh y tế lớn là rất quan trọng trong việc nâng cao khả năng chẩn đoán.
Trong nghiên cứu này, chúng tôi đã phát triển một phương pháp phân loại tự động cho năm loại bệnh da bằng cách trích xuất sáu đặc trưng nổi bật từ ảnh Các hình ảnh được tiền xử lý để loại bỏ thành phần không cần thiết và cải thiện chất lượng, sau đó tiến hành lọc để tách ROI và trích xuất đặc trưng thông qua GLCM Những đặc trưng này được sử dụng làm đầu vào cho bộ phân loại mạng nơ ron nhiều lớp (MLNNs) Độ chính xác trung bình của bộ phân loại được đánh giá thông qua ma trận nhầm lẫn.
Tính cấp thiết
Bệnh da người là một nhóm bệnh lý xuất hiện trên bề mặt da, với nhiều loại khác nhau, trong đó có những bệnh nguy hiểm có thể ảnh hưởng nghiêm trọng đến sức khỏe và chất lượng cuộc sống, thậm chí dẫn đến ung thư da và tử vong Nếu không được chữa trị kịp thời, các bệnh ngoài da có thể để lại di chứng nặng nề cho bệnh nhân, gây ra nhiều khó khăn cho gia đình và xã hội.
Chẩn đoán sớm và nhanh chóng có thể giúp người bệnh điều trị kịp thời, từ đó phục hồi sức khỏe trở lại bình thường Sự phát triển của công nghệ máy tính và các phương pháp xử lý ảnh hiện đại, như phân tích cấu trúc ảnh và trí tuệ nhân tạo, sẽ hỗ trợ bác sĩ trong việc nhận diện bệnh chính xác và nhanh chóng Điều này mang lại cơ hội cho bệnh nhân được chữa trị sớm, giúp họ sớm trở lại với cuộc sống thường nhật.
Nghiên cứu các phương pháp hiện đại không chỉ tạo ra kết quả chẩn đoán nhanh chóng thông qua phân tích cấu trúc và công nghệ nhận dạng, mà còn hỗ trợ giáo dục ở các cấp Đại học, Cao học và Nghiên cứu sinh Đề tài này sẽ mang đến cho học viên và nghiên cứu sinh cơ hội tiếp cận những thuật toán và phương pháp mới, từ đó nâng cao chất lượng học tập Hơn nữa, nghiên cứu còn có tiềm năng phát triển các sản phẩm ứng dụng thực tế cho các phòng khám và bệnh viện.
Mục tiêu đề tài
Hệ thống nhận biết bệnh da người được thiết kế bằng cách sử dụng phương pháp phân tích cấu trúc và thuật toán mạng học sâu Tập dữ liệu bao gồm những bệnh da phổ biến giúp đánh giá hiệu quả của thuật toán này trong việc đưa ra các kiến nghị chính xác.
Cách tiếp cận, phương pháp nghiên cứu, phạm vi nghiên cứu
Để hiểu rõ về bệnh ngoài da, cần nghiên cứu các tài liệu như bài báo, đề tài và luận văn tốt nghiệp cả trong và ngoài nước Việc này giúp nắm bắt các phương pháp xử lý ảnh và nhận dạng hiệu quả.
- Liên hệ và hợp tác với bệnh viện cho đánh giá kết quả
- Tiền xử lý ảnh dùng xử lý ảnh
- Phương pháp mạng học sâu cho nhận dạng loại bệnh
- Tập ảnh có sẵn trên mạng và 1 số ảnh bệnh da người được thu từ bệnh viện nếu có điều kiện
- Mô phỏng để nhận biết bệnh
- Thu thập tập ảnh bệnh da với tối thiểu 3 bệnh tiêu biểu
- Dùng các phương pháp xử lý ảnh như tiền xử lý để loại bỏ những phần không cần thiết trên ảnh
- Phân tích cấu trúc ảnh của mỗi loại bệnh da dựa vào ảnh sử dụng ma trận đồng dạng
- Trích đặc trưng ảnh dùng phương pháp phân tích thành phần chính hay màu da bệnh
- Nhận dạng ảnh dùng phương pháp mạng học sâu hay máy vector hỗ trợ
- Phương pháp đánh giá sự hiệu quả của bộ nhận dạng
- Chạy chương trình, kiểm tra, hiệu chỉnh và đánh giá kết quả
- Hoàn thiện các hồ sơ.
Các loại bệnh da thường gặp ở người
Tại Việt Nam, tỷ lệ mắc các bệnh ngoài da rất đa dạng, với khoảng 9.000 ca khám tại Da Liễu Trung ương trong tháng 5 và tháng 6 năm 2018 Các bệnh phổ biến bao gồm trứng cá bọc, trứng cá đầu đen và viêm da cơ địa, trong đó có viêm da tiếp xúc dị ứng và nhiễm nấm da Theo thống kê toàn cầu, mỗi năm có khoảng 210.000 người mắc bệnh phong, và nhiều triệu người vẫn chưa được chẩn đoán Năm 2017, bệnh da chiếm khoảng 1,79% tổng số bệnh trên toàn thế giới, bao gồm các loại như viêm da, mụn trứng cá, nổi mề đay, và nhiều bệnh khác liên quan đến da.
(a) Da bình thường (b) Da mắc bệnh chàm
(c) Da mắc bệnh nấm (d) Da mắc bệnh hắc lào
Hình 2.1 Một số loại da bị bệnh
Ung thư da là loại ung thư phổ biến nhất, thường phát triển ở những vùng da tiếp xúc trực tiếp với ánh nắng mặt trời Tỷ lệ mắc bệnh cao nhất ở người lao động ngoài trời, vận động viên và những người thường xuyên tắm nắng Bệnh thường gặp ở người da trắng, chủ yếu ở người lớn tuổi, với nam giới có nguy cơ cao hơn nữ giới, và thường xuất hiện ở những vùng da hở.
2 Cơ sở lý thuyết với các chất gây ung thư cũng có khả năng phát triển ung thư da Nguyên nhân bắt nguồn từ việc da tiếp xúc với các tia phóng xạ bao gồm bức xạ cực tím (ánh nắng mặt trời) và bức xạ ion hóa (trong quá trình chụp X- quang, CT), do tiếp xúc với các hóa chất gây ung thư hoặc do di truyền Các loại bệnh ung thư da thường gặp nhất là: ung thư biểu mô tế bào đáy (Basal cell carcinoma), dày sừng tiết bã lành tính (Benign keratosis), u da lành tính (Dermatofibroma), nốt ruồi hắc tố (Melanocytic nevus), ung thư tế bào hắc tố (Melanoma), ung thư biểu mô tế bào vảy (squamous cell carcinoma) Trong đó, bệnh ung thư biểu mô tế bào đáy (Basal cell carcinoma) chiếm tỉ lệ người mắc bệnh cao nhất [42] Các loại bệnh này thường có dấu hiệu như vùng da bị đỏ, bị sần sùi, lở loét lâu ngày nhưng không lành, hình dạng như hạt ngọc trông giống như mụn của ta nhưng ở giữa không có nhân, ở các vùng da có vảy, hoặc là ở các nốt ruồi có kích thước lớn bất thường Hình 2.2 mô tả các loại bệnh về da ung thư thường gặp nhất ở người được lấy từ tập ảnh của ISIC 2018 và Walk-in Dermatology.com
(a) Ung thư biểu mô tế bào đáy
(b) Dày sừng tiết bã lành tính (c) U da lành tính
(d) Nốt ruồi hắc tố (e) Ung thư tế bào hắc tố (f) Ung thư biểu mô tế bào vảy
Hình 2.2 Các loại bệnh da ung thư thường gặp ở người
Phương pháp phân loại bệnh da người
2.2.1 Phân loại bệnh da dựa vào phương pháp truyền thống
Phương pháp truyền thống trong phân loại bệnh da bao gồm việc trích xuất các đặc trưng một cách thủ công, sau đó đưa vào bộ phân loại Hình 2.3 minh họa quy trình tổng quát của phương pháp này.
Hình 2.3 Sơ đồ khối các bước phân loại bệnh da dùng phương pháp truyền thống
Cơ sở dữ liệu ảnh bệnh da được cung cấp miễn phí cho nhiều loại bệnh, với một số bộ dữ liệu hoàn toàn mã nguồn mở và một số khác có sẵn trên thị trường Hình ảnh đầu vào có thể là loại soi da hoặc lâm sàng, tùy thuộc vào tập dữ liệu được sử dụng Các bộ dữ liệu phổ biến bao gồm ISIC 2018, ISBI-2016, ISBI-2017, Ham10000, DermQuest, Derm Net NZ và Dermofit.
Tiền xử lý ảnh là bước thiết yếu trong việc xử lý hình ảnh lâm sàng, đặc biệt khi hình ảnh có thể chứa nhiễu như gel soi da, bọt khí và sợi lông Hình ảnh lâm sàng yêu cầu tiền xử lý kỹ lưỡng hơn so với ảnh soi da do sự khác biệt về độ phân giải, ánh sáng, góc chụp và kích thước vùng da Để loại bỏ sợi lông trên da, có thể sử dụng các bộ lọc như trung vị, trung bình, Gaussian, cũng như các phép toán hình thái học như xói mòn và giãn nở Đối với hình ảnh có độ tương phản thấp, các thuật toán tăng cường độ tương phản rất hữu ích, trong đó cân bằng biểu đồ là một kỹ thuật phổ biến giúp phân bố đồng đều cường độ pixel Đối với nhiễu muối tiêu, bộ lọc trung vị hoặc trung bình có thể mang lại hiệu quả loại bỏ nhiễu tốt hơn.
Phân đoạn hình ảnh đóng vai trò quan trọng trong việc phát hiện bệnh da bằng cách tách vùng bị bệnh ra khỏi vùng da bình thường Có ba phương pháp chính để thực hiện phân đoạn hình ảnh: dựa trên pixel, dựa trên cạnh và dựa trên vùng Phương pháp dựa trên pixel xác định mỗi pixel là phần của vùng đồng nhất hoặc đối tượng thông qua ngưỡng nhị phân Phương pháp phát hiện cạnh liên kết các cạnh để tạo hình dạng giới hạn của tổn thương da, trong khi phương pháp dựa trên vùng nhóm các pixel có giá trị cường độ tương tự và dựa vào tính liên tục, bao gồm các kỹ thuật như vùng phát triển, hợp nhất và chia tách, cũng như thuật toán Watershed.
Các bệnh về da thường được mô tả và xác định qua màu sắc và kết cấu của chúng Màu sắc đóng vai trò quan trọng trong việc phân biệt các bệnh khác nhau, và có thể được trích xuất bằng nhiều kỹ thuật như biểu đồ màu và GLCM Kết cấu hình ảnh thể hiện các mô hình phức tạp của tổn thương da, bao gồm độ sáng, màu sắc, hình dạng và kích thước, với sự thay đổi cường độ pixel là yếu tố chính Các phương pháp như GLCM, mẫu nhị phân cục bộ và SIFT được sử dụng để thu thập thông tin kết cấu Ngoài ra, hình dạng và kích thước của mỗi tổn thương cũng khác nhau tùy thuộc vào loại bệnh và mức độ nghiêm trọng.
Phân loại là một phương pháp học tập có giám sát trong lĩnh vực học máy, yêu cầu sử dụng tập dữ liệu đã được gán nhãn để phân chia dữ liệu thành các nhóm hoặc lớp cụ thể.
Có nhiều thuật toán phân loại hình ảnh bệnh da, bao gồm SVM, mạng nơron truyền thẳng, mạng nơron lan truyền ngược, k-láng giềng gần nhất và cây quyết định Những thuật toán này đóng vai trò quan trọng trong việc nâng cao độ chính xác và hiệu quả của quá trình chẩn đoán hình ảnh bệnh da.
2.2.2 Phân loại bệnh da dựa vào mạng học sâu
Học sâu, một nhánh của thuật toán học máy, được lấy cảm hứng từ cấu trúc và chức năng của não người, thường được gọi là mạng thần kinh Trong đó, CNN (Mạng nơ-ron tích chập) là một lớp thuật toán học sâu chủ yếu dùng để phân tích nội dung trực quan như hình ảnh và video Sự phát triển của CNN đã mang lại những cải tiến đáng kể trong việc giải quyết các vấn đề phân loại trong phân tích hình ảnh y tế, với quy trình cơ bản để phân loại hình ảnh bệnh da dựa trên CNN được minh họa trong hình 2.4.
Hình 2.4 Sơ đồ khối các bước phân loại ảnh bệnh da dựa vào phương pháp CNN
Quá trình bắt đầu bằng việc thu thập dữ liệu đầu vào cho CNN, có thể là hình ảnh soi da hoặc hình ảnh lâm sàng, với khả năng xử lý trước nếu cần Tiếp theo, dữ liệu được tăng cường để đảm bảo đủ mẫu cho việc huấn luyện mô hình Dữ liệu sau đó được đưa vào CNN để thực hiện trích xuất đặc trưng và phân loại CNN thường bao gồm lớp tích chập, nơi các bộ lọc thực hiện thao tác tích chập trên hình ảnh, tạo ra bản đồ đặc trưng của đối tượng Các bản đồ này được gộp lại để lấy mẫu sâu hơn, và cuối cùng, lớp kết nối đầy đủ thực hiện phân loại dựa trên tất cả các kết nối từ lớp trước.
Nhiều nghiên cứu đã áp dụng mạng nơ-ron tích chập (CNN) để phân loại bệnh da, thông qua việc học chuyển giao hoặc tinh chỉnh các mô hình đã được đào tạo trước như Inception V3, ResNet và VGG.
Trong quá trình học chuyển giao, chỉ có trọng số được tối ưu hóa khi thêm các lớp phân loại mới, trong khi trọng lượng của mô hình ban đầu vẫn giữ nguyên Khi tinh chỉnh, các thông số của mô hình đã được huấn luyện cần được điều chỉnh cẩn thận để xác nhận mô hình cho tập dữ liệu có số lượng ảnh ít hơn và không thuộc tập huấn luyện Đồng thời, cần theo dõi các thông số của CNN để tránh tình trạng quá khớp, khi mô hình học quá tốt dẫn đến việc học cả thông tin không liên quan và nhiễu, gây ra độ chính xác huấn luyện cao nhưng độ chính xác kiểm tra lại kém.
Phương pháp trích đặc trưng
2.3.1 Phương pháp phân tích GLCM
Phương pháp phân tích ma trận đồng xuất hiện mức xám (GLCM) được sử dụng để nghiên cứu mối quan hệ không gian giữa các pixel trong hình ảnh, và là một kỹ thuật phổ biến trong trích đặc trưng GLCM được xác định thông qua việc tính toán xác suất xuất hiện của một pixel có giá trị cường độ i trong mối quan hệ không gian với một pixel có giá trị j tại khoảng cách d và góc θ cụ thể Để tính toán GLCM cho hình ảnh đầu vào, thường thực hiện theo bốn hướng khác nhau và bốn khoảng cách khác nhau, bao gồm các góc 0°, 45°, 90° và 135° với các khoảng cách d = 1, 2, 3 và 4 Hình 2.5 sẽ minh họa quá trình này khi áp dụng phương pháp phân tích GLCM.
Hình 2.5 Phân tích GLCM cho ảnh
(a) Hình ảnh đầu vào có kích thước 4 × 4; (b) Tần suất xuất hiện của cặp (i , j) với d = 1 và θ = 0 0 ;
Sau khi phân tích ma trận GLCM, một số đặc trưng quan trọng được tính toán bao gồm độ tương phản, tương quan, năng lượng, tính đồng nhất, entropy, trung bình, độ lệch chuẩn và phương sai.
2.3.2 Phương pháp phân tích đặc trưng về màu sắc Đây là phương pháp khá đơn giản với mức độ tìm kiếm hình ảnh theo nội dung có độ chính xác không cao Một số lược đồ có thể được sử dụng như lược đồ HIS, lược đồ HSV, lược đồ màu RGB Trong đó, lược đồ màu RGB được sử dụng nhiều nhất [53] Đối với ảnh 256 màu, lược đồ màu của ảnh tương đương với lược đồ màu của ảnh xám Đối với ảnh có 24 bit màu, lược đồ miêu tả khả năng kết nối về cường độ của ba kênh màu R, G, B Lược đồ màu này được tính bằng cách rời rạc hóa từng màu trong ảnh, sau đó sẽ tiến hành đếm số điểm ảnh của mỗi màu Một cách khác để tính lược đồ màu của ảnh RGB là sẽ phân ra làm 3 lượt đồ riêng biệt hR[], hG[], hB[] Khi đó, mỗi lược đồ được tính bằng cách đếm kênh màu tương ứng trong mỗi điểm ảnh
2.3.3 Phương pháp phân tích LBP
Phương pháp phân tích mẫu nhị phân cục bộ (LBP) là một kỹ thuật quan trọng trong giám sát, bảo mật, mô tả kết cấu và nhận dạng khuôn mặt LBP hoạt động bằng cách tóm tắt cấu trúc cục bộ của hình ảnh thông qua việc so sánh mỗi pixel với các pixel lân cận Kỹ thuật này giúp xác định kết cấu hình ảnh hiệu quả bằng cách sử dụng hai thước đo bổ sung: các mẫu không gian cục bộ và thang độ xám tương phản.
Trong LBP gốc, toán tử Local Binary Pattern (LBP) được mô tả bằng hai tham số chính là L và r, trong đó L đại diện cho số lượng điểm lân cận, còn r là bán kính của vòng tròn được hình thành bởi các điểm lân cận p, từ đó tạo ra một tập hợp các giá trị đầu ra.
Pixel trung tâm được sử dụng để xác định ngưỡng cho tám pixel lân cận xung quanh nó Giá trị LBP của pixel trung tâm tại tọa độ (i, j) được tính toán theo một công thức cụ thể.
Giá trị mức xám của pixel trung tâm được ký hiệu là g c, trong khi g p đại diện cho giá trị mức xám của pixel lân cận A là hàm ngưỡng được tính toán theo công thức cụ thể.
Hình 2.6 là một ví dụ để tính toán mã LBP cho giá trị pixel trung tâm Theo công thức (2.1) thì LBP = (1×2 0 +1×2 1 +1×2 2 +0×2 3 +1×2 4 +0×2 5 +1×2 6 +0×2 7 )
Hình 2.6 Phân tích LBP cho một pixel
3 Phương Pháp Trích Đặc Trưng GLCM Cho Ảnh Bệnh Da
Contrast
Độ tương phản là chỉ số đánh giá cường độ và sự khác biệt mức xám giữa pixel tham chiếu và khu vực xung quanh Nó được xác định dựa trên sự khác biệt về màu sắc và độ sáng của đối tượng, với giá trị nằm trong khoảng từ 0 đến 1 Độ tương phản đạt giá trị 0 đối với các hình ảnh không có sự thay đổi Công thức tính toán độ tương phản được sử dụng để xác định đặc trưng này.
P(i,j) đại diện cho xác suất xuất hiện của cặp pixel (i,j), trong đó mỗi phần tử (i,j) thể hiện tổng số lần mà pixel có giá trị i xuất hiện trong mối quan hệ không gian với pixel có giá trị j.
Biểu đồ Hình 3.1 thể hiện đặc trưng về độ tương phản (Contrast) được phân tích từ hình ảnh của năm loại bệnh da khác nhau, bao gồm: ung thư tế bào (Basal cell carcinoma), viêm màng sừng (Benign keratosis), u da lành tính (Dermato-fibroma), nốt ruồi hắc tố (Melano-cytic nevus) và ung thư tế bào hắc tố (Melanoma).
Energy
Năng lượng của hình ảnh nằm trong khoảng từ 0 đến 1, với giá trị 1 thể hiện một hình ảnh không đổi Năng lượng đo lường tính đồng nhất của kết cấu hình ảnh, phản ánh sự lặp lại của cặp pixel và giúp xác định các rối loạn trong kết cấu Giá trị năng lượng mô tả độ dày của cấu trúc bức ảnh, được tính bằng tổng bình phương các thành phần của ma trận đồng hiện mức xám theo cả phương ngang và phương dọc Công thức tính toán năng lượng được áp dụng để phân tích đặc trưng hình ảnh.
G(i,j) đại diện cho xác suất xuất hiện của cặp pixel (i,j), trong đó mỗi phần tử (i,j) là tổng số lần mà pixel có giá trị i xuất hiện trong mối quan hệ không gian với pixel có giá trị j.
Hình 3.2 thể hiện đặc trưng về năng lượng được phân tích từ hình ảnh của năm loại bệnh da, bao gồm ung thư tế bào Basal, viêm màng sừng Benign keratosis, u da lành tính Dermatofibroma, nốt ruồi hắc tố Melanocytic nevus, và ung thư tế bào hắc tố Melanoma.
3 Phương Pháp Trích Đặc Trưng GLCM Cho Ảnh Bệnh Da
Homogeneity
Tính đồng nhất của các mục khác 0 trong ma trận GLCM được đo lường với giá trị nằm trong khoảng từ 0 đến 1, phản ánh độ nhám của cấu trúc bức ảnh Giá trị Hg càng cao cho thấy độ nhám của cấu trúc ảnh tại khu vực đó càng lớn Hình 3.3 minh họa giá trị tính đồng nhất của một số loại bệnh trên da người Đặc trưng Homogeneity được tính toán theo công thức cụ thể.
Entropy
Entropy là thước đo độ ngẫu nhiên thống kê, giúp mô tả cấu trúc của hình ảnh đầu vào Một hình ảnh hoàn toàn phẳng không có entropy, trong khi giá trị này thay đổi tùy theo cấu trúc khác nhau Khi entropy tăng, cấu trúc của các điểm trong bức ảnh trở nên thưa dần, và ngược lại Khi entropy bằng 0, các cấu trúc này không còn tồn tại Giá trị entropy được thể hiện trong hình 3.4 và được tính toán theo công thức cụ thể.
Mean
Mean là giá trị mức xám trung bình của ảnh bệnh da, với G(x, y) đại diện cho hình ảnh đã qua tiền xử lý có kích thước m × n Trước khi tính toán giá trị trung bình, cường độ xám của các pixel được chuẩn hóa trong khoảng [0,1].
Hình 3.5 biểu diễn đặc trưng Mean được phân tích từ ảnh của năm loại bệnh da
Standard Deviation
Độ lệch chuẩn là một chỉ số quan trọng để đo lường mức độ biến thiên hay phân tán của một tập hợp giá trị Để tính toán độ lệch chuẩn, ta sử dụng công thức cụ thể nhằm phản ánh mức độ phân tán của dữ liệu.
3 Phương Pháp Trích Đặc Trưng GLCM Cho Ảnh Bệnh Da
Hình 3.6 cho thấy rằng sự khác biệt giữa các loại bệnh được mô tả khi phân tích độ lệch chuẩn mức xám ảnh da
Hình 3.6 Đặc trưng Standard Deviation
Phân tích đặc trưng của bệnh ngoài da là cần thiết để phân loại chính xác, mặc dù có sự trùng lặp giữa các thông số Việc này có thể gây tốn thời gian mà không mang lại lợi ích cho quá trình huấn luyện phân loại Nghiên cứu này tập trung vào việc tính toán và thống kê các đặc điểm của bệnh ngoài da, nhằm lựa chọn những đặc trưng phản ánh sự khác biệt của da Qua phân tích dữ liệu từ mười một loại tính năng bằng thuật toán GLCM, nghiên cứu đã xác định được sáu tính năng tối ưu: Contrast, Energy, Homogeneity, Mean, Standard Deviation, và Entropy Những đặc điểm này cho thấy sự khác biệt rõ rệt giữa các bệnh da và hỗ trợ hiệu quả cho việc huấn luyện phân loại bệnh da.
4.1 Phương pháp tách vùng da bệnh
Tập dữ liệu bệnh da
Đề tài sử dụng tập dữ liệu ISIC 2018 gồm năm bệnh khác nhau với kích thước
Hình 4.2 mô tả năm bệnh trong tập dữ liệu, trong đó một số bệnh như ung thư biểu mô tế bào đáy và bệnh dày sừng tiết bã lành tính có sự tương đồng rõ rệt về kích thước và màu sắc khi nhìn bằng mắt thường Sự tương đồng này là một trong những nguyên nhân gây nhiễu trong quá trình huấn luyện dữ liệu.
4 Phân Loại Bệnh Da Dùng Mạng Nơ Ron Nhiều Lớp Và Đặc Trưng GLCM
Số lượng hình ảnh cho từng loại bệnh khác nhau: bệnh ung thư biểu mô tế bào đáy có 237 ảnh, bệnh dày sừng tiết bã lành tính có 276 hình, bệnh u da lành tính có 200 hình, bệnh nốt ruồi hắc tố có 314 hình, và bệnh ung thư tế bào hắc tố có 175 hình.
Hình 4.2 Hình ảnh bệnh da sử dụng trong đề tài
Tiền xử lý ảnh
Tiền xử lý ảnh là bước quan trọng trong việc trích xuất đặc trưng ảnh da nhằm phân loại bệnh da Quá trình này giúp nâng cao chất lượng ảnh, từ đó cải thiện độ chính xác của hệ thống nhận dạng và phân loại bệnh Ảnh gốc sẽ được chuẩn hóa và dán nhãn để thuận tiện cho việc xử lý và phân tích bằng mạng nơ ron Mặc dù giữ ảnh ở kích thước ban đầu mang lại độ sắc nét và chi tiết cao do độ phân giải tốt, nhưng dung lượng ảnh lớn có thể làm chậm quá trình xử lý Do đó, ảnh sẽ được điều chỉnh kích thước về 512x512 để tối ưu hóa hiệu suất.
Hình 4.3 Ảnh trước và sau khi định kích cỡ
Bước tiền xử lý là rất quan trọng để làm rõ ảnh bệnh da trước khi tiến hành phân đoạn và tách ROI khỏi ảnh cho việc trích đặc trưng Các bước tiền xử lý ảnh da bao gồm nhiều quy trình nhằm nâng cao chất lượng hình ảnh, giúp cải thiện độ chính xác trong việc phân tích và nhận diện các đặc điểm quan trọng.
Để bắt đầu, ảnh gốc sẽ được chuẩn hóa về kích thước 512x512 Tiếp theo, bộ lọc K 1 với kích thước 3x3 sẽ được áp dụng nhằm tăng cường độ sáng cho bức ảnh.
Gọi A là ảnh sau khi chuẩn hóa kích thước B là ảnh sau khi được tăng cường được tính theo công thức sau:
Sau khi tăng cường độ sáng, ảnh sẽ được chuyển đổi thành ảnh xám C và tiến hành lọc trong miền tần số bằng bộ lọc thông cao Butterworth với tần số cắt D0.
Bộ lọc thông cao Butterworth có bậc 3 và tần số cắt 500 nhằm mục đích làm sắc nét hình ảnh trong miền tần số Kỹ thuật này giúp tăng cường các chi tiết nhỏ và làm nổi bật các cạnh trong ảnh, mang lại chất lượng hình ảnh tốt hơn Hàm truyền của bộ lọc thông cao Butterworth được thể hiện qua công thức cụ thể.
(4.3) với D(u, v) là khoảng cách Euclidean từ bất kỳ điểm (u,v) tới tâm của ảnh trong miền tần số, và D u,v u 2 v 2
Phân đoạn ảnh trích ROI
Để phân tích các đối tượng bị bệnh trên da trong ảnh, cần phân biệt chúng với nền ảnh Các đối tượng này có thể được xác định thông qua kỹ thuật phân đoạn ảnh, giúp tách phần tiền cảnh khỏi hậu cảnh Mỗi đối tượng tách ra được gọi là ROI, và ROI này có thể chứa những đặc trưng khác nhau như màu sắc, kết cấu, mức xám, tần số và moment Những đặc tính này tạo nên một véc tơ đặc trưng riêng cho từng đối tượng.
4 Phân Loại Bệnh Da Dùng Mạng Nơ Ron Nhiều Lớp Và Đặc Trưng GLCM
ROI giúp phân biệt các tổn thương da khác nhau thông qua mạng nơron Nghiên cứu này thực hiện quá trình tách ROI qua nhiều bước khác nhau.
Bước đầu tiên trong quá trình phân đoạn ảnh là áp dụng phương pháp Otsu để xác định ngưỡng phân chia, nhằm chuyển đổi ảnh thành ảnh nhị phân E Quá trình này giúp loại bỏ phần hậu cảnh, tức là phần da bình thường (màu đen trong ảnh nhị phân), và giữ lại phần da bệnh (biểu thị bằng màu trắng trong ảnh nhị phân).
Bước 2 trong quy trình xử lý ảnh là lọc ảnh nhị phân bằng phương pháp lọc trung vị để loại bỏ nhiễu muối tiêu Sau đó, ảnh được tiếp tục xử lý bằng bộ lọc Bottom-Hat nhằm loại bỏ các thành phần không phải là vùng ảnh da bệnh, như lông tay Kết quả sau khi áp dụng kỹ thuật Bottom-Hat được gọi là F, và công thức tính F sẽ được trình bày dưới đây.
F (4.4) với K 2 là phần tử cấu trúc dạng đĩa kích thước 7x7 với các hệ số như sau:
Bước 3: Ảnh tiếp tục được xói mòn để loại bỏ các vùng ảnh có diện tích nhỏ, sau đó tách biên ảnh dùng phương pháp Canny
Bước 4: Giãn nở ảnh đã tách biên để nối liền các biên bị đứt quãng như sử dụng công thức sau:
I (4.7) với K 3 là phần tử cấu trúc có dạng sau:
Sau đó tiến hành lấp đầy lỗ trống bên trong đường biên của ảnh nhị phân như phương trình:
Trong bài viết này, mỗi giá trị k tương ứng với vùng lắp đầy khác nhau, với k = 1, 2, 3, cho đến khi X k = X k-1 Đồng thời, I c là phần bù của ma trận ảnh I, và K 4 đại diện cho phần tử cấu trúc dạng cross.
Để trích xuất ROI, bước cuối cùng là xác định vùng có diện tích lớn nhất trong ảnh nhị phân đã được lấp đầy Việc này yêu cầu người dùng phân tích các vùng hiện có để tìm ra vùng có diện tích tối đa.
Kết quả phân đoạn ảnh tạo ra vùng ROI (Region of Interest) cho bệnh da, phục vụ cho việc trích xuất đặc trưng Mặc dù quá trình tiền xử lý và tách ROI có thể tốn nhiều thời gian, nhưng nó sẽ giúp giảm thiểu thời gian cần thiết cho việc huấn luyện mạng nơ ron trong phân loại ảnh bệnh da.
Lựa chọn các đặc trưng cho quá trình huấn luyện phân loại bệnh da
Hình 4.4 trình bày các giá trị của 11 đặc trưng được tính toán từ thuật toán GLCM trên 10 ảnh bệnh da loại Basal cell carcinoma Thông qua hình này, có thể nhận thấy rằng các giá trị của từng đặc trưng trong 11 đặc trưng có sự tương đồng khi so sánh các ảnh cùng loại bệnh da Điều này chứng tỏ rằng thuật toán GLCM là một phương pháp phù hợp để phân tích và so sánh các giá trị đặc trưng giữa các loại bệnh da khác nhau.
4 Phân Loại Bệnh Da Dùng Mạng Nơ Ron Nhiều Lớp Và Đặc Trưng GLCM
Hình 4.4 Mối quan hệ của các tham số đặc trưng
Bảng 4.1 và 4.2 trình bày ngưỡng giá trị Min-Max cho từng đặc trưng của 5 loại bệnh: Basal cell carcinoma, Benign keratosis, Dermatofibroma, Melanocytic nevus và Melanoma Những thông tin này là công cụ hữu ích trong việc nhận diện các đặc trưng tiêu biểu cho từng loại bệnh.
Hai đặc trưng Smoothness và IDM cho thấy giá trị Min và Max không thay đổi, lần lượt là 1.0 và 1.0 cho mỗi bệnh Tương tự, đặc trưng Correlation cũng có sự chênh lệch nhỏ giữa các giá trị Min (0.05) và Max gần bằng 0, do đó không thể dùng để phân biệt các bệnh Trong khi đó, hai cặp đặc trưng Mean và Variance, RMS và Contrast có sự tương đồng khi so sánh giữa các bệnh, vì vậy chỉ chọn một cặp trong số đó.
Đặc trưng chính trong phân tích là Mean và Contrast Nhóm 6 đặc trưng gồm Contrast, Energy, Homogeneity, Mean, Standard Deviation và Entropy cho thấy sự khác biệt rõ rệt khi so sánh giá trị Min và Max cho các bệnh, và có thể được áp dụng trong việc huấn luyện phân loại.
Bảng 4.1 Đặc trưng GLCM của các bệnh da khác nhau
Contrast Homogeneity Entropy Mean RMS Energy min max min max min max min max min max min max
Bảng 4.2 Đặc trưng GLCM của các bệnh da khác nhau
Varience Smoothness Correlation IDM min max min max min max min max min max
Hình 4.5 trình bày thống kê 6 đặc trưng của 5 loại bệnh da, cho thấy sự khác biệt giữa các đặc trưng và giữa các bệnh Biểu đồ cột trong hình 4.5 có trục tung thể hiện giá trị đặc trưng đã được chuẩn hóa trong khoảng [0,1] và trục hoành là các loại bệnh cần phân loại Cụ thể, hình 4.5a thể hiện độ tương phản trung bình của 5 loại bệnh da từ 100 ảnh mỗi loại Các hình tiếp theo lần lượt thể hiện giá trị trung bình entropy (Hình 4.5b), đồng nhất (Hình 4.5c), năng lượng (Hình 4.5d), giá trị Mean (Hình 4.5e) và độ lệch chuẩn (Hình 4.5f) Đặc biệt, bệnh Dermato-fibroma (số 3) có các giá trị Contrast, Entropy, Mean và Standard Deviation thấp nhất, trong khi hai đặc trưng Homogeneity và Energy lại cao nhất với giá trị lần lượt là 0.996 và 0.926 Dữ liệu từ hình 4.5 cũng cho thấy thông tin quan trọng về bệnh Melanocytic nevus.
4) đều có các giá trị đặc trưng ở mức cao thứ 2 trong tất cả 5 bệnh, kế đến là bệnh Basal cell carcinoma (số 1) Qua việc phân tích giá trị trung bình các đặc trưng của các bệnh, có thể thấy sự khác biệt giữa 5 tập dữ liệu ảnh bệnh là khá rõ ràng cho việc phân loại
(a) Biểu diễn giá trị trung bình Contrast của 5 tập ảnh bệnh da
4 Phân Loại Bệnh Da Dùng Mạng Nơ Ron Nhiều Lớp Và Đặc Trưng GLCM
(b) Biểu diễn giá trị trung bình Entropy của tập ảnh bệnh da
(c) Biểu diễn giá trị trung bình Homogeneity của tập ảnh bệnh da
(d) Biểu diễn giá trị trung bình Energy của tập ảnh bệnh da
(e) Biểu diễn giá trị trung bình Mean của tập ảnh bệnh da
(f) Biểu diễn giá trị trung bình Standard Devation của tập ảnh bệnh da
Hình 4.5 Biểu diễn những thống kê của 6 đặc trưng tiêu biểu của 5 tập ảnh bệnh da, mỗi tập 100 ảnh
Mô hình mạng Nơ ron
Nghiên cứu này chỉ ra rằng khi số lượng bệnh gia tăng, việc phân loại bệnh da với độ chính xác cao trở nên khó khăn hơn Do đó, tiền xử lý ảnh là cần thiết để cải thiện chất lượng hình ảnh trước khi phân đoạn vùng ROI, từ đó tối ưu hóa quá trình huấn luyện và phân loại bằng mạng thần kinh nhân tạo nhiều lớp (MLNNs) Các nghiên cứu trước đã chứng minh rằng MLNNs hoạt động hiệu quả trong chẩn đoán y tế, và nghiên cứu của chúng tôi sẽ áp dụng phương pháp này để phân loại bệnh da, hứa hẹn mang lại hiệu suất phân loại cao hơn nhờ vào các đặc trưng từ phần ROI của ảnh bệnh da.
MLNNs có khả năng xử lý các mối quan hệ phức tạp giữa các tham số và phân loại dựa trên dữ liệu đào tạo Thành công của hệ thống phân loại MLNNs phụ thuộc vào kiến trúc mô hình và thuật toán huấn luyện Mô hình trong nghiên cứu này bao gồm một lớp đầu vào với 6 nodes, 3 lớp ẩn mỗi lớp có 100 nodes, và một lớp đầu ra với 5 nodes Số lượng lớp ẩn cần được tối ưu để cải thiện kết quả phân loại, và quá trình xác định số lớp cũng như số node thường dựa trên phương pháp thử và sai Trong nghiên cứu này, hàm loss được chọn là MSE và hàm kích hoạt là Log-sigmoid để đảm bảo hiệu quả trong việc training và phân loại bệnh da.
4 Phân Loại Bệnh Da Dùng Mạng Nơ Ron Nhiều Lớp Và Đặc Trưng GLCM
Hình 4.6 Mô hình mạng nơ-ron nhiều lớp cho phân loại bệnh da
Trong các mạng nơ-ron đa lớp (MLNNs) sử dụng thuật toán lan truyền ngược, sai số bình phương trung bình (MSE) là hàm mất mát hồi quy phổ biến nhất MSE được tính bằng tổng bình phương của khoảng cách giữa giá trị mục tiêu và các giá trị dự đoán.
MSE n (4.12) với y i là ngõ ra mong muốn, và y i ˆ là ngõ ra dự đoán, n là số lượng ngõ ra
Trong mạng MLNNs, logsig là hàm truyền được tính toán ở ngõ ra của mỗi lớp để tính ngõ ra y với ngõ vào x:
Kết quả thực nghiệm
4.4.1 Dữ liệu ảnh bệnh da
Nghiên cứu này sử dụng dữ liệu từ ISIC 2018, với bộ ảnh chuẩn hóa gồm 10.000 hình ảnh cho 7 loại bệnh da khác nhau.
Nghiên cứu này phân tích 5 loại bệnh da, sử dụng 100 ảnh cho quá trình huấn luyện và 20 ảnh để kiểm tra, như thể hiện trong bảng 4.3 Để đánh giá hiệu quả phân loại, số lượng ảnh bệnh da trong các tập ảnh được giữ nguyên, đảm bảo tỷ lệ giữa tập ảnh huấn luyện và kiểm tra tương ứng với bảng 4.3.
Bảng 4.3 Thống kê 5 loại bệnh da
Benign keratosis Dermatofibroma Melanocytic nevus Melanoma
Trong nghiên cứu này, ảnh bệnh da được điều chỉnh kích thước thành 512x512 và được gán nhãn như mô tả trong Hình 4.7 Trước khi tách vùng ROI, nhiều phương pháp xử lý ảnh được áp dụng, bao gồm tăng cường ảnh để làm rõ khu vực nghi ngờ (Hình 4.8) và loại bỏ nhiễu bằng bộ lọc thông cao Butterworth Ảnh sau đó được chuyển đổi sang ảnh nhị phân, với vùng nghi bệnh da được thể hiện bằng màu đen (Hình 4.9) Tiếp theo, ảnh được xử lý để loại bỏ chi tiết không cần thiết bằng bộ lọc trung vị (Hình 4.10), loại bỏ lông da bằng thuật toán co ảnh (Hình 4.11) và giản ảnh để lấp đầy khu vực nghi bệnh (Hình 4.12) Để tách vùng ROI, ảnh nhị phân được dò biên bằng phương pháp Canny (Hình 4.14), sau đó làm rõ biên (Hình 4.15) và lấp đầy các vùng (Hình 4.16) Vùng ROI trong ảnh nhị phân được xác định dựa trên diện tích lớn nhất (Hình 4.17) và sau đó nhân với ảnh gốc đã tăng cường để thu được ROI thực từ ảnh gốc trước khi đưa vào hệ thống phân loại (Hình 4.18).
Hình 4.7 Ảnh được định kích cỡ 512x512
Hình 4.8 Ảnh sau khi tăng cường
Hình 4.9 Ảnh sau khi lọc dùng bộ lọc Butterworth
4 Phân Loại Bệnh Da Dùng Mạng Nơ Ron Nhiều Lớp Và Đặc Trưng GLCM
Hình 4.11.Ảnh sau khi lọc trung vị Hình 4.12 Ảnh sau khi loại bỏ lông Hình 4.13 Ảnh sau khi giãn nở Hình 4.14 Ảnh sau khi tách biên
Hình 4.15 Ảnh biên được giãn nở
Hình 4.16 Ảnh với các đối tượng được lấp đầy
Hình 4.17 Ảnh với đối tượng lớn nhất
Hình 4.18 Ảnh sau khi tách ROI
Tất cả các ảnh bệnh da cần được xử lý bằng các phương pháp xử lý hình ảnh để nâng cao độ chính xác trong phân loại Hình 4.19 minh họa các ảnh ROI được trích từ ảnh gốc của năm bệnh da tiêu biểu, bao gồm: Basal cell carcinoma, Benign keratosis, Dermatofibroma, Melanocytic nevus và Melanoma Việc tách ROI giữ lại hầu hết vùng da bệnh cần phân loại và loại bỏ các vùng không cần thiết là rất quan trọng, giúp chắt lọc thông tin trong ảnh, từ đó cải thiện tốc độ và độ chính xác trong việc tính toán các đặc trưng Các ảnh ROI này được trích đặc trưng bằng phương pháp GLCM, trong đó có 6 trên 11 đặc trưng được chọn làm tiêu biểu cho quá trình huấn luyện nhằm phân loại bệnh hiệu quả hơn.
(a0) Basal cell carcinoma (a1) Ảnh ROI (b0) Benign keratosis (b1) Ảnh ROI
(c0) Dermato-fibroma (c1) Ảnh ROI (d0) Melan-cytic nevus (d1) Ảnh ROI
Hình 4.19 Ảnh ROI được trích sau khi thực hiện các phương pháp xử lý ảnh
4.4.4 Kết quả phân loại sử dụng MLNNs
Mô hình mạng nơron được thiết lập với tốc độ học không đổi là 10 -4 và mục tiêu sai số là 7.10 -3 Hình 4.20 minh họa đường cong sai số trong quá trình huấn luyện, cho thấy sai số của mô hình giảm liên tục và đạt giá trị tốt nhất là 0.0068 sau 449 epochs Kết quả này chứng tỏ mô hình đã hội tụ hiệu quả với thời gian huấn luyện nhanh chóng.
Hình 4.20 Kết quả huấn luyện
Sau khi huấn luyện, mô hình được sử dụng để dự đoán kết quả phân loại 5 loại bệnh da, với 100 ảnh tương ứng cho từng loại Kết quả cho thấy độ chính xác chung là 92%, cụ thể là: Basal cell carcinoma (85%), Benign keratosis (95%), Dermatofibroma (100%), Melanocytic nevus (85%), và Melanoma (95%) Dermatofibroma đạt độ chính xác cao nhất với 95% nhờ vào 6 đặc trưng nổi bật, trong khi Basal cell carcinoma và Melanocytic nevus có độ chính xác thấp nhất, đều là 85%.
4 Phân Loại Bệnh Da Dùng Mạng Nơ Ron Nhiều Lớp Và Đặc Trưng GLCM
Basal cell carcinoma thường bị nhầm lẫn với bệnh keratosis lành tính, dẫn đến kết quả dự đoán không chính xác Đối với bệnh Melanocytic nevus, có 2 trong số 20 hình ảnh, chiếm 10% tổng số hình ảnh, cũng bị nhầm lẫn với basal cell carcinoma.
Hình 4.21 Ma trận nhầm lẫn khi test 20 ảnh / loại Bảng 4 4 So sánh độ chính xác khi phân loại 5 bệnh sử dụng các đặc trưng khác nhau
Nhóm đặc trưng Độ chính xác trung bình
Bảng 4.4 so sánh độ chính xác khi phân loại 5 bệnh da với các đặc trưng khác nhau Kết quả cho thấy mô hình huấn luyện sử dụng 6 đặc trưng gồm Contrast, Energy, Homogeneity, Mean, Standard Deviation, và Entropy đạt độ chính xác cao nhất, trong khi mô hình sử dụng tất cả các đặc trưng từ phương pháp GLCM có độ chính xác thấp nhất, chỉ đạt 71% Việc sử dụng 6 đặc trưng này cũng cho thấy khả năng dự đoán từng bệnh da tốt hơn so với các nhóm đặc trưng khác, chứng minh rằng nhóm 6 đặc trưng đã chọn có khả năng đại diện cho sự khác biệt cấu trúc của 5 loại bệnh da trong nghiên cứu.
Bảng 4.5 So sánh độ chính xác của mô hình đề xuất với các mô hình khác
Kỹ thuật tiền xử lý
Tập dữ liệu Cấu trúc mô hình Độ chính xác (%)
401 Nevus: 2837 Seborrheic keratosis: 746 Senile lentigo: 79
Melanoma: 1113 Melanocytic nevus: 6705 Basal cell carcinoma:
514 Vascular lesion: 142 Actinic keratosis: 327 Benign keratosis: 1099 Dermatofibroma: 115
100 Benign keratosis: 100 Dermatofibroma: 100 Melanocytic nevus: 100 Melanoma: 100
Kết quả từ Bảng 4.5 cho thấy phương pháp đề xuất đạt độ chính xác 92% với 5 loại bệnh, vượt trội hơn 2% so với phương pháp tốt nhất [38] và cao hơn khoảng 6% so với độ chính xác thấp nhất [34] Mô hình tự thiết kế trong bài báo này cũng cho thấy hiệu suất cao hơn so với các mô hình khác sử dụng mạng CNN [31] và FRCNN.
[34], Depthwise separable CNN [32] và SVM [38] Ngoài ra, việc sử dụng trích đặc trưng bằng GLCM và nhận dạng dùng MLNNs cho kết quả tốt hơn so với việc kết
4 Phân Loại Bệnh Da Dùng Mạng Nơ Ron Nhiều Lớp Và Đặc Trưng GLCM hợp GLCM và SVM [38] với số bệnh được phân loại nhiều hơn là 2 bệnh và độ chính xác cao hơn khoảng 3% Từ kết quả thu được, chúng tôi kết luận rằng mô hình của chúng tôi có thể trích xuất các đặc điểm phân biệt một cách hiệu quả và đạt được kết quả tốt hơn về độ chính xác Ngoài ra, phương pháp được trình bày ở đây có thời gian huấn luyện ít hơn so với các phương pháp sử dụng CNN, cụ thể là với mô hình đề xuất sẽ mất 25 minutes để tách ROI và trích đặc trưng từ 500 ảnh, 10s để huấn luyện dữ liệu đặc trưng này, so với thời gian huấn luyện là 25 minutes, 90 minutes, 70 minutes, and 230 minutes cho các mô hình AlexNet, VGG16, ResNet-18 and ResNet-
Mô hình đề xuất sử dụng tập dữ liệu ISIC trong nghiên cứu 101 cho thấy thời gian huấn luyện ngắn hơn nhờ vào cấu trúc đơn giản của mạng MLNNs, với ít thông số hơn.
4.4.5 Thí nghiệm với số lượng bệnh da khác nhau
Nhóm nghiên cứu đã phân loại ba loại bệnh da: dày sừng tiết bã lành tính, u da lành tính và ung thư tế bào hắc tố Sự khác biệt rõ rệt giữa các đặc trưng của ba bệnh này hỗ trợ quá trình học tập và kiểm tra, mang lại kết quả khả quan Tỉ lệ phần trăm đạt được trong học và kiểm tra lần lượt là 99,3% và 98,3%, như thể hiện trong hình 4.22.
Hình 4.22 Kết quả huấn luyện và kiểm tra tập ba loại bệnh da
Trường hợp phân loại bốn loại bệnh da
Quá trình huấn luyện và kiểm tra trên bốn bệnh lý, bao gồm dày sừng tiết bã lành tính, u da lành tính, nốt ruồi hắc tố và ung thư tế bào hắc tố, đạt tỷ lệ cao với 98.8% cho huấn luyện và 93.8% cho kiểm tra, như thể hiện trong hình 4.23.
Hình 4.23 Kết quả huấn luyện và kiểm tra tập bốn loại bệnh da
Trường hợp phân loại năm loại bệnh da
Quá trình huấn luyện trên tập năm bệnh cho kết quả rất cao (98.2%) và tỉ lệ kiểm tra cũng tương đối cao (92.0%) như hình 4.24
Hình 4.24 Kết quả huấn luyện và kiểm tra tập năm loại bệnh da
5 Kết Luận Và Hướng Phát Triển
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Kết luận
Đề tài nghiên cứu phương pháp phân loại chính xác cho 5 loại bệnh ngoài da, sử dụng bộ lọc và phân đoạn để tách hình ảnh ROI hiệu quả Bằng cách áp dụng GLCM, 6 đặc trưng tối ưu đã được trích xuất, giúp tiết kiệm thời gian huấn luyện cho mạng MLNNs Đặc biệt, việc lựa chọn 100 hình ảnh cho mỗi loại bệnh đã tạo ra sự cân bằng trong bộ dữ liệu, từ đó nâng cao hiệu suất phân loại.
Một mô hình mạng nơ-ron với 6 nút đầu vào, 5 nút đầu ra và 3 lớp ẩn, mỗi lớp chứa 100 nút, đã được áp dụng để đạt được độ chính xác cao trong việc phân loại 5 nhóm bệnh da Đề tài cũng tiến hành huấn luyện và phân loại cho các trường hợp 3, 4 và 5 bệnh nhằm kiểm tra tính hiệu quả của phương pháp đề xuất.
Hướng phát triển
Trong tương lai, đề tài này sẽ mở rộng việc thu thập dữ liệu từ nhiều nguồn khác nhau, không chỉ giới hạn ở tập ISIC 2018 mà còn bao gồm các tập ảnh thực tế từ bệnh viện Việc cải thiện và đa dạng hóa tập dữ liệu sẽ giúp huấn luyện mạng nơ ron hiệu quả hơn, từ đó giảm thiểu tỷ lệ phân loại sai và nâng cao độ chính xác.