Để chứng minh cho những lợi ích mà hệ hỗ trợ chẩn đoán mang lại, đề tài chọn dữ liệu bệnh Nám má để thử nghiệm và đánh giá Học máy hay máy học là một lĩnh vực trong ngành Trí tuệ nhân tạ
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu và thực hiện luận văn
thực sự của riêng tôi, dưới sự hướng dẫn của TS Hồ Văn Lâm Mọi tham khảo
từ các tài liệu, công trình nghiên cứu liên quan trong nước và quốc tế đều được trích dẫn rõ ràng trong luận văn Mọi sao chép không hợp lệ, vi phạm quy chế hay gian trá tôi xin hoàn toàn chịu trách nhiệm và chịu mọi kỷ luật của trường Đại học Quy Nhơn
Bình Định, ngày tháng năm 2022
Học viên
Nguyễn Ngọc Huấn
Trang 4LỜI CẢM ƠN
Trong quá trình thực hiện và hoàn thiện luận văn này, tôi xin gửi lời cảm
ơn chân thành nhất đến các thầy cô trong Khoa Công nghệ thông tin, khoa Toán
và Thống kê trường Đại học Quy Nhơn cũng như các thầy thính giảng ở các trường, các viện ở Hà Nội và thành phố Hồ Chí Minh đã cung cấp cho tôi những kiến thức quý báu trong suốt 2 năm học qua Đặc biệt cho tôi gửi lời cảm ơn
sâu sắc nhất tới TS Hồ Văn Lâm đã dành nhiều thời gian vô cùng quý báu để
định hướng và tận tình hướng dẫn tôi cũng như tạo mọi điều kiện thuận lợi để tôi có thể hoàn thành tốt nhất luận văn của mình
Tôi xin chân thành cảm ơn!
HỌC VIÊN THỰC HIỆN
Trang 6MỤC LỤC
LỜI CAM ĐOAN
LỜI CẢM ƠN
DANH MỤC TỪ VIẾT TẮT
DANH MỤC BẢNG, BIỂU
DANH MỤC CÁC BIỂU ĐỒ
DANH MỤC CÁC HÌNH ẢNH
MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Tính cấp thiết của đề tài 2
3.Đối tượng và phạm vi nghiên cứu 3
4 Bố cục luận văn 4
CHƯƠNG I: TỔNG QUAN 5
1.1Khái quát khả năng sử dụng dữ liệu cho bài toán chẩn đoán bệnh 5
1.1.1 Cơ sở thực hiện 5
1.1.2 Nguồn dữ liệu hình ảnh hỗ trợ chẩn đoán bệnh Nám má 5
1.1.3 Công nghệ hỗ trợ CĐHA y tế và vai trò của AI 6
1.2Tổng quan về học máy và trí tuệ nhân tạo 8
1.2.1 Tổng quan về học máy 8
1.2.2 Các ứng dụng của học máy 9
1.2.3 Tổng quan ứng dụng trí tuệ nhân tạo trong y khoa 10
1.3 Thuật toán rút trích đặt trưng và nhận dạng đối tượng trong hình ảnh 15
1.3.1 Khái quát về trích chọn đặc trưng ảnh và tìm kiếm theo đặc trưng ảnh 15
1.3.2 Đặc trưng nội dung ảnh và tìm kiếm theo đặc trưng nội dung 17
1.3.3 Các phương pháp trích chọn đặc trưng và độ đo tương đồng giữa các ảnh 21
1.4 Một số ứng dụng điển hình sử dụng dữ liệu hình ảnh trong chẩn đoán bệnh 28
Trang 71.4.1 Công nghệ trí tuệ nhân tạo trong y tế 28
1.4.2 Những thành tựu bước đầu tại Việt Nam 29
1.4.3 Ứng dụng “AI Trợ lý bác sĩ trong chẩn đoán hình ảnh” Error! Bookmark not defined. 1.4.4 Ứng dụng của trí tuệ nhân tạo trong chẩn đoán hình ảnh ung thư tuyến tụy 31
1.5 Tổng quan về bệnh nám má 32
1.5.1 Định nghĩa 32
1.5.2 Dịch tễ học 33
CHƯƠNG II: BÀI TOÁN CHẨN ĐOÁN BỆNH NÁM MÁ BẰNG HÌNH ẢNH 34
2.1 Phát biểu bài toán 34
2.1.1 Dữ liệu đầu vào 34
2.1.2 Kết quả đầu ra 36
2.2 Sử dụng yolo rút trích đặc trưng và nhận dạng hình ảnh 38
2.2.1 Giới thiệu chung YOLO 38
2.2.2 Mạng YOLO là gì? 38
2.2.3 Quá trình phát triển của YOLO 39
2.2.4 Kiến trúc mạng YOLO 41
2.2.5 Đầu ra của YOLO 44
2.2.6 Dự báo trên nhiều feature map 46
CHƯƠNG III: XÂY DỰNG MÔ HÌNH HỌC MÁY VÀ CÀI ĐẶT THỬ NGHIỆM 48
3.1 Mô tả dữ liệu hình ảnh 48
3.2 Xây dựng dữ liệu đầu vào 49
3.2.1 Huấn luyện mô hình 49
3.2.2 Gán nhãn dữ liệu 50
3.3 Xây dựng mô hình 51
Trang 83.3.1 Tìm hiểu về YOLO v5 51
3.3.2 Tổ chức thư mục 52
3.3.3 Chọn mô hình 53
3.3.4 Xây dựng mô hình YOLOv5 trên môi trường Colab 53
3.4 Đánh giá mô hình 57
3.4.1 Một thông số cho mô hình phát hiện đối tượng 57
3.5 Thực nghiệm 61
3.6 Sử dụng mô hình dự đoán một bức ảnh bất kỳ 62
KẾT LUẬN VÀ KIẾN NGHỊ 64 TÀI LIỆU THAM KHẢO
QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO)
Trang 9DANH MỤC BẢNG
Bảng 1.1 Một số phương pháp lựa chọn đặc trưng 26
Bảng 2.1 Các layer trong mạng darknet-53 43
DANH MỤC CÁC BIỂU ĐỒ Biểu đồ 2.1 So sánh một số thuật toán phiên bản YOLO 40
Biểu đồ 3.1 Tương quan giữa các tọa độ 56
Biểu đồ 3.2 Phân bố x,y, height, width 57
Biểu đồ 3.3 Đánh giá Precision 59
Biểu đồ 3.4 Đánh giá khả năng tìm kiếm toàn bộ các nhãn của mô hình 59
Biểu đồ 3.5 Đánh giá độ tin cậy của mô hình 60
Biểu đồ 3.6 Các thông số đánh giá mô hình 60
Trang 10DANH MỤC CÁC HÌNH
Hình 1.1 AI hỗ trợ các bác sĩ đọc hình ảnh y khoa 6
Hình 1.2 Artifical Intelligence 10
Hình 1.3 Ví dụ hiển thị một ảnh 16
Hình 1.4 Ví dụ truy vấn của Google 17
Hình 1.5 Ví dụ truy vấn của Google 17
Hình 1.6 Ví dụ về một số lọai kết cấu 18
Hình 1.7 Một kết quả trả về của Google Image Swirl 19
Hình 1.8 Một kết quả trả về của Tiltomo 20
Hình 1.9 Một kết quả trả về của Byo Image Search 20
Hình 1.10 Hình ảnh X-quang đầu tiên 28
Hình 1.11 VinDr hỗ trợ chẩn đoán ảnh X-quang cột sống với độ chính xác lên tới 90% 30
Hình 1.12 Ứng dụng AI trong mô phỏng và chuẩn đoán hình ảnh trong điều trị bệnh Error! Bookmark not defined. Hình 1.13 Đại diện lãnh đạo VinBrain, Vinmec và Bệnh viện Phổi TƯ trao bản ghi nhớ hợp tác và triển khai ứng dụng “AI Trợ lý bác sĩ trong chẩn đoán hình ảnh” Error! Bookmark not defined. Hình 1.14 Đánh giá tuyến tụy thường gặp khó khăn do tụy nằm sau phúc mạc và dạ dày 32
Hình 2.1 vị trí gán nhãn các thể nám má 35
Hình 2.2 Một số hình ảnh về gán nhãn 35
Hình 2.3 Tên và tọa độ của nhãn 36
Hình 2.4 Ảnh minh họa các thách thức của bài toán Phát hiện đối tượng 37
Hình 2.5 Kiến trức một đầu ra của mô hình YOLO 45
Hình 2.6 Các feature maps của mạng YOLOv3 46
Hình 3.1 Một số dữ liệu hình ảnh bệnh nhân 48
Trang 11Hình 3.2 Gán nhãn dữ liệu 50
Hình 3.3 Nội dung trong một file annotation 51
Hình 3.6 Kiến trúc của các mô hình YOLOv5 52
Hình 3.7 Tổ chức dữ liệu 53
Hình 3.8 Kiến trúc của các mô hình YOLOv5 53
Hình 3.9 Kết quả xây dựng mô hình 56
Hình 3.10 Tập dữ liệu val label 62
Hình 3.11 Tập dữ liệu val predict 62
Hình 3.12 Kết quả nhận diện của mô hình 63
Trang 12Hình ảnh y khoa được tạo ra từ các kỹ thuật tạo ảnh bên trong cơ thể người (bao gồm cả các mô sinh học), nhằm hỗ trợ phân tích lâm sàng hoặc can thiệp y tế Hiểu một cách đơn giản, hình ảnh y khoa là các hình ảnh sinh học được tạo ra với sự hỗ trợ của các công nghệ hình ảnh như X-quang, cắt lớp vi tính (CT), cộng hưởng từ (MRI), siêu âm (Ultrasound), nội soi (Endoscopy), ảnh nhiệt (Thermography) trên tia UV, hay các hình ảnh y học hạt nhân như chụp cắt lớp phát xạ positron (PET) và chụp cắt lớp vi tính phát xạ photon đơn (SPECT)
Trong lĩnh vực Y khoa ở Việt Nam, hiện nay các tuyến y tế phường, xã, vùng sâu, vùng xa còn thiếu nhân lực y tế có trình độ chuyên môn và thiếu các trang thiết bị cần thiết trong chẩn đoán bệnh Vì vậy xây dựng hệ hỗ trợ trong chẩn đoán rất cần thiết cho ngành y tết hiện nay ở Việt Nam Hệ hỗ trợ sẽ kết hợp với cán bộ y tế giúp chẩn đoán sớm một số bệnh phát hiện sớm được những bệnh nguy hiểm và giảm gánh nặng kinh tế cho gia đình bệnh nhân và cho xã hội Để chứng minh cho những lợi ích mà hệ hỗ trợ chẩn đoán mang lại, đề tài chọn dữ liệu bệnh Nám má để thử nghiệm và đánh giá
Học máy hay máy học là một lĩnh vực trong ngành Trí tuệ nhân tạo, là
kỹ thuật giúp cho máy tính có thể tự học mà không cần phải cài đặt các luật quyết định Thường một chương trình máy tính cần các quy tắc, luật lệ để có thể thực thi được một tác vụ nào đó nhưng với học máy, các máy tính có thể tự
Trang 13động thực thi tác vụ khi nhận dữ liệu đầu vào, hay nói cách khác máy tính có được cảm quan và suy nghĩ được như con người cũng có một cách tiếp cận khác về học máy là phương pháp vẽ các đường thể hiện mối quan hệ của tập
dữ liệu Từ các kiến thức chuyên gia của Bác sỹ, các nghiên cứu về bệnh Nám
má từ hình ảnh thu thập từ người bệnh điều trị tại bệnh viện, chúng tôi sử dụng một số mô hình phân tích hình ảnh để chỉ ra các đặc trưng trong dữ liệu hình ảnh về bệnh Nám má
Nám má (Melasma) là bệnh da tăng sắc tố mắc phải, có căn nguyên và
cơ chế bệnh sinh rất phức tạp Thương tổn cơ bản của bệnh là các dát hoặc các mảng màu nâu đen, đối xứng, ở vùng tiếp xúc với ánh sáng mặt trời Vị trí thường gặp là 2 má, môi trên, cằm và trán Bệnh tuy lành tính nhưng ảnh hưởng nhiều đến tâm lý và thẩm mỹ của người bệnh
Chị em phụ nữ hiểu biết rất ít về nám má, về các tổn thương liên quan đến nám má Hiện nay với thiết bị di động thông minh, các chị em phụ nữ có thể thông qua mô hình học máy để hổ trợ chẩn đoán bệnh nám má Vì vậy, em
thực hiện nghiên cứu: “Ứng dụng học máy trong việc chẩn đoán bệnh nám má
thông qua dữ liệu hình ảnh”
2 TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Đặc điểm địa lý
Khu vực Nam Trung bộ và Tây nguyên là khu vực thời gian nắng nhiều
và cường độ bức xạ mặt trời cao nhất cả nước dễ làm tăng tỷ lệ nám má ở phụ nữ
Thiếu thông tin và thiếu hiểu biết về chăm sóc bảo vệ da, quan điểm trắng là đẹp
Điều kiện kinh tế của phụ nữ Miền Trung - Tây Nguyên còn nhiều khó khăn; việc tin dùng các sản phẩm tẩy trắng da không an toàn quảng cáo tràn lan
để lại hậu quả nặng nề làm tăng thêm gánh nặng chi phí điều trị cho người bệnh…
Thực tế cho thấy số lượng bác sĩ chuyên khoa da liễu Thẩm mỹ của miền Trung- Tây nguyên còn rất ít, đặc biệt ở các tuyến Y tế cơ sở cộng với thói quen
Trang 14tin theo những điều trị không đúng chuyên môn làm xuất hiện nguy cơ chẩn đoán nhầm Nám má với các rối loạn tăng sắc tố khác, nguy cơ kéo dài thời gian
bị bệnh, nguy cơ tai biến do điều trị sai, nguy cơ tốn kém do các điều trị quảng cáo không đúng chuyên môn
Lợi ích của AI
Ứng dụng Trí tuệ nhân tạo dự đoán nguy cơ giúp phụ nữ dự đoán được nguy cơ mắc bệnh của bản thân đồng thời có thể khuyến cáo các biện pháp dự phòng nguy cơ mắc bệnh nám má Sau khi xác định được các yếu tố nguy cơ của người tham gia khảo sát có được sự tiếp cận nhanh chóng hơn với các phương pháp điều trị đúng chuyên khoa Đồng thời ứng dụng Trí tuệ nhân tạo
hỗ trợ chẩn đoán sớm nám má dựa trên ảnh chụp vùng mặt, cổ của người bệnh
sẽ giúp hỗ trợ chẩn đoán sớm, tiết kiệm chi phí cho người bệnh và hỗ trợ tư vấn điều trị chuyên khoa tránh các tai biến không đáng có
3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
- Dữ liệu hình ảnh bệnh nhân nám má
- Mô hình học máy cho bài toán chẩn đoán bệnh nám má
Phương pháp nghiên cứu
a) Phương pháp nghiên cứu lý luận: Thu thập, đọc hiểu, phân tích
thông tin, dữ liệu từ các giáo trình, sách, các bài báo liên quan đến thuật toán rút trích đặc trưng và nhận dạng đối tượng trong hình ảnh
b) Phương pháp nghiên cứu thực tiễn:
- Nghiên cứu lý thuyết: Đọc tài liệu, các bài báo, để tìm hiểu kế thừa, tổng
Trang 15hợp những nghiên cứu của các tác giả đi trước trong lĩnh vực nghiên cứu
- Nghiên cứu độc lập, tăng cường trao đổi khoa học với các nhóm nghiên
cứu quan tâm cùng vấn đề
- Thực nghiệm trên dữ liệu hình ảnh
4 BỐ CỤC LUẬN VĂN
Luận văn này được chia thành ba chương như sau:
Chương 1 Tổng quan
Giới thiệu tổng quan về khả năng sử dụng dữ liệu cho bài toán chẩn đoán
bệnh, sử dụng học máy, bài toán rút trích và nhận dạng hình ảnh, một số ứng
dụng nhận dạng hình ảnh trong Y khoa
Chương 2 Bài toán chẩn đoán bệnh nám má bằng hình ảnh
Trong chương này, luận văn tìm hiểu nội dung các yêu cầu, dữ liệu đầu
vào và kết quả đầu ra của bài toán chẩn đoán bệnh nám má thông qua dữ liệu
hình ảnh Tìm hiểu thuật toán rút trích đặc trưng và nhận dạng hình ảnh trong
mô hình học máy để giải quyết bài toán chẩn đoán các thể bệnh nám má trên
dữ liệu hình ảnh bệnh nhân
Chương 3 Xây dựng Mô hình học máy và Cài đặt thử nghiệm
Trình bày ý tưởng, phương pháp và kỹ thuật ứng dụng học máy vào việc
chẩn đoán bệnh nám má bằng hình ảnh, phân tích, đánh giá kết quả đạt được
so với phương pháp truyền thống vẫn đang được sử dụng phổ biến Cài đặt thử
nghiệm chương trình trên hệ thống thực và đánh giá kết quả đạt được
Trang 16và mắc nhiều biến chứng do bệnh nhân tự điều trị bằng các phương pháp không
an toàn và chăm sóc da không phù hợp Mỗi năm, Bệnh viện Phong- Da liễu
TW Quy Hòa khám, tư vấn và điều trị cho hơn 25.000 lượt bệnh nhân bị các rối loạn sắc tố da thẩm mỹ như Nám má, tàn nhang, dày sừng ánh sáng, dày sừng da dầu, tăng sắc tố sau viêm, bớt tăng sắc tố, sạm da Riehl…
Một trong những nguyên nhân gây nên tình trạng Nám má nặng, kháng trị làm gia tăng chi phí điều trị và hạn chế hiệu quả điều trị là do người bệnh thiếu thông tin hỗ trợ chẩn đoán và điều trị kịp thời, an toàn, phù hợp Chính vì vậy, cần phải có những phần mềm hỗ trợ chẩn đoán bệnh từ xa, tư vấn điều trị
an toàn, phù hợp để tiết kiệm chi phí, thời gian, tăng cường kiến thức dự phòng, tăng cường hiệu quả điều trị, phòng tránh tai biến cho người bệnh Nám má
1.1.2 Nguồn dữ liệu hình ảnh hỗ trợ chẩn đoán bệnh Nám má
Bệnh viện Phong- Da liễu TW Quy Hòa là cơ sở chuyên khoa Da liễu hàng đầu khu vực miền Trung- Tây nguyên, đã có nguồn tư liệu lớn ảnh chụp bệnh nhân rối loạn tăng sắc tố da vùng mặt bằng máy ảnh kỹ thuật số từ năm
2009 đến nay cùng với bộ dữ liệu nghiên cứu dự đoán khả năng bị bệnh Nám
má đây là một trong những thuận lợi lớn để tiếp cận đến công nghệ hỗ trợ trong việc dự đoán, chẩn đoán cũng như tư vấn điều trị bệnh Nám má tại Bệnh Viện
Trang 171.1.3 Công nghệ hỗ trợ CĐHA y tế và vai trò của AI
Trong y khoa, các hệ thống hỗ trợ phát hiện (computer-aided detection - CADe) và hỗ trợ chẩn đoán (computer-aided diagnosis - CADx) được thiết kế
để giúp bác sĩ đưa ra quyết định nhanh và chính xác hơn [13], [19] Cụ thể, các
hệ thống này cho phép phân tích và đánh giá các bất thường từ dữ liệu y khoa trong thời gian ngắn Chúng có thể giúp cải thiện chất lượng hình ảnh y khoa, làm nổi bật các cấu trúc bất thường bên trong cơ thể và thực hiện đo đạc các chỉ số lâm sàng [13] Các hệ thống CADe/x được xây dựng dựa trên các công nghệ lõi gồm xử lý hình ảnh, thị giác máy tính, và đặc biệt là AI
Hình 1.1 AI hỗ trợ các bác sĩ đọc hình ảnh y khoa
Trong 5 năm trở lại đây, sự bùng nổ của dữ liệu lớn và năng lực tính toán
đã giúp cho các mô hình AI đạt được những bước tiến vượt bậc Các đột phá trong nghiên cứu cơ bản và nghiên cứu ứng dụng về AI trong y tế liên tiếp được công bố và đưa vào triển khai thực tế Nói một cách vắn tắt, các mô hình AI có thể tham gia hỗ trợ bác sĩ trong toàn bộ quy trình khám chữa bệnh lâm sàng dựa trên hình ảnh y tế AI cho phép tạo ra các hình ảnh y khoa nhanh hơn, chất
Trang 18lượng hơn với giá thành rẻ hơn Việc phân tích, chẩn đoán bệnh và tự động xuất báo cáo… cũng đều có thể đảm nhiệm bởi các thuật toán AI Trong các tác vụ trên, AI được đã được ứng dụng rộng rãi nhất nhằm phục vụ chẩn đoán bệnh dựa trên hình ảnh [9], [4]
Năng lực của một hệ thống AI trong CĐHA y tế có thể chia làm 3 mức độ: (1) Detection: phát hiện các bất thường tiềm tàng từ hình ảnh, phân loại giữa các hình ảnh bệnh nhân mắc bệnh và bệnh nhân không mắc bệnh Chức năng này của AI giúp giải quyết các bài toán sàng lọc diện rộng hoặc tối ưu việc phân luồng bệnh nhân theo tính ưu tiên
(2) Characterization: đặc tả các tính chất của tổn thương, tiến hành khoanh vùng, phân loại mức độ nguy hiểm theo các tiêu chuẩn y khoa Ví dụ phân loại mức độ ung thư hoá của một tổn thương
(3) Monitoring: giám sát và đánh giá sự tiến triển của các tổn thương trên hình ảnh Theo dõi và đánh giá theo thời gian thực các tình huống khẩn cấp nguy hiểm tới tính mạng của người bệnh
Sự thiếu hụt nguồn lực y tế so với nhu cầu là một thực tế trên toàn thế giới hiện nay Theo thống kê, tại Nhật Bản chỉ có 36 bác sĩ CĐHA/triệu dân
Cả Liberia chỉ có 2 bác sĩ CĐHA và 14 quốc gia tại châu Phi không có bác sĩ CĐHA Ngay cả đối với những quốc gia phát triển nhất, sự thiếu hụt nguồn nhân lực cũng là một vấn đề nhức nhối Tại Anh, ước tính có hơn 300.000 hình ảnh X-quang phải chờ đến hơn 30 ngày trước khi được phân tích tại một thời điểm bất kỳ trong năm AI được coi là xu hướng tất yếu và là công cụ mạnh nhất giúp bù đắp những thiếu hụt này Một loạt các công cụ AI mới đã được phát triển và ứng dụng trong phân tích và chẩn đoán nhiều phương thức hình ảnh khác nhau như X-quang phổi, X-quang vú, CT/MRI sọ não Tại Mỹ, một
số phần mềm AI đã được Cục quản lý Thực phẩm và Dược phẩm Hoa Kỳ (FDA) cấp giấy phép hoạt động
Trang 19Qua tập dữ liệu hình ảnh và công nghệ AI hỗ trợ nhận diện đối tượng tổn thương của bệnh nám má sẽ giúp chúng ta đưa ra một giải pháp cụ thể để giải quyết bài toán hỗ trợ chẩn đoán bệnh nám má
1.2 TỔNG QUAN VỀ HỌC MÁY VÀ TRÍ TUỆ NHÂN TẠO
1.2.1 Tổng quan về học máy
Khái niệm: Học máy (Machine Learning) là một ngành khoa học nghiên
cứu các thuật toán cho phép máy tính có thể học được các khái niệm (concept) Học máy hay máy học là một lĩnh vực trong ngành Trí tuệ nhân tạo, là kỹ thuật giúp cho máy tính có thể tự học mà không cần phải cài đặt các luật quyết định Thường một chương trình máy tính cần các quy tắc, luật lệ để có thể thực thi được một tác vụ nào đó nhưng với học máy, các máy tính có thể tự động thực thi tác vụ khi nhận dữ liệu đầu vào, hay nói cách khác máy tính có được cảm quan và suy nghĩ được như con người cũng có một cách tiếp cận khác về học máy là phương pháp vẽ các đường thể hiện mối quan hệ của tập dữ liệu
Phân loại: Có hai loại phương pháp học máy chính
Phương pháp quy nạp: Máy học/phân biệt các khái niệm dựa trên dữ liệu
đã thu thập được trước đó Phương pháp này cho phép tận dụng được nguồn dữ liệu rất nhiều và sẵn có
Phương pháp suy diễn: Máy học/phân biệt các khái niệm dựa vào các luật Phương pháp này cho phép tận dụng được các kiến thức chuyên ngành để
Trang 20 Các phương pháp tính: các thuật toán học máy thường sử dụng các tính toán số thực/số nguyên trên dữ liệu rất lớn Trong đó, các bài toán như: tối
ưu có/không ràng buộc, giải phương trình tuyến tính v.v… được sử dụng rất phổ biến
Khoa học máy tính: là cơ sở để thiết kế các thuật toán, đồng thời đánh giá thời gian chạy, bộ nhớ của các thuật toán học máy
Các nhóm giải thuật học máy:
Học có giám sát: Máy tính được xem một số mẫu gồm đầu vào (input)
và đầu ra (output) tương ứng trước Sau khi học xong các mẫu này, máy tính quan sát một đầu vào mới và cho ra kết quả
Học không giám sát: Máy tính chỉ được xem các mẫu không có đầu
ra, sau đó máy tính phải tự tìm cách phân loại các mẫu này và các mẫu mới
Học nửa giám sát: Một dạng lai giữa hai nhóm giải thuật trên
Học tăng cường: Máy tính đưa ra quyết định hành động (action) và nhận kết quả phản hồi (response/reward) từ môi trường (environment) Sau đó máy tính tìm cách chỉnh sửa cách ra quyết định hành động của mình
1.2.2 Các ứng dụng của học máy
Ứng dụng: Học máy có ứng dụng rộng khắp trong các ngành khoa học/sản xuất, đặc biệt những ngành cần phân tích khối lượng dữ liệu khổng lồ Một số ứng dụng thường thấy
Xử lý ngôn ngữ tự nhiên (Natural Language Processing): xử lý văn bản, giao tiếp người – máy, …
Nhận dạng (Pattern Recognition): nhận dạng tiếng nói, chữ viết tay, vân tay, thị giác máy (Computer Vision) …
Tìm kiếm (Search Engine)
Chẩn đoán trong y tế: phân tích ảnh X-quang, các hệ chuyên gia chẩn đoán tự động
Trang 21 Tin sinh học: phân loại chuỗi gene, quá trình hình thành gene/protein
Vật lý: phân tích ảnh thiên văn, tác động giữa các hạt …
Phát hiện gian lận tài chính (financial fraud): gian lận thẻ tỉn dụng
Phân tích thị trường chứng khoán (stock market analysis)
Chơi trò chơi: tự động chơi cờ, hành động của các nhân vật ảo
Rôbốt: là tổng hợp của rất nhiều ngành khoa học, trong đó học máy tạo nên
hệ thần kinh/bộ não của người máy
1.2.3 Tổng quan ứng dụng trí tuệ nhân tạo trong y khoa
Thuật ngữ “Trí tuệ nhân tạo” (AI) lần đầu tiên được John McCarthy đặt
ra cho một hội nghị về chủ đề này được tổ chức tại Dartmouth vào năm 1956 với tên gọi “khoa học và kỹ thuật chế tạo máy thông minh”
Trí tuệ nhân tạo (AI: Artificial Intelligence) có thể được định nghĩa như một ngành của khoa học máy tính liên quan đến việc tự động hóa các hành vi thông minh AI là một bộ phận của khoa học máy tính và do đó nó phải được đặt trên những nguyên lý lý thuyết vững chắc, có khả năng ứng dụng được của lĩnh vực này Những nguyên lý này bao gồm các cấu trúc dữ liệu dùng cho biểu diễn tri thức, các thuật toán cần thiết để áp dụng những tri thức đó, cùng các ngôn ngữ và kỹ thuật lập trình dùng cho việc cài đặt chúng
Hình 1.2 Artifical Intelligence
Trang 22AI đang sẵn sàng đóng một vai trò ngày càng nổi bật trong y học và chăm sóc sức khỏe vì những tiến bộ của sức mạnh tính toán, thuật toán học máy và tính sẵn sàng của dữ liệu lớn (dữ liệu lớn) từ hồ sơ y tế và máy đeo theo dõi sức khỏe Thị trường chăm sóc sức khỏe sử dụng AI đang tăng với tốc độ 40% và
dự kiến đạt 6,6 tỷ đô la vào năm 2021 Sự phong phú về dữ liệu chăm sóc sức khỏe đang giúp thúc đẩy sự phát triển của các ứng dụng AI mới hứa hẹn cải thiện hiệu quả của việc chăm sóc bệnh nhân Dữ liệu lớn liên quan đến chăm sóc sức khỏe có sẵn từ các nguồn như Hồ sơ y tế điện tử (EMR) và thiết bị theo dõi sức khỏe, có thể được phân tích và xử lý và sử dụng theo những cách mới
Sự phát triển của AI trong kỷ nguyên dữ liệu lớn có thể hỗ trợ các bác sĩ nâng cao chất lượng chăm sóc bệnh nhân và cung cấp cho các bác sĩ X quang các công cụ để cải thiện độ chính xác và hiệu quả của chẩn đoán và điều trị AI rất phù hợp để xử lý các quy trình làm việc lặp đi lặp lại, quản lý lượng lớn dữ liệu
và có thể cung cấp một lớp các cách hỗ trợ ra quyết định để giảm thiểu lỗi
Các chuyên gia dự đoán AI sẽ có tác động đáng kể trong các lĩnh vực chăm sóc sức khỏe đa dạng như quản lý bệnh mãn tính và ra quyết định lâm sàng Mặc dù vẫn còn trong giai đoạn đầu của việc ứng dụng AI, các thuật toán
AI đang cho thấy nhiều hứa hẹn trong các chuyên ngành như X quang, giải phẫu bệnh, nhãn khoa và tim mạch
Theo King Jr (2018), X quang đã chứng kiến những bước tiến to lớn với
sự ra đời của siêu âm, Chụp cắt lớp vi tính (CT), Chụp cộng hưởng từ (MRI)
và Chụp cắt lớp phát xạ Positron (PET) [11] Tác giả tin rằng bước đột phá tiếp theo sẽ không phải đến từ một số công nghệ máy quét mới mà là do AI sử dụng
dữ liệu hình ảnh đã có sẵn từ các công nghệ hình ảnh như siêu âm, CT, MRI và PET Theo tác giả, AI trong X quang có khả năng xuất hiện trong các giai đoạn với giai đoạn ban đầu đã xuất hiện Trong giai đoạn đầu tiên này, hệ thống AI thực hiện phân đoạn tự động các cấu trúc khác nhau trong hình ảnh CT và MR
Trang 23Điều này sẽ giúp cô lập và xác định các tổn thương bệnh lý để phân tích và sẽ tiết kiệm đáng kể thời gian cho các bác sĩ X quang
Recht & Bryan thảo luận về tác động đối với bác sĩ X quang khi máy học / trí tuệ nhân tạo được tích hợp nhiều hơn vào thực hành lâm sàng [21] Theo các tác giả, AI sẽ trở thành một phần thường xuyên trong cuộc sống của các bác sĩ X quang và giúp công việc của họ hiệu quả và chính xác hơn Theo các tác giả, có khả năng trong vòng 10 năm tới các hình ảnh y tế sẽ được phân tích trước bởi một công cụ AI trước khi được bác sĩ X quang xem xét Công cụ này
sẽ thực hiện các tác vụ đọc thông thường như định lượng, phân đoạn và nhận dạng mẫu thuần túy
Bertalan Meskó đã gọi AI là “Ống nghe của thế kỷ 21” [12] Theo tác giả, cũng như việc cộng đồng y tế phải mất thời gian để chấp nhận ống nghe, thì cộng đồng y tế cũng sẽ mất thời gian để chấp nhận AI như một công cụ chính thức để chăm sóc sức khỏe Mặc dù vậy, Meskó dự đoán rằng AI sẽ chiếm
vị trí xứng đáng trong lĩnh vực chăm sóc sức khỏe với các máy tính có tri thức
sẽ giúp các bác sĩ đưa ra quyết định lâm sàng Để biến điều này thành hiện thực, Meskó khuyến cáo rằng các bác sĩ nên tìm hiểu cách AI hoạt động trong lĩnh vực chăm sóc sức khỏe, các công ty như IBM nên nâng cao nhận thức của công chúng về những lợi thế và rủi ro của việc sử dụng AI trong y tế và các tổ chức chăm sóc sức khỏe nên đo lường hiệu quả của hệ thống dựa trên AI
Tác giả Houssami và cộng sự, (2017) thảo luận về ứng dụng AI trong phát hiện ung thư vú (BC) Trong khi chụp nhũ ảnh sàng lọc BC có thể mang lại lợi ích về tỷ lệ tử vong thông qua việc phát hiện BC sớm, nó cũng có thể bỏ sót ung thư đang có hoặc có thể dẫn đến dương tính giả Để thử và cải thiện kết quả, các cuộc kiểm tra chụp nhũ ảnh chủ yếu tập trung vào hình ảnh bổ sung ở dạng kép thay vì đọc đơn và các màn hình thường xuyên hơn Hình ảnh bổ sung như vậy làm tăng chi tiêu tài nguyên Theo các tác giả, AI có thể hỗ trợ việc sàng lọc chụp nhũ ảnh trở nên hiệu quả hơn bằng cách học nâng cao sử dụng
Trang 24bộ dữ liệu lớn phức tạp và bằng cách thực hiện các tác vụ như giải thích hình ảnh Các tác giả kết luận rằng mặc dù AI rất hứa hẹn cho việc sàng lọc BC, nhưng để biến hứa hẹn này thành hiện thực đòi hỏi các bộ dữ liệu rất lớn về kiểm tra hình ảnh có liên quan đến các yếu tố lâm sàng để đào tạo các mô hình
AI [23]
Nhóm Roach năm 2017, xem xét một số ứng dụng của AI trong Nhãn khoa Ứng dụng hứa hẹn nhất là phát hiện các bệnh võng mạc mắt Tác giả báo cáo rằng các nhà nghiên cứu từ dự án Google Brain đã báo cáo vào năm 2016 rằng hệ thống AI học sâu đã tự học cách phát hiện chính xác bệnh võng mạc tiểu đường (DR) và phù hoàng điểm do tiểu đường trong các bức ảnh chụp đáy mắt [15] AI cũng đang được áp dụng cho các bệnh võng mạc khác như phù hoàng điểm do tuổi tác (AMD) Theo bài báo, các hệ thống dựa trên AI có khả năng được các bác sĩ nhãn khoa sử dụng như một công cụ khác trong bộ công
cụ của họ để chẩn đoán các bệnh về mắt và để cải thiện độ nhạy để phát hiện những bệnh nhân có nguy cơ bị bệnh hay không bị bệnh
Chất lượng của camera điện thoại đang tăng lên hàng năm và có thể tạo
ra những hình ảnh khả thi để phân tích bằng các thuật toán trí tuệ nhân tạo Da liễu và nhãn khoa là những ngành sớm được hưởng lợi từ xu hướng này
Các nhà nghiên cứu ở Vương quốc Anh thậm chí đã phát triển một công
cụ xác định các bệnh phát triển bằng cách phân tích hình ảnh khuôn mặt của một đứa trẻ Thuật toán có thể phát hiện các đặc điểm riêng biệt, chẳng hạn như đường hàm, vị trí mắt và mũi của trẻ và các thuộc tính khác có thể chỉ ra sự bất thường về sọ mặt Hiện tại, công cụ này có thể so khớp các hình ảnh thông thường với hơn 90 chứng rối loạn để hỗ trợ quyết định lâm sàng
Trong điện thoại di động, các nhà sản xuất tin rằng họ có thể sử dụng dữ liệu đó với AI để cung cấp các dịch vụ được cá nhân hóa, nhanh hơn và thông minh hơn nhiều
Trang 25Sử dụng điện thoại thông minh để thu thập hình ảnh về mắt, tổn thương
da, vết thương, nhiễm trùng, thuốc men hoặc các đối tượng khác có thể giúp các khu vực không được phục vụ kịp thời đối phó với tình trạng thiếu bác sĩ chuyên khoa đồng thời có thể giúp giảm thời gian chẩn đoán
Da liễu TP HCM từ 01/09/2013 đến 28/02/2014: nám má chiếm 52,8% các rối loạn tăng sắc tố da ở bệnh nhân đến khám và điều trị tại đơn vị Điều trị thẩm
mỹ da bệnh viện Da liễu TP Hồ Chí Minh; 60,9% người tăng sắc tố da vùng mặt không có tiền sử gia đình mắc bệnh tăng sắc tố da vùng mặt[1]
Tại Nghị quyết số 23/NQ-TW ngày 22/3/2018 về “ Định hướng xây dựng chính sách phát triển công nghiệp quốc gia đến năm 2030 và tầm nhìn đến năm 2045”, Bộ Chính trị đã chỉ đạo nghiên cứu xây dựng và triển khai Chiến lược tiếp cận và chủ động tham gia cuộc Cách mạng công nghiệp lần thứ tư của Việt Nam, Chiến lược chuyển đổi số quốc gia và nhiều cơ chế, chính sách và giải pháp phát triển phù hợp với điều kiện Cách mạng công nghiệp lần thứ tư [2]; Thủ tướng Chính phủ đã ban hành Chỉ thị số 16- CT/TTg ngày 4/5/2017 về tăng cường năng lực tiếp cận cuộc Cách mạng công nghiệp lần thứ tư [5] Trên
cơ sở đó, Bộ Y tế đã phê duyệt triển khai Đề án “Ứng dụng và phát triển công nghệ thông tin y tế thông minh giai đoạn 2019-2025” (Ban hành kèm theo Quyết định số 4888/QĐ-BYT ngày 18/10/2019 của Bộ trưởng Bộ Y tế).Trong
đó, “Ứng dụng trí tuệ nhân tạo trong các cơ sở khám bệnh, chữa bệnh” là một
Trang 26nhiệm vụ ưu tiên trong 7 nhiệm vụ xây dựng hệ thống phòng bệnh và chăm sóc sức khỏe thông minh thuộc Đề án này [3]
1.3 THUẬT TOÁN RÚT TRÍCH ĐẶT TRƯNG VÀ NHẬN DẠNG ĐỐI TƯỢNG TRONG HÌNH ẢNH
1.3.1 Khái quát về trích chọn đặc trưng ảnh và tìm kiếm theo đặc trưng ảnh
1.3.1.1 Đặc trưng văn bản đi kèm ảnh và tìm kiếm ảnh theo văn bản đi kèm ảnh
Mỗi ảnh trên web thường có các văn bản đi kèm như là tên ảnh (title), các thẻ (tags), bình luận (comment) để mô tả các thông tin về ảnh, đây là các siêu dữ liệu (metadata) về ảnh Các dữ liệu này thường do người dùng tạo ảnh gắn cho mỗi ảnh, vì vậy chúng đều mang một ý nghĩa nhất định Độ quan trọng của các loại siêu dữ liệu khác nhau cũng khác nhau Ví dụ, các thẻ thường quan trọng hơn tên ảnh, tên ảnh quan trọng hơn bình luận Dưới đây là một ví dụ về văn bản đi kèm một ảnh:
Title: “Red_Rose Flower”
Tags: “redRoseflower, hongkongflowershow, 2009, bokeh,
causewaybay, hongkong, jonnoj, jonbinalay, nikond80,
interestingness50”
Description: “HEAVEN SCENT" FOR THE LOVE OF THE RED RED ROSE
Content:
Trang 28Mặt khác, các albumn cá nhân thường không có các thẻ hoặc văn bản đi kèm ảnh Cùng với số lượng ảnh số được chụp thêm mỗi ngày, việc gán thủ công các thẻ cho ảnh rất tốn kém Một hướng nghiên cứu nhằm khắc phục vấn
đề trên là tìm kiếm theo chính các đặc trưng trích xuất từ nội dung của ảnh
1.3.2 Đặc trưng nội dung ảnh và tìm kiếm theo đặc trưng nội dung
Tìm kiếm ảnh theo nội dung (Content Based Images Retrieval CBIR) hay truy vấn theo nội dung ảnh (Query Based Image Content QBIC) là một ứng dụng của thị giác máy tính đối với bài toán tìm kiếm ảnh [33] “Dựa vào nội dung ảnh (Content- Based) ” nghĩa là việc tìm kiếm sẽ phân tích nội dung thực
sự của các bức ảnh Nội dung ảnh ở đây được thể hiện bằng màu sắc, hình dạng, kết cấu (texture), các đặc trưng cục bộ (local features), hay bất cứ thông tin nào có từ chính nội dung ảnh Cụm từ CBIR được T.Kato đưa ra vào năm 1992 trong quá trình thu thập ảnh một cách tự động từ cơ sở dữ liệu dựa trên biểu diễn màu sắc và hình dạng của ảnh Tee Cheng Siew đã giới thiệu một số đặc trưng nội dung ảnh [26]:
• Đặc trưng màu sắc: Màu sắc là một đặc trưng nổi bật và được sử dụng phổ biến nhất trong tìm kiếm ảnh theo nội dung Mỗi một điểm ảnh (thông tin màu sắc) có thể được biểu diễn như một điểm trong không gian màu sắc ba chiều Các không gian màu sắc thường dùng là: RGB, Munsell, CIE, HSV Tìm kiếm ảnh theo màu sắc tiến hành tính toán biểu đồ màu cho mỗi ảnh để xác
Hình 1.4 Ví dụ truy vấn của Google
Kết quả với truy vấn “d-80”
Hình 1.5 Ví dụ truy vấn của Google Kết quả với truy vấn “Apple”
Trang 29định tỉ trọng các điểm ảnh của ảnh mà chứa các giá trị đặc biệt (màu sắc) Các nghiên cứu gần đây đang cố gắng phân vùng ảnh theo các màu sắc khác nhau
và tìm mỗi quan hệ giữa các vùng này
• Đặc trưng kết cấu: Trích xuất nội dung ảnh theo kết cấu nhằm tìm ra
mô hình trực quan của ảnh và cách thức chúng được xác định trong không gian Kết cấu được biểu diễn bởi các texel mà sau đó được đặt vào một số các tập phụ thuộc vào số kết cấu được phát hiện trong ảnh Các tập này không chỉ xác định các kết cấu mà còn chỉ rõ vị trí các kết cấu trong ảnh Việc xác định các kết cấu đặc biệt trong ảnh đạt được chủ yếu bằng cách mô hình các kết cấu như những biến thể cấp độ xám 2 chiều Ví dụ về một số loại kết cấu
Hình 1.6 Ví dụ về một số lọai kết cấu
• Đặc trưng hình dạng: Hình dạng của một ảnh hay một vùng là một đặc trưng quan trong trong việc xác định và phân biệt ảnh trong nhận dạng mẫu Mục tiêu chính của biểu diễn hình dạng trong nhận dạng mẫu là đo thuộc tính hình học của một đối tượng được dùng trong phân lớp, so sánh và nhận dạng đối tượng
Trang 30Thực tế, đã có nhiều máy tìm kiếm cho phép tìm kiếm ảnh theo nội dung ảnh, tuy nhiên, các máy tìm kiếm này thường chỉ khai thác vào một phần nội dung của ảnh
• Google Image Swirl: Là một thử nghiệm tìm kiếm hình ảnh theo nội dung của Google, trong đó, kết quả tìm kiếm được sẽ được tổ chức lại dựa vào hiển thị trực quan và độ tương đồng ngữ nghĩa giữa các ảnh Google Image Swril phân cụm tốp đầu các kết quả trả về cho trên 200.000 câu truy vấn và cho phép hiển thị hình ảnh dưới dạng các cụm và mối quan hệ giữa các ảnh
Hình 1.7 Một kết quả trả về của Google Image Swirl
• Tiltomo: Là một công cụ dựa trên Flickr và duy trì chính cơ sở dữ liệu ảnh của Flickr Nó cho phép tìm kiếm ảnh dựa vào độ tương đồng về chủ đề, màu sắc hay kết cấu
Trang 31Hình 1.8 Một kết quả trả về của Tiltomo
• Byo Image Search: Tìm kiếm ảnh theo độ tương đồng về màu sắc với mẫu ảnh mà người dùng tải lên từ máy tính hoặc từ một địa chỉ URL Công cụ tìm kiếm này không hỗ trợ tính năng tìm kiếm ảnh dựa vào độ tương đồng về chủ
đề
Hình 1.9 Một kết quả trả về của Byo Image Search Tìm kiếm ảnh theo mẫu (example-based image search): Tìm kiếm
ảnh theo mẫu là một dạng của tìm kiếm ảnh dựa vào nội dung Trong hệ thống
đó, đầu vào là một ảnh, hệ thống tìm kiếm và trả lại cho người dùng những ảnh tương đồng với ảnh mẫu
Trong nội khóa luận này, chúng tôi tập trung vào bài toán tìm kiếm ảnh dựa theo mẫu, tìm hiểu các phương pháp trích chọn đặc trưng nội dung cũng
Trang 32như các độ đo tương đồng để tìm kiếm tập ảnh sản phẩm gần với ảnh mẫu nhất trong tập cơ sở dữ liệu các ảnh sản phẩm
1.3.3 Các phương pháp trích chọn đặc trưng và độ đo tương đồng giữa các ảnh
1.3.3.1 Đặc trưng màu sắc
1.3.3.1.1 Đặc trưng màu sắc
Tìm kiếm ảnh theo lược đồ màu là phương pháp phổ biến và được sử dụng nhiều nhất trong các hệ thống tìm kiếm ảnh theo nội dung Đây là phương pháp đơn giản, tốc độ tìm kiếm tương đối nhanh tuy nhiên kết quả tìm kiếm có
độ chính xác không cao Đây có thể xem là bước lọc đầu tiên cho những bước tìm kiếm sau Một số lược đồ màu được sử dụng như: lược đồ màu RGB, lược
đồ màu HSI, lược đồ HSI cải tiến Trong đó, lược đồ màu RGB được sử dụng phổ biến nhất [22], [16]
Lược đồ màu RGB:
Đối với ảnh 256 màu, lược đồ màu của ảnh tương đương với lược đồ màu của ảnh xám Đối với ảnh 24 bit màu, lược đồ miêu tả khả năng kết nối về cường độ của ba kênh màu R, G, B Luợc đồ màu này được định nghĩa như sau:
h R G,B [r, g,b] = N * Pr ob {R = r, G = g, B = b} (1)
Trong đó N là số lượng điểm có trong ảnh
Lược đồ màu này được tính bằng cách rời rạc hóa từng màu trong ảnh, sau đó đếm số điểm ảnh của mỗi màu Khi mà số lượng màu là có hạng, để thuận tiện hơn, người ta thường chuyển đổi ba kênh màu thành một biến giá trị duy nhất Một cách khác để tính lược đồ màu của ảnh RGB là ta phân ra làm 3
lượt đồ riêng biệt hR[], hG[], hB[] Khi đó, mỗi lược đồ được tính bằng cách
đếm kênh màu tương ứng trong mỗi điểm ảnh
1.3.3.1.2 Độ đo tương đồng về màu sắc
Một số độ đo tương đồng được sử dụng như: Độ đo khoảng cách Ơclit,
Trang 33độ đo Jensen-Shannon divergence (JSD)
Gọi h(I) và h(M) tương ứng là 2 lượt đồ màu của hai ảnh I và ảnh M Khi
đó các loại độ đo màu được định nghĩa là một số nguyên (hoặc số thực) theo các loại độ đo tương ứng như sau:
Khoảng cách Ơclit:
Đây là khoảng cách Ơclit thông thường giữa các K bin:
Inter sec tion(h(I), h(M)) = XA/(h(I) - h(M))2 (2)
j=i
Hoặc:
Inter sec tion(h(I), h(M)) = Ih(I) - h(M)| (3)
j=1
Độ đo Jensen-Shannon divergence (JSD) :
Độ đo Jensen-Shannon divergence sử dụng lược độ màu RGB để tính toán
độ tương đồng về màu sắc giữa 2 ảnh :
M 2 H 2 H ' djSD (H, H ') =£Hm log 2H- + Hm log - (4)
m=1 H m + H m H m + H m Trong đó : H và H' là 2 biểu đồ màu được so sánh, Hmlà bin thứ m của biểu
Kết cấu cung cấp thông tin về sự sắp xếp về mặt không gian của màu sắc
và cường độ một ảnh Kết cấu được đặc trưng bởi sự phân bổ không gian của những mức cường độ trong một khu vực láng giềng với nhau Kết cấu gồm các kết cấu gốc hay nhiều kết cấu gộp lại đôi khi gọi là texel
Trang 34Một số phương pháp dùng để trích xuất các đặc trưng kết cấu như [22]:
Kim tự tháp "có thể lái được" (the steerable pyramid)
Biến đổi đường viền (the cotourlet transform)
Biến đổi sóng Gabor (The Gabor Wavelet transform)
Biểu diễn ma trận đồng hiện (co-occurrence matrix)
Hệ thống bộ lọc định hướng phức tạp (The complex directional fillter bank)
1.3.3.1.4 Độ đo tương đồng cho kết cấu ảnh
Để đo độ tương đồng theo kết cấu giữa các ảnh, người ta thường sử dụng
độ đo Ơclit Kết cấu được trích xuất từ các bức ảnh sẽ được biểu diễn thành các vector nhiều chiều và khoảng cách Ơclit được dùng để đo độ tương đồng giữa các đặc trưng của ảnh truy vấn với đặc trưng của ảnh trong cơ sở dữ liệu 1.3.3.1.5 Đặc trưng hình dạng
Màu sắc và kết cấu là những thuộc tính có khái niệm toàn cục trong một ảnh Trong khi đó, hình dạng không phải là một thuộc tính của ảnh Nói tới hình dạng không phải là nhắc đến hình dạng của một ảnh Thay vì vậy, hình dạng có khuynh hướng chỉ đến một khu vực đặc biệt trong ảnh, hay hình dạng chỉ là biên của một đối tượng nào đó trong ảnh
Trong tìm kiếm ảnh theo nội dung, hình dạng là một cấp cao hơn so với màu sắc và kết cấu Nó đòi hỏi sự phân biệt giữa các vùng để tiến hành xử lý
về độ đo của hình dạng Các hệ thống tìm kiếm ảnh theo nội dung thường khai thác hai nhóm biểu diễn hình dạng sau :
Biểu diễn hình dạng theo đường biên (cotour-based descriptor) : Biểu diễn các đường biên bao bên ngoài
Biểu diễn theo vùng (region-based descriptor): Biểu diễn một vùng toàn vẹn
Trang 351.3.3.1.6 Độ đo tương đồng cho hình dạng
Độ đo về hình dạng rất nhiều trong phạm vi lý thuyết của bộ môn xử lý ảnh Chúng trải rộng từ những độ đo toàn cục dạng thô với sự trợ giúp của việc nhận dạng đối tượng, cho tới những độ đo chi tiết tự động tìm kiếm những hình dạng đặc biệt Lược đồ hình dạng là một ví dụ của độ đo đơn giản Kỹ thuật dùng đường biên hiệu quả hơn phương pháp trước, chúng tìm kiếm những hình dạng đối tượng gần giống với đường biên nhất Phương pháp vẽ phác họa
là phương pháp có nhiều đặc trưng rõ ràng hơn, không chỉ tìm kiếm những đường biên đối tượng đơn, mà còn đối với tập những đối tượng đã được phân đoạn trong một ảnh mà người dùng vẽ hay cung cấp
1.3.3.1.7 Đặc trưng cục bộ bất biến
Người ta thường chia đặc trưng cụ bộ thành 2 loại là những điểm trích xuất được từ điểm "nhô ra" (salient points) của ảnh và đặc trưng SIFT được trích chọn từ các điểm hấp dẫn Haris (interest points) Trong phần này, chúng tôi sẽ trình bày chi tiết về việc trích chọn các đặc trưng cục bộ bất biến (Scale Invariant Feature Transform SIFT) của ảnh
Phần này trình bày phương pháp trích rút các đặc trưng cục bộ bất biến SIFT của ảnh Các đặc trưng này bất biến với việc thay đổi tỉ lệ ảnh, quay ảnh, đôi khi là thay đổi điểm nhìn và thêm nhiễu ảnh hay thay đổi cường độ chiếu sáng của ảnh Phương pháp được lựa chọn có tên là Scale-Invariant Feature Transform (SIFT) và đặc trưng trích rút đựợc gọi là đặc trưng SIFT (SIFT Feature) Các đặc trưng SIFT này được trích rút ra từ các điểm hấp dẫn cục bộ (Local Interest Point) [14], [17], [13]
Điểm hấp dẫn (Interest Point (Keypoint)): Là vị trí (điểm ảnh) "hấp
dẫn" trên ảnh "Hấp dẫn" ở đây có nghĩa là điểm đó có thể có các đặc trưng bất biến với việc quay ảnh, co giãn ảnh hay thay đổi cường độ chiếu sáng của ảnh
Trang 36Phương pháp trích rút các đặc trưng bất biến SIFT được tiếp cận theo phương pháp thác lọc, theo đó phương pháp được thực hiện lần lượt theo các bước sau:
Phát hiện các điểm cực trị Scale-Space (Scale-Space extrema detection):
Bước đầu tiên này tiến hành tìm kiếm các điểm hấp dẫn trên tất cả các tỉ
lệ và vị trí của ảnh Nó sử dụng hàm different-of-Gaussian để xác định tất cả các điểm hấp dẫn tiềm năng mà bất biến với quy mô và hướng của ảnh
Định vị các điểm hấp dẫn (keypoint localization) : Một hàm kiểm tra
sẽ được đưa ra để quyết định xem các điểm hấp dẫn tiềm năng có được lựa chọn hay không?
Xác định hướng cho các điểm hấp dẫn (Orientation assignment): Xác
định hướng cho các điểm hấp dẫn được chọn
Mô tả các điểm hấp dẫn (Keypoint descriptor): Các điểm hấp dẫn sau
khi được xác định hướng sẽ được mô tả dưới dạng các vector đặc trưng nhiều chiều
Với H, H' là 2 biểu đồ biểu diễn các vector đặc trưng SIFT
1.3.3.2 Lựa chọn đặc trưng
Sau khi trích chọn được các đặc trưng nội dung của ảnh, tập các đặc trưng
có thể được tối ưu hóa bằng các phương pháp lựa chọn đặc trưng để tăng chất lượng và hiệu quả khi sử dụng các tập đặc trưng
Một cách tổng quát, lựa chọn đặc trưng là phương pháp giảm thiểu các đặc trưng nhằm chọn ra một tập con các đặc trưng phù hợp trong học máy để xây dựng mô hình học tốt nhất Mục đích của lựa chọn đặc trưng là tìm ra không gian con các đặc trưng tối ưu sao cho các tập ảnh “thích hợp” và “không thích hợp” được tách biệt nhất
Có nhiều phương pháp lựa chọn đặc trưng được đề xuất như: phương pháp tăng khuyếch đại (boosting manner) kết hợp với nền tảng Real Adaboost
Trang 37của Wei Jian và Guihua Er [30] Mingjing Li [29] đưa ra tiêu chí lựa chọn các đặc trưng là: Mô hình tương phản đặc trưng được tổng quát hóa (Generalized Feature Contrast Model) dựa trên mô hình tương phản đặc trưng (Feature Contrast Model) Một số phương pháp cổ điển khác như phương pháp dựa vào phân phối (distribution based) Phương pháp dựa vào phân tích biệt thức (Discriminant analysis DA) ví dụ như Phân tích đa biệt thức (Mutiple Discriminant analysis MDA)), phân tích biệt thức không đối xứng (biased Discriminant analysis BDA) Phương pháp tối đa khoảng cách tối thiểu đối xứng trong không gian con (symmetric maximized minimal distance in subspace SMMS)
Bảng 1.1 Một số phương pháp lựa chọn đặc trưng
Trang 38Phương pháp MDA giả thiết rằng mỗi ảnh
“không thích hợp” đến từ một lớp khác nhau Phương pháp BDA giả thiết rằng mỗi ảnh
“không thích hợp” đến từ một số không xác định các lớp SMMS lựa chọn không gian đặc trưng con trực giao với không gian con kéo dài bằng các mẫu “thích hợp”
đại (Boosting manner)
Tăng các đặc trưng được học thành phân lớp toàn bộ giảm lỗi huấn luyện
Có nhiều phương pháp để đánh giá kết quả của tập con đặc trưng Vì vậy, kết quả đối với những mô hình lựa chọn đặc trưng khác nhau là khác nhau Hai
mô hình phổ biến cho lựa chọn đặc trưng là: Mô hình Filter và mô hình Wrapper
Mô hình Filter: đánh giá mỗi phần tử bằng một vài tiêu chuẩn hay độ đo nào đó, rồi chọn ra tập con các thuộc tính được đánh giá cao nhất
Mô hình Wrapper: Sử dụng một thuật toán tìm kiếm để đánh giá tập con các thuộc tính coi như là một nhóm hơn là một phần tử riêng lẻ Cốt lõi của mô hình Wrapper là một thuật toán học máy cụ thể Nó đánh giá độ tốt của những tập con đặc trưng tùy theo độ chính xác học của tập con, điều này xác định thông qua một tiêu chí nào đó
Trang 391.4 MỘT SỐ ỨNG DỤNG ĐIỂN HÌNH SỬ DỤNG DỮ LIỆU HÌNH ẢNH TRONG CHẨN ĐOÁN BỆNH
1.4.1 Công nghệ trí tuệ nhân tạo trong y tế
Dữ liệu lớn (Big Data) và công nghệ trí tuệ nhân tạo (AI) đang tạo ra những đột phá rộng khắp trên mọi lĩnh vực Ứng dụng AI và khai thác dữ liệu
y tế trong hỗ trợ chẩn đoán bệnh và xây dựng nền y tế thông minh đã trở thành vấn đề cốt lõi trong lộ trình phát triển y tế của mọi quốc gia, trong đó có Việt Nam
Hình ảnh y khoa được tạo ra từ các kỹ thuật tạo ảnh bên trong cơ thể người (bao gồm cả các mô sinh học), nhằm hỗ trợ phân tích lâm sàng hoặc can thiệp y tế Hiểu một cách đơn giản, hình ảnh y khoa là các hình ảnh sinh học được tạo ra với sự hỗ trợ của các công nghệ hình ảnh như X-quang, cắt lớp vi tính (CT), cộng hưởng từ (MRI), siêu âm (Ultrasound), nội soi (Endoscopy), ảnh nhiệt (Thermography), hay các hình ảnh y học hạt nhân như chụp cắt lớp phát xạ positron (PET) và chụp cắt lớp vi tính phát xạ photon đơn (SPECT)
Hình 1.10 Hình ảnh X-quang đầu tiên
Hình ảnh X-quang đầu tiên trong lịch sử y học thế giới được chụp năm
1895 bởi nhà vật lý học người Đức Wilhelm Röntgen, người sau đó được trao giải Nobel Vật lý năm 1901 Kể từ đó, hình ảnh X-quang nhanh chóng được