GIỚI THIỆU
GIỚI THIỆU ĐỀ TÀI
Ngày nay, hình ảnh đóng vai trò quan trọng trong việc trao đổi thông tin, nhưng một bức ảnh thường không thể truyền tải đầy đủ nội dung do bị ảnh hưởng bởi nhiều yếu tố như màu sắc, độ bóng và độ sáng Do đó, việc nghiên cứu và phát triển lĩnh vực xử lý ảnh (Image Processing) là cần thiết để cải thiện chất lượng hình ảnh, đặc biệt trong y tế Trong lĩnh vực này, việc xử lý ảnh y khoa giúp làm rõ các đường biên và cải thiện độ nét, từ đó hỗ trợ bác sĩ trong việc chẩn đoán chính xác hơn Điều này đặc biệt quan trọng khi phát hiện các khối u nhỏ và có hình dạng bất thường trong ảnh MRI.
Trong bài viết này, tôi sẽ trình bày phương pháp phân đoạn ảnh MRI, một nhiệm vụ khó khăn do nhiều nguyên nhân gây ra mờ nhiễu, như sự thay đổi độ nhạy của đầu dò, biến đổi môi trường, và sai số lượng tử hóa Hầu hết các thuật giải hiện có đều phức tạp và dựa vào miền giảm tạp nhiễu Do đó, nghiên cứu phương pháp xử lý ảnh y khoa để phân đoạn chính xác các đối tượng là một yêu cầu cấp bách hiện nay, tạo động lực cho việc thực hiện đề tài này.
MỤC TIÊU VÀ NỘI DUNG CỦA ĐỀ TÀI
Mục tiêu của đề tài là phát triển một giải thuật phân đoạn ảnh y khoa, tập trung vào ảnh MRI Để đạt được điều này, nội dung nghiên cứu sẽ bao gồm các bước cần thiết để thực hiện giải thuật.
- Thu thập và nghiên cứu các tài liệu liên quan đến đề tài
- Nghiên cứu và phân tích ưu nhược điểm các công trình nghiên cứu trong và ngoài nước liên quan đến đề tài
- Đề xuất giải thuật mới cho bài toán phân đoạn ảnh y khoa
- Hiện thực và so sánh kết quả với các giải thuật khác.
GIỚI HẠN ĐỀ TÀI
Trong bài viết này, tác giả tập trung vào việc phân đoạn ảnh y khoa MRI, sử dụng các ảnh thử nghiệm từ các tập ảnh chuẩn được các nhóm nghiên cứu trên toàn thế giới áp dụng, cùng với tập ảnh do giáo viên hướng dẫn cung cấp.
PHƯƠNG PHÁP NGHIÊN CỨU
Phương pháp nghiên cứu được sử dụng: định tính và định lượng
+ Định tính: ý kiến đánh giá của các chuyên gia trong cả hai lĩnh vực xử lý ảnh và y khoa
+ Định lượng: dựa trên thông số Peak signal –to-noise ratio (PSNR), Mean squared error (MSE) để đánh giá kết quả thu được
Sử dụng công cụ Matlab để tiến hành hiện thực giải thuật để thu kết quả.
ĐÓNG GÓP CỦA LUẬN VĂN VỀ MẶT KHOA HỌC VÀ ỨNG DỤNG
Đề tài nghiên cứu dự kiến sẽ đạt được các kết quả sau:
+ Tài liệu tổng hợp các cấu trúc lưu trữ và cách thức thể hiện của các ảnh y khoa, điển hình là với ảnh MRI
Xây dựng một tập các mức threshold đa cấp (multilevel thresholding) giúp giảm thiểu tạp nhiễu, bao gồm nhiễu độc lập với dữ liệu ảnh, nhiễu phụ thuộc vào dữ liệu ảnh, nhiễu Gauss và nhiễu muối – tiêu.
+ Xây dựng một phương pháp mới để phân đoạn ảnh MRI dựa trên các giải thuật đã có và so sách kết quả với các giải thuật hiện có.
CẤU TRÚC LUẬN VĂN
Luận văn này được chia thành năm chương có cấu trúc như sau:
Chương 1: Giới thiệu Trong chương này, tôi trình bày giới thiệu về đề tài, mục tiêu, nội dung và giới hạn đề tài cũng được đề cập trong chương này
Chương 2: Cơ sở lý thuyết và các nghiên cứu liên quan Trong chương này, tôi trình bày về lý thuyết xử lý ảnh cũng như các nghiên cứu liên quan đến đề tài
Chương 3: Phương pháp đề xuất Trong chương này, tôi sẽ đề xuất phương pháp phân đoạn ảnh MRI
Chương 4: Thực nghiệm và kết quả đạt được Trong chương này, tôi sẽ hiện thực phương pháp đề xuất và kết quả đạt được khi hiện thực phương pháp đề xuất
Chương 5: Kết luận Trong chương này, tôi sẽ tổng kết lại các công việc đã làm cũng như ưu nhược điểm của phương pháp đề xuất.
CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN
ĐỊNH DẠNG ẢNH Y KHOA
Ảnh y khoa là hình ảnh được tạo ra từ các thiết bị chụp y tế như X-Quang, CT và MRI, mang lại nhiều thông tin hơn so với ảnh thông thường Những hình ảnh này là sự tổng hợp của nhiều hình ảnh khác nhau, tạo thành một bức ảnh duy nhất Tại các bệnh viện ở thành phố Hồ Chí Minh, ảnh y khoa thường có kích thước vuông với các kích cỡ đa dạng như 256x256, 512x512, 1024x1024 và chủ yếu là ảnh xám.
Digital Imaging and Communications in Medicine (DICOM) is the standard for storing and transmitting medical images, which also defines the structure of information contained within medical image files The DICOM file structure includes essential information related to medical imaging.
Thông tin về lần khám của ảnh
Thông tin về thiết bị y khoa tạo ra ảnh
X-ray Computed Topography (x-ray CT) là công nghệ sử dụng tia X được xử lý bằng máy tính để thu nhận hình cắt lớp của những khu vực đặc biệt trên đối tượng, cho phép người dùng có thể quan sát bên trong cơ thể mà không cần phải phẫu thuật Quá trình xử lý hình ảnh số sẽ tái tạo ảnh ba chiều từ một chuỗi nhiều ảnh X quang 2 chiều được chụp xoay quanh một trục
Dạng thức ảnh vi tính cắt lớp đơn (CT) thường được ưa chuộng hơn so với x-ray, mặc dù còn có các công nghệ khác như PET và SPECT CT tạo ra một lượng lớn dữ liệu giúp minh họa các cấu trúc khác nhau trong cơ thể người dựa trên khả năng ngăn chặn tia X Hình ảnh được sản sinh trên mặt phẳng ngang, vuông góc với chiều dài cơ thể, nhưng máy quét hiện đại cho phép tái định dạng dữ liệu trên nhiều mặt phẳng khác nhau, thậm chí có thể tạo ra hình ảnh 3 chiều của các cấu trúc.
KHỬ MỜ NHIỄU TRONG ẢNH Y KHOA
Khử mờ, nhiễu và phân đoạn ảnh thường sử dụng ngưỡng lọc dựa trên giá trị của các điểm ảnh Cụ thể, nếu giá trị của điểm ảnh lớn hơn hoặc bằng ngưỡng lọc, điểm ảnh đó sẽ được hiển thị với giá trị tương ứng.
+ Ngược lại nếu điểm ảnh nhỏ hơn giá trị ngưỡng lọc thì sẽ không được nhận giá trị hiển thị
Việc khử nhiễu, mờ và phân đoạn ảnh y khoa bằng các ngưỡng lọc cao có thể dẫn đến mất thông tin quan trọng, ảnh hưởng tiêu cực đến kết quả chẩn đoán và điều trị của các chuyên gia y tế Do đó, việc xử lý ảnh y khoa, vốn chứa nhiều thông tin, gặp nhiều thách thức trong việc khử mờ nhiễu và phân đoạn.
Giá trị ngưỡng lọc cần được điều chỉnh phù hợp để bảo toàn thông tin trong ảnh Mặc dù giá trị ngưỡng lọc tối ưu cho ảnh thường chưa chắc mang lại hiệu quả tương tự cho ảnh y khoa, nhưng nếu giá trị này hoạt động tốt với ảnh y khoa, thì khả năng cao nó cũng sẽ đem lại kết quả khả quan cho ảnh thường do ảnh thường có ít thông tin hơn.
CÁC NGHIÊN CỨU LIÊN QUAN
Hiện nay, nghiên cứu về xử lý ảnh y khoa ở Việt Nam còn hạn chế, chủ yếu do nguồn nhân lực yếu kém và cơ sở vật chất thiếu thốn Hầu hết thiết bị y tế đều được nhập khẩu, với phần mềm xử lý ảnh thường được tích hợp từ các nhà sản xuất nước ngoài, dẫn đến giá thành cao Việc thiếu nhóm nghiên cứu trong lĩnh vực này đã hạn chế kết quả đạt được Hơn nữa, sự thiếu quan tâm đến phát triển công nghệ xử lý ảnh y khoa là một trở ngại lớn cho sự phát triển ngành công nghiệp y tế trong nước.
Sự kết hợp giữa công nghệ thông tin và y khoa trong chẩn đoán bệnh đã trở thành lĩnh vực nghiên cứu quan trọng, đặc biệt trong xử lý tín hiệu Nhiều nghiên cứu quốc tế đã phát triển các công cụ lọc nhiễu và phát hiện khối u từ ảnh MRI và CT, đạt nhiều thành tựu Gần đây, Kailash đề xuất phương pháp phân đoạn kết hợp các kỹ thuật phân cụm để cải thiện kết quả phát hiện khối u Gopal xây dựng hệ thống thông minh chẩn đoán khối u não từ ảnh MRI bằng cách kết hợp các thuật toán phân cụm Jichuan giới thiệu thuật toán phân đoạn ngưỡng cục bộ, hữu ích trong trường hợp có nhiều đối tượng tương tự Halder áp dụng K-means và phương pháp gán nhãn để dò tìm khối u, nhưng độ chính xác phụ thuộc vào K-means Koley sử dụng kỹ thuật Region-growing để xác định vùng bệnh và áp dụng thuật toán dò tìm đường viền Rohini cũng đã thành công trong việc dò tìm khối u qua ảnh MRI, nhưng kết quả phụ thuộc vào các bước trung gian Dosi thảo luận về các phương pháp phân đoạn ảnh để phát hiện khối u não, làm nổi bật sự đa dạng trong nghiên cứu hiện nay.
Phương pháp Thresholding sử dụng ngưỡng để phân cụm các điểm ảnh thành hai nhóm: một nhóm gồm các điểm ảnh có giá trị nhỏ hơn ngưỡng và một nhóm có giá trị lớn hơn ngưỡng Tuy nhiên, phương pháp này không phù hợp cho ảnh đa kênh, vì nó bỏ qua các tế bào quan trọng trong việc hình thành khối u.
Phương pháp Region growing là một kỹ thuật hiệu quả trong phân đoạn ảnh y khoa, được ứng dụng để phân đoạn các cơ quan như lá lách, bề mặt não và hình ảnh tim Tuy nhiên, phương pháp này có nhược điểm là yêu cầu người dùng phải chọn "seekpoint", và hiệu quả của việc phân đoạn phụ thuộc nhiều vào kỹ năng của người sử dụng.
+Phương pháp MeanShift chỉ được sử dụng cho việc phân cụm dữ liệu đa chiều
Phương pháp phân cụm K-Means rất đơn giản và dễ áp dụng, tuy nhiên, hiệu quả của nó lại phụ thuộc vào kỹ năng lựa chọn các điểm trung tâm ban đầu.
Phương pháp Fuzzy C-means mặc dù có thời gian thực thi lâu hơn K-means và không cho kết quả tốt với ảnh bị nhiễu, nhưng lại mang lại độ chính xác cao hơn trong việc dự đoán tế bào khối u, điều mà K-means không thể thực hiện.
EdEdily đã đề xuất một framework gồm 5 bước để xác định vị trí khối u não qua ảnh MRI, bao gồm thu nhận ảnh, tiền xử lý, dò tìm cạnh, điều chỉnh histogram và toán tử hình thái Tuy nhiên, phương pháp này gặp khó khăn với ảnh không phải là ảnh xám, do toán tử hình thái học chỉ tạo khoảng cách giữa các đối tượng có cường độ khác nhau Gopalakrishnan đã phát triển một phương pháp kết hợp K-means và Fuzzy C-means để phân đoạn khối u não, cho thấy Fuzzy C-means đạt kết quả tốt hơn nhờ khả năng tách khối u ác tính và phát hiện nhiều điểm ảnh bị lỗi Tuy nhiên, Fuzzy C-means có hạn chế về độ nhạy, khiến việc phát hiện các khối u có độ nhạy cao trở nên khó khăn.
Ankita đã kết hợp hai phương pháp Spatial Kfuzzy và LevelSet để phân đoạn và phát hiện khối u não từ ảnh MRI, giúp tách biệt các khối u một cách hiệu quả Kết quả của Spatial Kfuzzy cung cấp các đường viền gần đúng của các vùng chất trắng, chất xám, dịch tỷ não và các mô bất thường trong não Sau đó, phương pháp LevelSet được áp dụng để xác định chính xác đường viền của các vùng này Phương pháp Binaryzation cũng được sử dụng để xác định vị trí của khối u Tuy nhiên, phương pháp này gặp một số hạn chế về tốc độ xử lý và độ chính xác trong một số trường hợp.
Mohan J [11] đã đề xuất một phương pháp phân đoạn khối u não trong ảnh MRI, trong đó sử dụng K-means như một bước cuối cùng trong chuỗi thuật toán Mặc dù K-means có ưu điểm về tốc độ thực thi nhanh, nhưng độ chính xác của nó lại phụ thuộc vào việc xác định số cụm khởi tạo, điều này có thể dẫn đến những sai lệch trong kết quả phân đoạn.
Ngoài ra, còn một số các nghiên cứu của các tác giả khác Tuy nhiên, hầu hết các phương pháp có ưu nhược điểm riêng.
PHƯƠNG PHÁP ĐỀ XUẤT PHÂN ĐOẠN ẢNH
YÊU CẦU BÀI TOÁN
Dựa trên các cơ sở lý thuyết và các nghiên cứu liên quan, bài toán phân đoạn ảnh MRI đặt ra các yêu cầu sau:
1 Tìm hiểu các định dạng ảnh y khoa, nhất là định dạng ảnh MRI
2 Tìm ngưỡng thích hợp để phân chia ảnh thành các khu vực có chất lượng tốt, hay bị mờ nhiễu
3 Phân đoạn ảnh y khoa chứa các đối tượng cần phân đoạn như khối u,…
4 Tránh mất thông tin trong ảnh sau khi phân đoạn.
PHƯƠNG PHÁP ĐỀ XUẤT
Hình 3.1 Các phương pháp đề xuất
Các ảnh mức xám 8 bits với kích thước 512x512 Chúng tôi sử dụng 2 nguồn ảnh chính là:
Tập ảnh chuẩn được sử dụng trong nghiên cứu y khoa được thu thập từ các trang web cung cấp dữ liệu ảnh y khoa trên toàn thế giới.
+ Do giáo viên hướng dẫn cung cấp dữ liệu thực tế ở các bệnh viện
Các thiết bị chụp ảnh MRI khác nhau dẫn đến việc ảnh MRI có kích thước không đồng nhất Để giảm độ phức tạp trong quá trình xử lý, chúng ta cần giảm kích thước của ảnh.
Hầu hết các ảnh y khoa hiện nay đều bị mờ nhiễu do nhiều nguyên nhân như thiết bị chụp ảnh, kỹ thuật chụp ảnh và môi trường chụp Để giảm mờ nhiễu ảnh, chúng tôi áp dụng ngưỡng lọc Chất lượng hình ảnh sau khi denoising được đánh giá thông qua hai phương pháp đo lường là Peak Signal-to-Noise Ratio (PSNR) và Mean Squared Error (MSE).
Trung bình của bình phương lỗi (Mean Square Error)
Trung bình của bình phương lỗi (MSE) là một phương pháp ước lượng giúp đánh giá sự khác biệt giữa các dự đoán và giá trị thực tế MSE xác định độ rủi ro thông qua giá trị kỳ vọng của sự mất mát lỗi-bình phương Sự thay đổi này có thể xảy ra ngẫu nhiên hoặc do những yếu tố chưa được xem xét, dẫn đến việc mất mát thông tin MSE kết hợp cả phương sai của các ước lượng và độ sai lệch của chúng; trong trường hợp các ước lượng không có độ sai biệt lớn, MSE tương đương với phương sai Độ lệch chuẩn, căn bậc hai của MSE, cung cấp thông tin về trung bình bình phương lỗi của một đại lượng đang được xem xét.
Gọi ̂ là một vector với n dự đoán và Y là vector chứa giá trị thật, khi đó ước lượng lỗi của dự đoán là :
MSE là trung bình của bình phương lỗi
n là số dự đoán (số thành viên của vector Y)
̂ là vector ước lượng (dự đoán) giá trị lúc sau của Y
Y là vector chứa giá trị thật và giá trị ban đầu, đại diện cho một khái niệm về số lượng tính toán được cho bởi một mẫu cụ thể Để thực hiện tính toán, hai tham số cần có cùng kích thước và số lượng thành viên, chỉ khác nhau ở giá trị của một hoặc một vài thành viên Do đó, điều này cho phép mở rộng thành một ước lượng tổng quát cho một tham số chưa biết Ứng với tham số chưa biết, ta có ước lượng ̂, và MSE của ước lượng ̂ được định nghĩa như sau:
(̂) là ước lượng lỗi của tham số ̂
E là trung bình bình phương lỗi
là tham số chưa biết
̂ là dự đoán của tham số trước đó
Trong bài toán này, MSE được sử dụng để đo lường sự khác biệt giữa hai bức ảnh trước và sau khi thực hiện việc tăng cường đường biên và khắc phục khuyết điểm của đối tượng Công thức tính MSE cho hai bức ảnh được xác định dựa trên công thức tổng quát.
I(i, j) là giá trị pixel tại ví trí i, j của ảnh đối tượng lúc đầu
I’(i, j) là giá trị pixel tại ví trí i, j của ảnh đối tượng sau khi chỉnh sửa
M, N là kích thước dài, rộng của ảnh
i, j là vị trí pixel tại vị trí i, j trong ảnh
MSE (Mean Squared Error) là chỉ số đại diện cho bình phương lỗi tích lũy giữa ảnh gốc và ảnh đã chỉnh sửa, cho thấy mức độ sai lệch và thay đổi của ảnh Khi ảnh ít thay đổi, giá trị MSE sẽ nhỏ, điều này cho thấy ảnh gần như không bị lỗi.
Tỉ lệ nhiễu trên đỉnh (Peak Signal to Noise Ratio)
Tỉ lệ nhiễu trên đỉnh (PSNR) là kỹ thuật dùng để đo lường tỉ lệ giữa công suất tối đa của tín hiệu và tiếng ồn gây nhiễu, ảnh hưởng đến độ trung thực của tín hiệu Với tần số dao động lớn của tín hiệu ban đầu, PSNR được biểu thị bằng đơn vị decibel (dB).
PSNR là chỉ số quan trọng trong việc đánh giá chất lượng khôi phục các khối tín hiệu đã nén, như video và ảnh Trong quá trình nén, dữ liệu ban đầu và tiếng ồn xuất hiện do các lỗi Khi so sánh các khối đã giải nén với dữ liệu gốc, PSNR giúp chúng ta đánh giá chất lượng của khối ban đầu và khối được tái tạo.
PSNR (Peak Signal-to-Noise Ratio) là chỉ số đo lường sự tương đồng giữa hai tín hiệu, trong đó giá trị PSNR cao cho thấy tỷ lệ giống nhau giữa tín hiệu gốc và tín hiệu khôi phục là lớn.
Cho ảnh ban đầu I có kích thước MxN và ảnh sau khi bị nhiễu K Ta sẽ tính PSNR dựa trên MSE như sau :
MAX I là giá trị tối đa mà pixel có thể đạt được
MSE là trung bình bình phương lỗi
PSNR là tỉ lệ nhiễu đỉnh
Trong ảnh số, giá trị của các pixel được lưu trữ dưới dạng bit hoặc byte, với số bit phụ thuộc vào cấu trúc lưu trữ của ảnh Do đó, MAX I được tính toán theo công thức cụ thể.
MAX I là giá trị tối đa của một pixel có thể có
B là số lượng bit dùng để lưu trữ một pixel ảnh
Mục tiêu chính của phân đoạn ảnh là tạo ra các vùng dựa trên các vách ngăn, và phương pháp chúng tôi áp dụng là Region Growing Phương pháp này có những ưu điểm nổi bật như tạo ra các vùng ảnh đồng nhất và liên thông, đồng thời có tốc độ thực thi nhanh chóng Các bước thực hiện sẽ được trình bày cụ thể trong bài viết.
Bước đầu tiên là chọn ngẫu nhiên một điểm trong cửa sổ làm điểm khởi tạo (seed point) Chúng tôi sẽ sử dụng thông tin y khoa cơ bản của các đối tượng để xác định tọa độ của seed point.
Bước 2: Tính toán tọa độ các điểm lân cận của điểm seed và đưa vào hàng đợi Số lượng điểm lân cận có thể là 4 hoặc 8, tùy thuộc vào độ phân giải của ảnh đầu vào Trong thuật toán đề xuất, chúng tôi lựa chọn 4 điểm lân cận.
Bước 3: Chèn điểm khởi đầu vào ảnh phân đoạn bằng cách sử dụng ma trận nhị phân, trong đó giá trị 1 đại diện cho điểm thuộc đối tượng và giá trị 0 đại diện cho điểm không thuộc đối tượng.
LÀM RÕ BIÊN
Sau khi cải thiện chất lượng ảnh và thu giảm vùng ảnh, chúng tôi tiến hành tìm một “edge map”, tức là ảnh thu được từ việc phát hiện các đường biên của ảnh ban đầu Để thực hiện bước này, có thể áp dụng nhiều phương pháp phát hiện biên trong kỹ thuật xử lý ảnh Tuy nhiên, phương pháp được chọn cần phải tạo ra một “edge map” đáp ứng ba thuộc tính quan trọng.
(i) Gradient của “edge map” có những vector hướng về các biên đối tượng
(ii) Những vector của chỉ có biên độ lớn tại vùng lân cận của các biên dT dx
(iii) Trong những vùng đồng nhất, tức là những vùng có độ sáng ( ) gần như không đổi, xấp xỉ giá trị 0
Chúng tôi áp dụng phương pháp Canny để làm nổi biên các đối tượng trong ảnh, nhờ vào khả năng loại bỏ đường biên dư thừa do nhiễu, điều này rất quan trọng trong phát hiện biên đối tượng trong ảnh y khoa Kết quả từ thuật toán Canny đáp ứng tốt ba thuộc tính của "edge map" Sau khi có "edge map" cho ảnh ban đầu, bước tiếp theo là xác định biên cho đối tượng quan tâm bằng phương pháp GVF Snake, một cải tiến từ phương pháp Snake truyền thống, sử dụng miền GVF được tối thiểu hóa từ hàm năng lượng trong môi trường biến đổi.
Snake truyền thống là một mô hình đường biên hoạt động hai chiều, được định nghĩa bởi các hàm số trong không gian của ảnh, nhằm tối thiểu hóa hàm năng lượng.
(3.9) với (internal energy)là năng lượng của đường biên phát sinh do bị uốn cong,
Năng lượng ảnh (image energy) là năng lượng phát sinh từ sự biến đổi cường độ sáng, đường biên hoặc các điểm trên hình ảnh Trong khi đó, năng lượng bên ngoài (external energy) được tạo ra thông qua các quá trình xử lý nâng cao hoặc do người dùng tác động.
Hình 3.3 Tính tọa độ các điểm lân cận của seed pointMột Internal energy của snake được định nghĩa là
(3.9.1) với và là trọng số điều khiển độ căng (tension) và độ cứng (stiffness) của snake, và ( ), ( ) lần lượt là đạo hàm bậc 1 và bậc 2 của ( )
Năng lượng bên ngoài được trích xuất từ hình ảnh để giảm giá trị tại các đặc trưng quan tâm, chẳng hạn như đường biên Đối với một ảnh xám, được coi là một hàm của các tọa độ điểm liên tục, năng lượng bên ngoài được sử dụng để hướng các đường biên đến các cạnh của đối tượng.
Hàm Gaussian hai chiều với độ lệch chuẩn và toán tử Gradient cho thấy rằng giá trị lớn sẽ làm cho đường biên trở nên mờ hơn Tuy nhiên, việc sử dụng giá trị lớn là cần thiết để mở rộng phạm vi của đường biên.
Một đường biên hoạt động Snake phải thỏa mãn phương trình Euler sau:
(3.12) Phương trình này có thể được xem như là phương trình cân bằng lực:
Lực bên trong khiến snake co lại giống như sợi dây co, ngăn cản sự uốn cong, trong khi ngoại lực kéo snake tiến đến những đường biên trong ảnh Để giải phương trình (3.12), snake được biến đổi liên tục bằng hàm X theo thời gian t và s, tức là X(s,t) Đạo hàm từng phần của X theo t được gán cho vế trái của công thức (3.12).
(3.15) với ( ) là đường biên khởi tạo Khi X(s,t) trở nên ổn định, ( ) biến mất và chúng ta hoàn thành đường biên cho đối tượng
Trong mô hình đường biên hoạt động cơ bản, tồn tại một loại năng lượng tiềm ẩn được sinh ra từ các thao tác xử lý ảnh Năng lượng này giúp định hướng snake đến các đặc trưng quan trọng như đường thẳng, đường biên và các đỉnh trong ảnh.
(a) Hình ban đầu (b) Edge map
Hình 3.4 Làm nổi biên bằng phương pháp phát hiện biên Canny
PHƯƠNG PHÁP ĐÁNH GIÁ
Phương pháp này dựa trên sự đánh giá của bác sỹ chuyên ngành để đưa ra những nhận xét trên ảnh thu được
Sau khi áp dụng phương pháp và thu được kết quả, bạn cần mang theo hình ảnh gốc và ảnh đã chụp để gặp trực tiếp các bác sĩ chuyên ngành Kết quả sẽ được đánh giá dựa trên tiêu chí xác định chính xác vị trí và hình dạng của đối tượng.
Sau khi thực hiện và thử nghiệm giải thuật đề xuất, luận văn tiến hành so sánh kết quả với các phương pháp Level set và Mean-shift.
Kết quả so sánh được đánh giá dựa trên ba chỉ số: Jaccard Index (J.I), True Positive Rate (TPR) và True Negative Rate (TNR) Các chỉ số J.I, TPR và TNR càng cao thì độ chính xác của kết quả thu được càng lớn.
J.I là thông số để đo sự tương đồng giữa hai vùng dữ liệu A và B, được định nghĩa bởi công thức:
Trong bài toán xác định đường biên đối tượng, A là kết quả từ giải thuật đề xuất và B là kết quả phân đoạn chính xác từ chuyên gia y khoa Nếu cả A và B đều rỗng, JI(A,B) sẽ được xem là 100 Giá trị của JI dao động từ 0 đến 100, với giá trị cao hơn phản ánh độ chính xác tốt hơn của kết quả Để đánh giá hiệu quả của giải thuật, luận văn áp dụng các khái niệm TPR và TNR.
- True Positive (TP) là số lượng điểm ảnh được xác định đúng là thuộc đối tượng quan tâm
- True Negative (TN) là số lượng điểm ảnh được xác định đúng là không thuộc đối tượng quan tâm
- False Positive (FP) là số lượng điểm ảnh được xác định sai là thuộc đối tượng quan tâm
- False Negative (FN) là số lượng điểm ảnh được xác định sai là không thuộc đối tượng quan tâm
True Positive Rate, hay còn gọi là độ nhạy (sensitivity), là tỷ lệ giữa số điểm ảnh được xác định chính xác là thuộc đối tượng quan tâm so với tổng số điểm ảnh.
Tỷ lệ âm tính đúng (True Negative Rate), hay còn gọi là đặc trưng (specificity), là tỷ lệ giữa số điểm ảnh được xác định chính xác là không thuộc đối tượng quan tâm so với tổng số điểm ảnh.
THÍ NGHIỆM VÀ ĐÁNH GIÁ
TẬP DỮ LIỆU TEST VÀ CẤU HÌNH MÁY
Chương này trình bày quá trình thực hiện truy vấn ảnh dựa trên giải thuật đã được đề xuất Các thí nghiệm được thực hiện trên máy tính với cấu hình CPU Intel.
Bài viết này sử dụng bộ vi xử lý Core I3-4200U 2.4 GHz (4 CPU) và RAM 8GB trên hệ điều hành Windows 7 Tất cả các phương pháp được trình bày và so sánh đều được thực hiện bằng ngôn ngữ Matlab, phiên bản 2013b Để đánh giá hiệu quả của thuật toán, quá trình thực nghiệm được tiến hành trên nhiều tập dữ liệu khác nhau Các thí nghiệm được thực hiện trên hình ảnh mức xám 8 bits có kích thước 512x512, được thu thập từ ba nguồn khác nhau.
- Giáo viên hướng dẫn cung cấp dữ liệu thực tế ở các bệnh viện
- Sưu tập trên Internet từ các trang web cung cấp dữ liệu ảnh y khoa
Một số hình ảnh trong tập dữ liệu test:
Hình 4.1.1 Hình MRI não được đem mô phỏng
Hình 4.1.2 Dùng phần mềm MATLABR2013, mô phỏng việc tạo các “edge map”
KẾT QUẢ THÍ NGHIỆM
Trong phần này, luận văn chỉ đưa ra một số kết quả trên 1 bộ ảnh để minh họa và so sánh với các giải thuật khác
Hình 4.2.1 bắt đầu dò tìm “edge map” từ ảnh 4.1.1a
Hình 4.2.2 Bắt đầu dò tìm đường biên (GVF), từ ảnh 4.1.1a
Hình 4.2.3 đường biên ban đầu được tạo từ ảnh 4.1.1a
Hình 4.2.4 biến dạng đường biên trong quá trình mô phỏng với Iter = 50, từ ảnh 4.1.1a
Hình 4.2.5 biến dạng đường biên trong quá trình mô phỏng với Iter = 100, từ ảnh 4.1.1a
Hình 4.2.6 mô phỏng hoàn thành, từ hình 4.1.1a
Hình 4.2.7 bắt đầu dò tìm “edge map”, từ ảnh 4.1.1b
Hình 4.2.8 bắt đầu dò tìm tạo đường biên (GVF), từ ảnh 4.1.1b
Hình 4.2.9 đường biên ban đầu được tạo thành từ ảnh mô phỏng 4.1.1b
Hình 4.2.10 biến dạng đường biên trong quá trình mô phỏng với iter = 15, từ ảnh 4.1.1b
Hình 4.2.11 biến dạng đường biên trong quá trình mô phỏng với iter = 75, từ ảnh 4.1.1b
Hình 4.2.12 quá trình mô phỏng hoàn thành, từ ảnh 4.1.1b
Kết quả thực nghiệm trên ảnh phân đoạn MRI
Thực nghiệm trên ảnh kích thước 512 x 512 với các lát cắt Bảng kết quả thực nghiệm chỉ số J.I trên ảnh CT với kích thước 512 x 512 từ lát cắt 1 đến 15
Bảng 0.1 So sánh chỉ số J.I của các giải thuật phát hiện đường biên của đối tượng trong ảnh MRI
Lát cắt Level Set Giải thuật đề xuất
Bảng kết quả thực nghiệm các chỉ số TPR và TNR của giải thuật đề xuất trên ảnh với kích thước
Bảng 0.2 So sánh chỉ số TPR và TNR của giải thuật đề xuất trên đối tượng trong ảnh MRI
Lát cắt TPR (%) TNR (%) Độ chính xác trung bình (%)
Bảng kết quả thực nghiệm các chỉ số TPR và TNR của giải thuật Level set trên ảnh CT với kích thước 512 x 512 từ lát cắt 1 đến 15
Bảng 0.3 So sánh chỉ số TPR và TNR của giải thuật Level set trên đối tượng trong ảnh MRI
Lát cắt TPR (%) TNR (%) Độ chính xác trung bình (%)
Từ các bảng trên, ta thấy rằng phương pháp đề xuất cho kết quả tốt và tốt hơn phương pháp level set truyền thống.