Phân đoạn ảnh dựa vào phân cụm dữ liệu

Một phần của tài liệu Nghiên cứu các kỹ thuật phân cụm dữ liệu và ứng dụng (Trang 52 - 57)

Hình ảnh của một hệ thống được mô tả trong phạm vi phân khúc Hoffman và Jain sử dụng phân cụm bình phương lỗi trong một không gian

53

sáu chiều tính năng như một nguồn của một phân khúc thành đầu ra của các phân đoạn. Kỹ thuật này được nâng cao trong Flynn và Jain, và được sử dụng trong một so sánh có hệ thống gần đây của phân đoạn hình ảnh. Như vậy, nó có lẽ là một trong những giới hạn kỹ thuật phân cụm tồn tại lâu nhất và đã được thực hiện trên rất nhiều hình ảnh.

Tại mỗi điểm ảnh (i, j) trong phạm vi hình ảnh đầu vào, các đo lường được ký hiệu tương ứng 3D (xij, yij, zij) với xij là một hàm tuyến tính của j (số cột), yij là một hàm tuyến tính của i (số hàng). Một k k láng giềng của (i, j) được sử dụng để ước lượng bề mặt 3D nij = ( , , ) tại (i, j), thông thường bằng việc tìm kiếm ít nhất ô vuông phẳng phù hợp với các điểm 3D trong láng giềng. Các véc tơ tính năng cho điểm ảnh tại (i, j) là sáu chiều (xij, yij, zij, , , ), và một phân khúc được tìm thấy bởi phân cụm các véc tơ tính năng này. Vì các lý do thực tế nên không phải véc tơ tính năng của mỗi điểm ảnh đều được sử dụng trong các thủ tục phân cụm.

Thuật toán CLUSTER được sử dụng để có được các nhãn phân đoạn cho mỗi điểm ảnh. CLUSTER là một thuật toán mở rộng của thuật toán k-means, có khả năng xác định một số cụm của một tập dữ liệu. Hoffman và Jain cũng thử nghiệm với các kỹ thuật phân nhóm khác để cung cấp sự kết hợp tốt nhất về hiệu suất và độ chính xác. Một lợi thế bổ sung của CLUSTER là nó tạo ra một chuỗi các cụm đầu ra, mỗi phân nhóm theo thứ tự sản lượng này thống kê clustering kết hợp giữa cụm phân tách và cụm phân tán. Phân cụm tối ưu hóa các số liệu thống kê này được chọn là một trong cụm tốt nhất.

Mỗi điểm ảnh trong phạm vi hình ảnh được gán nhãn phân đoạn của các trung tâm cụm gần nhất. Điều này phân loại khoảng cách tối thiểu không được bảo đảm để sản xuất phân đoạn đó được kết nối trong mặt phẳng hình ảnh, do vậy, một thành phần kết nối ghi nhãn thuật toán phân bổ các nhãn mới cho các khu vực phân chia được đặt trong cùng một nhóm. Hoạt động tiếp theo bao gồm

54

các xét nghiệm loại bề mặt, việc sáp nhập các bản vá liền kề sử dụng một thử nghiệm cho sự hiện diện của mép nhăn hoặc nhảy cạnh giữa các phân đoạn liền kề và ước lượng thông số bề mặt.

a ) b )

c ) d )

Hình 19: Phân đoạn ảnh bằng phân cụm dữ liệu a) Ảnh đầu vào

b) Mặt bằng chính tắc hình ảnh được chọn

c) Bước đầu phân đoạn (19 nhóm giải pháp) trả lại bằng cách sử dụng CLUSTER 1000 sáu chiều mẫu từ hình ảnh như là một mẫu thiết lập d) Kết quả phân đoạn cuối cùng sau khi đã xử lý

Một hệ thống phân chia hình ảnh cho kết cấu được mô tả bởi Jain và Farrokhnia, ở đó bộ lọc Gabor đã được sử dụng để có được 28 định hướng và tính năng chọn lọc các kết cấu trong các láng giềng của mỗi điểm ảnh. 28 tính năng được giảm đến một số lượng nhỏ hơn thông qua một thủ tục lựa chọn tính năng, và các tính năng kết quả được tiền xử lý và sau đó nhóm bằng cách sử dụng CLUSTER.

55

a) b)

Hình 20: Kết quả của kết cấu phân đoạn ảnh

a) Một khảm kết cấu bao gồm bốn đầu vào của các kết cấu Brodatz phổ biến

b) Phân khúc sản xuất khi các tính năng lọc Gabor được ghép để chứa các thông tin không gian

Phân cụm dữ liệu có thể được sử dụng như là một giai đoạn tiền xử lý để xác định các lớp mẫu để phân loại giám sát tiếp theo. Taxt và Lundervold mô tả một thuật toán clustering partitional và một kỹ thuật ghi nhãn hướng dẫn sử dụng để xác định các lớp vật liệu (ví dụ: não tủy, chất lỏng, chất trắng, khối u) trong các hình ảnh được đăng ký của một con người có được ở năm kênh khác nhau. Một số phân cụm đã thu được và kết hợp với kiến thức tên miền (nhân lực chuyên môn) để xác định các lớp khác nhau.

56

a) b)

Hình 21: Phân đoạn ảnh y tế đa quang phổ a) Kênh duy nhất của ảnh đầu vào

b) 9 cụm phân đoạn ảnh

a) b) Hình 22: Phân đoạn ảnh LANDSAT a) Bản gốc hình ảnh ESA/EURIMAGE/Sattelitbild b) Cảnh đã được phân cụm

57

Một phần của tài liệu Nghiên cứu các kỹ thuật phân cụm dữ liệu và ứng dụng (Trang 52 - 57)

Tải bản đầy đủ (PDF)

(69 trang)