Chương II: PHÁT HIỆN ĐỐI TƯỢNG NỔI BẬT TRONG VIDEO THỜI
2.1. CÁC BỘ LỌC VÀ ỨNG DỤNG
2.1.1. Lọc trong miền không gian
Lọc ảnh là một kỹ thuật trong xử lý ảnh số, trong đó, các điểm ảnh mới đƣợc tính toán dựa trên các điểm ảnh láng giềng và một mặt nạ (gọi là bộ lọc).
Việc xác định các điểm láng giềng đƣợc thực hiện dựa trên bộ lọc. Lọc trong miền không gian là việc thực hiện các phép biến đổi và tính toán trực tiếp dựa vào ảnh gốc. Giá trị điểm ảnh mới được tính bằng tích chập hoặc tương quan giữa bộ lọc và các điểm ảnh tương ứng trong ảnh gốc.
Hình 2-1 Tính toán trên miền không gian với ma trận lọc 3x3
14
Ở đây giá trị điểm ảnh mới sẽ đƣợc tính bởi công thức:
(5) Tổng quát hơn, nếu ta có một ảnh đầu vào kích thước với các điểm ảnh f(x,y) và một ma trận lọc w kích thước , giả sử và , với là hai số nguyên dương ta có:
( ) ∑ ∑ ( ) (
)
(6)
2.1.1.1. Lọc trung bình
Một trong những bộ lọc trong miền không gian thường được sử dụng phổ biến chính là bộ lọc trung bình. Lọc trung bình có tác dụng làm mịn ảnh, các giá trị điểm ảnh thay đổi đột ngột (nhiễu) sẽ đƣợc biến đổi về gần các giá trị điểm ảnh vùng láng giềng bằng cách thay thế giá trị điểm ảnh trung tâm vùng láng giềng bằng giá trị trung bình của các điểm ảnh nằm trong vùng láng giềng đó [5].
Ví dụ: Sử dụng mặt nạ lọc kích thước 3x3 tương ứng ta có ma trận lọc
Trong một số trường hợp người ta cũng sử dụng bộ lọc trung bình có trọng số bằng cách gán trọng số khác nhau cho các vị trí khác nhau trong ma trận lọc (thường vị trí trung tâm là quan trọng hơn) ví dụ như:
15
Khi đó các điểm ảnh có giá trị đột biến so với các giá trị điểm ảnh vùng láng giềng sẽ đƣợc làm nổi bật, rõ nét hơn.
Hình 2-2 Minh họa bộ lọc trunh bình
Trong đó (a) là hình ảnh gốc; (b) là hình ảnh sau khi sử dụng bộ lọc trung bình; (c) là hình ảnh sau khi cắt ngƣỡng sử dụng bộ lọc trung bình.
Ƣu điểm: Là bộ lọc tuyến tính đơn giản trong tính toán, ảnh đạt độ trơn mịn.
Nhược điểm: Không loại bỏ hoàn toàn ảnh hưởng của nhiễu, độ sắc nét của ảnh kém, độ tương phản thấp.
16 2.1.1.2. Lọc Gaussian
Lọc mờ Gaussian là làm mờ một ảnh bằng hàm Gaussian. Bản chất của bộ lọc mờ Gaussian là tính tích chập của hình ảnh ban đầu với ma trận tích chập đƣợc sinh ra bởi hàm Gaussian đƣợc cho bởi công thức:
( )
(7)
Trong đó x, y là tọa độ của điểm ảnh theo hai trục thẳng đứng (chiều cao của hình ảnh) và trục nằm ngang (chiều rộng của hình ảnh), là phương sai chuẩn của hàm Gaussian (giá trị quyết định độ lệch chuẩn giữa các điểm trên hàm nhân Gaussian). Trong không gian hai chiều, công thức này sinh ra những đường tròn đồng tâm tuân theo logic phân tán Gaussian từ điểm trung tâm. Giá trị từ hệ thống phân tán này sẽ đƣợc sử dụng để xây dựng ma trận tích chập dùng để tính toán phép tích chập với hình ảnh gốc. Giá trị của các điểm ảnh sau khi đƣợc tính tích chập với hàm nhân đại diện cho hàm Gaussian có thể đƣợc coi là trung bình các giá trị xung quanh nó. Giá trị của phần tử trung tâm của hàm nhân tương ứng với điểm ảnh đang xét là lớn nhất, các điểm ảnh lân cận có tính đối xứng và tỷ lệ thuận với khoảng cách của các điểm này tới trung tâm.
Hình 2-3 Minh họa bộ lọc Gaussian
Trong đó (a) là hình ảnh gốc; (b) là hình ảnh sau khi sử dụng bộ lọc Gaussian
17
Do có tính chất đối xứng, cho nên với các hình ảnh trong không gian hai chiều thì bộ lọc Gaussian có thể đƣợc áp dụng nhƣ hai phép tính trên không gian một chiều độc lập. Hiệu quả từ việc tính toán Gaussian trên ma trận điểm ảnh hai chiều tương đương với việc tính toán hai Gaussian trên các trục thẳng đứng (trục x) và nằm ngang (trục y) theo các công thức đƣợc trình bày sau đây:
( )
√
(8)
( )
√
(9)
Điều này giúp làm cho việc tính toán trở nên đơn giản hơn, do đó làm giảm độ phức tạp và vì thế giảm chi phí tính toán.
Ƣu điểm: Hỗ trợ tốt cho các yêu cầu tính toán phức tạp sau này
Nhƣợc điểm: Hình ảnh các lớn thì thuật toán càng phức tạp.
2.1.1.3. Lọc trung vị
Lọc trung vị thường có tác dụng làm sắc nét hình ảnh, các giá trị điểm ảnh quan trọng sẽ đƣợc làm sắc nét hơn các giá trị điểm ảnh vùng láng giềng bằng cách thay thế giá trị điểm ảnh trung tâm vùng láng giềng bằng giá trị trung vị của các điểm ảnh nằm trong vùng láng giềng đó (sau khi đã đƣợc sắp xếp tăng dần hoặc giảm dần) [5].
Ƣu điểm: Bảo toàn đƣợc độ phân giải của hình ảnh gốc.
Nhƣợc điểm: Chi phí thiết kế và tính toán phức tạp, tốc độ xử lý chậm do cần phải sắp xếp lại các giá trị điểm ảnh trong cửa sổ lọc theo trật tự.
18
Hình 2-4 So sánh bộ lọc trung bình và trung vị
Trong đó (a) là hình ảnh gốc; (b) là hình ảnh sau khi sử dụng bộ lọc trung bình; (c) là hình ảnh sau khi sử dụng bộ lọc trung vị
Một nhược điểm chung của các bộ lọc trong miền không gian là thường bỏ qua các giá trị biên (không đủ kích thước cửa sổ lọc) do đó có thể làm mất thông tin hoặc phân đoạn đối tượng không rõ ràng. Vì vậy, trước khi sử dụng các bộ lọc để xử lý ảnh trong miền không gian người ta phải sử dụng thêm các kỹ thuật xử lý biên nhƣ [5]:
Bỏ qua các điểm ảnh thiếu: Giữ nguyên giá trị điểm ảnh không đủ kích thước cửa sổ lọc để hiển thị kết quả mà không tính toán lại khi sử dụng các bộ lọc.
Bổ sung các giá trị: Mở rộng kích thước ma trận điểm ảnh đầu vào và bổ sung thêm các giá trị (thường tất cả là 0 hoặc 255) sao cho tất cả các điểm ảnh ở ma trận điểm ảnh ban đầu đều đủ kích thước so với cửa sổ lọc.
Nhân đôi biên: Mở rộng kích thước ma trận điểm ảnh đầu vào và bổ sung các giá trị bằng chính giá trị điểm ảnh đang thiếu so với kích thước cửa sổ lọc.
19
Copy biên ngƣợc chiều: Giống nhân đôi biên nhƣng khác ở chỗ các giá trị đƣợc bổ sung đƣợc lấy bằng các giá trị điểm ảnh nằm ở biên ngƣợc chiều (đối xứng) trong ma trận điểm ảnh đầu vào.
Cắt hình ảnh: Chỉ xử lý với các điểm ảnh đủ kích thước của cửa sổ lọc, các điểm ảnh bị thiếu (nằm ở biên) sẽ bị cắt bỏ khi hiển thị hình ảnh sau khi lọc.