Kỹ thuật trừ nền

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số kỹ thuật phát hiện đối tượng chuyển động từ camera và ứng dụng giám sát tự động trong siêu thị (Trang 33 - 39)

5. Phƣơng pháp nghiên cứu:

2.1.6. Kỹ thuật trừ nền

Hình 2.4. Quy trình trừ nền

Phát hiện đối tƣợng đƣợc xây dựng bằng phƣơng pháp xác định thể hiện của khung hình gọi chung là mô hình nền, sau đó tiếp cận với các khung nhìn kế tiếp. Bất kỳ thay đổi nào so với mô hình nền cũng sẽ đƣợc ghi nhận nhƣ có một đối tƣợng dịch chuyển. Các điểm thay đổi này đƣợc gom nhóm lại tạo thành một vùng thay đổi để xử lý. Tiến trình này đƣợc gọi với một tên chung là tách nền. Quy trình tổng quan của kỹ thuật trừ nền có thể đƣợc mô tả nhƣ lƣợc đồ trên.

Các thay đổi chính đối với nền đƣợc phân loại thành:

 Theo sự thay đổi độ sáng (illumination changes)

o Thay đổi độ sáng từ từ do nguồn sáng (mặt trời) chuyển động

o Thay đổi độ sáng đột ngột do nguồn sáng bị thay đổi: trời chuyển giữa mƣa và nắng, đèn trong phòng chuyển từ bật sang tắt hoặc ngƣợc lại

 Thay đổi chuyển động (motion changes)

o Hình ảnh thay đổi do camera dịch chuyển

o Chuyển động trong các thành phần của nền nhƣ cành cây đung đƣa, nƣớc chảy…

 Thay đổi đƣợc báo trƣớc: Chuyển động của chiếc ô tô từ từ dời khỏi điểm đỗ, ngƣời di chuyển ra khỏi phòng….

Một trong những phƣơng pháp hiệu quả và hay đƣợc sử dụng để mô hình hóa nền đó là mô hình Gauss hỗn hợp.

Ta nhận thấy rằng tại thời điểm t bất kỳ, điểm ảnh trong khung hình I chịu tác động của nhiều yếu tố nhƣ ánh sáng, môi trƣờng cũng nhƣ sự chuyển động của chính điểm ảnh. Chính vì vậy, nếu chỉ dùng một mô hình Gauss thì sự biến động của các biến cố là không đƣợc cập nhật hết. Do đó, cần thiết phải sử dụng mô hình Gauss hỗn hợp.

Tại mỗi thời điểm, giá trị của các tham số phân phối Gauss đƣợc cập nhật, mô hình lại đánh giá lại các điểm ảnh một cách heuristic để xác định xem điểm ảnh nào có xu hƣớng thuộc về mô hình nền. Các điểm ảnh đƣợc đánh giá là nổi trội sẽ đƣợc gom nhóm lại và đƣợc “bám sát” trong các khung hình kế tiếp.

Ta coi giá trị của một điểm ảnh cụ thể theo thời gian nhƣ một tiến trình xử lý điểm ảnh. Tiến trình này là một chuỗi thời gian gồm các giá trị điểm ảnh có thể là vô hƣớng cho ảnh xám hay vectơ với ảnh màu. Tại một thời điểm bất kỳ, điểm ảnh t có giá trị * + đƣợc xác định trong tập:

* + * ( ) +

Trong đó, I là chuỗi ảnh. Một số tiến trình xử lý điểm ảnh đƣợc mô tả bằng sự phân phối màu, mô tả tính cần thiết của hệ thống ngƣỡng tự động.

Giá trị của mỗi điểm thể hiện một phép đo độ sáng theo hƣớng của cảm biến của đối tƣợng đầu tiên bị phân cắt bởi tia sáng tới điểm. Trong một nền

tĩnh và ánh sáng động, giá trị này sẽ là một hằng số. Với giả định độc lập, nhiễu Gauss không xuất hiện trong tiến trình lấy mẫu và mật độ phân phối đƣợc mô tả bằng một phân phối Gauss đơn tập trung tại giá trị điểm trung bình. Nhƣng trên thực tế, chuỗi video thƣờng gồm các thay đổi về ánh sáng về cảnh và cả các đối tƣợng di chuyển.

Nếu ánh sáng thay đổi trong một khung cảnh tĩnh ta cần một hàm Gauss để theo những thay đổi này. Khi một đối tƣợng tĩnh đƣợc thêm vào khung cảnh mà không đƣợc tích hợp vào nền thì đối tƣợng đó sẽ đƣợc xem là điểm nổi trội trong một khoảng thời gian chấp nhận đƣợc. Chính điều này gây ra lỗi tích lũy đối với xấp xỉ nổi trội và gây lỗi cho quá trình bám sát. Những nhân tố này cho thấy các quan sát trong thời điểm gần là quan trọng trong xác định tham số Gauss.

Bên cạnh đó, một số đặc tính khác cũng xuất hiện khi thêm một đối tƣợng có chuyển động vào khung hình. Đối tƣợng chuyển động sẽ sinh ra nhiều dao động hơn đối tƣợng tĩnh. Tuy nhiên, một cách tổng quan, vẫn cần có thêm dữ liệu để hỗ trợ phân phối nền vì các dữ liệu đƣợc lặp lại trong khi các giá trị điểm với các đối tƣợng khác nhau thƣờng không cùng màu.

Các nhân tố này đƣợc lựa chọn để cập nhật thủ tục. Với các điểm ảnh đƣợc mô hình bằng phân phối Gauss thứ K. Khả năng quan sát đƣợc điểm ảnh hiện tại đƣợc tính bằng công thức

( ) ∑ ( ∑

)

Trong đó:

K là số lƣợng phân phối Gauss

là xấp xỉ của trọng số của hàm phân phối Gauss thứ i tại thời điểm t trong công thức.

là giá trị trung bình của phân phối Gauss thứ thứ i tại thời điểm t (2.27)

là hàm mật độ phân phối Gauss đƣợc tính theo công thức

( ∑ ) ( ) |∑ | ( )( ) ∑ ( )

K đƣợc xác định bằng bộ nhớ trống và khả năng tính toán. Thông thƣờng, ta hay lấy giá trị trong khoảng [3,5].  là ma trận hiệp phƣơng sai cấp n, có các phần tử dạng ∑ . Công thức ∑ đƣợc tính dựa vào tính chất các màu trong kênh RGB là độc lập và có cùng độ lệch.

Phân phối quan sát đƣợc của mỗi điểm ảnh trong khung cảnh đƣợc mô hình hóa bằng hàm hỗn hợp Gauss. Một giá trị điểm ảnh mới đƣợc thể hiện bằng các thành phần chính của mô hình hỗn hợp và đƣợc sử dụng để cập nhật mô hình.

Tiến trình xử lý điểm ảnh đƣợc xem là tiến trình tĩnh, một phƣơng pháp chuẩn để cực đại hóa dữ liệu quan sát đƣợc là dùng giá trị kỳ vọng cực đại. Nhƣng trong thực tế, các điểm ảnh trong khung hình là chuyển động do đó ta cần sử dụng phƣơng pháp xấp xỉ, phƣơng pháp này coi các tập quan sát mới là một tập mẫu với kích thƣớc là 1 và sử dụng các luật học chuẩn để tích hợp vào dữ liệu mới.

Với các điểm ảnh trong khung hình, ta xây dựng một mô hình hỗn hợp, do đó, chi phí cài đặt thuật toán EM trong cửa sổ dữ liệu hiện tại sẽ tốn kém. Thay vào đó chúng ta cài đặt một xấp xỉ K-mean trực tuyến. Mọi giá trị điểm ảnh mới Xt sẽ đƣợc kiểm tra xem với phân phối Gauss K cho tới khi tìm thấy sự phù hợp. Điểm ảnh đƣợc kết luận là phù hợp nếu có sự sai lệch 2.5 đơn vị so với phân phối chuẩn. Ngƣỡng này là chấp nhận đƣợc và hiệu quả trong trƣờng hợp các vùng khác nhau có ánh sáng khác nhau; các đối tƣợng trong vùng tối (bóng của ánh sáng) không bị nhiễu nhƣ đối tƣợng ở vùng sáng.

Nếu không có giá trị nào phù hợp với phân phối K, phân phối nhỏ nhất đƣợc thay thế bằng phân phối với giá trị hiện tại, giá trị khởi tạo biến động lớn và trọng số thấp. Trọng số ƣu tiên của phân phối K tại thời điểm t, ( )

đƣợc điều chỉnhnhƣ sau:

( ) ( )

Trong đó: là tỷ lệ học

bằng 1 với mô hình phù hợp và có giá trị bằng 0 trong các trƣờng hợp còn lại.

Sau khi tính xấp xỉ, các trọng số đƣợc thiết lập lại. ⁄ định nghĩa hằng số thời gian xác định tốc độ tham số phân phối thay đổi. là bộ lọc trung bình của khả năng trƣớc đó, khi giá trị điểm ảnh phù hợp với mô hình k quan sát đƣợc trong thời gian từ 1 tới t. Điều này là phù hợp với sự mong đợi của giá trị này trong cửa sổ số mũ của giá trị trƣớc đó.

Tham số  và  đƣợc sử dụng cho những phân phối không phù hợp. Các tham số của phân phối phù hợp với quan sát mới đƣợc cập nhật theo công thức

( )

( ) ( ) ( )

Trong đó : ( | )

Phƣơng pháp này có ƣu điểm chính là khi kết nạp thêm điểm vào nền thì mô hình nền cũ không bị ảnh hƣởng. Màu nền của nền gốc sẽ đƣợc duy trì cho tới khi tìm đƣợc phân phối thứ K thích hợp nhất và màu mới quan sát đƣợc. Do đó, một đối tƣợng xuất hiện đủ lâu để trở thành nền rồi mới di chuyển thì phân phối mô tả nền trƣớc đó tồn tại với tham số và trọng số

 thấp sẽ đƣợc nhanh chóng kết hợp vào nền.

Để xấp xỉ mô hình nền, ta cần xác định phân phối Gauss nào là thích hợp nhất trong tiến trình sinh nền. Thông thƣờng ta lựa chọn phân phối Gauss có nhiều căn cứ hỗ trợ và ít biến đổi.

(2.29)

(2.30) (2.31)

Khi có một đối tƣợng tĩnh xuất hiện trong khung hình trong một khoảng thời gian dài, ta coi các căn cứ hỗ trợ và hằng số biến đổi cho nền là thấp. Ngƣợc lại, khi có đối tƣợng mới chiếm giữ đối tƣợng nền thì sẽ không có sự phù hợp với phân phối hiện tại. Lúc này sẽ có một phân phối mới đƣợc hình thành và làm tăng mức biến đổi của phân phối hiện tại. Mức biến đổi của đối tƣợng chuyển động đƣợc kỳ vọng là lớn hơn điểm ảnh nền cho tới khi đối tƣợng dừng di chuyển. Để mô hình trƣờng hợp này ta cần phƣơng pháp quyết định phần nào của mô hình hỗn hợp phù hợp với tiến trình thể hiện nền.

Trƣớc hết phân phối Gauss đƣợc sắp xếp theo giá trị ⁄ . Giá trị này tăng khi các chứng cứ hỗ trợ và các biến của phân phối thay đổi. Sau khi xác định lại giá trị của hỗn hợp ta cần sắp xếp lại từ các phân phối thích hợp nhất tới phân phối nền có thể, vì chỉ có giá trị mô hình phù hợp tƣơng ứng mới thay đổi. Trật tự mô hình này hiệu quả vì các phân phối nền phù hợp nhất ở trên và những phân phối ít phù hợp đƣợc sắp dƣới cùng. Các phân phối phía dƣới có thể đƣợc thay bằng phân phối mới.

Sau đó, phân phối B đầu tiên đƣợc lựa chọn làm mô hình nền là

(∑

)

Với T là phép đo phần nhỏ nhất của dữ liệu đƣợc tính cho nền.

Phân phối này là phân phối tốt nhất trong vùng dữ liệu đang xem xét. Khi có một giá trị T nhỏ hơn đƣợc chọn thì mô hình nền thƣờng là phƣơng thức duy nhất. Trong trƣờng hợp này phân phối có khả năng cao nhất sẽ đƣợc lƣu lại.

Nếu có giá trị lớn hơn T thì phân phối đa phƣơng thức đƣợc thực hiện bởi phép lặp nền chuyển động (ví dụ: lá trên cây, cờ treo trƣớc gió…). Quá trình này có thể có nhiều hơn một màu đƣợc chứa trong mô hình nền. Kết quả này cho phép mô hình nền có thể có nhiều hơn một màu.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số kỹ thuật phát hiện đối tượng chuyển động từ camera và ứng dụng giám sát tự động trong siêu thị (Trang 33 - 39)

Tải bản đầy đủ (PDF)

(78 trang)