KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN MẶT NGƯỜI
Khái quát về xử lý ảnh
1.1.1 Một số khái niệm cơ bản
Xử lý ảnh đóng vai trò quan trọng trong kỹ thuật thị giác máy tính, là nền tảng cho nhiều nghiên cứu trong lĩnh vực này Hai nhiệm vụ chính của xử lý ảnh bao gồm nâng cao chất lượng thông tin hình ảnh và cung cấp dữ liệu cho các quá trình khác, đặc biệt là ứng dụng thị giác vào điều khiển.
Quá trình xử lý ảnh bắt đầu bằng việc thu nhận hình ảnh từ các thiết bị số hoặc tương tự và gửi đến máy tính Dữ liệu ảnh sau đó được lưu trữ ở định dạng phù hợp để xử lý Lập trình viên áp dụng các thuật toán tương ứng lên dữ liệu ảnh nhằm thay đổi cấu trúc ảnh cho phù hợp với các ứng dụng khác nhau.
Quá trình xử lý nhận dạng ảnh là thao tác trên ảnh đầu vào để đạt được kết quả mong muốn, có thể là một ảnh đã được xử lý hoặc một kết luận cụ thể.
Quá trình xử lý ảnh liên quan đến việc xem ảnh như một tập hợp các điểm ảnh, trong đó mỗi điểm ảnh thể hiện cường độ sáng hoặc một đặc trưng tại vị trí cụ thể của đối tượng trong không gian Điều này cho phép coi ảnh như một hàm n biến P(c,c1,c2,…), dẫn đến việc hình ảnh trong xử lý ảnh có thể được hiểu như ảnh n chiều Kết quả của quá trình này là ảnh được xử lý, mang lại những thông tin và đặc điểm mới cho người dùng.
* Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hình 1.2 Các bước cơ bản trong một hệ thống xử lý ảnh
1.1.2 Một số vấn đề trong xử lý ảnh
1.1.2.1 Các hệ thống xử lý ảnh a Tiền xử lý
Tiền xử lý là giai đoạn đầu tiên trong xử lý ảnh số, bao gồm các công đoạn như nâng cấp, khôi phục ảnh, nắn chỉnh hình học và khử nhiễu, tùy thuộc vào các bước xử lý tiếp theo.
Trong quá trình xử lý ảnh, việc trích chọn các đặc điểm của đối tượng được thực hiện tùy theo mục đích nhận dạng Trích chọn hiệu quả các đặc điểm này không chỉ nâng cao độ chính xác trong việc nhận dạng các đối tượng ảnh mà còn giúp tăng tốc độ tính toán và giảm dung lượng bộ nhớ lưu trữ.
Nhận dạng tự động, mô tả đối tượng, phân loại và phân nhóm mẫu là những vấn đề cốt lõi trong thị giác máy, với ứng dụng rộng rãi trong nhiều lĩnh vực khoa học Các mẫu có thể bao gồm hình ảnh vân tay, ảnh chụp vật thể, chữ viết, khuôn mặt con người hoặc tín hiệu âm thanh Để nhận dạng hoặc phân loại một mẫu, hệ thống nhận dạng tự động trải qua ba giai đoạn chính.
Thu nhận dữ liệu và tiền xử lý
Nhận dạng, ra quyết định
Hệ quyết định Đối sánh rút ra kết luận
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là: Đối sánh mẫu dựa trên các đặc trưng được trích chọn
Phân loại thống kê Đối sánh cấu trúc
Phân loại dựa trên mạng nơ-ron nhân tạo
Trong các ứng dụng phân loại, không thể chỉ sử dụng một phương pháp duy nhất để đạt được kết quả tối ưu Do đó, việc kết hợp nhiều phương pháp và cách tiếp cận khác nhau là cần thiết Các phương thức phân loại tổ hợp đã được áp dụng hiệu quả trong nhận dạng, với những kết quả triển vọng từ việc thiết kế các hệ thống lai (hybrid system) kết hợp nhiều mô hình.
1.1.2.2 Các hình thái của ảnh a.Chuyển ảnh màu thành ảnh xám Đơn vị tế bào của ảnh số là pixel Tùy theo mỗi định dạng là ảnh màu hay ảnh xám mà từng pixel có thông số khác nhau Đối với ảnh màu từng pixel sẽ mang thông tin của ba màu cơ bản tạo ra bản màu khả kiến là Đỏ (R), Xanh lá (G) và Xanh biển (B) [Thomas 1892] Trong mỗi pixel của ảnh màu, ba màu cơ bản R, G và B được bố trí sát nhau và có cường độ sáng khác nhau Thông thường, mỗi màu cơ bản được biểu diễn bằng tám bit tương ứng 256 mức độ màu khác nhau Như vậy mỗi pixel chúng ta sẽ có 28x3"4 màu (khoảng 16.78 triệu màu) Đối với ảnh xám, thông thường mỗi pixel mang thông tin của 256 mức xám (tương ứng với tám bit) như vậy ảnh xám hoàn toàn có thể tái hiện đầy đủ cấu trúc của một ảnh màu tương ứng thông qua tám mặt phẳng bit theo độ xám b.Lược đồ xám của ảnh (Histogram)
Lược đồ xám của một ảnh số được xác định bởi các mức xám trong khoảng [0,L−1] và được mô tả bằng hàm rời rạc p(rk)=nk/n, trong đó nk là số pixel có mức xám rk và n là tổng số pixel trong ảnh Hàm P(rk) cho phép chúng ta ước lượng xác suất xuất hiện của mức xám rk Việc vẽ hàm này cho tất cả các giá trị k sẽ thể hiện sự phân bố các mức xám trong ảnh Ngoài ra, lược đồ mức xám cũng có thể được biểu diễn qua tần suất xuất hiện của từng mức xám trên hệ tọa độ vuông góc xOy, với trục hoành là số mức xám từ 0 đến N (số bit của ảnh xám) và trục tung biểu thị tần suất.
1.1.3 Một số ứng dụng trong xử lý ảnh
Các kỹ thuật xử lý ảnh trước đây chủ yếu nhằm nâng cao chất lượng hình ảnh, tạo cảm giác về sự cải thiện chất lượng quang học cho người quan sát Gần đây, ứng dụng của xử lý ảnh đã mở rộng đáng kể, và hiện tại không có lĩnh vực khoa học nào không tận dụng những thành tựu của công nghệ xử lý ảnh số.
Trong y học, các thuật toán xử lý ảnh giúp chuyển đổi hình ảnh từ nguồn bức xạ X-ray hoặc siêu âm thành hình ảnh quang học trên film x-quang hoặc màn hình hiển thị Những hình ảnh này có thể được xử lý thêm để nâng cao độ tương phản, lọc và tách các thành phần cần thiết, hoặc tạo ra hình ảnh 3D từ siêu âm.
Trong lĩnh vực địa chất, ảnh vệ tinh có thể được phân tích để xác định cấu trúc bề mặt trái đất Kỹ thuật nâng cao hình ảnh và khôi phục ảnh giúp cải thiện chất lượng ảnh vệ tinh, từ đó tạo ra bản đồ địa hình 3-D với độ chính xác cao.
Trong ngành khí tượng học, việc xử lý và nâng cao chất lượng ảnh từ hệ thống vệ tinh theo dõi thời tiết giúp tạo ra hình ảnh bề mặt trái đất trên diện rộng, từ đó cải thiện độ chính xác trong dự báo thời tiết.
Xử lý ảnh đóng vai trò quan trọng trong lĩnh vực hình sự và hệ thống bảo mật, giúp nhận diện vân tay và khuôn mặt, từ đó phát hiện nhanh các đối tượng nghi vấn và nâng cao hiệu quả bảo mật cá nhân Ngoài ra, kỹ thuật này còn được ứng dụng trong nhiều lĩnh vực khác như tự động nhận dạng, nhận diện mục tiêu quân sự, máy nhìn công nghiệp trong hệ thống điều khiển tự động, cũng như nén ảnh tĩnh và động để lưu trữ và truyền tải qua mạng viễn thông.
Bài toán nhận dạng mặt người
1.2.1 Bài toán nhận dạng mặt người
Hệ thống nhận dạng khuôn mặt là công nghệ cho phép phân tích hình ảnh hoặc video để xác định vị trí khuôn mặt con người Qua quá trình xử lý, hệ thống có thể nhận diện người trong ảnh, xác định danh tính của họ dựa trên dữ liệu đã được học, hoặc phân loại họ là người lạ.
1.2.2 Những khó khăn của nhận dạng khuôn mặt a Tư thế góc chụp : Ảnh chụp khuôn mặt có thể thay đổi rất nhiều bởi vì góc chụp giữa camera và khuôn mặt.Chẳng hạn như : chụp thẳng, chụp xéo bên trái
Việc nhận diện khuôn mặt gặp nhiều khó khăn do nhiều yếu tố khác nhau Đầu tiên, góc chụp ảnh có thể làm khuất một phần hoặc toàn bộ các thành phần trên khuôn mặt như mắt, mũi, và miệng Thứ hai, sự xuất hiện hoặc thiếu vắng của các đặc trưng như râu mép, kính mắt có thể làm tăng độ phức tạp của bài toán Thứ ba, biểu cảm khuôn mặt cũng ảnh hưởng lớn đến nhận diện, vì cùng một khuôn mặt có thể trông rất khác khi người đó cười hay sợ hãi Thêm vào đó, khuôn mặt có thể bị che khuất bởi các đối tượng khác, và hướng của ảnh có thể thay đổi đáng kể với các góc quay khác nhau của camera Điều kiện chụp ảnh, bao gồm ánh sáng và loại camera, cũng ảnh hưởng đến chất lượng hình ảnh Cuối cùng, nền ảnh phức tạp có thể gây nhầm lẫn, làm cho quá trình phân tích và nhận diện khuôn mặt trở nên khó khăn hơn.
Màu sắc của da mặt đóng vai trò quan trọng trong việc nhận diện khuôn mặt Khi màu da quá tối hoặc gần giống với màu sắc của môi trường xung quanh, thuật toán nhận diện sẽ gặp khó khăn trong việc xác định các đặc trưng khuôn mặt Điều này có thể dẫn đến việc không nhận diện được khuôn mặt người một cách chính xác.
1.2.3 Tầm quan trọng của bài toán nhận diện mặt người
Công nghệ nhận dạng giọng nói phù hợp cho các ứng dụng call-center nhưng gặp khó khăn trong môi trường ồn ào và đông người Trong khi đó, nhận dạng chữ ký có nhược điểm là khó duy trì tính nhất quán, khiến người dùng gặp phiền phức Nhận dạng vân tay đã trở nên phổ biến nhưng cũng bị ảnh hưởng bởi độ ẩm và hóa chất, đồng thời có nguy cơ bị giả mạo Ngược lại, công nghệ nhận dạng mống mắt nổi bật với độ chính xác cao và khả năng chống giả mạo, nhờ vào sơ đồ mạch máu trong võng mạc mắt, không thay đổi trong suốt cuộc đời Tuy nhiên, công nghệ này cũng chịu tác động từ nhiều yếu tố như độ rộng của mắt và lông mi, đồng thời khó triển khai rộng rãi do thiết bị phức tạp.
Công nghệ nhận dạng mặt người, mặc dù không nổi bật về độ chính xác, lại có ưu điểm lớn là không cần tiếp xúc trực tiếp giữa đối tượng và thiết bị thu nhận Điều này cho phép công nghệ này thực hiện việc theo dõi và giám sát một cách thuận tiện, rất phù hợp cho các ứng dụng bảo vệ mục tiêu và chống khủng bố tại những khu vực công cộng đông người, điều mà các phương pháp nhận dạng khác khó đạt được.
1.2.4.Các ứng dụng đặc trưng của bài toán nhận diện mặt người
Bài toán phát hiện mặt người trong ảnh là một thách thức phức tạp nhưng thu hút sự quan tâm của nhiều nhà nghiên cứu do tính ứng dụng thực tiễn rộng rãi trong cuộc sống hiện đại Một số ứng dụng phổ biến của công nghệ nhận diện khuôn mặt bao gồm an ninh, giám sát, và cải thiện trải nghiệm người dùng trong các dịch vụ trực tuyến.
Hệ thống giao tiếp thông minh giữa con người và máy tính cho phép nhận diện khuôn mặt và biểu cảm để dự đoán trạng thái tâm lý Trong tương lai, ngôi nhà thông minh sẽ có khả năng nhận biết chủ nhân thông qua công nghệ nhận diện khuôn mặt, dáng người, giọng nói và vân tay.
Hệ thống nhận dạng tội phạm có khả năng nhận diện khuôn mặt ngay lập tức và đối chiếu với hàng triệu bản ghi trong cơ sở dữ liệu, giúp xác định liệu đó có phải là một tội phạm đang bị truy nã hay một nhân vật đặc biệt cần được chú ý.
Trong thời đại công nghệ hiện đại, hầu hết các máy ảnh đều được trang bị chức năng tự động nhận diện khuôn mặt, giúp tối ưu hóa độ nét và điều chỉnh ánh sáng phù hợp với môi trường xung quanh Nhiều trang web cũng đã áp dụng công nghệ này, sử dụng hệ thống nhận diện khuôn mặt để so sánh với kho dữ liệu khổng lồ, từ đó cung cấp những lời chào và dịch vụ thông minh nhất cho người dùng.
Hệ thống quan sát, theo dõi và bảo vệ: các hệ thống camera sẽ xác định đâu là con người và theo dõi người đó…
Hệ thống kiểm soát ra vào các cơ quan, văn phòng cho phép nhân viên truy cập vào những khu vực quan trọng mà không cần đăng nhập hay sử dụng thẻ Khi kết hợp với công nghệ nhận diện vân tay hoặc mống mắt, hệ thống này sẽ mang lại độ chính xác cao trong việc xác thực danh tính.
Tổ chức tìm kiếm liên quan đến con người thông qua khuôn mặt trên nhiều hệ cơ sở dữ liệu lớn
Phân tích cảm xúc của khuôn mặt người v v
1.2.5.Xây dựng hệ thống nhận diện mặt người đặc trưng
Hệ thống nhận diện khuôn mặt người bao gồm ba bước cơ bản: thu thập dữ liệu hình ảnh, xử lý và phân tích đặc trưng khuôn mặt, và cuối cùng là so sánh và nhận diện khuôn mặt Quá trình này có thể phức tạp và đòi hỏi nhiều công đoạn khác nhau để đạt được độ chính xác cao.
Hình 1.4 Hệ thống nhận diện mặt người đặc trưng
Tiền xử lý ảnh là bước quan trọng trong việc cải thiện chất lượng hình ảnh bằng cách điều chỉnh độ sáng và giảm độ nhiễu Quá trình này giúp rút trích các đặc trưng khuôn mặt một cách dễ dàng hơn Thông thường, tiền xử lý ảnh được thực hiện nhanh chóng và đơn giản, không yêu cầu các thuật toán phức tạp hay tốn nhiều thời gian.
Trích rút đặc trưng là một kỹ thuật quan trọng, sử dụng các thuật toán để thu thập thông tin đặc trưng của từng cá nhân, giúp nhận diện và phân tích đặc điểm riêng biệt của họ.
Nhận diện khuôn mặt: sau khi đã rút trích các đặc trưng, sẽ đưa vào khối nhận dạng để phân lớp đối tượng
1.2.6 Một số phương pháp nhận diện mặt người
Hiện nay, có nhiều phương pháp xác định khuôn mặt trong ảnh, bao gồm cả ảnh chất lượng thấp và cao, cũng như ảnh đen trắng và có màu Các phương pháp này có thể được chia thành bốn hướng tiếp cận chính.
Pháp phát hiện mặt người dựa trên đặc trưng lõm
Lõm được hiểu đơn giản là những điểm thấp nhất trong một khu vực, như thung lũng Trong ảnh vệ tinh, lõm thể hiện qua các đường khe giữa hai dãy núi Trong y tế, lõm là các thành phần trũng xuống, và trên khuôn mặt, các hốc mắt cũng được xem là lõm.
Tác giả Hải Trần áp dụng bộ lọc Laplacian-of-Gaussian và một thuật toán để dò tìm quỹ tích các điểm cực trị, như thể hiện trong Hình 2.1 với các đặc trưng lõm được tô màu xanh Các điểm lõm này chỉ đại diện cho những vùng chi tiết nhỏ, bao gồm mắt, chân mày, mũi và miệng.
Trong bài viết này, chúng ta sẽ khám phá các đặc trưng lõm ở nhiều mức độ khác nhau Bắt đầu từ mức thấp nhất, chúng ta sẽ tìm kiếm các đặc trưng nhỏ và chi tiết như mắt và mũi Khi nâng cao lên các mức độ tiếp theo, chúng ta sẽ tìm kiếm các vùng lõm lớn hơn Hình ảnh so sánh với việc nhìn một người từ xa cho thấy, ở khoảng cách xa, chỉ có thể nhận diện dáng người, gần hơn một chút có thể thấy mặt nhưng không thể nhìn rõ các chi tiết như mắt, mũi, miệng Chỉ khi lại gần hơn, chúng ta mới có thể quan sát rõ ràng các chi tiết này Điều này phản ánh cách tiếp cận phân tích ở nhiều mức độ khác nhau.
Hình 2.1.Dò tìm thông tin lõm
2.2.Rút trích các đặc trƣng lõm
Gọi I(x, y) là hàm hai biến đại diện cho một ảnh I, tạo thành một mặt (x, y, I(x, y)) Mục tiêu của chúng ta là xác định các điểm có khả năng là.
TÌM HIỂU VỀ CÁC ĐẶC TRƯNG KHUÔN MẶT
Rút trích các đặc trưng lõm
Lõm được hiểu đơn giản là những điểm thấp nhất, như thung lũng trong tự nhiên Trong ảnh vệ tinh, lõm thể hiện qua các đường khe giữa hai dãy núi Trong y tế, lõm xuất hiện dưới dạng các thành phần trũng xuống, và trong khuôn mặt, các hốc mắt cũng được xem là lõm.
Tác giả Hải Trần áp dụng bộ lọc Laplacian-of-Gaussian và thuật toán dò tìm quỹ tích của các điểm cực trị để phân tích hình ảnh Hình 2.1 minh họa các đặc trưng lõm tương tự như kết quả của Hải Trần, với các điểm lõm được tô màu xanh Cần lưu ý rằng các điểm lõm được rút trích chỉ đại diện cho các vùng lõm nhỏ và chi tiết, bao gồm mắt, chân mày, mũi và miệng.
Trong bài viết này, chúng ta sẽ khám phá các đặc trưng lõm ở các mức độ khác nhau Ở mức thấp nhất, chúng ta sẽ tìm kiếm các đặc trưng lõm nhỏ và chi tiết như mắt và mũi Khi nâng cao đến các mức độ cao hơn, chúng ta sẽ tìm kiếm các vùng lõm lớn hơn Cách tiếp cận này tương tự như việc quan sát một người từ xa, nơi chỉ có thể nhận diện hình dáng; khi đến gần hơn, ta có thể thấy khuôn mặt nhưng không nhìn thấy chi tiết, và chỉ khi lại gần hơn nữa, ta mới có thể nhận diện rõ ràng các chi tiết như mắt, mũi và miệng.
Hình 2.1.Dò tìm thông tin lõm
2.2.Rút trích các đặc trƣng lõm
Hàm I(x, y) là một hàm hai biến đại diện cho một bức ảnh, tạo ra một mặt (x, y, I(x, y)) Mục tiêu chính của chúng ta là xác định các điểm có khả năng cao để phát hiện.
(2.3) Ảnh đang xét s Vùng đánh giá
Điểm lõm trên mặt là những điểm mà tại đó cả hai đạo hàm đạt cực trị Tuy nhiên, trong thực tế, do ảnh là một hàm số không liên tục và rời rạc do sự số hóa của máy tính, việc tìm kiếm các điểm cực trị trở nên khó khăn hơn.
Chúng ta sẽ mất một số thông tin từ các điểm ảnh lõm và những điểm lân cận Để giảm bớt các ràng buộc đối với điểm lõm, chúng tôi đưa ra các công thức sau đây.
Trong đó V P là tập các điểm lõm Ký hiệu LoG ( x, y) là giá trị của
Laplacian-of-Gaussian tại điểm (x, y) Mục đích là rút trích các vùng lõm chứ không chỉ rút trích điểm lõm
2.2.2 Dò tìm và lấy vùng lõm Để đánh giá một vùng có phải là lõm hoặc không lõm, chúng ta đề xuất một bộ lọc như sau:
Hình 2.2 Dò tìm vùng lõm trên ảnh Ứng với vùng đang xét – một hình vuông s x s , chúng ta tính giá trị của bộ lọc trên
Nguyễn Thị Thơm - Lớp CT1301 23
Lọc chữ nhật ngang Lọc chữ nhật đứng
Trong công thức (2.3), hàm sum(X) là hàm tổng giá trị độ sáng trong vùng X Dựatrên giá trị F(R) vừa tính được, chúng ta đánh giá vùng R theo công thức sau:
Công thức (2.5) mở rộng từ (2.2) và (2.3) để phát hiện các vùng lõm trên ảnh, với điểm khác biệt chính là sử dụng bộ lọc hiệu trong (2.5) thay vì Laplacian-of-Gaussian Bằng cách thay đổi kích thước S của vùng xét, chúng ta có thể phát hiện các vùng lõm với nhiều kích cỡ và mức độ khác nhau Để nhận diện và rút trích các vùng lõm có hình dạng đa dạng, việc sử dụng một tập hợp các lọc hình học với nhiều hình dạng là cần thiết, thay vì chỉ dùng một bộ lọc vuông.
Hình 2.3 Tập các bộ lọc
Do đó ta có thể biến đổi công thức (2.4) thành công thức sau:
F S (R) được sử dụng để tính giá trị lọc vuông, trong khi FR (R) được áp dụng cho các lọc hình chữ nhật Các công thức tính lọc tương tự như công thức của Laplacian, nhưng khác biệt ở chỗ sử dụng vùng thay vì từng điểm đơn lẻ Hệ số đứng trước hàm sum(R) được xác định bởi tỷ lệ giữa diện tích vùng trung tâm và tổng diện tích của vùng lân cận Cụ thể, trong hình (2.3a), tổng diện tích các vùng xung quanh gấp đôi diện tích phần giữa, dẫn đến hệ số 2 Trong khi đó, ở hình (2.3b) và (2.3c), tổng diện tích các vùng xung quanh gấp rưỡi diện tích hình chữ nhật giữa, do đó hệ số chính xác là 1.5 Tuy nhiên, để tăng tốc độ tính toán, ta sử dụng các hệ số nguyên 3 và 2 thay vì hệ số 1.5, vì việc tính toán trên số thực rất chậm.
Một yếu tố quan trọng trong công thức (2.5) là ngưỡng, phụ thuộc tuyến tính vào diện tích vùng xét Chúng ta sử dụng 1 = KS² cho lọc hình vuông kích thước S và 2 = 4KS² cho lọc hình chữ nhật cùng kích thước K là thông số thực nghiệm, trong đó ngưỡng 1 là tích của K và S² Tương tự, trong (2.7), giá trị F R (R) được gấp đôi để tránh tính toán trên số thực, do đó ngưỡng 2 cũng cần được gấp đôi để tăng độ chính xác trong đánh giá.
2.2.3.Dò và phát hiện vùng lõm o nhiều mức khác nhau
Phương pháp này sử dụng các bộ lọc hiệu quả ở nhiều mức độ khác nhau để phát hiện các vùng lõm Các bộ lọc đã được giới thiệu ở phần trước sẽ được áp dụng với nhiều kích thước khác nhau, giúp xác định các vùng lồi ở nhiều mức độ khác nhau.
, ảnh sau khi smoth với Các vùng lõm dò với kích thước lọc 1 Gausian 10 2
, ảnh sau khi smoth với Các vùng lõm dò tìm với kích
Hình 2.4 Dò tìm vùng lõm ở nhiều mức khác nhau Đặt 1 , 2 , n là các mức độ được định nghĩa trước và có độ lớn tăng dần
Mức độ 1 là mức thấp nhất, cho phép chúng ta dò tìm các vùng lõm nhỏ và chi tiết Trong khi đó, mức độ n là mức cao nhất, giúp phát hiện các vùng lõm lớn hơn với ít chi tiết hơn Trước khi thực hiện dò tìm ở mỗi mức, chúng ta cần áp dụng một lọc phù hợp.
Chúng tôi sử dụng bộ lọc Gaussian với kích thước i 2 và 3 bộ lọc hiệu với kích thước S = i, như thể hiện trong hình (2.3) Hình (2.4) minh họa các vùng lõm, được đánh dấu bằng hình vuông và hình chữ nhật màu xanh Mặc dù có nhiều vùng lõm khác được phát hiện, hình (2.4) chỉ tập trung vào các vùng lõm trong khu vực ảnh quan tâm, cụ thể là khuôn mặt Phần tiếp theo sẽ trình bày phương pháp cấu trúc các vùng lõm rút trích thành các cây cấp bậc.
2.2.3.1.Tối ƣu tốc độ dò tìm
Trong việc tính tổng độ sáng của các điểm ảnh trong một vùng hình chữ nhật có thể chồng chéo, việc tính toán trở nên chậm chạp do phải lặp lại nhiều lần Để giảm độ phức tạp của quá trình này, tôi áp dụng phương pháp tương tự như ảnh tích phân và kỹ thuật lập trình quy hoạch động Phương pháp này giúp tối ưu hóa tính toán và nâng cao hiệu suất xử lý.
Cho trước một ảnh mức xám I (x, y) , chúng ta định nghĩa một ảnh tích phân
S(x, y) sao cho S(x, y) là tổng mức sáng của toàn bộ điểm ảnh trong hình chữ nhật R(1,1, x, y) Chúng ta có thể dễ dàng tính được S (x, y) theo công thức truy hồi:
Từ ảnh S (x, y) , ta dễ dáng tính được tổng độ sáng của một hình chữ nhật bất kỳ R(l, r,t,b) theo công thức sau:
Phương pháp này nâng cao đáng kể tốc độ tính toán bằng cách chỉ yêu cầu tính toán một lần ảnh tích phân, sau đó áp dụng cho tất cả các cửa sổ hình chữ nhật con Đặc biệt, độ phức tạp tính toán không phụ thuộc vào kích thước của vùng được xem xét.
2.2.4.1.Xây dựng cấu trúc cây lõm
Từ các vùng lõm đã rút trích, chúng ta tạo ra các cây quan hệ cấp bậc Những vùng rút trích ở cấp độ cao nhất sẽ trở thành các nút gốc, trong khi những vùng ở cấp độ thấp nhất sẽ được chèn vào cây như các nút lá.
Hình 2.7 Tạo cây cấp bậc