Luận văn tìm hiểu đặc trưng lồi 3d và bài toán phát hiện mặt người trong ảnh

KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN MẶT NGƯỜI

Khái quát về xử lý ảnh

1.1.1 Một số khái niệm cơ bản

Xử lý ảnh là một lĩnh vực quan trọng trong kỹ thuật thị giác máy tính, đóng vai trò nền tảng cho nhiều nghiên cứu trong ngành Hai nhiệm vụ chính của xử lý ảnh bao gồm nâng cao chất lượng thông tin hình ảnh và cung cấp dữ liệu cho các quy trình khác, trong đó có ứng dụng thị giác trong điều khiển.

Quá trình xử lý ảnh bắt đầu bằng việc thu nhận ảnh từ các thiết bị số hoặc tương tự và gửi về máy tính Dữ liệu ảnh sau đó được lưu trữ ở định dạng phù hợp để phục vụ cho việc xử lý Lập trình viên sẽ áp dụng các thuật toán tương ứng lên dữ liệu ảnh nhằm thay đổi cấu trúc ảnh, phù hợp với các ứng dụng khác nhau.

Quá trình xử lý nhận dạng ảnh là thao tác trên ảnh đầu vào để đạt được kết quả mong muốn, có thể là một ảnh "tốt hơn" hoặc một kết luận cụ thể Ảnh được coi là tập hợp các điểm ảnh, mỗi điểm ảnh đại diện cho cường độ sáng hoặc một dấu hiệu tại vị trí cụ thể của đối tượng trong không gian, và có thể được mô tả như một hàm n biến P(c,c1,c2,…) Do đó, trong lĩnh vực xử lý ảnh, ảnh có thể được hiểu như một ảnh n chiều.

* Sơ đồ tổng quát của một hệ thống xử lý ảnh:

Tiền xử lý Trích trọn đặc điểm

Hệ quyết định Đối sánh rút ra kết luận

Kết luận Ảnh tốt hơn Ảnh xấu hơn

Phạm Thành Huân – Lớp CT1301 6

1.1.2 Một số vấn đề trong xử lý ảnh

1.1.2.1 Các hệ thống xử lý ảnh

Thu nhận ảnh là bước đầu tiên trong quá trình xử lý ảnh, yêu cầu sử dụng các thiết bị như camera và scanner Những thiết bị này có khả năng thu nhận ảnh, bao gồm cả ảnh đen trắng.

There are two main types of image capture devices corresponding to the common image formats: Raster and Vector Typically, Raster images are captured using cameras, while Vector images are acquired through sensors, digitizers, or by converting Raster images.

Các thiết bị thu ảnh thông thường bao gồm camera và bộ chuyển đổi tương tự số AD hoặc scanner chuyên dụng, cho phép tạo ra ảnh đen trắng hoặc ảnh màu Đầu ra của scanner là ảnh ma trận số, hay còn gọi là bản đồ ảnh (ảnh Bitmap), trong khi bộ số hoá (digitalizer) tạo ra ảnh vector có hướng Nhìn chung, các hệ thống thu nhận ảnh thực hiện hai quá trình chính.

- Cảm biến : biến đổi năng lượng quang học thành năng lượng điện

- Tổng hợp năng lượng điện thành ảnh

Tiền xử lý là bước quan trọng trong việc cải thiện chất lượng ảnh, bao gồm các kỹ thuật như tăng cường độ tương phản, khử nhiễu, khôi phục hình ảnh và điều chỉnh hình học Mục tiêu của quá trình này là nâng cao chất lượng ảnh, tạo nền tảng vững chắc cho các bước xử lý phức tạp tiếp theo.

Khử nhiễu là quá trình loại bỏ hai loại nhiễu: nhiễu hệ thống và nhiễu ngẫu nhiên Nhiễu hệ thống có tính tuần hoàn và có thể được khử bằng phép biến đổi Fourier để loại bỏ các đỉnh điểm Trong khi đó, nhiễu ngẫu nhiên thường xuất hiện dưới dạng các vết bẩn tương ứng với các điểm sáng hoặc tối, có thể được xử lý bằng các phương pháp như nội suy, lọc trung vị và lọc trung bình.

Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh

Chỉnh tán xạ là quá trình cải thiện chất lượng ảnh thu nhận từ các thiết bị quang học hoặc điện tử, thường gặp tình trạng mờ, nhòe Phương pháp biến đổi Fourier, thông qua tích chập của ảnh với hàm tán xạ, giúp hiệu chỉnh và khôi phục độ rõ nét cho ảnh.

Nắn chỉnh hình học là quá trình điều chỉnh các biến dạng hình học thường xảy ra do ảnh hưởng của thiết bị điện tử và quang học Phương pháp hiệu chỉnh hình ảnh dựa trên mô hình được diễn tả qua phương trình biến đổi từ ảnh biến dạng f(x,y) thành ảnh lý tưởng f(x’,y’).

Trong đó , là các phương trình tuyến tính (biến dạng do phối cảnh) hay bậc hai (biến dạng do ống kính camera)

Việc trích chọn đặc điểm trong ảnh là cần thiết do lượng thông tin lớn mà ảnh chứa đựng Hầu hết các ứng dụng chỉ cần một số thông tin đặc trưng, do đó, quá trình này giúp giảm thiểu khối lượng dữ liệu khổng lồ Trích chọn hiệu quả các đặc điểm không chỉ nâng cao độ chính xác trong việc nhận dạng đối tượng ảnh mà còn cải thiện tốc độ tính toán và giảm dung lượng bộ nhớ lưu trữ.

Các đặc điểm của đối tượng được trích chọn tùy theo mục đích nhận dạng, bao gồm đặc điểm không gian như phân bố mức xám, phân bố xác suất, biên độ và điểm uốn Đặc điểm biến đổi được xác định thông qua lọc vùng (zonal filtering) với các bộ vùng gọi là “mặt nạ đặc điểm”, thường có hình dạng như chữ nhật, tam giác hay cung tròn Đặc điểm biên và đường biên là những yếu tố quan trọng trong việc nhận dạng đối tượng, giúp trích chọn các đặc tính bất biến Những đặc điểm này có thể được xác định bằng các toán tử như Gradien, Laplace và toán tử chéo không (zero crossing).

Nhận dạng tự động, mô tả đối tượng, phân loại và phân nhóm mẫu là những vấn đề quan trọng trong lĩnh vực thị giác máy, với ứng dụng rộng rãi trong nhiều ngành khoa học Các mẫu có thể bao gồm ảnh vân tay, hình ảnh vật thể, chữ viết, khuôn mặt con người hoặc tín hiệu tiếng nói Việc nhận dạng và phân loại các mẫu này là cần thiết để hiểu và xử lý thông tin hiệu quả.

Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau đây:

Thu nhận dữ liệu và tiền xử lý

Nhận dạng, ra quyết định

Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là: Đối sánh mẫu dựa trên các đặc trưng được trích chọn

Phân loại thống kê Đối sánh cấu trúc

Phân loại dựa trên mạng nơ-ron nhân tạo

Trong các ứng dụng, việc sử dụng một phương pháp duy nhất để phân loại “tối ưu” là không khả thi Do đó, cần áp dụng nhiều phương pháp và cách tiếp cận khác nhau một cách đồng thời Các phương thức phân loại tổ hợp thường được sử dụng trong nhận dạng và đã cho thấy kết quả triển vọng thông qua thiết kế các hệ thống lai.

(hybrid system) bao gồm nhiều mô hình kết hợp

1.1.2.2 Các hình thái của ảnh

Chuyển đổi ảnh màu thành ảnh xám liên quan đến việc xử lý từng pixel, đơn vị cơ bản của ảnh số Mỗi pixel trong ảnh màu chứa thông tin về ba màu cơ bản: Đỏ (R), Xanh lá (G) và Xanh biển (B), với mỗi màu được biểu diễn bằng tám bit, cho phép hiển thị khoảng 16.78 triệu màu khác nhau Trong khi đó, ảnh xám đơn giản hóa thông tin này, chỉ sử dụng một giá trị độ sáng duy nhất cho mỗi pixel, giúp giảm dung lượng và tăng tốc độ xử lý ảnh.

Bài toán nhận dạng mặt người

1.2.1 Bài toán nhận dạng mặt người

Nhận diện mặt người, một lĩnh vực nghiên cứu mới chỉ xuất hiện vài thập kỷ qua, đã thu hút sự quan tâm lớn từ cộng đồng khoa học và công nghệ Với nhiều ứng dụng thực tiễn trong đời sống, giải trí và an ninh bảo mật, công nghệ này không chỉ mang lại tiện ích mà còn tạo ra sức hấp dẫn mạnh mẽ, thúc đẩy sự phát triển và hoàn thiện không ngừng.

Các nghiên cứu ban đầu về nhận diện khuôn mặt thường chỉ sử dụng ảnh đen trắng, chụp thẳng và thường chỉ có một hoặc hai khuôn mặt Tuy nhiên, theo thời gian, lĩnh vực này đã mở rộng để xử lý nhiều điều kiện phức tạp hơn, bao gồm ảnh màu, nhiều khuôn mặt, ánh sáng kém và môi trường xung quanh phức tạp Bài toán nhận diện khuôn mặt hiện nay có nhiều hướng nghiên cứu khác nhau, nhưng hai hướng chính vẫn được nhấn mạnh.

Nhận diện khuôn mặt trong ảnh và so sánh với các mẫu trong thư viện giúp xác định danh tính của một người Ứng dụng này có thể được áp dụng trong lĩnh vực an ninh và truy tìm tội phạm, mang lại hiệu quả cao trong việc phòng chống tội phạm.

Xác định vị trí nhiều khuôn mặt trong bức ảnh là một bài toán quan trọng, đặc biệt khi ảnh có nhiều khuôn mặt với kích thước và độ sáng khác nhau Công nghệ này không chỉ giúp nhận diện khuôn mặt mà còn có ứng dụng rộng rãi trong lĩnh vực giải trí.

1.2.2 Những khó khăn của nhận dạng khuôn mặt

Nhận diện khuôn mặt trong ảnh là một trong những thách thức phức tạp nhất trong lĩnh vực nhận diện Những khó khăn thường gặp bao gồm sự biến đổi về ánh sáng, góc chụp, và sự che khuất khuôn mặt, tất cả đều ảnh hưởng đến độ chính xác của quá trình nhận diện.

Nền ảnh phức tạp là một trong những thách thức lớn nhất trong nhận diện khuôn mặt, vì khuôn mặt có thể bị nhầm lẫn với nhiều khung cảnh xung quanh Điều này ảnh hưởng đáng kể đến quá trình phân tích và rút trích đặc trưng khuôn mặt, có thể dẫn đến việc không nhận diện được khuôn mặt hoặc nhận nhầm các yếu tố xung quanh thành khuôn mặt người.

Màu sắc da mặt ảnh hưởng lớn đến khả năng nhận diện khuôn mặt Khi màu da quá tối hoặc tương đồng với màu sắc xung quanh, thuật toán sẽ gặp khó khăn trong việc nhận diện các đặc trưng, dẫn đến khả năng không nhận ra khuôn mặt.

Góc chụp khuôn mặt là một thách thức lớn trong nhận diện khuôn mặt, đặc biệt khi khuôn mặt nhìn thẳng nhưng máy ảnh lại lệch hướng, hoặc khi khuôn mặt bị quay nghiêng nhiều Hầu hết các ứng dụng hiện nay chỉ hoạt động hiệu quả với ảnh có khuôn mặt nhìn thẳng hoặc gần như thẳng, trong khi những khuôn mặt bị nghiêng có thể làm che khuất hoặc biến dạng một số bộ phận, gây khó khăn trong việc tìm kiếm và rút trích đặc trưng.

Việc thể hiện cảm xúc mạnh mẽ và sử dụng nhiều phụ kiện trang trí trên khuôn mặt có thể gây khó khăn trong việc nhận diện khuôn mặt, đồng thời tạo ra thách thức cho các hệ thống nhận biết cảm xúc Những yếu tố như hình xăm, khuyên tai và kiểu tóc bù xù làm tăng độ phức tạp trong quá trình nhận diện Bên cạnh đó, điều kiện ánh sáng và môi trường xung quanh khi chụp ảnh cũng ảnh hưởng lớn đến việc phân tích đặc trưng khuôn mặt; ánh sáng không đủ hoặc quá mức đều gây trở ngại, cùng với các yếu tố thời tiết như mưa hay tuyết cũng làm giảm hiệu quả nhận diện.

Ngoài ra, các yếu tố khác cũng ảnh hưởng đến bức ảnh, bao gồm việc mặt người có thể bị che khuất bởi các đối tượng khác và sự đa dạng của nét mặt như vui, buồn, hay ngạc nhiên.

1.2.3 Tầm quan trọng của bài toán nhận diện mặt người

Công nghệ nhận dạng giọng nói phù hợp cho các ứng dụng call-center nhưng gặp khó khăn với tiếng ồn và môi trường đông người Trong khi đó, công nghệ nhận dạng chữ ký gây phiền phức cho người dùng do khó duy trì chữ ký giống nhau Nhận dạng vân tay được sử dụng phổ biến nhưng cũng có nhược điểm như ảnh hưởng bởi độ ẩm và hóa chất, cũng như dễ bị giả mạo Ngược lại, công nghệ nhận dạng mống mắt có độ chính xác cao và khả năng chống giả mạo nhờ vào sơ đồ mạch máu trong võng mạc, không thay đổi từ khi sinh đến khi chết Tuy nhiên, công nghệ này cũng bị ảnh hưởng bởi các yếu tố như độ rộng mắt, lông mi và kính đeo, đồng thời khó triển khai rộng rãi do tính phức tạp của thiết bị.

Công nghệ nhận dạng mặt người, mặc dù không nổi bật về độ chính xác, lại có ưu điểm vượt trội so với các phương pháp khác nhờ khả năng hoạt động mà không cần tiếp xúc trực tiếp giữa đối tượng và thiết bị thu nhận Điều này cho phép công nghệ này thực hiện theo dõi và giám sát hiệu quả, rất thuận tiện cho các ứng dụng bảo vệ mục tiêu và chống khủng bố tại những địa điểm đông người.

1.2.4 Các ứng dụng đặc trưng của bài toán nhận diện mặt người

Bài toán phát hiện khuôn mặt trong ảnh là một thách thức phức tạp nhưng thu hút sự quan tâm của nhiều nhà nghiên cứu, nhờ vào tính ứng dụng rộng rãi và thiết thực trong cuộc sống hiện đại Một số ứng dụng phổ biến của công nghệ nhận diện khuôn mặt bao gồm an ninh, nhận diện người dùng, và tương tác người-máy.

Hệ thống giao tiếp thông minh giữa con người và máy tính cho phép nhận diện khuôn mặt và biểu cảm, từ đó tạo ra những tương tác hiệu quả hơn Công nghệ này giúp cải thiện khả năng giao tiếp, mang lại trải nghiệm người dùng tốt hơn và mở ra nhiều cơ hội trong các lĩnh vực như dịch vụ khách hàng, giáo dục và giải trí.

Phạm Thành Huân – Lớp CT1301 15 cho rằng, trong tương lai, ngôi nhà thông minh sẽ có khả năng nhận diện chủ nhân thông qua các phương pháp như nhận diện khuôn mặt, hình dáng cơ thể, giao tiếp bằng giọng nói và dấu vân tay.

PHÁT HIỆN MẶT NGƯỜI DỰA VÀO ĐẶC TRƯNG LỒI

Đặc trƣng lồi

Điểm lồi được hiểu đơn giản là những điểm cao nhất, như đỉnh của dãy núi, và trong ảnh vệ tinh, lồi thể hiện đường xương sống của dãy núi Trong lĩnh vực y tế, lồi có thể là các đường mạch máu hoặc các cơ quan nhô cao Đối với khuôn mặt, mũi và các phần nhô của hai má cũng được coi là điểm lồi.

Tác giả Hải Trần áp dụng bộ lọc Laplacian-of-Gaussian và thuật toán dò tìm quỹ tích các điểm cực trị, với hình 2.1 minh họa các đặc trưng lồi, trong đó các điểm lồi được tô màu đỏ Cần lưu ý rằng các điểm lồi được rút trích chỉ đại diện cho các vùng lồi nhỏ và chi tiết, như chân mày, mũi và miệng.

Trong bài viết này, chúng ta sẽ khám phá các đặc trưng lồi ở các mức độ khác nhau Ở mức thấp nhất, chúng ta sẽ tìm kiếm các đặc trưng nhỏ và chi tiết như mắt và mũi Tiến lên mức cao hơn, chúng ta sẽ xác định các vùng lồi lớn hơn, và ở mức độ lớn nhất, toàn bộ khuôn mặt có thể trở thành một vùng lồi Điều này tương tự như việc quan sát một người từ xa, khi chỉ thấy dáng vẻ tổng quát, và khi lại gần hơn, chúng ta mới có thể nhận diện rõ các chi tiết trên khuôn mặt Phương pháp này phản ánh cách tiếp cận phân tích đa mức.

Hình 2.1 Dò tìm thông tin lồi và lõm

(2.3) Ảnh đang xét s Vùng đánh giá

Hàm hai biến I(x, y) đại diện cho một ảnh I, thiết lập mặt (x, y, I(x, y)) Mục tiêu của chúng ta là tìm kiếm các điểm lồi trên mặt này, được định nghĩa là những điểm mà cả hai đạo hàm đạt cực trị Tuy nhiên, do ảnh là hàm không liên tục và rời rạc do quá trình số hóa, việc chỉ dò tìm các điểm cực trị có thể dẫn đến mất thông tin về các điểm ảnh lồi và các điểm lân cận của chúng.

Vì vậy ta đưa ra các công thức sau đây nhằm giảm bớt các điều kiện ràng buộc đối với điểm lồi :

R P là tập hợp các điểm lồi, trong khi LoG (x, y) biểu thị giá trị của Laplacian-of-Gaussian tại tọa độ (x, y) Mục tiêu chính là rút trích các vùng lồi, không chỉ đơn thuần là các điểm lồi.

2.1.2 Dò tìm và lấy vùng lồi Để đánh giá một vùng có phải là lồi hoặc không lồi, chung ta đề xuất một bộ lọc như sau:

Hình 2.2 Dò tìm vùng trên ảnh

Đối với vùng hình vuông có kích thước s x s, giá trị bộ lọc được tính theo công thức 2.2 Các hình chữ nhật S1, S2, S3 và S4 bao quanh hình vuông R, và giá trị lọc F(R) được xác định dựa trên các hình này.

Trong công thức (2.3), hàm sum(X) tính tổng giá trị độ sáng trong vùng X Dựa trên giá trị F(R) đã được tính, chúng ta tiến hành đánh giá vùng R theo công thức đã cho.

Công thức 2.4 mở rộng từ (2.1) và (2.2) để phát hiện các vùng lồi trên ảnh, với điểm khác biệt chính là việc sử dụng bộ lọc hiệu trong (2.4) thay vì Laplacian-of-Gaussian Bằng cách điều chỉnh kích thước S của vùng xét, ta có thể phát hiện các vùng lồi với nhiều kích cỡ và mức độ khác nhau Thêm vào đó, để tìm và rút trích các vùng lồi có hình dạng đa dạng, việc sử dụng một tập hợp các lọc hình học thay vì chỉ một bộ lọc vuông là rất cần thiết.

Hình 2.3 Tập các bộ lọc

Do đó ta có thể biến đổi công thức (2.3) thành công thức sau:

F S (R) được sử dụng để tính giá trị lọc vuông, trong khi F R (R) được dùng cho giá trị lọc hình chữ nhật Các công thức tính lọc này tương tự như công thức của một Laplacian, nhưng khác biệt ở chỗ sử dụng vùng thay vì từng điểm đơn lẻ Hệ số trước hàm sum(R) được xác định bởi tỷ lệ giữa diện tích vùng ở tâm và tổng diện tích của vùng lân cận Ví dụ, trong hình (2.3a), tổng diện tích các vùng xung quanh gấp đôi diện tích phần ở giữa, dẫn đến hệ số 2 Trong các hình (2.3b) và (2.3c), tổng diện tích các vùng xung quanh gấp rưỡi diện tích phần hình chữ nhật ở giữa, do đó hệ số chính xác là 1.5 Tuy nhiên, để tăng tốc độ tính toán, chúng ta sử dụng các hệ số nguyên 3 và 2 thay vì hệ số 1.5.

Một thông số quan trọng khác trong công thức (2.4) là ngưỡng Ngưỡng phải phụ thuộc tuyến tính vào diện tích của vùng đang xét Chúng ta sử dụng

Đối với lọc hình vuông có kích thước S, giá trị KS² được tính là 1, trong khi đối với lọc hình chữ nhật có kích thước S, giá trị là 2 = 4KS² K là một thông số thực nghiệm quan trọng Ngưỡng 1 được xác định là tích của K và S², tương ứng với diện tích của lọc vuông Để tăng độ chính xác trong đánh giá, chúng ta đã gấp đôi giá trị F R (R) trong phần 2.6 và cũng cần gấp đôi ngưỡng 2.

2.1.3 Dò tìm và phát hiện vũng lồi ở nhiều mức khác nhau

Phương pháp này sử dụng các bộ lọc hiệu quả ở nhiều mức độ khác nhau để phát hiện các vùng lồi Các bộ lọc được giới thiệu trước đó sẽ được áp dụng với nhiều kích thước khác nhau, giúp xác định các vùng lồi ở nhiều mức độ khác nhau.

, ảnh sau khi smoth với Các vùng lồi dò tìm với kích

`, ảnh sau khi smoth với Các vùng lồi dò tìm với kích

Hình 2.4 minh họa quá trình dò tìm vùng lồi ở nhiều mức độ khác nhau, từ mức độ thấp nhất 1 đến mức độ cao nhất n, với mức độ 1 cho phép phát hiện các vùng lồi nhỏ và chi tiết Mỗi mức độ bắt đầu bằng việc áp dụng lọc Gaussian với kích thước i, sau đó sử dụng ba bộ lọc hiệu với kích thước S = i Các vùng lồi được xác định trong hình 2.4 được thể hiện bằng các hình vuông và hình chữ nhật màu đỏ, tập trung vào vùng ảnh khuôn mặt Mặc dù có nhiều vùng lồi khác được phát hiện, bài viết chỉ đề cập đến các vùng lồi trong vùng ảnh quan tâm Phương pháp tiếp theo sẽ trình bày cách cấu trúc các vùng lồi rút trích thành các cây cấp bậc.

2.1.4 Tối ƣu tốc đọ dò tìm

Trong quá trình tính toán tổng độ sáng của các điểm ảnh trong một vùng hình chữ nhật có thể chồng chéo, hiệu suất tính toán thường bị giảm do phải thực hiện nhiều phép tính lặp lại Để tối ưu hóa quy trình này, chúng tôi áp dụng phương pháp tương tự như ảnh tích phân và kỹ thuật lập trình quy hoạch động, giúp giảm độ phức tạp của các phép tính và cải thiện tốc độ xử lý.

Cho một ảnh mức xám I (x, y), ảnh tích phân S(x, y) được định nghĩa là tổng mức sáng của tất cả điểm ảnh trong hình chữ nhật R(1,1, x, y) Chúng ta có thể tính S(x, y) một cách dễ dàng bằng công thức truy hồi.

Từ ảnh S (x, y) , ta dễ dáng tính được tổng độ sáng của một hình chữ nhật bất kỳ R(l, r,t,b) theo công thức sau:

Hình 2.6:Tính tổng độ sáng cho hình chữ nhật R(l,t,r,b)

Phương pháp này nâng cao tốc độ tính toán một cách đáng kể, chỉ cần tính toán ảnh tích phân một lần và áp dụng cho tất cả các cửa sổ hình chữ nhật con Đặc biệt, độ phức tạp tính toán không phụ thuộc vào kích thước của vùng được xem xét.

Phát hiện mặt người

2.2.1 Xây dựng cấu trúc cây

Từ các vùng lồi được rút trích, chúng ta xây dựng các cây quan hệ cấp bậc, trong đó những vùng ở mức cao nhất n sẽ trở thành các nút gốc, còn những vùng ở mức thấp nhất 1 sẽ được chèn vào cây như những nút lá.

Hình 2.7 Tạo cây cấp bậc

Công việc chính trong việc tạo cây là kết nối các vùng rút trích tại một mức với các vùng ở mức kế tiếp Nếu vùng R tại mức 1 bị che khuất hơn hai phần ba bởi vùng R’ ở mức i+1, thì R sẽ được gán nhãn là nút con của R’ Qua đó, chúng ta có thể dễ dàng xây dựng cây cấp bậc từ các vùng đã rút trích Các vùng rút trích trong hình được tổ chức thành cây một cách hợp lý.

Mỗi nút trong cây rút trích từ khuôn mặt cần lưu trữ các thông tin quan trọng, bao gồm loại nút (lồi hoặc lõm), hình dạng (vuông, chữ nhật ngang, chữ nhật đứng), vị trí tương đối so với nút cha (giá trị từ 0 đến 12), và thông tin về độ sáng của nút.

Hình 2.9: vị trí vùng tương đối của nút con

Trong hình, các vị trí tương đối của nút con trên nút cha được thể hiện qua các hình dạng vuông, chữ nhật ngang và chữ nhật đứng Việc xác định vị trí của nút con so với nút cha khá đơn giản: nếu tâm của nút con nằm trong vùng nào của hình thì chỉ số của vùng đó chính là giá trị vị trí tương đối của nút con Đối với các nút gốc, giá trị này sẽ là 0 Thông tin về độ sáng cũng rất quan trọng trong việc phát hiện và nhận dạng khuôn mặt, và để lưu trữ thông tin này trên cây, ta sử dụng

Phạm Thành Huân - Lớp CT1301 đã áp dụng phương pháp phân tích thành phần chính (PCA) để giảm số chiều của ảnh mức xám trên vùng ảnh của nút Phương pháp này giúp giảm đáng kể thông tin cần lưu trữ về độ sáng của ảnh, cho phép chỉ cần lưu trữ một vector PCA thay vì toàn bộ điểm sáng của các vùng lồi Nhờ đó, thông tin cần lưu trữ và xử lý được giảm thiểu mà không làm mất quá nhiều thông tin.

Hình 2.10: cách tính vecto đại diện độ sáng cho nút

Để thực hiện quá trình này, chúng ta sử dụng một cửa sổ con S có kích thước 9x9 để quét theo đường zic-zac trên ảnh xám của vùng lồi Các cửa sổ này có thể chồng lắp lên nhau với hai phần ba kích thước của nó Tại mỗi điểm quét, chúng ta lưu lại giá trị trung bình mức sáng của các điểm ảnh trong cửa sổ S, từ đó tạo ra một vector đại diện cho mức sáng của điểm ảnh tại nút đó.

Zoom out Nội dung của nút được

Hình 2.11: cây rút trích được và các thông tin trên một nút

Chúng ta áp dụng một số quy tắc để loại bỏ các nhánh không cần thiết trong cây Nếu một nút có kiểu giống với nút cha của nó, nó sẽ được coi là nút lặp và bị tỉa khỏi cây Đối với nút lá, việc xóa bỏ diễn ra dễ dàng Tuy nhiên, nếu nút đó không phải là nút lá, tất cả các nút con của nó sẽ được gán lại cho nút cha Chẳng hạn, hai vùng lồi hình chữ nhật ở mức 2 và 3 thực chất là một, nhưng do hiệu ứng của phép lọc Gaussian tại các mức khác nhau, chúng được trích xuất từ ảnh với kích thước khác nhau, dẫn đến việc vùng lồi ở mức 3 bị xóa khỏi cây.

2.2.2 Xây dựng hàm tính độ tương đồng giữa hai cây

Trong phần này, chúng ta sẽ khám phá cách tính độ tương đồng giữa hai cây theo phương pháp đã trình bày trước đó Việc xây dựng hàm tương đồng giữa hai cây là rất quan trọng trong các xử lý liên quan đến đặc trưng này, vì nó quyết định độ chính xác trong phát hiện và nhận dạng khuôn mặt.

2.2.2.1 Độ tương đồng giữa hai nút trên cây Để xây dựng hàm tính độ tương đồng giữa hai cây trước hết ta cần xây dựng hàm tính độ tương đồng của hai nút trên hai cây Với điều kiện rằng hai nút thuộc hai cây khác nhau này cùng mức i nào đó

(2.3) Đặt N1 và N2 là hai nút cùng cấp trên hai cây T1 và T2 Khi đó N1 và N2 có những thuộc tính sau:

Trong bài viết này, chúng ta xem xét các đặc điểm của nút, bao gồm loại nút (t ∈ {ridge} - nút lồi), hình dạng của nút (s = {square, horizontal rectangle, vertical rectangle} - vuông, hình chữ nhật ngang, hình chữ nhật đứng) và vị trí tương đối của nút trong nút cha (p ∈ [0 12]) Thêm vào đó, i ∈ (a1, a2, , an) là vector chứa thông tin độ sáng của nút, với n thay đổi tùy theo cấp của nút Khi mức i càng cao, kích thước của vùng lồi lõm tương ứng với nút sẽ lớn hơn, đồng thời số chiều n của vector này cũng tăng lên.

Dựa trên các thuộc tính của node định nghĩa trong công thức 3.9, ta xây dựng công thức tính độ tương đồng giữa 2 nút như sau:

Trong công thức 2.10 , 1 , 1 , và 1 là các thông số thực ngiệm, hàm E(x,y) dùng để xét sự giống nhau giữa 2 thuộc tính được định nghĩa như sau:

Ký hiệu EV(x,y) đại diện cho hàm tính độ tương đồng giữa hai vector đã được chuẩn hóa trong khoảng [0,1] Ở đây, x và y là hai vector độ sáng có n chiều, được biểu diễn dưới dạng (a1,a2, an).

Mỗi thành phần ai trong vector độ sáng có giá trị từ 0 đến 255, do đó dễ dàng chứng minh rằng EV(x,y) nằm trong khoảng từ 0 đến 1 Giá trị EV(x,y) đạt tối đa là 1 khi hai vector x và y hoàn toàn trùng nhau, trong khi đó giá trị tối thiểu là 0 khi hai vector có khoảng cách Euclid lớn nhất Từ đó, chúng ta cũng có thể suy ra giá trị của NS (N1, N).

2 ) ∈[0,1] với mọi cặp nút N1 và N2

2.2.2.2 Độ tương đồng giữa hai cây

Dựa trên hàm tính độ tương đồng giữa hai nút, chúng ta có thể xây dựng hàm tính độ tương đồng giữa hai cây T1 và T2 Hai cây này sẽ có những thuộc tính đặc trưng cần được xem xét để đánh giá mức độ tương đồng.

Trong cấu trúc cây, r đại diện cho nút gốc với r thuộc tập Node Số lượng nhánh con được ký hiệu là n, với n thuộc tập N Mỗi nhánh con thứ i được ký hiệu là ci, với ci thuộc tập Tree và i nằm trong khoảng [1 n] Các nhánh con ci có thể là một nút đơn lẻ hoặc là một cây con khác.

Từ công thức (2.13), ta xây dựng công thức tính độ tương đồng của 2 cây như sau:

Trong bài viết này, chúng tôi sẽ thảo luận chi tiết về các thông số thực nghiệm 1, 1 và 1 trong công thức (2.10) cùng với thông số 2 trong công thức (2.14) để xác định thông số thực nghiệm tối ưu Theo công thức (2.14), ta nhận thấy rằng TS (T1,T2) nằm trong khoảng [0,1] cho mọi cặp cây T1 và T2 Giá trị của hàm này càng cao thì mức độ tương đồng giữa hai cây càng lớn.

CÀI ĐẶT THỬ NGHIỆM

Tiêu đề	Luận Văn Tìm Hiểu Đặc Trưng Lồi 3D Và Bài Toán Phát Hiện Mặt Người Trong Ảnh
Trường học	Trường Đại Học Dân Lập Hải Phòng
Thể loại	Đồ Án Tốt Nghiệp
Năm xuất bản	2013
Thành phố	Hải Phòng

Định dạng
Số trang	55
Dung lượng	2,06 MB