1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)

116 17 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 116
Dung lượng 2,36 MB

Cấu trúc

  • Trang bia.pdf

  • Nhiem vu luan van.pdf

  • Loi cam on.pdf

  • ABSTRACT.pdf

  • Mucluclv.pdf

  • C0 -Gioi thieu.pdf

  • C1- Cac phuong phap.pdf

  • C2 - Gaborwavelets.pdf

  • C3 - Ung dung GB.pdf

  • C4- Ket qua mo phong.pdf

  • Tai lieu tham khao.pdf

  • C5- Phu luc.pdf

Nội dung

CÁC PHƯƠNG PHÁP NHẬN DẠNG MẶT NGƯỜI

Nhận dạng mặt con người

(Human Face Recognition: Perceptual and Cognitive Aspects)

Nghiên cứu trong lĩnh vực khoa học thần kinh tập trung vào khả năng nhận dạng mặt của con người và cách thức hoạt động của bộ não trong quá trình này Các nhà sinh lý học đã phát hiện rằng não bộ có những khu vực đặc biệt, như các tế bào dò tìm mặt ở vỏ não, giúp phân biệt giữa các vật thể là mặt và không phải là mặt, chủ yếu ở bán cầu não phải.

Các đặc trưng của con người được sử dụng để nhận dạng mặt rất quan trọng trong việc thiết kế thuật toán cho hệ thống nhận dạng Khi các đặc trưng như mũi, miệng và mắt được sắp xếp không bình thường trong hình ảnh, việc nhận dạng trở nên khó khăn Do đó, cả đặc trưng tổng thể và cục bộ cần được xem xét, với đặc trưng cục bộ cung cấp hệ thống phân loại cho nhận dạng Nghiên cứu cho thấy khuôn mặt không có nét hấp dẫn hoặc có quá nhiều nét hấp dẫn thường khó nhận dạng hơn, trong khi khuôn mặt đặc biệt dễ nhận diện hơn khuôn mặt điển hình Thông tin ở vùng tần số thấp giúp xác định giới tính, trong khi các thành phần tần số cao được dùng để nhận dạng chi tiết Cuối cùng, phần trên của mặt có vai trò quan trọng hơn trong quá trình nhận dạng so với phần dưới.

Trong thí nghiệm của Bruce, việc chồng không gian tần số thấp của mặt Margaret lên các thành phần tần số cao của mặt Tony cho thấy rằng chỉ có mặt Tony được nhìn thấy khi ở gần, nhưng từ xa, mặt Tony lại biến mất, nhường chỗ cho mặt Margaret Điều này chứng minh rằng thông tin quan trọng để nhận diện khuôn mặt quen thuộc nằm trong một khoảng không gian tần số đặc biệt Hệ thống nhận diện mặt có thể gặp sai sót khi có sự thay đổi về hướng chiếu sáng và góc quan sát Nhiều nhà khoa học đã nghiên cứu mô hình 3D của ảnh mặt và nhận thấy rằng việc nhận diện khuôn mặt phụ thuộc nhiều vào góc độ quan sát, trong khi các hiệu ứng ánh sáng và khớp mặt cho thấy rằng sự mô tả cho nhận diện khuôn mặt bị ảnh hưởng bởi sự thay đổi các đặc trưng ảnh ở mức thấp.

Nghiên cứu trước đây cho thấy rằng ảnh âm bản, với sự đảo ngược cả màu sắc lẫn độ chói, ảnh hưởng tiêu cực đến khả năng nhận diện khuôn mặt quen thuộc Tuy nhiên, âm bản không có tác động đáng kể đến việc nhận dạng và khớp các hình ảnh mặt khi thiếu đặc trưng về kết cấu và sắc tố da Điều này mở ra khả năng sử dụng hiệu ứng âm bản để truyền tải thông tin về độ sáng của vùng sắc tố, ví dụ như âm bản của mái tóc đen sẽ có màu vàng hoe trên nền tối.

Giá trị màu sắc của các vùng da không ảnh hưởng nhiều đến việc nhận dạng Các ảnh mặt được mô tả dưới dạng âm bản, với độ chói đảo ngược, vẫn có thể được nhận dạng tốt như những ảnh mặt có màu sắc gốc, mặc dù phương pháp này làm giảm dung lượng nhớ cần thiết cho việc nhận dạng.

Trẻ em có khả năng nhận diện các khuôn mặt xa lạ thông qua những tín hiệu không liên quan như kính, quần áo, mũ và kiểu tóc Đến tuổi 12, trẻ bắt đầu chú ý đến các đồ dùng cá nhân mới.

Con người có khả năng nhận diện người cùng chủng tộc tốt hơn so với người thuộc chủng tộc khác Họ có thể mã hóa một khuôn mặt theo tiêu chuẩn bình thường, tuy nhiên, tiêu chuẩn này có thể khác nhau giữa các chủng tộc và giới tính Một khảo sát tại Nhật Bản cho thấy đặc trưng khuôn mặt của phụ nữ không đồng nhất như của nam giới; khuôn mặt phụ nữ da trắng có nhiều biến đổi hơn ở những vùng nhỏ, nhưng tổng thể lại ít thay đổi hơn so với nam giới.

Nhận diện khuôn mặt quen thuộc là yếu tố quan trọng trong tương tác xã hội, giúp con người nhận ra nhiều khuôn mặt khác nhau Các nhà tâm lý học nghiên cứu cơ chế cảm giác và nhận thức liên quan đến quá trình này, từ đó cung cấp thông tin giá trị cho lĩnh vực nghiên cứu trực quan máy tính.

Chúng ta có thể tổng kết những nghiên cứu về nhận dạng mặt người như sau:

1 Khả năng nhận dạng mặt là quá trình riêng biệt, không đơn thuần như các ứng dụng của quá trình nhận dạng vật thể nói chung Do đó hệ thống nhận dạng mặt nhân tạo có những điểm đặc biệt riêng

2 Các khuôn mặt có những nét đặc biệt thì dễ nhận dạng hơn các khuôn mặt ủieồn hỡnh

3 Cả hai loại đặc tính tổng thể và cục bộ đều được dùng để miêu tả và nhận dạng mặt

4 Con người nhận dạng những người cùng chủng tộc của họ dễ hơn người khác chủng tộc Con người có thể mã hóa một khuôn mặt “tiêu chuẩn bình thường”

5 Những biến đổi ảnh như chuyển âm bản, thay đổi điểm nhìn, thay đổi hướng ánh sáng có thể làm mất khả năng nhận dạng

Mặc dù các công nghệ kỹ thuật hiện đại không thể tạo ra một hệ thống nhận dạng hoàn hảo, nhưng bộ não con người cũng có những hạn chế nhất định.

Hệ thống máy tính mang lại lợi ích lớn trong việc điều khiển và xử lý tập dữ liệu lớn về hình ảnh khuôn mặt Việc nghiên cứu khả năng nhận dạng của con người là bước khởi đầu quan trọng cho phát triển phương pháp nhận dạng mặt tự động Hệ thống này cần tập trung vào các đặc trưng riêng biệt của khuôn mặt để phân biệt và khuyếch đại các đặc điểm nhận dạng Sự khác biệt giữa khuôn mặt quen thuộc và lạ cũng rất đáng chú ý, với việc xác định các điểm đặc trưng của khuôn mặt Nhìn nhận khuôn mặt trong nhiều điều kiện khác nhau, như ánh sáng, góc độ và biểu cảm, giúp chúng ta làm quen với khuôn mặt đó Quá trình này giống như một hình thức huấn luyện, và việc nhận diện từ hình ảnh hai chiều đòi hỏi chú ý đến mức độ quen thuộc để chuyển từ khuôn mặt lạ sang quen thuộc.

Trước đây, các nhà khoa học đã lấy cảm hứng từ chim để phát triển các phương tiện bay, nhưng không có máy bay nào có khả năng "vỗ cánh" Việc thiết kế thuật toán và hệ thống nhận dạng khuôn mặt tự động cần hiểu rõ các vấn đề về vật lý và hệ thần kinh, đồng thời áp dụng những kiến thức thực tiễn một cách hợp lý.

1.2 Nhận dạng mặt tự động (Automatic Face Recognition)

Mặc dù con người dễ dàng nhận diện khuôn mặt, nhưng quá trình này diễn ra nhờ những tính toán phức tạp trong hệ thống thị giác Việc tìm kiếm và nhận diện khuôn mặt bình thường là kết quả của hàng triệu năm tiến hóa, và chúng ta vẫn chưa hiểu rõ lý do tại sao não bộ có khả năng này.

Nhận dạng mặt tự động là kỹ thuật xác định hoặc xác minh cá nhân qua đặc trưng vật lý, với khả năng hoạt động nhanh chóng và ít cần can thiệp từ người dùng Hiện tại, chưa có giải pháp hoàn chỉnh cho việc nhận dạng khuôn mặt từ ảnh thực tế Bài viết này sẽ xem xét các hệ thống nhận dạng mặt qua năm phương pháp: phương pháp đầu tiên, neural networks, phương pháp thống kê, phương pháp khuôn mẫu, và phương pháp dựa trên các đặc trưng Trong đó, phương pháp dựa trên các đặc trưng hiện đang là công nghệ tiên tiến nhất trong nhận dạng mặt.

1.2.1 Sự biểu diễn, so khớp ảnh mặt và giải pháp thống kê

(Representation, Matching and Statistical Decision)

Bộ lọc Gabor

Hàm cơ sở Gabor là thành phần tối ưu trong xử lý tín hiệu, cho phép tổng hợp thời gian-tần số hiệu quả Các lý thuyết tương tự khai thác khai triển Gabor để phân tích tín hiệu, tương đồng với phép biến đổi Fourier ngắn hạn.

Hàm cơ sở Gabor được sử dụng như các bộ lọc phân tích tín hiệu, hoạt động tương tự như một toán tử của bộ lọc tuyến tính khi chập với tín hiệu Bộ lọc Gabor trong miền liên tục được tập trung gần điểm thời gian tức thời t₀, và phép chập với bộ lọc trung tâm gốc (thường là t₀ = 0) là phương pháp phổ biến trong nhiều ứng dụng.

Pha (φ) của bộ lọc được xác định bởi mối quan hệ giữa các phần thực và ảo Đối với các hàm giống nhau tại mọi vị trí, sự dịch pha phụ thuộc vào vị trí (to), do đó độ dịch pha có thể bị bỏ qua ở bộ lọc trung tâm với φ=0 Kết quả là, chúng ta có hàm bộ lọc Gabor đơn giản hơn.

Nếu phương trình (2.15) được sử dụng như một bộ lọc tuyến tính thì đáp ứng bộ lọc tại thời điểm t1 được tính bằng phép chập

( ) ( ) t e dt e e dt t e e dt t t t t t t resp t f j window t t t f j t t f t j t o o o

Phương trình biến đổi Fourier liên tục thời gian ngắn (biến đổi S) ở tần số fo với hàm cửa sổ Gaussian tại thời điểm t1 chỉ khác biệt ở hệ số pha t f j o e − 2 π trong hàm cửa sổ.

Khoảng thời gian của bộ lọc phụ thuộc vào tần số trung tâm \( f_o \), giúp các bộ lọc ở các tần số khác nhau được sắp xếp theo dạng riêng Điều này được thực hiện bằng cách thay thế \( \alpha = \gamma f_o \), trong đó \( f_o \) là tần số trung tâm và \( \gamma \) điều khiển độ nét của bộ lọc, bao gồm khoảng thời gian và băng thông Do đó, khoảng thời gian của bộ lọc được kết nối chặt chẽ với tần số.

-56 - bộ lọc Mối quan hệ của khoảng thời gian và tần số trong biến dổi S là cố định

= 2 γ nhưng trong (2.17) γ có thể được chọn tuỳ theo ứng dụng

Theo phương trình (2.11) hàm của bộ lọc gabor chuẩn được định nghĩa

Thay f o =f ta có dạng đơn giản hơn

= (2.20) Đây là dạng bộ lọc Gabor một chiều (1D) Hàm Gabor 1D ở miền tần số

Trong đó, u có nghĩa là tần số

2.3.2 Bộ lọc Gabor hai chiều 2D chuẩn

Daugman định nghĩa sự thay đổi như phương trình (2.8) trong miền không gian 2-d và miền không gian- tần số gồm Δx, Δy, Δu và Δv

Hàm cơ sở Gabor 2D được định nghĩa như sau

Thay α = f o γ ,β = f o η hàm của bộ lọc Gabor 2D chuẩn như sau:

Trong bộ lọc Gabor 2D chuẩn, f đại diện cho tần số trung tâm, θ là góc quay của trục Gaussian chính và mặt phẳng sóng, γ thể hiện độ nét dọc theo trục chính, trong khi η là độ nét dọc theo trục phụ Tỉ số co λ được tính bằng η/γ.

2.4 Hàm biến đổi Gabor Wavelets

2.4.1 Hàm biến đổi Gabor Wavelets một chtichwj

Gabor Wavelets được xây dựng dựa trên sự tích hợp các đường sin của hàm Gaussian, giúp làm nổi bật các thông tin tần số gần trung tâm của Gaussian khi thực hiện phép chập Ngược lại, các thông tin tần số xa trung tâm Gaussian sẽ có ảnh hưởng không đáng kể.

Phương trình biểu diễn Gabor Wavelets 1 chiều là:

Phép chập với hàm wavelets được thực hiện như sau:

Khai triển của hàm Wavelets có nhiều điểm giống như biến đổi Fourier:

Kết quả của phép tích phân là một hệ số phức C(x, t₀, ϖ₀) mô tả thông tin tần số cục bộ của hàm x tại tần số ϖ₀ và thời gian t₀ Tương tự như biến đổi Fourier, hệ số wavelets này bao gồm phần thực và phần ảo, tương ứng với hàm sin và cos.

Tại thời điểm này, các đường hình sin được nhân với một hàm Gaussian, tương tự như phương trình (2.5) Hệ số phức này được biểu diễn trong hệ tọa độ cực, với biên độ tổng là a và góc pha φ, trong đó cos φ = a real và sin φ = a imag.

Ngược lại a và φ được tính từ phương trình:

0 0 imag real imag real real real imag real real imag a a neáu a a neáu a a neáu arctg a a a neáu arctg a π π φ π (2.33)

Hiểu mối quan hệ giữa sự dịch chuyển trong miền thời gian và góc pha của hệ số là rất quan trọng Các thuật giải dựa trên bộ lọc Gabor thường sử dụng chuyển đổi trục tọa độ cực của các hệ số để ước lượng sự dịch chuyển của các điểm ảnh Khi tính toán hệ số wavelets cho hai điểm gần nhau, cần xem xét sự khác biệt giữa các góc pha của các hệ số để phân biệt sự dịch chuyển giữa hai điểm chập đó.

Hình 2.1 minh họa kết quả từ một thí nghiệm tính toán trong Matlab, bao gồm bốn đồ thị Đồ thị đầu tiên thể hiện một hàm gồm 10 đường sin giả ngẫu nhiên, được tạo ra bằng cách cộng một hàm sin và cos với biên độ ngẫu nhiên từ -1 đến 1 cho mỗi tần số Đồ thị thứ hai mô tả phần thực (đậm) và phần ảo (nhạt) của biến đổi Gabor wavelets, với tần số tương tự như một trong các tần số của hàm đầu tiên Đồ thị thứ ba thể hiện giá trị của phép chập wavelets tại mỗi điểm của hàm gốc, cho thấy rằng giá trị chập lớn nhất xảy ra khi wavelets và hàm đồng pha, trong khi khi lệch pha π, giá trị chập trở thành âm Cuối cùng, đồ thị thứ tư biểu diễn độ lớn của đáp ứng wavelets, cho thấy năng lượng của thành phần tần số riêng của hàm tập trung ở vùng gần trung tâm, trong khi biên độ ở rìa trái và phải bị suy giảm do hàm không xác định ở vùng đã qua biên.

Đồ thị thứ tư thể hiện pha của các hệ số wavelets, cho thấy chu kỳ của pha tương đương với chu kỳ của hàm sin Mã chung cho các hình ảnh được trình bày trong pha này.

Hình 2.1: Ví dụ về phép chập Wavelets

2.4.2 Biến đổi Gabor Wavelets 2 chiều

Gabor Wavelets một chiều là một khái niệm quan trọng trong việc trích xuất đặc trưng hình ảnh bằng cách sử dụng bộ lọc Gabor Các wavelets này được tạo ra thông qua phép nhân nhiều sóng sin phẳng từ hàm Gaussian hai chiều, giúp nắm bắt thông tin tần số trong bức ảnh Hàm Gaussian đóng vai trò quan trọng trong việc làm nổi bật các vùng ảnh gần trung tâm của wavelets Bài viết cũng trình bày các thông số khác nhau để mô tả Gabor Wavelets, giúp hiểu rõ hơn về ứng dụng của chúng trong xử lý ảnh.

Gabor Wavelets có nhiều dạng khác nhau với các thông số như hướng điều khiển, tần số, pha, kích thước và hệ số co Để mô tả chính xác thông tin tần số của các đặc trưng trong bức ảnh, cần kết hợp vị trí này với nhiều trường hợp của wavelets, đại diện cho việc lấy mẫu tại các tần số và hướng khác nhau Các bộ lọc wavelets được tính toán trước để thực hiện phép chập Hình 2.2 minh họa kết quả của phép chập một hình ảnh với độ lớn và pha của Gabor wavelets, cho thấy các đặc trưng của hình ảnh tương ứng với hướng và tần số của wavelets Ảnh độ lớn cho thấy wavelets phản ứng trên tai, mắt và viền cổ, trong khi giá trị pha thể hiện các đường sọc dịch chuyển theo chiều ngang, tương tự như ví dụ một chiều.

Bộ lọc Gabor wavelets : phần thực, phần ảo và độ lớn

Aûnh gốc, đáp ứng của bộ lọc: độ lớn và pha Hình 2.2: Ví dụ về phép chập Gabor Wavelets 2 chiều

Mỗi bộ lọc trong phép chập wavelets là một ma trận hai chiều, tập trung vào các vị trí chính xác trong bức ảnh, với mỗi giá trị được nhân và cộng thành tổng Để tính toán cả phần thực và phần ảo, cần sử dụng hai bộ lọc lệch pha π/2, tương ứng với hàm sin và cos Hiểu rõ các thông số trong phương trình Wavelets là cần thiết, vì thuật giải có thể điều chỉnh các thông số như hướng, bước sóng, pha, kích thước của bộ lọc Gaussian và hệ số co Thêm vào đó, mỗi nhân Gabor wavelets còn có một thông số điều khiển kích thước bộ lọc Sự biểu diễn wavelets dựa theo phương trình được chọn vì tính dễ hiểu và linh động.

Có 5 thông số điều khiển wavelets:

Hệ thống nhận dạng mặt người

Con người dễ dàng nhận diện người quen nhờ vào mắt và cơ quan thị giác, nhưng khả năng ghi nhớ của chúng ta có giới hạn, dẫn đến sự phát triển của các thiết bị nhận dạng Hiện nay, nhiều phương pháp nhận dạng cá nhân được áp dụng rộng rãi, bao gồm mật khẩu, mã cá nhân, thẻ vạch, chữ ký, vân tay, tiếng nói và nhận dạng khuôn mặt Trong số đó, hệ thống nhận dạng bằng tiếng nói và khuôn mặt là gần gũi nhất với khả năng nhận diện trực tiếp của con người Bài viết sẽ tập trung vào các thiết bị nhận dạng khuôn mặt và sơ đồ khối của hệ thống nhận dạng này.

Hệ thống nhận dạng mặt tự động bắt đầu bằng việc sử dụng máy chụp ảnh hoặc camera để xác định sự hiện diện của khuôn mặt trong hình ảnh Giai đoạn đầu tiên của quy trình này là dò tìm mặt, nhằm xác minh xem hình ảnh có phải là mặt người hay không Các phương pháp dò tìm bao gồm mô hình thống kê và nhiều kỹ thuật khác.

Phương pháp nhận dạng khuôn mặt sử dụng mạng nơ-ron và dò tìm màu sắc mặt trải qua quy trình tiền xử lý, bao gồm cắt ảnh mặt, triệt nhiễu và tăng độ tương phản Giai đoạn nhận dạng khuôn mặt xác nhận danh tính từ cơ sở dữ liệu cá nhân đã biết Các phương pháp như Eigenfaces, mô hình ẩn Markov, mạng nơ-ron và phân tích đặc trưng đã được giới thiệu trong chương 1 Hiện nay, công nghệ dựa trên các đặc trưng đang thu hút nhiều sự quan tâm trong nghiên cứu.

Sử dụng các điểm đặc trưng cục bộ để nhận diện khuôn mặt mang lại nhiều lợi ích, bao gồm việc biểu diễn ảnh mặt một cách cô đọng và tiết kiệm dung lượng bộ nhớ, điều này rất quan trọng khi xử lý dữ liệu ảnh lớn Phương pháp này dựa trên việc xác định các điểm hoặc vùng cục bộ chuẩn để so sánh trên ảnh mặt và biểu diễn thông tin tương ứng một cách hiệu quả Tuy nhiên, việc lựa chọn các vị trí đặc trưng thích hợp cùng với các giá trị tương ứng là một thách thức lớn trong việc phát triển hệ thống nhận diện.

Trong những năm gần đây, bộ lọc Gabor đã trở thành một công cụ quan trọng trong hệ thống nhận dạng khuôn mặt Một trong những phương pháp nhận dạng hiệu quả nhất là so sánh đồ thị từ các hệ số thu được từ bộ lọc Gabor Tuy nhiên, phương pháp này gặp khó khăn trong việc so sánh khớp mặt phức tạp, yêu cầu định vị đồ thị huấn luyện bằng tay và thời gian xử lý lâu, dẫn đến giảm hiệu quả trong việc mô tả các đặc điểm riêng biệt của từng cá nhân Để khắc phục những nhược điểm này, đã xuất hiện những hướng đi mới dựa trên phương pháp Gabor.

Hàm Gabor 2D là công cụ hiệu quả để làm nổi bật các đường viền và chi tiết quan trọng trong bức ảnh, như các đường biên của mắt, miệng và mũi, giúp xác định các điểm đặc trưng của khuôn mặt Nó cũng có khả năng làm nổi bật những đặc điểm riêng biệt của từng cá nhân, chẳng hạn như nốt ruồi, núm đồng tiền và các vết trên da, tạo nên sự khác biệt và độc đáo cho mỗi người.

Sẹo được xác định qua các điểm đặc trưng nổi bật, tạo thành ma trận đặc trưng cho mỗi gương mặt Mỗi gương mặt có thể được biểu diễn bằng các điểm đặc thù riêng mà không cần lưu giữ ảnh gốc Ma trận đặc trưng này được điều chỉnh để bảo tồn toàn bộ thông tin cần thiết khi làm nổi bật các điểm đặc thù.

Trong luận văn này, chúng tôi đề xuất phương pháp chọn các đỉnh có năng lượng cao từ đáp ứng Gabor làm điểm đặc trưng, thay vì sử dụng các nút đồ thị trong phương pháp khớp đồ thị đàn hồi Điều này giúp giảm dung lượng mô tả của Gabor wavelets Các vector đặc trưng được lấy mẫu từ đáp ứng của ảnh thông qua phép biến đổi Gabor wavelets tại các điểm đặc trưng Lưu ý rằng vị trí và số lượng điểm đặc trưng sẽ khác nhau đối với từng hình ảnh, ngay cả khi các ảnh thuộc về cùng một cá nhân.

Phần tiếp theo trình bày chi tiết về biến đổi Gabor wavelets được đưa ra để nhận dạng mặt và sau đó là các giải thuật chi tiết.

Biểu diễn khuôn mặt dùng Gabor Wavelets

Từ những khám phá của Hubel và Wiesel về cấu trúc lớp vỏ thị giác vào thập niên 30, nhiều nghiên cứu lý thuyết và thực nghiệm đã làm sáng tỏ vùng này và phản ứng của tế bào Marcelja và Daugman đã cung cấp cái nhìn quan trọng, cho rằng các tế bào đơn trong lớp vỏ thị giác có thể được mô hình hóa bằng các hàm Gabor Những hàm Gabor mà Daugman phát triển là các bộ lọc băng không gian, dựa trên lý thuyết về việc kết hợp thông tin trong không gian 2D và miền Fourier 2D.

Hàm Gabor, được đề xuất bởi Dennis Gabor, là một công cụ hữu ích trong việc phát hiện nhiễu Gabor đã chứng minh rằng có một "nguyên tắc lượng tử" cho thông tin, trong đó miền kết hợp thời gian – tần số cho tín hiệu 1D cần phải được lượng tử hóa để không có tín hiệu hay bộ lọc nào có thể giữ ít hơn vùng cực tiểu trong nó Ông cũng chỉ ra rằng cần có sự cân bằng giữa giải pháp miền thời gian và miền tần số Đặc biệt, Gabor đã khám phá rằng điều biến Gaussian mũ phức mang lại sự cân bằng tối ưu cho việc kết hợp này, với hàm Gabor sơ cấp được phát sinh từ một Gaussian cố định trong khi tần số của sóng điều biến thay đổi.

Các bộ lọc Gabor, được phát hiện và khái quát hóa trong không gian 2D, được ứng dụng rộng rãi trong nhiều lĩnh vực tính toán thị giác Daugman đã tổng quát hóa hàm Gabor 2D để mô hình hóa các vùng cảm thụ của các tế bào chọn lọc định hướng đơn Có nhiều cách để biểu diễn hàm Gabor wavelets trong không gian hai chiều, và trong bài viết này, chúng tôi chọn cách biểu diễn theo phương trình (2.34).

Trong không gian, các thông số x, y đại diện cho tọa độ, θ là hướng, λ là bước sóng, ϕ là pha, σ là bán kính và γ là hệ số co của Gabor wavelets Chi tiết về các thông số này sẽ được trình bày trong chương 2.

Các thông số của Gabor Wavelets được sử dụng trong luận văn này

• θ là hướng của wavelet, sử dụng 8 hướng khác nhau từ 0 đến π Hướng từ π đến 2π không cần quan tâm vì tính đối xứng chẵn/ lẻ của wavelets, θ∈{0, π/8, 2π/8, 3π/8, 4π/8, 5π/8, 6π/8, 7π/8 }

• λ là bước sóng của sóng sin, λ∈{4, 6, 8, 10, 12}

Pha ϕ của sóng sin và Gabor wavelets bao gồm cả phần chẵn và phần lẻ, trong đó phần chẵn tương ứng với hàm cos và phần lẻ tương ứng với hàm sin Trong thuật toán này, phần chẵn được xem là phần thực của wavelets, trong khi phần lẻ là phần ảo Do đó, phép chập giữa hai pha tạo thành một hệ số phức, với ϕ thuộc tập hợp {0, π/2}.

• σ là bán kính của Gaussian Thông số này thường tỉ lệ với bước sóng, các wavelets có kích thước, tần số khác nhau được đặt ở các mức độ riêng σ = 0.575λ

• γ: xác định hệ số co của bộ lọc Gaussian, γ=1 (bằng mô hình sinh học)

Với 8 hướng, 5 tần số và 2 pha ta có 40 mặt nạ Gabor wavelets phức khác nhau

(40 phần thực và 40 phần ảo của nhân Gabor wavelets)

3.2.2 Gabor wavelets 2D biểu diễn các khuôn mặt

Khi công nghệ nhận dạng mặt trở nên dễ dàng hơn, bộ lọc Gabor đã trở thành lựa chọn tối ưu cho nhiệm vụ này Bộ lọc Gabor mô phỏng phản ứng của các tế bào đơn trong vùng thị giác của não người, với các dạng sóng phẳng được giới hạn bởi hàm Gaussian Hình ảnh có thể được phân tích thông qua biến đổi Gabor wavelets, cho phép mô tả cả trong không gian tần số và không gian mối liên hệ Phép chập ảnh sử dụng bộ lọc phức hợp với 5 tần số và 8 hướng giúp thu được phổ tần số cho cả biên độ và pha.

Hình 3.2 biểu diễn 40 phần thực của Gabor wavelets ở 5 bước sóng λ∈(4,6,8,10,12), 8 hướng θ∈{0, π/8, 2π/8, 3π/8, 4π/8, 5π/8, 6π/8, 7π/8 } Và độ lớn cuả Gabor wavelets ở 5 bước sóng

Hình 3.2: Gabor wavelets (a) Phần thực của các nhân Gabor wavelets ở 5 bước sóng λ∈(4,6,8,10,12), 8 hướng θ∈{0, π/8, 2π/8, 3π/8, 4π/8, 5π/8, 6π/8, 7π/8} (b)ứ Độ lớn cuả cỏc nhõn Gabor wavelets ở 5 bước súng

Để trích xuất các đặc trưng của một bức ảnh, ta thực hiện phép chập giữa ảnh đó và tập hợp nhân Gabor được định nghĩa trong phương trình (2.34) Ở đây, I(x,y) đại diện cho sự phân bố mức xám của ảnh Đáp ứng của phép chập giữa ảnh I(x,y) và nhân Gabor Ψ(x,y) được xác định bởi công thức: Φ(x,y) = I(x,y) * Ψ(x,y), trong đó * là toán tử chập.

Hình 3.3: Đáp ứng của phép chập ảnh mẫu với các mặt nạ Gabor wavelets

(a) Ảnh gốc (b) Phần thực của đáp ứng (c) Độ lớn của đáp ứng

Quan sát các đáp ứng của phép chập ảnh với mặt nạ Gabor wavelets cho thấy các đặc trưng của khuôn mặt như mắt, mũi, miệng, tai, và cằm được làm nổi bật theo các hướng khác nhau Độ rộng của các đặc trưng này thay đổi tùy thuộc vào tần số của Gabor Chúng tôi đã chập ảnh mặt với 40 phần thực và 40 phần ảo của nhân Gabor, từ đó tính toán độ lớn và pha cho từng cặp, tạo ra 40 ma trận độ lớn, được gọi là 40 đáp ứng của khuôn mặt Sau khi thu thập 40 đáp ứng, chúng tôi tiến hành trích xuất các đặc trưng từ chúng Một kỹ thuật nhận dạng mặt dựa trên biến đổi Gabor là sử dụng mô tả dạng lưới topo cho mã mặt, trong đó các nút biểu đồ được chọn là các điểm đặc trưng.

Phương pháp chọn 75 đỉnh (điểm có năng lượng cao) trong đáp ứng không chỉ giúp giảm bớt sự phức tạp của tính toán mà còn cải thiện tốc độ thực hiện Như đã đề cập, vị trí và số lượng điểm đặc trưng có thể thay đổi tùy theo từng khuôn mặt, ngay cả khi đó là của cùng một cá nhân Các vector đặc trưng được lấy mẫu từ các đáp ứng của ảnh thông qua phép biến đổi Gabor wavelets tại các điểm đặc trưng.

3.2.3 Trích đặc trưng (Feature extraction)

Thuật toán trích đặc trưng của phương pháp này gồm hai bước:

• Định vị điểm đặc trưng

• Tính toán vector đặc trưng

3.2.3.1 Định vị điểm đặc trưng (Feature point localization)

Trong bước này, các vector đặc trưng được trích xuất từ những điểm có thông tin cao trên khuôn mặt Thông thường, các điểm đặc trưng này bao gồm mắt, mũi và miệng, nhưng trong nghiên cứu này, chúng tôi không cố định số lượng và vị trí của các điểm Số lượng vector đặc trưng và vị trí của chúng có thể được điều chỉnh để mô tả tốt hơn các đặc điểm của khuôn mặt như núm đồng tiền và nốt ruồi, những đặc tính này cũng có thể được sử dụng để nhận diện khuôn mặt.

Hình 3.4: Các điểm đặc trưng là các điểm có năng lượng cao (đỉnh) của đáp ứng Gabor wavelets

Hình 3.5: Độ lớn đáp ứng của phép chập ảnh mẫu với các mặt nạ Gabor wavelets có thông số λ= 6, σ=0.575λ, γ=1 và 8 hướng trong không gian

Hình 3.5 minh họa độ lớn đáp ứng của phép chập ảnh mẫu (hình 3.3a) với các bộ lọc Gabor có thông số khác nhau trong không gian Các đỉnh của đáp ứng thể hiện các điểm có khả năng mô tả cao một khuôn mặt, hay còn gọi là điểm có năng lượng cao Cần lưu ý rằng vị trí và số lượng các đỉnh của đáp ứng từ cùng một ảnh mẫu với các mặt nạ Gabor khác nhau là khác nhau Điều này cho phép chúng ta lựa chọn một trong các đáp ứng để xác định các điểm đặc trưng của khuôn mặt.

Điểm đặc trưng được trích xuất từ ảnh mặt thông qua bộ lọc Gabor, với các đỉnh được xác định tự động bằng cách sử dụng một cửa sổ Wo có kích thước WxW Một điểm có tọa độ (xo, yo) được coi là điểm đặc trưng nếu nó thỏa mãn các điều kiện nhất định.

Độ lớn đáp ứng của ảnh mặt từ bộ lọc Gabor thứ j được ký hiệu là Rj, trong khi N1N2 biểu thị kích thước của ảnh mặt Trung tâm của cửa sổ Wo được xác định bởi điểm (xo, yo) Kích thước của cửa sổ W là một thông số quan trọng trong giải thuật, cần được chọn sao cho đủ nhỏ để giữ lại các đặc trưng quan trọng nhưng cũng đủ lớn để tránh dư thừa Điểm ảnh được chọn làm đặc trưng là điểm ảnh trung tâm Wo có giá trị mức xám lớn nhất trong cửa sổ, đồng thời giá trị này phải lớn hơn giá trị mức xám trung bình của toàn bộ ảnh mặt.

Phương trình (3.3) được sử dụng để loại bỏ các điểm đỉnh lớn nhất trong một vùng cục bộ Khi áp dụng bộ lọc Gabor lên ba ảnh khác nhau của cùng một cá nhân, vị trí và số lượng điểm đặc trưng được chọn tự động có thể khác nhau, mặc dù chúng thường nằm trong một khu vực nhất định và có thể thay đổi theo trạng thái khuôn mặt Tương tự, khi chập ba ảnh của một cá nhân khác với cùng thông số bộ lọc Gabor, chúng ta nhận thấy rằng vị trí và số lượng điểm đặc trưng cũng khác nhau, nhưng thường tập trung vào các vùng như mắt, mũi, miệng, lông mày, tai và đường viền khuôn mặt Một ma trận đặc trưng được tạo ra bằng cách sử dụng 40 bộ lọc cho một ảnh mặt.

(b) Hình 3.6: Điểm đặc trưng của 3 ảnh khác nhau của một cá nhân

Vi,k ={ xk, yk, Ri,j (xk,yk) với j =1,…,40 }

Hình 3.4: Lưu đồ của giai đoạn trích tạo ma trận đặc trưng M i của ảnh

3.2.3.2 Tạo các vector đặc trưng

Các vector đặc trưng được hình thành từ các điểm đặc trưng, với thành phần là giá trị đáp ứng của biến đổi Gabor wavelets trên một hình ảnh Vector đặc trưng thứ k của mặt i được xác định dựa trên các giá trị này.

Với Rj là độ lớn đáp ứng của ảnh mặt từ bộ lọc Gabor thứ j Khi có 40 bộ lọc

KẾT QUẢ MÔ PHỎNG 4.1 Tập dữ liệu ảnh

Ngày đăng: 29/08/2021, 17:36

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Mô hình Appearance - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 1.1 Mô hình Appearance (Trang 24)
Hình 1.2: Mô hình Discriminative - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 1.2 Mô hình Discriminative (Trang 25)
Hình 1.3: Kỹ thuật lấy mẫu ảnh cho nhận dạng HMM - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 1.3 Kỹ thuật lấy mẫu ảnh cho nhận dạng HMM (Trang 34)
hình - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
h ình (Trang 37)
Sự nhận dạng là so sánh ảnh thử với mỗi mẫu được huấn luyện (hình 1.3). Để đạt được điều này, hình ảnh được biến đổi thành sự quan sát liên tiếp và sau đó  mẫu P(Otest|λ i) được tính toán cho mỗi λi, i=1,...,c - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
nh ận dạng là so sánh ảnh thử với mỗi mẫu được huấn luyện (hình 1.3). Để đạt được điều này, hình ảnh được biến đổi thành sự quan sát liên tiếp và sau đó mẫu P(Otest|λ i) được tính toán cho mỗi λi, i=1,...,c (Trang 38)
Hình 1.6: MaÏng Neural Network với hai lớp ẩn - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 1.6 MaÏng Neural Network với hai lớp ẩn (Trang 40)
Hình 1.7: Sơ đồ của hệ thống mạng Neural chập - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 1.7 Sơ đồ của hệ thống mạng Neural chập (Trang 42)
Hình 1.8: Đồ thị lưới 2D trên ảnh mặt Marilyn Monroe. - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 1.8 Đồ thị lưới 2D trên ảnh mặt Marilyn Monroe (Trang 48)
Hình 1.9: Đồ thị chùm a) ảnh nghệ thuật (“Chân dung chưa hoàn thành” của - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 1.9 Đồ thị chùm a) ảnh nghệ thuật (“Chân dung chưa hoàn thành” của (Trang 50)
Hình 1.10: Đồ thị chùm của một mặt (Bunch graph matched t oa face.) 1.2.8. Tình trạng hiện nay của công nghệ nhận dạng mặt người  - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 1.10 Đồ thị chùm của một mặt (Bunch graph matched t oa face.) 1.2.8. Tình trạng hiện nay của công nghệ nhận dạng mặt người (Trang 51)
Hình 2.1: Ví dụ về phép chập Wavelets 2.4.2.   Biến đổi Gabor Wavelets 2 chiều  - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 2.1 Ví dụ về phép chập Wavelets 2.4.2. Biến đổi Gabor Wavelets 2 chiều (Trang 67)
Hình 2.5: GaborWavelets với các pha khác nhau - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 2.5 GaborWavelets với các pha khác nhau (Trang 71)
Hình 2.6: GaborWavelets với bán kính khác nhau - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 2.6 GaborWavelets với bán kính khác nhau (Trang 71)
Hình 2.8 biểu diễn Hàm GaborWavelets 2 chiều với các thông số khác nhau trong không gian - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 2.8 biểu diễn Hàm GaborWavelets 2 chiều với các thông số khác nhau trong không gian (Trang 72)
Hình 2.9: Các bộ lọc GaborWavelets (độ lớn của các cặp GW thực và ảo )2 chiều với các  bước sóng (λ) khác nhau   - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 2.9 Các bộ lọc GaborWavelets (độ lớn của các cặp GW thực và ảo )2 chiều với các bước sóng (λ) khác nhau (Trang 73)
Hình 3.1: Hệ thống nhận dạng mặt tự động - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 3.1 Hệ thống nhận dạng mặt tự động (Trang 74)
Hình 3.2 biểu diễn 40 phần thực của Gabor wavelets ở5 bước sóng - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 3.2 biểu diễn 40 phần thực của Gabor wavelets ở5 bước sóng (Trang 79)
Hình 3.3: Đáp ứng của phép chập ảnh mẫu với các mặt nạ Gabor wavelets. (a) Ảnh gốc.  (b)  Phần thực của đáp ứng - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 3.3 Đáp ứng của phép chập ảnh mẫu với các mặt nạ Gabor wavelets. (a) Ảnh gốc. (b) Phần thực của đáp ứng (Trang 81)
Hình 3.5: Độ lớn đáp ứng của phép chập ảnh mẫu với các mặt nạ Gabor wavelets có thông số λ= 6, σ=0.575λ, γ=1 và 8 hướng  trong không gian - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 3.5 Độ lớn đáp ứng của phép chập ảnh mẫu với các mặt nạ Gabor wavelets có thông số λ= 6, σ=0.575λ, γ=1 và 8 hướng trong không gian (Trang 86)
Hình 3.6: Điểm đặc trưng của 3 ảnh khác nhau của một cá nhân - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 3.6 Điểm đặc trưng của 3 ảnh khác nhau của một cá nhân (Trang 88)
Hình 3.4: Lưu đồ của giai đoạn trích tạo ma trận đặc trưng Mi của ảnh - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 3.4 Lưu đồ của giai đoạn trích tạo ma trận đặc trưng Mi của ảnh (Trang 89)
Hình 3.5: Lưu đồ tạo tập dữ liệu ma trận đặc trưngj =j+1 - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 3.5 Lưu đồ tạo tập dữ liệu ma trận đặc trưngj =j+1 (Trang 97)
Hình 3.5: Lưu đồ nhận dạng ảnh mặt ngườiXác định  ma trận đặc trưng Mi của ảnh vào i  - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 3.5 Lưu đồ nhận dạng ảnh mặt ngườiXác định ma trận đặc trưng Mi của ảnh vào i (Trang 98)
Hình 4.1: Ảnh của một số cá nhân trong tập ảnh dữ liệu - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 4.1 Ảnh của một số cá nhân trong tập ảnh dữ liệu (Trang 100)
Hình 4.2: Aûnh mẫu của tập ảnh mẫ uA của một số cá nhân - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 4.2 Aûnh mẫu của tập ảnh mẫ uA của một số cá nhân (Trang 102)
Hình 4.3: Aûnh mẫu của tập ảnh mẫ uB của một số cá nhân - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 4.3 Aûnh mẫu của tập ảnh mẫ uB của một số cá nhân (Trang 103)
Hình 4.4: Vị trí các điểm đặc trưng 4.3.  Kết quả mô phỏng  - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 4.4 Vị trí các điểm đặc trưng 4.3. Kết quả mô phỏng (Trang 104)
Hình 4.5: Vị trí các điểm đặc trưng trên 2 ảnh mặt của một cá nhân - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 4.5 Vị trí các điểm đặc trưng trên 2 ảnh mặt của một cá nhân (Trang 105)
Hình 4.6: Giao diện nhận dạng ảnh mặt - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 4.6 Giao diện nhận dạng ảnh mặt (Trang 106)
Hình 4.7: Các ảnh nhận dạng tốt đối với tập ảnh mẫ uA - Nhận dạng mặt người dùng gabor wavelets (face recognition using gabor wavelets)
Hình 4.7 Các ảnh nhận dạng tốt đối với tập ảnh mẫ uA (Trang 108)

TỪ KHÓA LIÊN QUAN

w