1. Trang chủ
  2. » Thể loại khác

TÌM HIỂU ĐẶC TRƢNG LÕM 3D VÀ BÀI TOÁN PHÁT HIỆN MẶT NGƢỜI TRONG ẢNH ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY

46 28 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tìm Hiểu Đặc Trưng Lõm 3D Và Bài Toán Phát Hiện Mặt Người Trong Ảnh
Tác giả Nguyễn Thị Thơm
Người hướng dẫn PGS. TS. Đỗ Năng Toàn
Trường học Trường Đại Học Dân Lập Hải Phòng
Chuyên ngành Công Nghệ Thông Tin
Thể loại đồ án tốt nghiệp
Năm xuất bản 2013
Thành phố Hải Phòng
Định dạng
Số trang 46
Dung lượng 1,47 MB

Cấu trúc

  • CHƯƠNG 1. KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN MẶT NGƯỜI (8)
    • 1.1. Khái quát về xử lý ảnh (8)
      • 1.1.1. Một số khái niệm cơ bản (8)
      • 1.1.2. Một số vấn đề trong xử lý ảnh (9)
        • 1.1.2.1. Các hệ thống xử lý ảnh (9)
        • 1.1.2.2. Các hình thái của ảnh (10)
      • 1.1.3. Một số ứng dụng trong xử lý ảnh (11)
    • 1.2. Bài toán nhận dạng mặt người (11)
      • 1.2.1. Bài toán nhận dạng mặt người (11)
      • 1.2.2. Những khó khăn của nhận dạng khuôn mặt (12)
      • 1.2.3. Tầm quan trọng của bài toán nhận diện mặt người (13)
      • 1.2.4. Các ứng dụng đặc trưng của bài toán nhận diện mặt người (14)
      • 1.2.5. Xây dựng hệ thống nhận diện mặt người đặc trưng (15)
      • 1.2.6. Một số phương pháp nhận diện mặt người (15)
        • 1.2.6.1. Dựa trên tri thức (16)
        • 1.2.6.2. Hướng tiếp cận dựa trên đặc trưng không thay đổi (17)
        • 1.2.6.3. Hướng tiếp cận dựa trên so khớp mẫu (20)
        • 1.2.6.4. Hướng tiếp cận dựa trên diện mạo (21)
    • 1.3. Pháp phát hiện mặt người dựa trên đặc trưng lõm (0)
  • CHƯƠNG 2 TÌM HIỂU VỀ CÁC ĐẶC TRƯNG KHUÔN MẶT (23)
    • 2.1. Đặc trưng lõm (0)
    • 2.2. Rút trích các đặc trưng lõm (0)
      • 2.2.1. Điểm lõm (23)
      • 2.2.2. Dò tìm và lấy vùng lõm (24)
      • 2.2.3. Dò và phát hiện vùng lõm ở nhiều mức khác nhau (0)
        • 2.2.3.1. Tối ưu tốc độ dò tìm (27)
      • 2.2.4. Phát hiện mặt người (29)
        • 2.2.4.1. Xây dựng cấu trúc cây lõm (29)
        • 2.2.4.2. Xây dựng hàm tính độ tương đồng giữa hai cây (31)
      • 2.3.1. Gán nhãn (34)
      • 2.3.2. Thống kê (35)
      • 2.3.3. Đánh giá dùng cho phát hiện khuôn mặt (36)
      • 2.3.4. Hậu xử lí (37)
  • CHƯƠNG 3 CHƯƠNG TRÌNH THỬ NGHIỆM (38)
    • 3.1. Bài toán (38)
    • 3.2. Phân tích thiết kế (38)
    • 3.3. Một số kết quả chương trình (38)
      • 3.3.1 Tập ảnh thử nghiệm (38)
      • 3.3.2 Kết quả chương trình (39)
      • 3.3.3 Kết quả thực nghiệm (43)
  • TÀI LIỆU THAM KHẢO (46)

Nội dung

KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN MẶT NGƯỜI

Khái quát về xử lý ảnh

1.1.1 Một số khái niệm cơ bản

Xử lý ảnh đóng vai trò quan trọng trong kỹ thuật thị giác máy tính, là nền tảng cho nhiều nghiên cứu trong lĩnh vực này Hai nhiệm vụ chính của xử lý ảnh là nâng cao chất lượng thông tin hình ảnh và cung cấp dữ liệu cho các quá trình khác, bao gồm ứng dụng thị giác trong điều khiển.

Quá trình xử lý ảnh bắt đầu từ việc thu nhận hình ảnh từ các thiết bị số hoặc tương tự, sau đó gửi đến máy tính Dữ liệu ảnh được lưu trữ ở định dạng phù hợp để xử lý Người lập trình áp dụng các thuật toán tương ứng lên dữ liệu ảnh nhằm điều chỉnh cấu trúc ảnh cho phù hợp với các ứng dụng khác nhau.

Quá trình xử lý nhận dạng ảnh là thao tác trên ảnh đầu vào để đạt được kết quả mong muốn, có thể là một ảnh "đã được xử lý" hoặc một kết luận cụ thể.

Quá trình xử lý ảnh liên quan đến việc biến đổi hình ảnh thành tập hợp các điểm ảnh, mỗi điểm ảnh thể hiện cường độ sáng tại một vị trí cụ thể trong không gian Điều này cho phép hình ảnh được xem như một hàm n chiều, với các biến đại diện cho các đặc trưng khác nhau của ảnh Kết quả của quá trình này là hình ảnh đã được xử lý, mang lại những thông tin và giá trị mới cho người sử dụng.

* Sơ đồ tổng quát của một hệ thống xử lý ảnh:

Hình 1.2 Các bước cơ bản trong một hệ thống xử lý ảnh

1.1.2 Một số vấn đề trong xử lý ảnh

1.1.2.1 Các hệ thống xử lý ảnh a Tiền xử lý

Tiền xử lý là bước đầu tiên trong quy trình xử lý ảnh số, bao gồm các công đoạn như nâng cấp, khôi phục ảnh, nắn chỉnh hình học và khử nhiễu Giai đoạn này đóng vai trò quan trọng trong việc chuẩn bị dữ liệu cho các bước xử lý tiếp theo, đồng thời giúp trích chọn các đặc điểm cần thiết để nâng cao chất lượng hình ảnh.

Trích chọn các đặc điểm của đối tượng trong xử lý ảnh là rất quan trọng để nhận dạng chính xác Việc trích chọn hiệu quả không chỉ nâng cao độ chính xác trong nhận dạng mà còn tăng tốc độ tính toán và giảm dung lượng bộ nhớ lưu trữ.

Nhận dạng tự động là một lĩnh vực quan trọng trong thị giác máy, liên quan đến việc mô tả, phân loại và phân nhóm các mẫu như vân tay, ảnh vật thể, chữ viết, khuôn mặt và tín hiệu âm thanh Hệ thống nhận dạng tự động hoạt động qua ba giai đoạn chính, giúp xác định và phân loại các mẫu một cách hiệu quả, ứng dụng rộng rãi trong nhiều ngành khoa học khác nhau.

Thu nhận dữ liệu và tiền xử lý

Nhận dạng, ra quyết định

Hệ quyết định Đối sánh rút ra kết luận

Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là: Đối sánh mẫu dựa trên các đặc trưng được trích chọn

Phân loại thống kê Đối sánh cấu trúc

Phân loại dựa trên mạng nơ-ron nhân tạo

Trong việc phân loại, không thể chỉ sử dụng một phương pháp duy nhất để đạt được kết quả tối ưu Do đó, việc áp dụng nhiều phương pháp và cách tiếp cận đồng thời là cần thiết Các phương thức phân loại tổ hợp đã được sử dụng hiệu quả trong nhận dạng, và hiện nay, các hệ thống lai (hybrid system) với sự kết hợp của nhiều mô hình đã cho thấy những kết quả triển vọng.

1.1.2.2 Các hình thái của ảnh a.Chuyển ảnh màu thành ảnh xám Đơn vị tế bào của ảnh số là pixel Tùy theo mỗi định dạng là ảnh màu hay ảnh xám mà từng pixel có thông số khác nhau Đối với ảnh màu từng pixel sẽ mang thông tin của ba màu cơ bản tạo ra bản màu khả kiến là Đỏ (R), Xanh lá (G) và Xanh biển (B) [Thomas 1892] Trong mỗi pixel của ảnh màu, ba màu cơ bản R, G và B được bố trí sát nhau và có cường độ sáng khác nhau Thông thường, mỗi màu cơ bản được biểu diễn bằng tám bit tương ứng 256 mức độ màu khác nhau Như vậy mỗi pixel chúng ta sẽ có 28x3"4 màu (khoảng 16.78 triệu màu) Đối với ảnh xám, thông thường mỗi pixel mang thông tin của 256 mức xám (tương ứng với tám bit) như vậy ảnh xám hoàn toàn có thể tái hiện đầy đủ cấu trúc của một ảnh màu tương ứng thông qua tám mặt phẳng bit theo độ xám b.Lược đồ xám của ảnh (Histogram)

Lược đồ xám của một ảnh số thể hiện các mức xám trong khoảng [0,L−1] dưới dạng hàm rời rạc p(rk)=nk/n, trong đó nk là số pixel có mức xám rk và n là tổng số pixel trong ảnh Hàm P(rk) cung cấp một xấp xỉ xác suất xảy ra mức xám rk Khi vẽ hàm này cho tất cả các giá trị của k, chúng ta có thể hình dung sự xuất hiện của các mức xám trong ảnh Lược đồ mức xám cũng có thể được biểu diễn thông qua tần suất xuất hiện của mỗi mức xám trên hệ tọa độ vuông góc xOy, với trục hoành biểu diễn số mức xám từ 0 đến N (số bit của ảnh xám) và trục tung thể hiện tần suất.

1.1.3 Một số ứng dụng trong xử lý ảnh

Các kỹ thuật xử lý ảnh trước đây chủ yếu nhằm nâng cao chất lượng hình ảnh, tạo cảm giác về sự cải thiện chất lượng quang học trong mắt người xem Gần đây, ứng dụng của công nghệ xử lý ảnh số đã mở rộng đáng kể, đến mức không có lĩnh vực khoa học nào không áp dụng các thành tựu này.

Trong y học, các thuật toán xử lý ảnh cho phép chuyển đổi hình ảnh từ nguồn bức xạ X-ray hoặc siêu âm thành hình ảnh quang học trên film x-quang hoặc màn hình hiển thị Hình ảnh các cơ quan chức năng của con người có thể được xử lý tiếp để cải thiện độ tương phản, lọc và tách các thành phần cần thiết, cũng như tạo ra hình ảnh trong không gian ba chiều (siêu âm 3 chiều).

Trong lĩnh vực địa chất, việc phân tích hình ảnh vệ tinh giúp xác định cấu trúc bề mặt trái đất Kỹ thuật nâng cao hình ảnh và khôi phục hình ảnh không chỉ cải thiện chất lượng ảnh vệ tinh mà còn tạo ra các bản đồ địa hình 3-D với độ chính xác cao.

Trong ngành khí tượng học, ảnh từ hệ thống vệ tinh theo dõi thời tiết được xử lý và nâng cao chất lượng để tạo ra hình ảnh bề mặt trái đất trên diện rộng, giúp cải thiện độ chính xác trong dự báo thời tiết.

Xử lý ảnh đóng vai trò quan trọng trong lĩnh vực hình sự và hệ thống bảo mật, giúp nhận diện vân tay và khuôn mặt để phát hiện nhanh các đối tượng nghi vấn, từ đó nâng cao hiệu quả bảo mật cá nhân và kiểm soát ra vào Ngoài ra, kỹ thuật xử lý ảnh còn được ứng dụng trong tự động nhận dạng, nhận diện mục tiêu quân sự, máy nhìn công nghiệp trong hệ thống điều khiển tự động, cũng như nén ảnh tĩnh và động để lưu trữ và truyền tải trong mạng viễn thông.

Bài toán nhận dạng mặt người

1.2.1 Bài toán nhận dạng mặt người

Hệ thống nhận dạng mặt người là công nghệ cho phép nhận diện và xác định vị trí khuôn mặt trong ảnh hoặc video Qua quá trình xử lý, hệ thống có khả năng nhận diện người đã được biết đến từ trước hoặc phân loại người lạ, dựa trên dữ liệu đã học.

1.2.2 Những khó khăn của nhận dạng khuôn mặt a Tư thế góc chụp : Ảnh chụp khuôn mặt có thể thay đổi rất nhiều bởi vì góc chụp giữa camera và khuôn mặt.Chẳng hạn như : chụp thẳng, chụp xéo bên trái

Trong bài toán nhận diện khuôn mặt, có nhiều yếu tố ảnh hưởng đến độ chính xác, bao gồm góc chụp, sự xuất hiện hay thiếu hụt các đặc trưng khuôn mặt, biểu cảm, sự che khuất, hướng ảnh, điều kiện chụp và nền ảnh phức tạp Các góc chụp khác nhau như 45 độ bên phải hay từ trên xuống có thể làm khuất một phần hoặc toàn bộ khuôn mặt, trong khi sự xuất hiện của các đặc trưng như râu hay kính cũng có thể gây khó khăn Biểu cảm của khuôn mặt, như cười hay sợ hãi, có thể làm thay đổi đáng kể các thông số nhận diện Hơn nữa, khuôn mặt có thể bị che khuất bởi các đối tượng khác, và hướng của ảnh cũng ảnh hưởng đến cách nhìn nhận khuôn mặt Điều kiện chụp, như ánh sáng và loại camera, cũng đóng vai trò quan trọng trong chất lượng ảnh Cuối cùng, nền ảnh phức tạp có thể dẫn đến nhầm lẫn giữa khuôn mặt và các khung cảnh xung quanh, gây khó khăn trong việc phân tích và nhận diện chính xác.

Màu sắc của da mặt ảnh hưởng lớn đến khả năng nhận diện khuôn mặt, đặc biệt khi màu da quá tối hoặc gần với màu sắc của môi trường xung quanh Điều này gây khó khăn cho thuật toán trong việc nhận diện các đặc trưng của khuôn mặt, dẫn đến khả năng không phát hiện được khuôn mặt người.

1.2.3 Tầm quan trọng của bài toán nhận diện mặt người

Công nghệ nhận dạng giọng nói phù hợp cho các ứng dụng call-center nhưng gặp khó khăn trong môi trường ồn ào Trong khi đó, nhận dạng chữ ký gây phiền phức do khó duy trì độ nhất quán Nhận dạng vân tay đã phổ biến nhưng bị ảnh hưởng bởi độ ẩm và hóa chất, đồng thời dễ bị giả mạo Ngược lại, công nghệ nhận dạng mống mắt có độ chính xác cao và khả năng chống giả mạo nhờ vào sơ đồ mạch máu trong võng mạc, nhưng lại bị ảnh hưởng bởi các yếu tố như độ rộng mắt và lông mi, đồng thời khó triển khai rộng rãi do thiết bị phức tạp.

Công nghệ nhận dạng mặt người, mặc dù không nổi bật về độ chính xác, lại có ưu điểm vượt trội là không cần tiếp xúc trực tiếp giữa đối tượng và thiết bị thu nhận Điều này cho phép công nghệ này thực hiện theo dõi và giám sát một cách thuận tiện, đặc biệt trong các ứng dụng bảo vệ mục tiêu và chống khủng bố tại những địa điểm công cộng đông người, điều mà các phương pháp nhận dạng khác khó có thể đạt được.

1.2.4.Các ứng dụng đặc trưng của bài toán nhận diện mặt người

Bài toán phát hiện mặt người trong ảnh là một thách thức phức tạp nhưng thu hút sự quan tâm lớn từ các nhà nghiên cứu, nhờ vào tính ứng dụng đa dạng và thiết thực trong cuộc sống hiện đại Một số ứng dụng phổ biến của công nghệ nhận diện khuôn mặt bao gồm an ninh, nhận diện khách hàng trong lĩnh vực thương mại, và cải thiện trải nghiệm người dùng trong các ứng dụng công nghệ.

Hệ thống giao tiếp thông minh giữa người và máy cho phép nhận diện khuôn mặt và biểu cảm để dự đoán trạng thái tâm lý của người dùng Trong tương lai, ngôi nhà thông minh sẽ có khả năng nhận biết chủ nhân thông qua các phương thức như nhận diện khuôn mặt, dáng người, giọng nói và vân tay.

Hệ thống nhận dạng tội phạm có khả năng nhận diện khuôn mặt ngay lập tức và đối chiếu với hàng triệu bản ghi trong cơ sở dữ liệu Điều này giúp xác định liệu khuôn mặt đó có phải là tội phạm đang bị truy nã hay một nhân vật đặc biệt cần được chú ý.

Trong thời đại công nghệ hiện đại, hầu hết các máy ảnh đều trang bị chức năng tự động nhận diện khuôn mặt, giúp tối ưu hóa độ nét và điều chỉnh ánh sáng phù hợp với môi trường xung quanh Bên cạnh đó, nhiều trang web cũng ứng dụng công nghệ này để so sánh với kho dữ liệu lớn, từ đó cung cấp những lời chào và dịch vụ thông minh nhất cho người dùng.

 Hệ thống quan sát, theo dõi và bảo vệ: các hệ thống camera sẽ xác định đâu là con người và theo dõi người đó…

Hệ thống kiểm soát ra vào các cơ quan và văn phòng cho phép nhân viên truy cập vào những khu vực quan trọng mà không cần đăng nhập hay sử dụng thẻ Khi kết hợp với công nghệ nhận diện vân tay hoặc mống mắt, hệ thống này sẽ mang lại độ chính xác cao trong việc xác thực danh tính.

 Tổ chức tìm kiếm liên quan đến con người thông qua khuôn mặt trên nhiều hệ cơ sở dữ liệu lớn

 Phân tích cảm xúc của khuôn mặt người v v

1.2.5.Xây dựng hệ thống nhận diện mặt người đặc trưng

Hệ thống nhận diện khuôn mặt người được xây dựng qua nhiều công đoạn phức tạp, nhưng có thể tóm gọn thành ba bước cơ bản.

Hình 1.4 Hệ thống nhận diện mặt người đặc trưng

Tiền xử lý ảnh là bước quan trọng trong việc cải thiện chất lượng hình ảnh, bao gồm việc điều chỉnh độ sáng và giảm nhiễu Quá trình này giúp việc rút trích các đặc trưng khuôn mặt trở nên dễ dàng hơn Thông thường, tiền xử lý ảnh được thực hiện một cách nhanh chóng và đơn giản, không cần sử dụng các thuật toán phức tạp.

Trích rút đặc trưng là một kỹ thuật quan trọng sử dụng các thuật toán để thu thập thông tin đặc trưng, phản ánh những đặc điểm riêng biệt của từng cá nhân.

 Nhận diện khuôn mặt: sau khi đã rút trích các đặc trưng, sẽ đưa vào khối nhận dạng để phân lớp đối tượng

1.2.6 Một số phương pháp nhận diện mặt người

Hiện nay, có nhiều phương pháp xác định khuôn mặt trong ảnh, từ ảnh chất lượng thấp đến cao, bao gồm cả ảnh đen trắng và ảnh màu Các phương pháp này có thể được phân chia thành bốn hướng tiếp cận chính.

Pháp phát hiện mặt người dựa trên đặc trưng lõm

Lõm có thể hiểu đơn giản là những điểm thấp nhất trong một khu vực, ví dụ như thung lũng Trong hình ảnh vệ tinh, lõm thể hiện qua các đường khe giữa hai dãy núi Trong lĩnh vực y tế, lõm là các thành phần trũng xuống, trong khi đó, trên khuôn mặt, các hốc mắt cũng được xem là những vùng lõm.

Tác giả Hải Trần áp dụng bộ lọc Laplacian-of-Gaussian và một thuật toán để phát hiện quỹ tích của các điểm cực trị Hình 2.1 cho thấy các đặc trưng lõm tương tự như kết quả của Hải Trần, với các điểm lõm được tô màu xanh Cần lưu ý rằng các điểm lõm được rút trích chỉ đại diện cho những vùng lõm nhỏ và chi tiết, bao gồm mắt, chân mày, mũi và miệng.

Trong bài viết này, chúng ta sẽ khám phá các đặc trưng lõm ở nhiều mức độ khác nhau Ở mức thấp nhất, chúng ta sẽ tìm kiếm những đặc trưng nhỏ và chi tiết như mắt và mũi Khi nâng cao đến các mức độ tiếp theo, chúng ta sẽ chú ý đến các vùng lõm lớn hơn Hình ảnh này tương tự như việc quan sát một người từ xa: từ xa chỉ thấy dáng vẻ tổng quát, khi gần hơn ta có thể nhận diện khuôn mặt nhưng chưa thấy rõ các chi tiết, và chỉ khi lại gần hơn nữa, chúng ta mới có thể nhìn thấy rõ mắt, mũi, và miệng Điều này phản ánh phương pháp phân tích theo nhiều cấp độ khác nhau.

Hình 2.1.Dò tìm thông tin lõm

2.2.Rút trích các đặc trƣng lõm

Gọi I(x, y) là hàm hai biến biểu diễn một ảnh, thiết lập mặt (x, y, I(x, y)) Mục tiêu của chúng ta là xác định các điểm có khả năng là.

TÌM HIỂU VỀ CÁC ĐẶC TRƯNG KHUÔN MẶT

Rút trích các đặc trưng lõm

Lõm có thể được hiểu đơn giản là những điểm thấp nhất trong một khu vực, ví dụ như thung lũng Trong ảnh vệ tinh, lõm thể hiện qua các đường khe giữa hai dãy núi Trong lĩnh vực y tế, lõm là các thành phần trũng xuống, còn trong ảnh khuôn mặt, các hốc mắt cũng được xem là lõm.

Tác giả Hải Trần áp dụng bộ lọc Laplacian-of-Gaussian và thuật toán dò tìm quỹ tích của các điểm cực trị, như thể hiện trong Hình 2.1 với các đặc trưng lõm được tô màu xanh Các điểm lõm rút trích chỉ biểu diễn những vùng lõm nhỏ và chi tiết, bao gồm mắt, chân mày, mũi và miệng.

Trong bài viết này, chúng ta sẽ khám phá các đặc trưng lõm ở các mức độ khác nhau Ở mức thấp nhất, chúng ta sẽ tìm kiếm các đặc trưng lõm nhỏ và chi tiết như mắt, mũi Khi nâng cao lên các mức độ tiếp theo, chúng ta sẽ tìm kiếm các vùng lõm lớn hơn Cách tiếp cận này tương tự như việc quan sát một người từ xa; từ xa chỉ thấy được dáng vẻ tổng quát, gần hơn có thể thấy được khuôn mặt nhưng không nhìn thấy chi tiết, và chỉ khi lại gần hơn, chúng ta mới có thể nhận diện rõ các chi tiết như mắt, mũi, miệng.

Hình 2.1.Dò tìm thông tin lõm

2.2.Rút trích các đặc trƣng lõm

Gọi I(x, y) là hàm hai biến đại diện cho một ảnh I, thiết lập một mặt (x, y, I(x, y)) Mục tiêu của chúng ta là xác định các điểm có khả năng nổi bật trong ảnh.

(2.3) Ảnh đang xét s Vùng đánh giá

Điểm lõm trên mặt là những điểm mà tại đó cả hai đạo hàm đạt cực trị Tuy nhiên, do ảnh là một hàm số không liên tục và rời rạc do sự số hóa của máy tính, việc tìm kiếm các điểm cực trị sẽ gặp nhiều khó khăn.

Chúng ta sẽ mất một số thông tin từ các điểm ảnh lõm và các điểm lân cận Để giảm bớt các điều kiện ràng buộc đối với điểm lõm, chúng tôi đề xuất các công thức sau đây.

Trong đó V P là tập các điểm lõm Ký hiệu LoG ( x, y) là giá trị của

Laplacian-of-Gaussian tại điểm (x, y) Mục đích là rút trích các vùng lõm chứ không chỉ rút trích điểm lõm

2.2.2 Dò tìm và lấy vùng lõm Để đánh giá một vùng có phải là lõm hoặc không lõm, chúng ta đề xuất một bộ lọc như sau:

Hình 2.2 Dò tìm vùng lõm trên ảnh Ứng với vùng đang xét – một hình vuông s x s , chúng ta tính giá trị của bộ lọc trên

Nguyễn Thị Thơm - Lớp CT1301 23

Lọc chữ nhật ngang Lọc chữ nhật đứng

Trong công thức (2.3), hàm sum(X) là hàm tổng giá trị độ sáng trong vùng X Dựatrên giá trị F(R) vừa tính được, chúng ta đánh giá vùng R theo công thức sau:

Công thức (2.5) mở rộng từ (2.2) và (2.3) để phát hiện các vùng lõm trong ảnh, với sự khác biệt chính là việc sử dụng bộ lọc hiệu trong (2.5) thay vì Laplacian-of-Gaussian Bằng cách thay đổi kích thước S của vùng xét, ta có thể dò tìm các vùng lõm với nhiều kích cỡ và mức độ khác nhau Để phát hiện và trích xuất các vùng lõm có hình dạng đa dạng, nên sử dụng một tập hợp các lọc hình học thay vì chỉ một bộ lọc vuông đơn giản.

Hình 2.3 Tập các bộ lọc

Do đó ta có thể biến đổi công thức (2.4) thành công thức sau:

F S (R) được sử dụng để tính giá trị lọc vuông, trong khi FR (R) được áp dụng cho lọc hình chữ nhật Các công thức tính lọc tương tự như công thức của Laplacian, nhưng khác biệt ở chỗ sử dụng vùng thay vì từng điểm đơn lẻ Hệ số trước hàm sum(R) được xác định bởi tỷ lệ giữa diện tích vùng trung tâm và tổng diện tích vùng lân cận Ví dụ, trong hình (2.3a), tổng diện tích các vùng xung quanh gấp đôi diện tích phần giữa, dẫn đến hệ số 2 Trong hình (2.3b) và (2.3c), tổng diện tích các vùng xung quanh gấp rưỡi diện tích phần hình chữ nhật giữa, do đó hệ số chính xác là 1.5 Tuy nhiên, để tăng tốc độ tính toán, ta sử dụng các hệ số nguyên 3 và 2 thay vì chỉ dùng hệ số 1.5.

Ngưỡng là một thông số quan trọng trong công thức (2.5), phụ thuộc tuyến tính vào diện tích của vùng đang xét Chúng ta sử dụng ngưỡng 1 = KS² cho lọc hình vuông kích thước S và ngưỡng 2 = 4KS² cho lọc hình chữ nhật kích thước S, trong đó K là thông số thực nghiệm Ngưỡng 1 được tính bằng tích của K và S² - diện tích của lọc vuông Trong công thức (2.7), giá trị của F R (R) được gấp đôi để tránh tính toán trên số thực, do đó, ngưỡng 2 cũng cần được gấp đôi để tăng độ chính xác trong đánh giá.

2.2.3.Dò và phát hiện vùng lõm o nhiều mức khác nhau

Phương pháp này sử dụng các bộ lọc hiệu quả ở nhiều mức độ khác nhau để phát hiện các vùng lõm Các bộ lọc đã được giới thiệu trước đó sẽ được áp dụng với nhiều kích thước khác nhau, cho phép phát hiện các vùng lồi ở nhiều mức độ khác nhau.

, ảnh sau khi smoth với Các vùng lõm dò với kích thước lọc 1 Gausian 10 2

, ảnh sau khi smoth với Các vùng lõm dò tìm với kích

Hình 2.4 Dò tìm vùng lõm ở nhiều mức khác nhau Đặt 1 , 2 , n là các mức độ được định nghĩa trước và có độ lớn tăng dần

Mức độ 1 là mức thấp nhất, cho phép chúng ta dò tìm các vùng lõm nhỏ và chi tiết Trong khi đó, mức độ n là mức cao nhất, giúp phát hiện các vùng lõm lớn hơn nhưng ít chi tiết hơn Trước khi thực hiện dò tìm ở mỗi mức, cần áp dụng một bộ lọc thích hợp.

Sử dụng bộ lọc Gaussian với kích thước i 2, chúng ta áp dụng 3 bộ lọc hiệu như trong hình (2.3) với kích thước S = i Hình (2.4) minh họa các vùng lõm, trong đó các hình vuông và hình chữ nhật màu xanh đại diện cho những khu vực này Mặc dù có nhiều vùng lõm khác được phát hiện, hình (2.4) chỉ tập trung vào các vùng lõm trong khu vực ảnh quan tâm - khuôn mặt Phần tiếp theo sẽ trình bày phương pháp cấu trúc các vùng lõm đã rút trích thành các cây cấp bậc.

2.2.3.1.Tối ƣu tốc độ dò tìm

Trong quá trình tính toán tổng độ sáng của các điểm ảnh trong một vùng hình chữ nhật có thể chồng chéo, hiệu suất tính toán thường bị giảm do phải thực hiện nhiều phép tính lặp lại Để tối ưu hóa quy trình này, tôi áp dụng phương pháp tương tự như ảnh tích phân (integral image) kết hợp với kỹ thuật lập trình quy hoạch động Phương pháp này giúp giảm độ phức tạp trong tính toán và nâng cao hiệu suất xử lý.

Cho trước một ảnh mức xám I (x, y) , chúng ta định nghĩa một ảnh tích phân

S(x, y) sao cho S(x, y) là tổng mức sáng của toàn bộ điểm ảnh trong hình chữ nhật R(1,1, x, y) Chúng ta có thể dễ dàng tính được S (x, y) theo công thức truy hồi:

Từ ảnh S (x, y) , ta dễ dáng tính được tổng độ sáng của một hình chữ nhật bất kỳ R(l, r,t,b) theo công thức sau:

Phương pháp này giúp cải thiện đáng kể tốc độ tính toán, vì chỉ cần tính toán một lần ảnh tích phân và áp dụng cho tất cả các cửa sổ hình chữ nhật con Đặc biệt, độ phức tạp tính toán không phụ thuộc vào kích thước của vùng đang xét.

2.2.4.1.Xây dựng cấu trúc cây lõm

Từ các vùng lõm được rút trích, chúng ta xây dựng các cây quan hệ cấp bậc, trong đó những vùng rút trích ở mức cao nhất n sẽ trở thành các nút gốc, trong khi những vùng ở mức thấp nhất 1 sẽ được chèn vào cây như những nút lá.

Hình 2.7 Tạo cây cấp bậc

CHƯƠNG TRÌNH THỬ NGHIỆM

Ngày đăng: 12/07/2021, 01:53

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Ming-Hsuan Yang, David J. Kriegman, Narendra Ahuja, “Detecting Faces in Images: A Survey”, IEEE Transaction on Pattern Analysis and Machine Intelligence (PAMI), Vol. 24, No 1, pp. 34-47, Jan 2002 Sách, tạp chí
Tiêu đề: Detecting Faces in Images: A Survey
[2]. T. Kanade, “Picture Processing Computer Complex and Recognition of Human Faces”, PhD thesis, Kyoto Univ., 1973 Sách, tạp chí
Tiêu đề: Picture Processing Computer Complex and Recognition of Human Faces
[3]. G. Yang, T. S. Huang, “Human Face Detection in Complex Background”, Pattern Recognition, Vol. 27, No. 1, pp. 53-63, 1994 Sách, tạp chí
Tiêu đề: Human Face Detection in Complex Background
[4]. C. Kotropoulos, I. Pitas, “Rule-based Face Detection in Frontal Views”, Proc. Int’l Conf. Acoustics, Speech and Signal Processing, Vol. 4, pp. 2637-2540, 1997 Sách, tạp chí
Tiêu đề: Rule-based Face Detection in Frontal Views
[5]. T. K. Leung, M.C. Burl, P. Perona, “Finding Faces in Cluttered Scenes Using Random Labeled Graph Matching”, Proc. 5th IEEE Conf. Computer Vision (ICCV’95), pp. 637-644, 1995 Sách, tạp chí
Tiêu đề: Finding Faces in Cluttered Scenes Using Random Labeled Graph Matching
[6]. K. C. Yow, R. Cipolla, “Feature-Based Human Face Detection”, Image and Vision Computing, Vol. 15, No. 9, pp. 713-735, 1997 Sách, tạp chí
Tiêu đề: Feature-Based Human Face Detection
[7]. I. Craw, D. Tock, A. Bennett, “Finding Face Features”, Proc. 2nd European Conf. Computer Vision (ECCV’92), Vol. 2, pp. 92-96, 1992 Sách, tạp chí
Tiêu đề: Finding Face Features
[8]. A. Lanitis, C. J. Taylor, T. F. Cootes, “An Automatic Face Identification System Using Flexible Appearance Models”, Image and Vision Computing, Vol.13, No. 5, pp. 393-401, 1995.[B]. Tài liệu Tiếng Việt Sách, tạp chí
Tiêu đề: An Automatic Face Identification System Using Flexible Appearance Models
[9]. PGS.TS Đỗ Năng Toàn, TS. Phạm Việt Bình, “Giáo trình Xử Lý Ảnh”, Đại học Thái Nguyên, 2007 Sách, tạp chí
Tiêu đề: Giáo trình Xử Lý Ảnh
[10]. Phạm Thế Bảo, Nguyễn Thành Nhựt, Cao Minh Thịnh, Trần Anh Tuấn, Phan Phúc Doãn, “Tổng quan các phương pháp xác định khuôn mặt người”, Tạp chí Công nghệ thông tin & Truyền thông, 2007 Sách, tạp chí
Tiêu đề: Tổng quan các phương pháp xác định khuôn mặt người

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN