1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên

75 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Tác giả Nguyễn Duy Khánh
Người hướng dẫn TS. Đặng Thái Việt
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Kỹ thuật Cơ Điện Tử
Thể loại luận văn thạc sĩ
Năm xuất bản 2020
Thành phố Hà Nội
Định dạng
Số trang 75
Dung lượng 2,23 MB

Cấu trúc

  • LỜI MỞ ĐẦU

  • MỤC LỤC

  • CHƯƠNG 1.

  • CHƯƠNG 2.

  • CHƯƠNG 3.

  • KẾT LUẬN

  • TÀI LIỆU THAM KHẢO

Nội dung

TỔNG QUAN

Đặt vấn đề

Trong thời kỳ hội nhập, sự phát triển của khoa học kỹ thuật là cần thiết để đáp ứng nhu cầu của kỷ nguyên mới Ngành kỹ thuật cơ điện tử đóng vai trò quan trọng trong việc thúc đẩy sự phát triển này Trước đây, các hệ thống công nghệ chủ yếu hoạt động dựa trên kết cấu cơ khí đơn giản và mạch điện tử điều khiển cơ bản, chỉ đáp ứng một số thao tác cơ bản Tuy nhiên, sự phát triển mạnh mẽ của công nghiệp sản xuất yêu cầu một công nghệ cao hơn, uyển chuyển và linh hoạt hơn, dẫn đến sự ra đời của cơ điện tử.

Nền công nghiệp 4.0 đang mở ra cơ hội và thách thức lớn cho các quốc gia, bao gồm cả Việt Nam, thông qua việc tích hợp công nghệ tiên tiến như tự động hóa và công nghệ thông tin để nâng cao chất lượng cuộc sống Sự phát triển mạnh mẽ của công nghệ xử lý trong chuyển đổi số đã dẫn đến nhiều ứng dụng thực tiễn, chẳng hạn như hệ thống cảnh báo khoảng cách an toàn trong giao thông và hệ thống bãi đỗ xe tự động, giúp quản lý hiệu quả và tiết kiệm thời gian, chi phí cho người dùng.

Lĩnh vực thị giác máy tính đang trên đà phát triển mạnh mẽ nhờ vào sự đầu tư đáng kể, đạt được nhiều thành tựu quan trọng Quá trình chuyển đổi số hiện nay được xây dựng dựa trên nền tảng trí tuệ nhân tạo, mang lại những tiến bộ vượt bậc trong công nghệ.

Công nghệ nhận dạng khuôn mặt đang ngày càng phát triển, không chỉ giúp giảm khối lượng công việc mà còn nâng cao độ chính xác trong nhiều ứng dụng thực tiễn như kiểm soát an ninh và giám sát hành vi Một nghiên cứu gần đây của Sadhna Sharma về "Template Matching Approach for Face Recognition System" đã cải thiện hệ thống an ninh cũ bằng cách sử dụng thuật toán khớp mẫu, cho phép xác định khuôn mặt qua các giá trị tương quan với các mẫu chuẩn Mặc dù phương pháp này dễ cài đặt, nhưng hiệu quả bị ảnh hưởng bởi sự thay đổi về tỷ lệ và tư thế Để khắc phục hạn chế này, một nghiên cứu khác của Sarma và Prasad đã phát triển hệ thống an ninh văn phòng dựa trên Labview, mặc dù độ chính xác của phương pháp phân tích histogram còn chưa cao Ngoài ra, N Dileep Kumar và S Shanthi cũng đã đề xuất hệ thống nhận diện khuôn mặt cho an ninh tòa nhà sử dụng công nghệ Haar-cascade.

Hệ thống cổng tự động sử dụng kỹ thuật nhận diện khuôn mặt dựa trên thuật toán HAAR Cascade kết hợp với việc huấn luyện dữ liệu Quá trình bắt đầu bằng việc chuyển đổi ảnh thành ảnh xám, sau đó áp dụng các đặc trưng haar-like để quét khắp bức ảnh Những khu vực có đặc trưng tương đồng nhất sẽ được đánh dấu là có khuôn mặt Tuy nhiên, do có nhiều khu vực có thể bị nhận diện nhầm là khuôn mặt, các ảnh không phù hợp sẽ được sử dụng để loại trừ những vùng này Do đó, trong quá trình huấn luyện bộ nhận dạng, cần phải có một số lượng lớn ảnh sai để cải thiện độ chính xác.

Để nâng cao độ chính xác trong các hệ thống an ninh, cần một phương pháp ổn định hơn, như nghiên cứu của nhóm Rajiv về hệ thống bảo mật dựa trên công nghệ nhận diện khuôn mặt và quản lý qua email Hệ thống này cho phép phát hiện đối tượng qua khuôn mặt và làn da với độ chính xác cao nhờ vào học sâu, tuy nhiên, việc yêu cầu sự cho phép truy cập của chủ nhà qua email vẫn là một nhược điểm cần cải thiện để tăng tính hiệu quả và ứng dụng thực tế.

Bài toán xác định mật độ đối tượng có ứng dụng quan trọng trong nhiều lĩnh vực như an ninh, kiểm soát hành vi và giáo dục Do đó, việc nghiên cứu và phát triển, cũng như thử nghiệm để cải thiện độ chính xác của thuật toán là cần thiết Tác giả đã áp dụng trực tiếp thuật toán vào hệ thống điểm danh tự động nhằm kiểm nghiệm tính chính xác và hiệu quả của nó.

Để xây dựng hệ thống tích hợp các giải pháp xử lý dữ liệu và trích xuất thông tin phù hợp với từng vùng và tổ chức, hệ thống sẽ áp dụng phương pháp điểm danh sinh trắc học vân tay kết hợp với nhận diện khuôn mặt Đồng thời, hệ thống sẽ được kiểm nghiệm và so sánh với các công bố trong cùng lĩnh vực Tác giả xin đề xuất đề tài này nhằm nâng cao hiệu quả trong việc quản lý và bảo mật thông tin.

Nghiên cứu và thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt kết hợp với thuật toán học sâu nhằm mục đích điểm danh và đánh giá độ chuyên cần của sinh viên Hệ thống này không chỉ nâng cao hiệu quả trong việc quản lý sinh viên mà còn đảm bảo tính chính xác và nhanh chóng trong quá trình điểm danh.

Tổng quan mạng nơ-ron tích chập CNN

1.2.1 Giới thiệu mạng nơ-ron Định nghĩa: Mạng nơ-ron nhân tạo, Artificial Neural Network (ANN) là một mô hình xử lý thông tin mô phỏng theo cách thức xử lý thông tin của các hệ nơ- ron sinh học Nó được tạo nên từ một số lượng lớn các phần tử kết nối với nhau thông qua các liên kết (trọng số liên kết) làm việc như một thể thống nhất để giải quyết một vấn đề cụ thể nào đó Một mạng nơ-ron nhân tạo được cấu hình cho

Học máy là một ứng dụng quan trọng trong việc nhận dạng mẫu và phân loại dữ liệu, diễn ra thông qua quá trình học từ tập các mẫu huấn luyện Quá trình này chủ yếu liên quan đến việc điều chỉnh trọng số liên kết giữa các nơ-ron để cải thiện độ chính xác của mô hình.

Hình 1.1: Cấu trúc mạng Nơ-ron

Các thành phần cơ bản của một nơ-ron nhân tạo bao gồm:

- Tập các đầu vào: Là các tín hiệu vào (đầu vào signals) của nơ-ron, các tín hiệu này thường được đưa vào dưới dạng một vec-tơ N chiều

Trong mạng nơ-ron, mỗi liên kết được biểu thị bằng trọng số liên kết (synaptic weight), ký hiệu là w kj, thể hiện mối quan hệ giữa tín hiệu đầu vào thứ j và nơ-ron k Các trọng số này thường được khởi tạo ngẫu nhiên khi mạng bắt đầu và được cập nhật liên tục trong quá trình học của mạng.

- Bộ tổng (Summing function): Thường dùng để tính tổng của tích các đầu vào với trọng số liên kết của nó

- Ngưỡng (còn gọi là một độ lệch - bias): Ngưỡng này thường được đưa vào như một thành phần của hàm truyền

Hàm truyền (Transfer function) là công cụ quan trọng trong mạng nơ-ron, giúp xác định giới hạn đầu ra của từng nơ-ron Hàm này nhận đầu vào từ kết quả của hàm tổng và ngưỡng, đảm bảo rằng đầu ra được điều chỉnh phù hợp với yêu cầu của mô hình.

- Đầu ra: Là tín hiệu đầu ra của một nơ-ron, với mỗi nơ-ron sẽ có tối đa là một đầu ra

Xét về mặt toán học, cấu trúc của một nơ-ron k, được mô tả bằng cặp biểu thức sau:

- x 1 , x 2 , , x p : là các tín hiệu vào

- (w k1 , w k2 , , w kp ) là các trọng số liên kết của nơ-ron thứ k

- y k là tín hiệu đầu ra của nơ-ron

Nơ-ron nhân tạo tiếp nhận tín hiệu đầu vào, thực hiện việc xử lý bằng cách nhân các tín hiệu với trọng số liên kết, tính tổng các tích thu được và gửi kết quả đến hàm truyền, từ đó tạo ra tín hiệu đầu ra là kết quả của hàm truyền.

1.2.2 Cấu trúc mạng Nơ-ron tích chập CNN

Hiểu biết về Mạng Nơ-ron Tích chập (CNN) là một trong những thuật toán học sâu quan trọng cho nhận dạng vật thể và hình ảnh Để nhận diện vật thể, mô hình CNN sẽ được huấn luyện và thử nghiệm liên tục nhằm đạt được kết quả tốt nhất Mỗi ảnh đầu vào được xem như một mảng điểm ảnh, phụ thuộc vào độ phân giải, cũng như loại ảnh (màu hay đen trắng), dẫn đến sự khác biệt trong số lớp và cách xử lý Quá trình xử lý và huấn luyện của CNN bao gồm các lớp như lớp tích chập, lớp kích hoạt phi tuyến ReLU, lớp lấy mẫu và lớp kết nối đầy đủ, với số lượng và cách sắp xếp có thể thay đổi để phù hợp với từng bài toán cụ thể.

Hình 1.2: Cấu trúc mạng tích chập CNN

1.2.2.1 Lớp tích chập (Convolution layer) Đây là thành phần quan trọng nhất trong mạng CNN, cũng là nơi thể hiện tư tưởng xây dựng sự liên kết cục bộ thay vì kết nối toàn bộ các điểm ảnh Các liên kết cục bộ này được tính toán bằng phép tích chập giữa các giá trị điểm ảnh trong một vùng ảnh cục bộ với các bộ lọc – filters – có kích thước nhỏ

Hình 1.3: Nguyên lý bộ lọc tích chập

Bộ lọc 3x3 được sử dụng để quét toàn bộ bức ảnh, tạo ra một bức ảnh mới có kích thước nhỏ hơn hoặc bằng kích thước ảnh đầu vào Kích thước của bức ảnh mới phụ thuộc vào các khoảng trắng được thêm ở viền bức ảnh gốc và được tính theo công thức cụ thể.

- O: kích thước ảnh đầu ra

- i: kích thước ảnh đầu vào

- p: kích thước khoảng trắng phía ngoài viền của ảnh gốc

- s: bước trượt của bộ lọc

Kết quả cuối cùng bước này sẽ cho ra đầu ra như thế nào? Bước tiến hành lớp convolution này để tìm đặc trưng ảnh như viền,…

Hình 1.4 Kết quả xử lý sau lớp tích chập

1.2.2.2 Lớp lấy mẫu( Pooling Layer)

Pooling giúp giảm số tham số cần tính toán, từ đó tiết kiệm thời gian và tránh trùng lặp Max pooling là loại pooling phổ biến nhất, lấy giá trị lớn nhất trong một cửa sổ pooling Quá trình pooling tương tự như convolution, với một cửa sổ trượt gọi là pooling window, trượt qua các giá trị của ma trận dữ liệu đầu vào (thường là các sơ đồ đặc trưng trong lớp convolutional) và chọn ra giá trị lớn nhất từ các giá trị trong cửa sổ trượt.

Hình 1.5: Xử lý Max Pooling

1.2.2.3 Lớp kết nối đầy đủ( Fully Connected module)

Trong mạng nơ-ron, các nơ-ron đầu vào được kết nối với các nơ-ron khác thông qua trọng số cụ thể Dữ liệu từ ảnh đầu vào sẽ được xử lý qua các nơ-ron trung gian để tìm ra kết quả đầu ra phù hợp Nếu kết quả chưa đạt yêu cầu tối ưu, mạng nơ-ron sẽ điều chỉnh để cải thiện hiệu suất.

8 lan truyền ngược để tìm lại trọng số ở mỗi nơ-ron sao cho kết quả đạt được là tối ưu nhất

Sự ra đời của mạng CNN đã khắc phục những hạn chế của các mạng nơ-ron nhân tạo truyền thống trong việc học thông tin từ ảnh Các mạng nơ-ron truyền thẳng gặp khó khăn do số lượng liên kết tăng nhanh khi kích thước ảnh lớn, dẫn đến khối lượng tính toán khổng lồ Hơn nữa, việc kết nối đầy đủ là không cần thiết, vì thông tin chủ yếu đến từ mối quan hệ giữa các điểm ảnh lân cận hơn là từ những điểm ảnh xa Mạng CNN với kiến trúc mới cho phép xây dựng liên kết chỉ từ một phần cục bộ của ảnh, giúp tối ưu hóa quá trình học và giảm thiểu sự dư thừa trong tính toán.

Thuật toán FaceNet

Thuật toán Facenet đã được các nhà khoa học phân tích và so sánh, cho thấy độ chính xác cao và khả năng ứng dụng đa dạng Nghiên cứu "Face Recognition Algorithm Bias: Performance Differences on Images of Children and Adults" của nhóm tác giả Nisha Srinivas, Karl Ricanek và Dana Michalski đã chỉ ra khả năng phân tích sự khác biệt giữa trẻ em và người lớn Thuật toán này có thể được huấn luyện từ nhiều nguồn dữ liệu khác nhau, giúp nâng cao độ chính xác và tính tiện lợi Để chứng minh sự vượt trội, nhóm tác giả Ivan William, De Rosal Ignatius Moses Setiadi và Eko Hari Rachmawanto đã tiến hành so sánh với các phương pháp nhận diện khuôn mặt khác.

9 với đề tài “Face Recognition using FaceNet (Survey,Performance Test, and Comparison)”[8] để thấy tính vượt trội về độ chính xác so với phương pháp PCA,…

FaceNet cung cấp khả năng nhúng thống nhất cho các tác vụ nhận dạng, xác minh và phân cụm khuôn mặt bằng cách ánh xạ mỗi hình ảnh khuôn mặt vào một không gian ơ-clit Trong không gian này, khoảng cách giữa các điểm tương ứng với sự tương đồng giữa các khuôn mặt, đảm bảo rằng hình ảnh của một người được đặt gần hơn với những hình ảnh khác của họ so với hình ảnh của người khác trong tập dữ liệu Khi xử lý, khuôn mặt được biểu diễn dưới dạng vec-tơ, giúp cho việc nhận dạng và so sánh toán học trở nên dễ dàng hơn Để xác định khuôn mặt, chúng ta cần tính toán độ giống và khác nhau giữa các khuôn mặt, và để đơn giản hóa, bài toán này sẽ được quy về việc tính khoảng cách giữa các vec-tơ.

Bài toán là chuyển đổi khung hình khuôn mặt thành vec-tơ sao cho các vec-tơ của hai khuôn mặt tương tự có khoảng cách gần nhau, trong khi các vec-tơ của hai khuôn mặt khác nhau phải có khoảng cách xa hơn Mô hình áp dụng trong trường hợp này là Triplet Loss, như được minh họa trong sơ đồ.

Triplet là bộ ba thông số gồm một ảnh mặt của một người (query), một ảnh mặt khác của cùng người đó (positive) và một ảnh mặt của người khác (negative), với góc quay tối đa là 20 độ Việc huấn luyện mô hình dựa trên bộ ba này cung cấp thêm thông tin về mối quan hệ giữa các ảnh, từ đó giúp mô hình hoạt động hiệu quả hơn trong việc nhận diện khuôn mặt.

Để mô hình có thể hiểu và tạo ra các vec-tơ mong muốn trong quá trình huấn luyện, việc sử dụng triplet loss là rất cần thiết Hàm loss của mô hình sẽ được thiết lập theo dạng thích hợp để đạt hiệu quả tối ưu.

- f(p) là vec-tơ biểu diễn p

- D là khoảng cách giữa 2 vec-tơ

Chúng ta đang huấn luyện mô hình để tối ưu hóa giá trị hàm, nhằm giảm khoảng cách giữa vec-tơ f(pi) (Hình ảnh Query) và f(pi+) (Hình ảnh Tích cực), đồng thời tăng khoảng cách giữa hình ảnh Query và hình ảnh Tiêu cực Mục tiêu chính là giúp mô hình học được cách phân biệt và cải thiện độ chính xác trong việc nhận diện hình ảnh.

Để tính toán hàm Loss, chúng ta cần xác định rằng ảnh x_i_a của một người nên gần gũi hơn với các ảnh x_i_p (positive) của cùng người trong bộ dữ liệu, so với các ảnh x_i_n (negative) của người khác Khoảng cách giữa các ảnh này được thể hiện qua hệ số α.

Từ đó tính được hàm Loss:

Dữ liệu huấn luyện bao gồm hai phần chính: một phần dành cho quá trình pre-train nhằm trích xuất đặc trưng của hệ thống, sử dụng tập Labeled Face in Wild (LFW) Tập dữ liệu này chứa hơn 13.000 ảnh mặt người đã được gán nhãn và thu thập từ internet.

Phần thứ hai của bài viết đề cập đến việc thu thập dữ liệu huấn luyện cho hệ thống nhận diện khuôn mặt Cụ thể, cơ sở dữ liệu bao gồm 150 hình ảnh của 150 người, được thu thập từ nhiều nguồn khác nhau Trong đó, 50 hình ảnh đầu tiên được lấy từ website http://cyberextruder.com, nơi chuyên cung cấp dữ liệu cho việc nhận diện khuôn mặt 50 hình ảnh tiếp theo được lấy từ trang web https://susanqq.github.io/UTKFace/, với các khuôn mặt trực diện, rất phù hợp cho quá trình huấn luyện và nhận diện.

50 ảnh của học sinh, sinh viên chụp từ điện thoại

Hầu hết các khuôn mặt trong tập mẫu dữ liệu đều xuất hiện trực diện với mặt phẳng ảnh, cung cấp đầy đủ thông tin đặc trưng Chỉ có một số ít khuôn mặt quay với góc độ không đáng kể.

Kích thước chuẩn hóa cho mỗi mẫu trong tập huấn luyện là 30x30 hoặc 32x32 điểm ảnh Tùy thuộc vào đặc trưng xử lý của từng thuật toán, chúng ta sẽ chọn một trong hai kích thước ảnh chuẩn này.

Dữ liệu ảnh được biểu diễn qua cường độ sáng của các điểm ảnh tại vị trí X và Y, ký hiệu là I(x,y) Để phục vụ cho các thuật toán học nhận dạng, chúng ta có hai cách tổ chức dữ liệu khác nhau.

Để xử lý hình ảnh, bước đầu tiên là đọc từng dòng ảnh theo thứ tự từ trên xuống Mỗi dòng ảnh được sắp xếp liên tục trên một mảng số thực một chiều Ví dụ, một hình ảnh có kích thước 30x30 điểm ảnh sẽ được chuyển đổi thành một mảng vec-tơ một chiều trong máy tính, ký hiệu là X (X1, X2, …, X900).

Bước 2: Đọc từng khối ảnh kích thước 8x32 (điểm ảnh) theo thứ tự, chồng lấp khối trên một nửa chiều cao Từ mỗi khối 8x32, tiếp tục tách ra các khối con 8x8 liên tiếp Từ khối 8x8, chọn ra 20 hệ số đặc trưng qua phép biến đổi miền tần số Mỗi khối ảnh 8x32 được lượng hoá thành một vec-tơ một chiều, tạo thành chuỗi vec-tơ một chiều cho mỗi khuôn mặt trong máy tính.

Thuật toán MTCNN

Mục đích của việc phát hiện khuôn mặt là xác định vị trí và các điểm quan trọng trên mặt như mắt và mũi Tuy nhiên, việc nhận diện khuôn mặt và căn chỉnh chính xác gặp nhiều thách thức do sự đa dạng về tư thế và ánh sáng Với công nghệ học sâu dựa trên MTCNN, chúng ta có khả năng nhận dạng và định vị khuôn mặt cùng các điểm đặc trưng một cách chính xác.

Thuật toán MTCNN đã được nghiên cứu và cải tiến để nâng cao độ chính xác trong việc tính toán nhanh và hiệu quả Một ví dụ điển hình là công trình của Rong Xie và Qingyu Zhang, trong đó họ so sánh MTCNN với các phương pháp khác, chứng minh sự vượt trội của nó qua công bố "A Method of Small Face Detection Based on CNN".

Hình 1.10: So sánh phương pháp MTCNN

Thuật toán MTCNN (Multi-task Cascaded Convolutional Networks) là một phương pháp nhận diện khuôn mặt đa tác vụ, không chỉ phát hiện khuôn mặt mà còn xác định các điểm đặc trưng trên khuôn mặt MTCNN sử dụng mạng hiệu chuẩn để điều chỉnh khuôn mặt sau khi phát hiện, mặc dù nó có nhiều mô hình với lượng tính toán lớn nhưng vẫn bỏ qua các liên kết nội tại giữa các giới hạn hồi quy và vị trí khuôn mặt Qua phân tích, tốc độ xử lý dữ liệu của MTCNN được đánh giá là khá cao, đáp ứng tốt yêu cầu của hệ thống Nguyên lý hoạt động của MTCNN được minh họa rõ ràng qua hình ảnh dưới đây.

Hình 1.11: Nguyên lý hoạt động MTCNN [9]

MTCNN hoạt động qua ba bước với ba mạng nơ-ron riêng biệt: P-Net, R-Net, và O-Net, mỗi bước thực hiện xử lý độc lập để phát hiện khuôn mặt trong ảnh nhanh chóng và chính xác Đối với mỗi bức ảnh đầu vào, MTCNN tạo ra nhiều phiên bản với kích thước khác nhau Bài viết sẽ phân tích cấu trúc và nguyên lý hoạt động của từng mạng, từ đó cung cấp cái nhìn tổng quan về thuật toán MTCNN.

Hình 1.12: Quá trình xử lý mạng P-Net

Bước 1 trong quy trình xử lý P-Net bao gồm việc sử dụng một kernel 12x12 để quét toàn bộ ảnh, nhằm xác định các cửa sổ có khả năng chứa khuôn mặt và các vec-tơ hồi quy tương ứng Sau đó, các cửa sổ này được hiệu chuẩn dựa trên các vec-tơ hồi quy đã thu được Cuối cùng, các cửa sổ chồng chéo trong một khu vực sẽ được hợp nhất thành một cửa sổ duy nhất thông qua phương pháp NMS Kết quả sau khi xử lý qua tầng P-Net là các cửa sổ có khả năng chứa khuôn mặt.

Hình 1.13: Ví dụ xử lý mạng P-Net

Bước 2: Quá trình xử lý R-Net Tất cả các cửa sổ chứa khuôn mặt từ tầng P-

Net sẽ được xử lý qua CNN R-Net để loại bỏ nhiều cửa sổ không có khuôn mặt Tiếp theo, thực hiện hiệu chuẩn với vec-tơ hồi quy và hợp nhất các cửa sổ chồng chéo trong cùng một khu vực.

Hình 1.14: Quá trình xử lý mạng R-Net

Quá trình xử lý của mạng R-Net bắt đầu từ ảnh đã qua xử lý của P-Net, giúp loại bỏ hiệu quả các vùng không chứa khuôn mặt, mang lại ảnh sau xử lý rõ ràng hơn.

Hình 1.15: Ví dụ xử lý mạng R-Net

Bước 3 trong quá trình xử lý O-Net liên quan đến việc sử dụng Mạng đầu ra (O-Net), tương tự như tầng R-Net O-Net áp dụng CNN chi tiết nhất để lọc kết quả một lần nữa và xác định vị trí năm điểm chính trên khuôn mặt Kết quả sau khi qua tầng 3 là các khuôn mặt đã được phát hiện.

Hình 1.16: Quá trình xử lý O-Net

Sau khi xử lý, thuật toán cung cấp ba kết quả chính: xác suất khuôn mặt nằm trong đường bao, tọa độ của đường bao khuôn mặt, và tọa độ các mốc quan trọng trên khuôn mặt như vị trí mắt, mũi và miệng.

Kết luận

Qua những nội dung đã phân tích ở chương một, tác giả đã phân tích và chỉ rõ một số nội dung như sau:

- Tổng quan về cuộc cách mạng công nghiệp lần thứ 4, cùng với sự phát triển đó lĩnh vực thị giác máy tính cũng có những tiến bộ vượt bậc

Các công bố liên quan đã góp phần giải quyết nhiều khó khăn trong các bài toán thực tiễn, đồng thời nâng cao chất lượng cuộc sống cho con người hiện nay.

Tác giả đã phân tích các ưu và nhược điểm của các phương pháp hiện tại dựa trên các công trình đã công bố, từ đó đề xuất những bài toán giải quyết các vấn đề chưa được công bố hoặc chưa được giải quyết Bài toán điểm danh được xác định có tính thực tiễn cao và cần được thử nghiệm để đánh giá kết quả một cách chính xác.

Tác giả đã cung cấp những kiến thức liên quan áp dụng vào bài toán nghiên cứu, với sự phân tích sâu về mạng nơ-ron trong hai thuật toán MTCNN và Facenet, giúp làm rõ và chi tiết hóa nội dung nghiên cứu.

Tác giả giới thiệu phương pháp thử nghiệm nhằm xác định và quản lý mật độ đối tượng, từ đó tiến hành thử nghiệm và cải tiến độ chính xác so với các nghiên cứu đã công bố trước đó.

CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP PHÂN TÍCH XỬ LÝ BÀI TOÁN

Tổng quan bài toán xác định mật độ đối tượng

Cuộc cách mạng công nghiệp 4.0 và sự phát triển mạnh mẽ của khoa học công nghệ đã mang lại nhiều ứng dụng hiệu quả trong cuộc sống Trong các lĩnh vực đời sống xã hội, việc tìm kiếm phương pháp quản lý mật độ đối tượng trở nên cần thiết Bài toán này không chỉ lớn và khó khăn mà còn có tính ứng dụng thực tiễn cao, đặc biệt trong nhiều lĩnh vực khác nhau.

An ninh và an toàn luôn là vấn đề quan trọng trong các tòa nhà, khu vực quan trọng và cơ quan, xí nghiệp Để nâng cao hiệu quả giám sát an ninh và giảm thiểu nhân công, việc ứng dụng công nghệ vào quản lý là cần thiết và cần được triển khai sớm.

Trong bối cảnh quản lý nhân sự ngày càng phức tạp, việc chấm công và điểm danh nhân viên cần được cải tiến để nâng cao tốc độ và độ chính xác Việc áp dụng công nghệ trong quy trình này là giải pháp không thể thiếu, giúp giảm thiểu công sức và thời gian so với phương pháp truyền thống Công nghệ không chỉ tối ưu hóa quy trình quản lý mà còn đảm bảo tính chính xác trong việc ghi nhận thời gian làm việc của nhân viên.

- Bài toán quản lý giao thông, đô thị thông minh: Hầu hết với các phương pháp truyền thống để quản lý phương tiện, con người tham gia

Việc xử phạt các vi phạm giao thông thường gặp khó khăn đối với cơ quan chức năng, nhưng với sự áp dụng công nghệ, việc đảm bảo an toàn giao thông trở nên dễ dàng hơn rất nhiều.

Vấn đề an ninh an toàn tại các khu tập thể và tòa nhà doanh nghiệp đã từng là một thách thức lớn trong quản lý, với những khó khăn như kiểm soát ra vào và đội ngũ bảo vệ không đủ Tuy nhiên, trong thời gian gần đây, sự phát triển mạnh mẽ của các hệ thống giám sát an ninh và an toàn đã giúp nâng cao hiệu quả quản lý và bảo vệ cho các tòa nhà và doanh nghiệp.

Một nghiên cứu gần đây của Fahim Faisal Syed và Akhter Hossain từ đại học Daffodil International đã công bố về việc áp dụng trí tuệ nhân tạo để cải thiện chất lượng hệ thống an ninh với tiêu đề “Hệ thống An ninh Thông minh Sử dụng Nhận diện Khuôn mặt trên Raspberry Pi” Nghiên cứu sử dụng phương pháp Viola-Jones để phát hiện khuôn mặt và nhận diện người, kết hợp với bộ kit Raspberry để giảm chi phí và kích thước hệ thống Hệ thống sẽ tự động mở cửa khi nhận lệnh từ bộ xử lý, trong khi các truy cập bất hợp pháp sẽ được ghi lại và tải lên máy chủ web, đồng thời gửi email cho chủ sở hữu kèm theo liên kết đến hình ảnh.

Chủ sở hữu hệ thống có thể quản lý quyền truy cập và kích hoạt báo động từ xa thông qua trang web Tuy nhiên, theo phân tích của Monali Chaudhari, Shanta Sondur và Gauresh Vanjare trong bài báo về phương pháp Viola-Jones, thuật toán xác định khuôn mặt có tốc độ nhanh nhưng độ chính xác phụ thuộc vào ánh sáng và ngưỡng Để cải thiện độ chính xác, nhiều nghiên cứu đã được thực hiện, trong đó có công trình của Arwa M Basbrain về việc nâng cao độ chính xác của thuật toán Viola-Jones cho phát hiện khuôn mặt nhiệt Phương pháp này kết hợp ba tính năng HOG, LBP và Haar, cùng với giai đoạn tiền xử lý để tăng tốc độ phát hiện Kết quả cho thấy việc cải tiến hiệu suất đã nâng cao độ chính xác đáng kể.

19 hiện cao hơn so với phương phápViola-Jones và cũng tăng gấp đôi tốc độ phát hiện

Nghiên cứu của Ratnawati Ibrahim và Zalhan Mohd Zin về "Hệ thống Nhận diện Khuôn mặt Tự động cho Ứng dụng Kiểm soát Truy cập Cửa Văn phòng" tập trung vào an ninh và an toàn trong môi trường văn phòng Nghiên cứu phân tích ảnh hưởng của ba yếu tố chính: chiếu sáng, khoảng cách và định hướng khuôn mặt đến hiệu suất của thuật toán nhận diện khuôn mặt Kết quả cho thấy hệ thống đạt tỷ lệ nhận diện 78% khi khoảng cách giữa camera và đối tượng từ 40 cm đến 60 cm, với góc định hướng của đối tượng nằm trong khoảng -20 đến +20 độ Độ chính xác là yếu tố quan trọng hàng đầu trong hệ thống an ninh, tiếp theo là phương pháp quản lý dữ liệu thu thập và xử lý Các bài báo trước đây cho thấy lĩnh vực an ninh đang nhận được sự quan tâm lớn và độ chính xác đang được cải thiện dần.

Hệ thống chấm công nhân viên và điểm danh học sinh đang được nghiên cứu và cải thiện để quản lý dữ liệu lớn một cách chính xác Phương pháp thủ công như sử dụng thẻ RFID và chấm công vân tay có độ chính xác cao nhưng vẫn tồn tại nhiều hạn chế Gần đây, sự phát triển của công nghệ, đặc biệt là trí tuệ nhân tạo, đã giúp nâng cao độ chính xác trong việc chấm công, với khả năng thay thế hoặc kết hợp các phương pháp truyền thống.

Trên toàn cầu, nhiều nghiên cứu đã được công bố trên các trang thông tin uy tín, trong đó có đề tài “Automated Attendance Marking and Management System by Facial Recognition Using Histogram” của nhóm tác giả Jenif D Souza W S, Jothi S, Chandrasekar A, được đăng tải trên IEEE papers Bài báo này giới thiệu phương pháp điểm danh học sinh thông qua công nghệ nhận diện khuôn mặt, cho phép thực hiện điểm danh hoàn toàn tự động, thay thế cho phương pháp thủ công truyền thống.

Hệ thống điểm danh tự động sử dụng camera cố định trong phòng học để chụp ảnh và thu thập dữ liệu khuôn mặt, sau đó so sánh với cơ sở dữ liệu nhằm xác định sự có mặt của học sinh Nếu học sinh bị đánh dấu là vắng mặt, thông báo sẽ được gửi đến phụ huynh Phương pháp điểm danh này dựa trên thuật toán Histogram Tuy nhiên, nghiên cứu của Priyanka Garg và Trisha Jain trong bài viết “A Comparative Study on Histogram Equalization and Cumulative Histogram Equalization” đã chỉ ra một số nhược điểm của phương pháp histogram.

- Phù hợp hơn với những ứng dụng thực hiện trên phần cứng

- Cần xử lý, hoạt động nhiều hơn vì nó là cần thiết để tạo cơ sở tích lũy dữ liệu

- Tính toán rất chậm, đòi hỏi một số lượng lớn thông số trên mỗi điểm ảnh

Để giải quyết vấn đề quản lý nhân viên hiệu quả, nhóm tác giả Shreyak Sawhney, Karan Kacke và Samyak Jain đã đề xuất hệ thống "Real-Time Smart Attendance System using Face Recognition Techniques" được công bố trên IEEE Hệ thống này sử dụng kỹ thuật nhận dạng khuôn mặt kết hợp với phân tích thành phần nguyên tắc (PCA) và mạng trí tuệ nhân tạo CNN để tự động hóa quản lý nhân viên tại văn phòng Danh tính và ID của khuôn mặt được xác định thông qua việc so sánh với cơ sở dữ liệu khuôn mặt của nhân viên Mặc dù hệ thống đã đạt được thành công trong việc nâng cao độ chính xác nhận dạng nhờ vào mạng nơ-ron, nhưng vẫn tồn tại vấn đề nhận dạng giả mạo khi sử dụng hình ảnh hoặc video của người khác Vấn đề then chốt là tìm ra giải pháp để ngăn chặn hiện tượng giả mạo trong nhận dạng khuôn mặt.

Bài toán đô thị thông minh đang được nhiều quốc gia quan tâm, với mục tiêu triển khai các thành phố thông minh tại những khu vực đô thị lớn Những thành phố này không chỉ thúc đẩy tăng trưởng xã hội mà còn nâng cao phát triển kỹ thuật, kinh tế và chính trị thông qua việc áp dụng các giải pháp công nghệ hiện đại.

Thành phố thông minh sử dụng công nghệ tiên tiến như dữ liệu lớn và trí tuệ nhân tạo để cải thiện các lĩnh vực như sức khỏe, giao thông, năng lượng, giáo dục, dịch vụ nước và quản lý chất thải, từ đó nâng cao chất lượng sống cho công dân Đặc biệt, trong hệ thống giao thông, chính quyền cần giám sát và quản lý lưu lượng truy cập để cải thiện dịch vụ vận chuyển công cộng Việc lắp đặt thiết bị tại các điểm kiểm tra chính và sử dụng camera để thu thập dữ liệu video liên tục giúp tăng cường khả năng quản lý giao thông Tuy nhiên, sự gia tăng dữ liệu giao thông cũng đặt ra thách thức cho thành phố trong việc quản lý hiệu quả Dữ liệu lớn được xem là một giải pháp tiềm năng, với phân tích và sử dụng hiệu quả là yếu tố quan trọng cho thành công trong nhiều lĩnh vực Nghiên cứu như “Study and Analysis of Smart Applications in Smart City Context” của Jally Sahoo và Mamata Rath đã chỉ ra rằng việc áp dụng thuật toán học sâu và dữ liệu lớn có thể nâng cao hiệu suất quản lý, đồng thời kết nối các công nghệ như điện toán đám mây và hệ thống wi-fi tạo ra mạng lưới ứng dụng hiệu quả.

Mô hình dựa trên xác suất cho bảo mật dữ liệu lớn trong thành phố thông minh đã được công bố, cung cấp một phương pháp quản lý hiệu quả Bài báo giới thiệu cách tiếp cận phát hiện rò rỉ dữ liệu do cố ý hoặc vô ý, sử dụng thuật toán Bigraph nhằm bảo vệ an toàn cho dữ liệu quan trọng bằng cách xác định các tác nhân có khả năng gây ra rò rỉ.

Hình 2.1: Kiến trúc quản lý đô thị công bố bởi [18]

Tổng quan hệ thống điểm danh sinh viên

Hệ thống điểm danh và quản lý học sinh sinh viên đã được cải tiến bằng cách áp dụng công nghệ hiện đại nhằm giảm tải công việc cho giảng viên Một trong những nghiên cứu tiêu biểu là “Fingerprint-Based Attendance Management System” của nhóm tác giả Akinduyite C.O, Adetunmbi A.O, Olabode O.O, Ibidunmoye E.O, trong đó ứng dụng công nghệ vân tay để quản lý điểm danh Bài viết trình bày quy trình quản lý sử dụng vân tay trong môi trường đại học, bao gồm hai bước chính: lấy vân tay và xác thực Trong quá trình đăng ký, dấu vân tay của người dùng được ghi lại và lưu trữ cùng với danh tính trong cơ sở dữ liệu Tuy nhiên, tác giả cũng chỉ ra rằng việc không truy xuất được vân tay do xước hay môi trường ẩm ướt là một thách thức Để xử lý hiệu quả lượng dữ liệu lớn, tác giả đã kết hợp công nghệ điểm danh vân tay với xử lý hình ảnh và nhận diện khuôn mặt, nhằm giảm khối lượng công việc và nâng cao độ chính xác cho hệ thống.

Hệ thống điểm danh tự động được thiết kế đồng bộ với khả năng thu thập, so sánh và đánh giá kết quả chuyên cần một cách hoàn toàn tự động Để đáp ứng đa dạng nhu cầu sử dụng và kinh phí, hệ thống cung cấp nhiều phương thức điểm danh, bao gồm nhận diện khuôn mặt, điểm danh vân tay, hoặc kết hợp cả hai phương pháp nhằm nâng cao độ chính xác.

Phương pháp nhận diện khuôn mặt đang ngày càng được ưa chuộng, đặc biệt là qua việc sử dụng camera gắn trước cửa để phát hiện và trích xuất danh tính Ưu điểm nổi bật của công nghệ này là độ chính xác cao, thời gian lấy mẫu nhanh chóng và khả năng phát hiện mà không cần tiếp xúc, khác biệt hoàn toàn so với phương pháp nhận diện bằng vân tay.

Phương pháp chấm vân tay đang ngày càng phổ biến trong việc điểm danh sinh viên Hệ thống sẽ so sánh vân tay hiện tại với dữ liệu đã được lưu trữ trước đó, mang lại sự nhanh chóng và độ chính xác cao Tuy nhiên, việc lấy vân tay có thể gặp khó khăn nếu vân tay bị biến dạng do nước hoặc trầy xước.

Hình 2.2: Tổng quan hệ thống điểm danh

Tùy vào mục đích sử dụng, có thể áp dụng riêng rẽ hoặc kết hợp hai phương pháp điểm danh, với điểm nổi bật là khả năng kết nối và truyền nhận dữ liệu lớn Cụ thể, dữ liệu từ lớp A được thu thập qua vân tay và lớp B qua nhận diện khuôn mặt sẽ được hệ thống tập hợp vào cơ sở dữ liệu chung để xử lý Nhờ đó, việc sử dụng linh hoạt các phương pháp và thiết bị vẫn đảm bảo dữ liệu được quản lý và điều hành một cách dễ dàng.

Phân tích, cải tiến bài toán xác định mật độ đối tượng

Dựa trên phân tích các bài báo đã công bố, việc triển khai một hệ thống an ninh an toàn hoặc quản lý nhân sự sử dụng công nghệ nhận diện khuôn mặt và thuật toán nhận diện khuôn mặt là rất cần thiết để đảm bảo độ chính xác yêu cầu Mục tiêu là lựa chọn phương pháp phù hợp cho ứng dụng này.

Trong bài viết này, tác giả sẽ phân tích các phương pháp phổ biến hiện nay trong hệ thống quản lý mật độ đối tượng, đặc biệt là trên hệ thống điểm danh sinh viên.

Nghiên cứu về phương pháp xác định khuôn mặt người đã tiến triển từ ảnh xám đến ảnh màu Bài viết này tổng hợp các hướng giải quyết chính cho bài toán nhận diện khuôn mặt, từ đó nhiều tác giả đã điều chỉnh và phát triển những ý tưởng nhỏ để đạt được kết quả mới Theo các nghiên cứu gần đây, có nhiều phương pháp hiệu quả trong việc nhận diện khuôn mặt và danh tính người được đề cập.

Thuật toán nhận diện khuôn mặt truyền thống được chia thành hai loại: phương pháp tuyến tính và phi tuyến Các phương pháp tuyến tính như phân tích thành phần chính (PCA), phân tích thành phần độc lập (ICA) và phân tích phân biệt tuyến tính (LDA) đã cho thấy hiệu quả tốt trong xử lý Tuy nhiên, do sự biến đổi lớn trong điều kiện ánh sáng và biểu cảm khuôn mặt, các phương pháp này có thể không đủ khả năng để nắm bắt đầy đủ đặc trưng khuôn mặt Để khắc phục vấn đề này, các phương pháp phi tuyến như kernel LDA (KLDA) và nhúng tuyến tính cục bộ (LLE) đã được đề xuất, sử dụng kỹ thuật kernel để ánh xạ hình ảnh khuôn mặt vào không gian có chiều cao hơn, từ đó cho phép áp dụng các phương pháp tuyến tính truyền thống.

Mạng Nơ-ron Nhân Tạo (Artificial Neural Networks) được sử dụng để nhận diện khuôn mặt bằng cách tích hợp với hệ số ma trận Tác giả áp dụng mạng nơ-ron phản hồi để học các đặc điểm khuôn mặt thông qua các số liệu khoảng cách và tương quan chuẩn hóa Một phương pháp tiếp cận mới dựa trên cây quyết định cũng được đề xuất nhằm cải thiện khả năng nhận dạng khuôn mặt.

Nó kết hợp các yếu tố từ mạng nơ-ron và phương pháp thống kê, đồng thời bổ sung các kỹ thuật nhận dạng hình ảnh khuôn mặt không trực diện.

- Phương pháp Gabor wavelet‐ based: Phương pháp Gabor được áp dụng tại các vị trí cố định, tương ứng với các nút của lưới ô vuông

Bài viết trình bày về việc sử dụng 25 mô hình con để phân tích hình ảnh khuôn mặt thông qua các đặc điểm Gabor, được xác định và trích xuất từ cùng một hàng trong lưới ô vuông Những đặc điểm này sau đó được chiếu vào không gian kích thước thấp hơn bằng phép biến đổi Karhunen-Loeve Để huấn luyện Parzen Cửa sổ Classifier, các tính năng thu được sử dụng thuật toán di truyền (GA) Quá trình khớp diễn ra thông qua việc tổng hợp các phân loại, với biểu đồ Histogram được đề xuất để tổng hợp các mẫu cục bộ Cuối cùng, phương pháp học được áp dụng để tạo ra biểu diễn của hình ảnh khuôn mặt thông qua các mẫu Gabor cục bộ đã học, thay vì chỉ sử dụng tính năng ghép biểu đồ đơn giản.

Phương pháp nhận diện khuôn mặt dựa trên mô tả sử dụng các mẫu ảnh để học và áp dụng kỹ thuật xác suất thống kê cùng máy học nhằm tìm ra các đặc tính liên quan đến khuôn mặt Các đặc tính này được biểu diễn qua các mô hình phân bố và hàm biệt số, giúp xác định khuôn mặt một cách hiệu quả Để tối ưu hóa quá trình tính toán và nâng cao độ chính xác, bài toán giảm số chiều thường được thực hiện Các phương pháp khác trong nhận diện khuôn mặt bao gồm việc tìm hàm biệt số để phân loại dữ liệu thành hai lớp: khuôn mặt và không phải khuôn mặt Thông thường, các mẫu ảnh được chiếu vào không gian có số chiều thấp hơn, sau đó sử dụng hàm biệt số hoặc mạng nơ-ron đa tầng để phân loại Ngoài ra, SVM (Support Vector Machine) và các phương thức kernel cũng được áp dụng để chiếu mẫu vào không gian có số chiều cao hơn, giúp phân loại dữ liệu một cách rõ ràng.

Bảng 2.1: So sánh các phương pháp nhận diện khuôn mặt

STT Phương pháp Ưu điểm Nhược điểm

Nhận diện khuôn mặt truyền thống

Tập trung vào sự đa dạng các cấu trúc cục bộ

Khoảng cách từ không gian mặt là trực giao với mặt phẳng của hình ảnh, do đó việc chuyển đổi sang khoảng cách Mahalanobis với giải thích xác suất trở nên dễ dàng hơn.

Phương pháp này có thể không nhận diện được khuôn mặt khi sự thay đổi lớn trong chiếu sáng

Tích hợp hệ số mạng nơ-ron, có thể cập nhật để đạt độ chính xác cao

Phương pháp tiếp cận đơn giản hóa, tốc độ tính toán nhanh và đặc biệt có hiệu quả khi nhận diện một phần hoặc toàn bộ khuôn mặt

Nhược điểm chính của phương pháp này là yêu cầu số lượng lớn của mẫu huấn luyện

Thể hiện được các đặc trưng mong muốn của các thuộc tính trực

Cách tiếp cận là tính toán chuyên sâu, không thực tế cho các ứng dụng thời gian thực Ngoài ra, tính

27 quan như định hướng không gian vị trí, tính chọn lọc,… năng Gabor rất nhạy cảm biến sáng

Nhận diện khuôn mặt dựa trên mô tả mang lại lợi ích lớn trong việc phân biệt danh tính của từng cá nhân Phương pháp này cho phép dễ dàng trích xuất thông tin và đạt được độ chính xác cao trong phân loại.

Cách tiếp cận tính toán chuyên sâu trong giai đoạn trích xuất mô tả cần được cân nhắc kỹ lưỡng, tuy nhiên, nên ưu tiên các phương pháp đơn giản và hiệu quả cho các ứng dụng thời gian thực có yêu cầu không quá cao.

Yêu cầu bài toán áp dụng vào hệ thống:

- Xử lý trực tuyến với tốc độ tương đối ổn định

- Nhận diện không chỉ hướng trực diện

- Độ chính xác tương đối cao

- Ánh sáng ảnh hưởng không nhiều

→ Chọn phương pháp nhận dạng sử dụng mạng nơ-ron

2.3.1 Thuật toán nhận dạng khuôn mặt sử dụng mạng nơ-ron Để giải quyết bài toán liên quan học sâu nói chung và nhận diện khuôn mặt sử dụng mạng nơ-ron nói riêng, khâu chuẩn bị dữ liệu huấn luyện là hết sức quan trọng Như đã phân tích ở trên, phương pháp này cần một lượng dữ liệu khá lớn để hệ thống có thể học được Sau khi đã học xong, quá trình nhận diện sẽ có thể tiến hành, độ chính xác của hệ thống càng cao khi lượng dữ liệu huấn luyện càng lớn tuy nhiên thời gian huấn luyện cũng lâu hơn Quá trình huấn luyện dữ liệu, nhận diện được tóm tắt ngắn gọn như dưới đây:

Hình 2.3: Lưu đồ quá trình nhận diện khuôn mặt

2.3.2 Cách thức tổ chức và xử lý dữ liệu huấn luyện

2.3.2.1 Gán nhãn, phát hiện biên và đặc trưng khuôn mặt

Bước 1: Tách biên vùng chứa khuôn mặt

Bước đầu tiên trong việc giảm biến đổi ảnh khuôn mặt là tách biên các khuôn mặt với nhau, giúp giảm thiểu biến đổi về vị trí, hướng và tỷ lệ Quá trình tách biên được thực hiện trực tiếp từ các bức ảnh, tạo ra không gian ảnh khuôn mặt tối thiểu Tuy nhiên, cường độ ánh sáng có thể thay đổi, khiến việc tách biên trở nên khó khăn Để khắc phục điều này, chúng ta thực hiện gán nhãn thủ công cho các mẫu khuôn mặt, cụ thể là đánh dấu vị trí của hai mắt, đỉnh mũi, hai góc và trung tâm miệng.

Bước 2: Tách biên giữa các khuôn mặt

Sau bước đầu tiên, dữ liệu sẽ được sử dụng để tách biệt các khuôn mặt với nhau Quá trình này bắt đầu bằng việc định nghĩa tách biên giữa hai tập hợp điểm đặc trưng, thông qua các phép biến đổi như quay, thay đổi tỷ lệ và dịch chuyển, nhằm tối thiểu hóa tổng bình phương.

29 khoảng cách giữa từng cặp đặc trưng tương ứng Trong không gian hai chiều, một phép biến đổi toạ độ như vậy có thể được viết dưới dạng sau:

- x, y là tọa độ điểm đặc trưng ban đầu

- x’, y’ là tọa độ điểm đặc trưng sau phép biến đổi

- tx, ty là khoảng cách trong phép dịch chuyển

Khi có hai hoặc nhiều cặp điểm đặc trưng phân biệt, hệ phương trình tuyến tính có thể được giải bằng phương pháp đảo ngược giả Đặt ma trận bên trái là A, vec-tơ (a, b, t, t, x, y) là T, và ma trận bên phải là B, từ đó có thể tìm ra lời giải cho hệ phương trình.

Lời giải đảo ngược giả đưa ra phép biến đổi T làm cực tiểu tổng bình phương khác biệt giữa tập toạ độ x’ i , y’ i và phiên bản đã biến đổi của x i , y i

Bước 3: Tách biên tập các điểm đặc trưng

Kết luận

Qua những phân tích, thử nghiệm và đánh giá trong chương hai, tác giả đã đi sâu nêu rõ những nội dung sau:

Bài viết trình bày vấn đề nhận dạng và quản lý mật độ đối tượng, từ đó chọn một bài toán cụ thể để đánh giá Tiếp theo, tác giả đưa ra phương pháp phân tích và cơ sở lựa chọn phương pháp nhận diện khuôn mặt, nêu rõ ưu nhược điểm của các thuật toán hiện có.

Bài viết này trình bày cơ sở lý thuyết về các thuật toán được sử dụng trong việc huấn luyện mô hình cho bài toán nhận dạng khuôn mặt Chúng tôi phân tích ưu, nhược điểm của các công trình đã công bố và từ đó đề xuất phương pháp cải tiến nhằm tăng độ chính xác nhận dạng Hai cải tiến chính bao gồm việc huấn luyện bổ sung dữ liệu và áp dụng các kỹ thuật chống giả mạo khuôn mặt bằng cách sử dụng ảnh và video giả.

Nội dung phần tiếp theo tập trung vào việc thiết kế hệ thống điểm danh cùng với thử nghiệm kết quả đưa ra đánh giá cho bài toán

THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN

Ngày đăng: 08/12/2021, 23:50

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Cheng-Hsiung Hsieh ; Dung-Ching Lin ; Cheng-Jia Wang ; Zong-Ting Chen ; Jiun-Jian Liaw, "Real-Time Car Detection and Driving Safety Alarm System With Google Tensorflow Object Detection API", 2019 International Conference on Machine Learning and Cybernetics (ICMLC) Sách, tạp chí
Tiêu đề: Real-Time Car Detection and Driving Safety Alarm System With Google Tensorflow Object Detection API
[2] P. Choorat, C. Sirikornkarn, T. Pramoun, "License Plate Detection and Integral Intensity Projection for Automatic Finding the Vacant of Car Parking Space", 2019 34th International Technical Conference on Circuits/Systems, Computers and Communications (ITC-CSCC) Sách, tạp chí
Tiêu đề: License Plate Detection and Integral Intensity Projection for Automatic Finding the Vacant of Car Parking Space
[3] Sadhna Sharma, "Template Matching Approach for Face Recognition System", International Journal of Signal Processing Systems Vol. 1, No. 2 December 2013 Sách, tạp chí
Tiêu đề: Template Matching Approach for Face Recognition System
[4] S. R. K, T. C. Sarma, and K. S. Prasad, "Face Recognition Office Security System Using LabVIEW 8.6", Int. J. Electron. Commun.Instrum. Eng. Res. Dev., vol. 3, no. 2, p. 8, 2013 Sách, tạp chí
Tiêu đề: Face Recognition Office Security System Using LabVIEW 8.6
[5] N. Dileep kumar, S. Shanthi, “Automatic Gate using Face Recognition Technique using HAAR Cascade Algorithm", International Journal of Engineering and Advanced Technology (IJEAT) ISSN: 2249 – 8958, Volume-9 Issue-3, February, 2020 Sách, tạp chí
Tiêu đề: Automatic Gate using Face Recognition Technique using HAAR Cascade Algorithm
[6] P. Rajiv, R. Raj, and M. Chandra, "Email based remote access and surveillance system for smart home infrastructure" , Perspect. Sci., pp.3–5, 2016 Sách, tạp chí
Tiêu đề: Email based remote access and surveillance system for smart home infrastructure
[7] Nisha Srinivas, Karl Ricanek, Dana Michalski, "Face Recognition Algorithm Bias: Performance Differences on Images of Children and Adults", 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW) Sách, tạp chí
Tiêu đề: Face Recognition Algorithm Bias: Performance Differences on Images of Children and Adults
[8] Ivan William, De Rosal Ignatius Moses Setiadi , Eko Hari Rachmawanto, "Face Recognition using FaceNet (Survey,Performance Test, and Comparison)", 2019 Fourth International Conference on Informatics and Computing (ICIC) Sách, tạp chí
Tiêu đề: Face Recognition using FaceNet (Survey,Performance Test, and Comparison)
[9] Rong Xie, Qingyu Zhang, “A Method of Small Face Detection Based on CNN”, 2019 4th International Conference on Computational Intelligence and Applications (ICCIA) Sách, tạp chí
Tiêu đề: A Method of Small Face Detection Based on CNN”, "2019 4th
[10] Fahim Faisal Syed và Akhter Hossain, “Smart Security System Using Face Recognition on Raspberry Pi”, 2019 13th International Conference on Software, Knowledge, Information Management and Applications (SKIMA) Sách, tạp chí
Tiêu đề: Smart Security System Using Face Recognition on Raspberry Pi”, "2019 13th International Conference on Software, Knowledge, Information
[12] Arwa M. Basbrain, “Accuracy Enhancement of the Viola-JonesAlgorithm for Thermal Face Detection”, International Journal of New Technology and Research (IJNTR) ISSN:2454- 4116, Volume-3, Issue-9, September 2017 Pages 41-43 Sách, tạp chí
Tiêu đề: Accuracy Enhancement of the Viola-JonesAlgorithm for Thermal Face Detection”, "International Journal of New Technology and Research (IJNTR)
[13] Ratnawati Ibrahim, Zalhan Mohd Zin, “Study of Automated Face Recognition System for Office Door Access Control Application”, 2011 IEEE 3rd International Conference on Communication Software and Networks Sách, tạp chí
Tiêu đề: Study of Automated Face Recognition System for Office Door Access Control Application”, "2011 IEEE 3rd International Conference on
[14] Ratnawati Ibrahim ; Zalhan Mohd Z, “Automated Attendance Marking and Management System by Facial Recognition Using Histogram”, in 2019, 5th International Conference on Advanced Computing & Communication Systems (ICACCS) Sách, tạp chí
Tiêu đề: Automated Attendance Marking and Management System by Facial Recognition Using Histogram”, in 2019, 5th
[15] Priyanka Garg , Trisha Jain, “A Comparative Study on Histogram Equalization and Cumulative Histogram Equalization” Sách, tạp chí
Tiêu đề: A Comparative Study on Histogram Equalization and Cumulative Histogram Equalization
[16] Shreyak Sawhney, Karan Kacke, Samyak Jain, “Real-Time Smart Attendance System using Face Recognition Techniques”, 2019 9th International Conference on Cloud Computing, Dữ liệu Science & Engineering (Confluence) Sách, tạp chí
Tiêu đề: Real-Time Smart Attendance System using Face Recognition Techniques”, 2019 9th
[17] Jally Sahoo, Mamata Rath, “Study and Analysis of Smart Applications in Smart City Context”, 2017 International Conference on Information Technology (ICIT) Sách, tạp chí
Tiêu đề: Study and Analysis of Smart Applications in Smart City Context”
[18] Vishal Dattana, Kishu Gupta, "A Probability based Model for Dữ liệu lớn Security in Smart City", 2019 4th MEC International Conference on Dữ liệu lớn and Smart City (ICBDSC) Sách, tạp chí
Tiêu đề: A Probability based Model for Dữ liệu lớn Security in Smart City
[19] Akinduyite C.O, “Fingerprint-Based Attendance Management System” , 2015 IEEE International Conference on Electrical, Computer and Communication Technologies (ICECCT) Sách, tạp chí
Tiêu đề: Fingerprint-Based Attendance Management System” , 2015 IEEE "International Conference on Electrical, Computer and Communication Technologies
[20] Hong Duan, Ruohe Yan, Kunhui Lin, "Research on Face Recognition Based on PCA", 2012 Symposium on Photonics and Optoelectronics, IEEE, 2012 Sách, tạp chí
Tiêu đề: Research on Face Recognition Based on PCA
[23] Fangfang Lu, Hongdong Li, "KLDA - An Iterative approach to fisher discriminal analysis", 2007 IEEE International Conference on Image Processing, IEEE, 2007, Dec Sách, tạp chí
Tiêu đề: KLDA - An Iterative approach to fisher discriminal analysis

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Cấu trúc mạng Nơ-ron - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 1.1 Cấu trúc mạng Nơ-ron (Trang 14)
Hình 1.3: Nguyên lý bộ lọc tích chập - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 1.3 Nguyên lý bộ lọc tích chập (Trang 16)
Hình 1.7: FaceNet process - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 1.7 FaceNet process (Trang 19)
Hình 1.8: Triplet Loss - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 1.8 Triplet Loss (Trang 20)
Hình 1.9: Dữ liệu LWF - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 1.9 Dữ liệu LWF (Trang 21)
Hình 1.10: So sánh phương pháp MTCNN - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 1.10 So sánh phương pháp MTCNN (Trang 23)
Hình 1.16: Quá trình xử lý O-Net - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 1.16 Quá trình xử lý O-Net (Trang 25)
Hình 2.1: Kiến trúc quản lý đô thị công bố bởi [18] - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 2.1 Kiến trúc quản lý đô thị công bố bởi [18] (Trang 31)
Hình 2.2: Tổng quan hệ thống điểm danh - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 2.2 Tổng quan hệ thống điểm danh (Trang 33)
Hình 2.3: Lưu đồ quá trình nhận diện khuôn mặt - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 2.3 Lưu đồ quá trình nhận diện khuôn mặt (Trang 38)
Hình 2.6: Thuật toán dò tìm khuôn mặt - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 2.6 Thuật toán dò tìm khuôn mặt (Trang 42)
Hình 2.8: Độ chính xác công bố của Vishal Agarwal - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 2.8 Độ chính xác công bố của Vishal Agarwal (Trang 44)
Hình 2.7: Kết quả độ chính xác của nhóm tác giả [27] - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 2.7 Kết quả độ chính xác của nhóm tác giả [27] (Trang 44)
Hình 2.10: Dữ liệu  AFAD - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 2.10 Dữ liệu AFAD (Trang 45)
Hình 2.11: Dữ liệu trước khi huấn luyện - Nghiên cứu, thiết kế hệ thống cơ điện tử thông minh ứng dụng công nghệ nhận dạng khuôn mặt và thuật toán học sâu trong việc điểm danh và đánh giá độ chuyên cần của sinh viên
Hình 2.11 Dữ liệu trước khi huấn luyện (Trang 47)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w