Tập dữ liệu chống tấn công giả mạo(Dataset)

Một phần của tài liệu Nghiên cứu giải pháp chống tấn công giả mạo khuôn mặt (Trang 32 - 35)

Chương 2. Tổng quan về bài toán chống tấn công giả mạo khuôn mặt (face anti-spoofing)

2.2. Học sâu trong bài toán chống tấn công giả mạo khuôn mặt

2.2.3. Tập dữ liệu chống tấn công giả mạo(Dataset)

Các tập dữ liệu chống giả mạo khuôn mặt rất quan trọng để huấn luyện và đánh giá các hệ thống phân biệt giữa khuôn mặt thật và giả, một phần không thể thiếu trong các hệ thống nhận diện khuôn mặt nhằm ngăn chặn truy cập trái phép qua ảnh, video, hoặc mặt nạ. Dưới đây là một số tập dữ liệu chống giả mạo khuôn mặt được sử dụng rộng rãi:

a) NUAA

 Mô tả: Bộ dữ liệu NUAA đề cập đến NUAA Photograph Imposter Dataset, một tập dữ liệu được sử dụng rộng rãi trong nghiên cứu về phát hiện giả mạo khuôn mặt. Tập dữ liệu này được tạo ra bởi Đại học Hàng không và Vũ trụ Nam Kinh (NUAA) và được thiết kế để đánh giá và phát triển các phương pháp phân biệt giữa khuôn mặt người thật và các nỗ lực giả mạo, chẳng hạn như ảnh chụp khuôn mặt.

 Đặc điểm: Chủ yếu được sử dụng để phát hiện giả mạo khuôn mặt, tập trung vào các cuộc tấn công bằng ảnh chụp. Hình ảnh khuôn mặt thật được chụp từ các đối tượng sống. Hình ảnh giả mạo được tạo bằng cách sử dụng các bức ảnh in của những đối tượng đó.

 Ứng dụng: Huấn luyện và kiểm tra các thuật toán chống giả mạo khuôn mặt.

Tăng cường hệ thống bảo mật sinh trắc học. Xác thực các mô hình trong môi trường dễ bị tấn công bằng ảnh chụp.

Hình 2. 13 Dữ liệu cơ bản của bộ dataset NUAA

b) CelebA Spoof

 Mô tả: Bộ dữ liệu CelebA-Spoof là một tập dữ liệu quy mô lớn được thiết kế đặc biệt cho nghiên cứu phát hiện giả mạo khuôn mặt. Nó mở rộng từ bộ dữ liệu nổi tiếng CelebA bằng cách bổ sung dữ liệu giả mạo, trở thành một tài nguyên quý giá cho các nhà nghiên cứu phát triển và đánh giá các hệ thống xác thực khuôn mặt.

 Đặc điểm: Nhằm giải quyết thách thức trong việc phát hiện giả mạo khuôn mặt bằng cách cung cấp một tập dữ liệu toàn diện với nhiều kịch bản giả mạo. Bao

gồm 625.537 hình ảnh từ 10.177 đối tượng tổng cộng hơn 70GB dữ liệu. Ảnh thật được lấy từ bộ dữ liệu CelebA gốc.

 Ứng dụng: Huấn luyện và kiểm tra các mô hình phát hiện giả mạo khuôn mặt.

Phát triển các hệ thống xác thực sinh trắc học chống lại tấn công giả mạo.

Nghiên cứu khả năng tổng quát hóa và độ bền vững của các hệ thống phát hiện khuôn mặt.

Hình 2. 14 Dữ liệu cơ bản cuả bộ dataset CelebA Spoof

c) CASIA-FASD

 Mô tả: Bộ dữ liệu CASIA-FASD (CASIA Face Anti-Spoofing Dataset) là một trong những tập dữ liệu nổi tiếng được sử dụng rộng rãi trong nghiên cứu phát hiện giả mạo khuôn mặt. Tập dữ liệu này được tạo ra bởi Viện Hàn lâm Khoa học Trung Quốc (CASIA) và được thiết kế để phát triển và đánh giá các hệ thống có khả năng phân biệt giữa khuôn mặt thật và các nỗ lực giả mạo.

 Đặc điểm: Hỗ trợ nghiên cứu phát hiện các hình thức tấn công giả mạo khuôn mặt khác nhau, bao gồm tấn công bằng video và ảnh chụp. Bộ dữ liệu bao gồm video của các đối tượng được ghi lại trong ba kịch bản giả mạo khác nhau như tấn công bằng ảnh, tấn công bằng video, tấn công bằng ảnh cắt

 Ứng dụng: Phát triển và đánh giá các kỹ thuật chống giả mạo khuôn mặt. Tăng cường bảo mật cho các hệ thống xác thực sinh trắc học. Kiểm nghiệm các mô hình trong môi trường có cả đầu vào độ phân giải thấp và cao.

Hình 2. 15 Cấu trúc cơ bản của bộ CASIA-FASD

d) Tấn công lặp lại(Replay-Attack)

 Mô tả: Bộ dữ liệu Replay-Attack Dataset là một tập dữ liệu nổi tiếng trong lĩnh vực phát hiện giả mạo khuôn mặt, đặc biệt được sử dụng để đánh giá các hệ thống chống lại các cuộc tấn công bằng phát lại. Tập dữ liệu này được tạo bởi Viện Nghiên cứu Idiap và đã được sử dụng rộng rãi trong nghiên cứu học thuật để kiểm tra tính mạnh mẽ của các hệ thống sinh trắc học.

 Đặc điểm: Được thiết kế để nghiên cứu và cải thiện khả năng phát hiện các cuộc tấn công phát lại trong các hệ thống nhận diện khuôn mặt. Video khuôn mặt của các cá nhân được ghi lại trong các điều kiện khác nhau. Các bản ghi thật của các cá nhân để so sánh với các nỗ lực giả mạo.

 Ứng dụng: Phát triển và đánh giá các thuật toán phát hiện tấn công phát lại.

Tăng cường tính mạnh mẽ của các hệ thống xác thực khuôn mặt chống lại giả mạo. Huấn luyện các mô hình học máy để phân loại nhị phân giữa dữ liệu thật và giả.

Mỗi tập dữ liệu có những đặc điểm và điểm mạnh riêng, vì vậy các nhà nghiên cứu có thể lựa chọn hoặc kết hợp các tập dữ liệu dựa trên yêu cầu cụ thể của mô hình chống giả mạo. Hãy cho tôi biết nếu bạn cần thêm chi tiết hoặc hỗ trợ truy cập các tập dữ liệu này nhé!

Một phần của tài liệu Nghiên cứu giải pháp chống tấn công giả mạo khuôn mặt (Trang 32 - 35)

Tải bản đầy đủ (DOCX)

(59 trang)
w