1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận án tiến sĩ Quản lý hệ thống thông tin: Nghiên cứu phát triển một số kỹ thuật trích rút đặc trưng và tối ưu mô hình Random Forest trong phát hiện sự kiện ngã của con người bằng điện thoại thông minh

160 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Phát Triển Một Số Kỹ Thuật Trích Rút Đặc Trưng Và Tối Ưu Mô Hình Random Forest Trong Phát Hiện Sự Kiện Ngã Của Con Người Bằng Điện Thoại Thông Minh
Tác giả Lê Hồng Lam
Người hướng dẫn PGS. TS. Nguyễn Hà Nam
Trường học Đại học Quốc gia Hà Nội
Chuyên ngành Quản lý hệ thống thông tin
Thể loại luận án tiến sĩ
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 160
Dung lượng 64,72 MB

Nội dung

LỜI CAM ĐOANTôi xin cam đoan Luận án Tiến sĩ, với tiêu đề “Wghiên cứu phát triển một số kỹ thuậttrích rút đặc trưng và toi wu mô hình Random Forest trong phát hiện sự kiện ngã của con ng

Trang 1

LE HONG LAM

NGHIEN CUU PHAT TRIEN MOT SO KY THUAT

TRÍCH RUT DAC TRƯNG VA TOI UU MÔ HÌNH

RANDOM FOREST TRONG PHAT HIEN SU KIEN NGA

CUA CON NGUOI BANG DIEN THOAI THONG MINH

LUẬN AN TIEN SĨ CHUYEN NGANH QUAN LY HE THONG THONG TIN

Hà Nội - 2024

Trang 2

LÊ HÒNG LAM

NGHIÊN CỨU PHÁT TRIEN MOT SO KỸ THUẬT

TRÍCH RÚT ĐẶC TRƯNG VÀ TÓI ƯU MÔ HÌNH RANDOM FOREST TRONG PHÁT HIỆN SỰ KIỆN NGÃ

CUA CON NGƯỜI BẰNG ĐIỆN THOẠI THONG MINH

Chuyên ngành: Quản lý hệ thống thông tin

Mã số: 9480205.01QTD

LUẬN ÁN TIỀN SĨ CHUYEN NGÀNH QUAN LÝ HE THONG THONG TIN

NGUOI HUONG DAN KHOA HOC:

PGS TS NGUYEN HA NAM

Hà Nội - 2024

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan Luận án Tiến sĩ, với tiêu đề “Wghiên cứu phát triển một số kỹ thuậttrích rút đặc trưng và toi wu mô hình Random Forest trong phát hiện sự kiện ngã của

con người bằng điện thoại thông minh” là công trình nghiên cứu khoa học của tôi,

được thực hiện dưới sự hướng dẫn của PGS.TS Nguyễn Hà Nam Nội dung của luận

án không có sự sao chép và không được sử dụng để bảo vệ cho bất kỳ học vị nàokhác Tất cả các số liệu, kết quả và tài liệu tham khảo trong luận án đều có nguồn gốc

rõ ràng và đã được trích dẫn đầy đủ theo quy định

Các kêt quả nghiên cứu của tôi việt chung với các tác gia khác đã được sự nhat trí của đông tác giả trước khi đưa vào luận án Tôi chịu trách nhiệm hoàn toàn về sự trung thực và tính chính xác của những nội dung được trình bày trong luận án.

Luận án này được hoàn thành trong thời gian tôi làm Nghiên cứu sinh tại Viện Công

nghệ thông tin, Đại học Quốc gia Hà Nội

NGƯỜI CAM ĐOAN

Nghiên cứu sinh

Lê Hồng Lam

Trang 4

LOI CAM ON

Trong hành trình hoc tập va nghiên cứu tai Viện công nghệ thông tin, Dai hoc Quốc

gia Hà Nội, tôi đã có nhiều trải nghiệm quý báu và đối mặt với không ít thách thức.

Có được thành quả hôm nay là nhờ sự giúp đỡ, động viên của nhiều tập thể và cá

nhân mà tôi vô cùng trân trọng.

Trước hết, tôi xin gửi lời biết ơn sâu sắc đến thầy giáo - PGS TS Nguyễn Hà Nam,người đã tận tâm hướng dẫn, tận tình chỉ bảo và định hướng cho tôi trong suốt quátrình nghiên cứu Thầy đã truyền cho tôi niềm đam mê, sự nghiêm túc, chính xác vàsáng tạo trong khoa học Sự khuyến khích và hỗ trợ cả về vật chất lẫn tinh thần từthầy đã giúp tôi vượt qua khó khăn trong những ngày đầu của hành trình nghiên cứu

Tôi cũng xin gửi lời cảm ơn chân thành đến thầy giáo - TS Nguyễn Đức Nhân cùngcác thầy cô, anh chị em tiến sĩ, nghiên cứu sinh và học viên cao học trong nhómnghiên cứu của thầy Nguyễn Hà Nam Sự chia sẻ nhiệt tình về kiến thức và kinhnghiệm từ mọi người đã giúp tôi hoàn thiện bản thân và tiến bộ không ngừng

Không thể không nhắc đến sự tận tâm của các thầy cô và cán bộ của Viện Công nghệthông tin Tôi xin bày tỏ lòng biết ơn đến các thầy cô đã giảng dạy và hướng dẫntrong chương trình tiến sĩ, giúp tôi có nền tảng kiến thức vững chắc Đồng thời, lờicảm ơn chân thành xin được gửi đến Ban lãnh đạo Viện, Phòng Khoa học Công nghệ

và Đào tạo; Lab AI 4.0 của thầy giáo - PGS.TS Lê Hoàng Sơn và các phòng banchức năng của Viện Sự hỗ trợ và tạo điều kiện thuận lợi từ quý thầy cô đã giúp tôitập trung học tập và hoan thành luận án.

Tôi cũng không thé quên gửi lời cảm ơn chân thành đến thay cô trong hội đồng đánhgiá luận án các cấp và các thầy cô tham gia phản biện độc lập Những nhận xét và

góp ý quý báu từ quý thầy cô đã giúp tôi nâng cao chất lượng nghiên cứu và hoàn

thiện công trình của mình.

ii

Trang 5

Sự hỗ trợ từ các cơ quan, tô chức và cá nhân đã cung cấp dữ liệu, thông tin và thiết

bị cần thiết cho nghiên cứu cũng là một phần không thể thiếu trong thành công của

luận án này Sự giúp đỡ từ các nhà khoa học và tác giả của những công trình mà tôi

tham khảo đã có nhiều đóng góp vào quá trình nghiên cứu

Tôi sẽ không thê hoàn thành luận án này nếu không nhận được sự giúp đỡ của cơ

quan chủ quản Xin gửi lời cảm ơn chân thành đến tập thé lãnh đạo Trường Dai học

Sư phạm Kỹ thuật Vinh, lãnh đạo và đồng nghiệp tại Khoa Điện - Điện tử đã tạo điều

kiện thuận lợi dé tôi yên tâm học tập và nghiên cứu

Với tình cảm sâu nặng, tôi xin dành những lời cảm ơn thiêng liêng nhất đến gia đình

thân yêu - cha mẹ đẻ, mẹ vợ, hai con nhỏ và đặc biệt người vợ yêu quý Nguyễn Thị

Anh Quỳnh — người đã luôn bên cạnh, chia sẻ và hy sinh vì tôi Tình yêu thương và

sự giúp đỡ của gia đình là nguồn động lực vô giá giúp tôi vượt qua mọi thử thách

trong suốt hành trình này

Cuối cùng, xin gửi lời tri ân chân thành đến đại gia đình, anh chị em nội ngoại và bạn

bè Sự ủng hộ và động viên của mọi người đã góp phần to lớn vào thành công của tôingày hôm nay Thành tựu này không chỉ là của riêng tôi mà còn là kết tinh của tìnhcảm, sự giúp đỡ và đông hành từ tât cả mọi người.

Hà Nội, ngày tháng năm 2024

NGHIÊN CỨU SINH

Lê Hồng Lam

11

Trang 6

MỤC LỤC

LOI CAM DOAN -~~~~~~~~================mrzz~===eeeeemmmrmmrr==eeeemreeeemmme I

LỜI CẢM ƠN Seen II

MỤC 0) Ul CREE ne oo IV

DANH MỤC KY HIỆU VA CHU VIET TAT -~~¬~~-=-============== VII DANH MỤC BANG BIEU -~ -~===~~~==============r==z====ermmmz=eeermmmme IX DANH MỤC HÌNH VE, DO THI -~~ ~=~~~~=================z=====rmmmme XI

MỞ ĐẦU -~ = -~-=====~~=======>>====rmmrr==eermmrr=eeermmre=emee 1

Ly do chon đề tài -~~~ ======~==============r==zz====rmmrz==mermmmx=eerrmmexe 1 Mục tiêu của đề tài -==-~-~~=============rrmzz==eerrmxxemermmmxeerrrrmexe 3

Đối tượng và phạm vi nghiên cứu -===================================m==me 3

Y nghĩa khoa hoc và thực tiễn của để tài ~~~~ ~~-~~~=======>z====em=zz==e=emmmr 3

Dong góp của luận án -=====================r==rem==r=mrrme=mm=me=m==me 4

Phương pháp tiếp cận -~-~ -=======================rr==mmmmm=====eeeemmmmmme 5

Phương pháp nghiên cứu -========================e=r=ss=mrrme=mmemee=me=m 5

Bồ cục của luận án -======~~=======z=====rmmzz==eerrmmxxemermmmx=eerrrmexe 6

CHƯƠNG 1 TONG QUAN -~~~ ============r=mz=====rmmz===eermmmme 8

1.1 Một số khái niệm cơ ban -=====~~===============m=z====mmmmm====em §

1.2 Cấu trúc chung của hệ thống nhận dạng hoạt d6ng - 9

1.2.1 Thu đữ thập liệu cho HAR - 10

1.2.2 Một số mô hình phân loại thông dụng trong HAR - 13

1.2.3 Cac phương pháp đánh giá hiệu năng của mô hình - 17

1.3 Tình hình nghiên cứu trong và ngoài nước về phát hiện ngã - 22

1.3.1 Một số nghiên cứu trên thé giới - 22

1.3.2 Một số nghiên cứu ở Việt Nam - 23

1.4 Khoảng trống nghiên cứu và đề xuất giải pháp - 25

1V

Trang 7

1.4.1 Dinh hướng nghiên cứu - 25

1.4.2 Kihoang trong nghiện 0ÚU- nên 26 1.4.3 Đề xuất giải phap - 27

1.5 Kết luận chương -~ -======~==============r==z====rrmmr==eeermmmm=eem 28 CHUONG 2 TRÍCH RUT ĐẶC TRUNG -================== 29

2.1 Tổng quan về trích rút đặc trưng - 29

2.1.1 Vai trò của trích rút đặc trưng - 29

2.1.2 Một số nghiên cứu liên quan đến trích rút đặc trưng - 30

2.1.3 Thách thức trong trích rút đặc trung - 33

2.1.4 Hướng tiếp cận giải quyết thách thức - 33

2.2 Phương pháp trích rút đặc trưng từ dữ liệu cảm biến gia tốc - 34

2.3 Nguồn dit liệu gia tốc -~-~~~================z=====rm=mm==e=emm 36 2.3.1 Bộ dữ liệu MobiAct v2.0 - 37

2.3.2 Bộ dit liệu UP-Fall - 39

2.4 Tiền xử ly dữ liệu -~~ -======================r=mm=====mmmm====mmmm 40 2.4.1 Kỹ thuật lọc nhiéu - 40

2.4.2 Phân đoạn dữ liệu - 41

2.5 Trích rút đặc trưng -== ===================r=rrmr=mrrmrrmmrmm=mmer 44 2.5.1 Miền thời gian - 45

2.5.2 Miễn tần §Õ-===-====-=== -====-======================================== 48

2.5.3 Tham số định hướng - 49

2354 Thạm sò HỌNH ——— 51 2.6 Lựa chọn đặc trưng - 202 2-022022- 33 2.7 Thực nghiệm và đánh giá kết quả -~ -~-=======¬===============r= 54 2.7.1 Thiết kế thực nghiệm - 54

27.2 Kệtqu va ban luận — 57 2.7.3 So sánh kết quả với các nghiên cứu liên quan - 69

2.8 Kết luận chương -= -==-===================e=r=rer=eemreerrerrrrree 75 CHUONG 3 XÂY DỰNG MÔ HÌNH PHÁT HIEN SỰ KIỆN NGÃ - 76

Trang 8

3.1 Giới thiệu bài toán -=~-============================z===m=z~m==e 76

3.1.1 Thách thức trong phát hiện ngã - 76

3.1.2 Hướng tiếp cận giải quyết thách thức - 77

3.1.3 Một số nghiên cứu liên quan - 78

3.2 Tối ưu mô hình mô hình RE -~ -==~============================ 80

3.2.4, Giải thuat di trryen = — ——-—— - _- 80 3.2.2 Đề xuất thuật toán GA4RE - 82

3.2.3 Thực nghiệm và đánh giá kết qua - 93

3.3 Xây dựng mô hình phát hiện sự kiện ngã - 107

3.3.1 Thách thức trong phat triển mô hình phát hiện sự kiện ngã - 107

3.3.2 Ảnh hưởng của kích thước cửa số dit liệu - 107

3.3.3 Phương pháp thiết kế FEDM - 109

3.3.4 Thực nghiệm và đánh giá kết qua - 115

3.4 Kết luận chương -~ -===============z=====rmmz===eermmm==eeermmmee 120 KET LUẬN VÀ KIÊN NGHỊ -~-~~~~-================z====mm=mz====mmmm 122 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIÁ LIÊN QUAN ĐÉN LUAN AN 0 THNNNgggggg111 124 PHU LUC: XÂY DUNG UNG DUNG DEMO -~~~~~~~~~=-=========~=== 125 TAI LIEU THAM KHAO -~ -======================r===zmmm=======eeemmmmm 132

vi

Trang 9

Bluetooth low energy Classification and regression tree Convolutional neural network

Disability-adjusted life years

Deep learning Decision tree Data overlapping ratio Data window size

Electrocardiogram

Fall detection system Fall event detection model Fast Fourier transform

False negative False positive Genetic algorithm

Global positioning system

Gated recurrent unit Grid search

Grey wolf optimizer

Human activity recognition

Hidden markov model

Independent Component Analysis

Inertial measurement unit

Các hoạt động thường ngày

Trí tuệ nhân tạo

Mô hình phát hiện sự kiện ngã

Biến đổi Fourier nhanh

Phân loại sai thành âm tính

Phân loại sai thành dương tính

Giải thuật di truyền

Hệ thống định vị toàn cầu Don vị công hồi tiếp

Tìm kiếm theo lưới

Thuật toán sói màu xắm Nhận dạng hoạt động của con người

Mô hình Markov an

Phân tích thành phần độc lập

Đơn vị đo lường quán tính

Trang 10

Long window size Matthew correlation coefficient Meta-heuristic/Metaheuristic

Short window size t-Distributed Stochastic Neighbor Embedding

True negative True positive

Wearable device World health organization Window size

Vili

Tiếng Việt

Internet vạn vật

k láng giềng gần nhất Hồi quy logistic

Bộ nhớ dài ngắn hạn Kích thước cửa số dài

Hệ số tương quan Matthew

Siêu kinh nghiệm

Học máy/máy học

Thuật toán động vật săn môi biển

Nghiên cứu sinh

Cửa sé trượt không xếp chồng Cửa số trượt có xếp chồng

Phép phân tích thành phần chính Hồng ngoại thụ động

Thuật toán tối ưu bầy đàn

giảm sô chiêu phi tuyên

Phân loại đúng âm tính Phân loại đúng dương tính

Các thiết bị đeo được

Tổ chức Y tế Thế giới

Kích thước cửa sô

Trang 11

DANH MỤC BANG BIEU

Bảng 1.1 Ma trận nhằm lẫn trong phân lớp nhị phân - 18

Bảng 1.2 Ma trận nhằm lẫn trong phân loại đa lop - 18

Bang 2.1 Một số nghiên cứu về trích rút đặc trưng từ dit liệu cảm biến gia tốc 32

Bảng 2.2 Các bộ dữ liệu công khai được sử dung trong ADL và phát hiện ngã - 36

Bảng 2.3 Thông số các cảm biến quán tính trên SP Samsung Galaxy S3 - 37

Bảng 2.4 Hoạt động thường ngày và ngã trong bộ dữ liệu MobiAct [104] - 38

Bảng 2.5 Hoạt động thường ngày và ngã trong bộ dit liệu UP-Fall [32] - 40

Bảng 2.6 Các đặc trưng cơ bản trong miền thời gian - 46

Bảng 2.7 Các đặc trưng cơ bản trong miền tần số - 48

Bảng 2.8 Tập các đặc trưng được lựa chọn để trích rút thông tin từ dữ liệu cảm biến gia tốc cho hệ thống phát hiện sự kiện ngã - 53

Bang 2.9 Các bộ đặc trưng được sử dụng trong Thực nghiệm 2.1 - 55

Bảng 2.10 Bộ tham số mặc định của các mô hình phân lớp - 56

Bảng 2.11 Hiệu suất phân loại từng hoạt động của năm mô hình ML khi sử dụng bộ đặc trưng TFDHD trích rút từ các bộ dữ liệu MobiAct v2.0 - 63

Bảng 2.12 Hiệu suất phân loại từng hoạt động của năm mô hình ML khi sử dụng bộ đặc trưng TFDHD trích rút từ các bộ dữ liệu UP-Fall - 64

Bảng 2.13 Ảnh hưởng của DWS đến hiệu suất nhận dạng các hoạt động trong bộ dữ liệu

MobiAct v2.Ô -~~ ===~~=====~~======~=====~z====r=~~==rr~=====~===mmr 66

Bảng 2.14 Ảnh hưởng của DWS đến hiệu suất nhận dạng các hoạt động trong bộ dữ liệu

1X

Trang 12

Bang 3.2 Tổng hợp kết quả thực nghiệm trên bộ dữ liệu MobiAct v2.0 của 50 thế hệ cuối

cùng trước khi thuật toán GA4RF đạt điều kiện dirng - 97

Bảng 3.3 Tổng hợp kết quả thực nghiệm trên bộ dit liệu UP-Fall của 51 thé hệ cuối cùng

trước khi thuật toán GA4RF đạt điều kiện dừng - 98

Bang 3.4 Hiệu suất trung bình các hoạt động trong tập dit liệu MobiAct khi áp dụng thuật

toán GA4RF với 15 bộ siêu tham số cuối, trước khi đạt điều kiện dừng 101

Bảng 3.5 Hiệu suất trung bình các hoạt động trong bộ dữ liệu UP-Fall khi áp dụng thuật

toán GA4RF với 15 bộ siêu tham số cuối, trước khi đạt điều kiện dừng 102Bảng 3.6 Tỉ lệ đồng nhất (rk) khi dự đoán hoạt động ở các sWS so với LWS; “1” mô hình

đoán đúng là hoạt động bình thường, “0” mô hình đoán là sự kiện nga114

Bảng 3.7 Các mẫu hoạt động bình thường trong bộ dữ liệu MobiAct v2.0 được sử dụng dé

huấn luyện mô hình - 115

Bang 3.8 Kết quả huấn luyện các mô hình ở các WS khác nhau dựa trên chín nhãn ADL

thường gặp trong bộ dữ liệu MobiAct 2.0 - 117

Bảng 3.9 Kết quả thử nghiệm FEDM với bộ dữ liệu hoạt động bình thường - 118

Bảng 3.10 Kết quả thử nghiệm FEDM với bộ dữ liệu các sự kiện nga - 119

Bảng 3.11 Kết quả thực nghiệm hệ thống nhận dang các mẫu chuyên động bình thường và

Trang 13

DANH MỤC HÌNH VE, DO THỊ

Hình 1.1 Cau trúc chung của hệ thống HAR [41—44] -~~~= =~~=~=====~= 9

Hình 1.2 Các loại cảm biến thường dùng trong HAR - 10

Hình 1.3 Mẫu dữ liệu ngã thu bằng cảm biến gia tốc của SP - 13

Hình 1.4 Phân phối các mô hình học máy và học sâu được sử dụng trong 305 nghiên cứu về FDS (từ 2015 đến 2020) [7] - 14

Hình 1.5 Khung kiến trúc của mô hình phát hiện ngã dựa trên điện thoại thông minh và kỹ thuật học máy -~ ===========~==~======~==~========r~==~======~= 26 Hình 2.1 Quy trình trích rút đặc trưng - 35

Hình 2.2 Phân phối dữ liệu trên hai bộ: (a) MobiAct v2.0 [104]; (b) UP-Fall [32] 36 Hình 2.3 Phân đoạn dữ liệu bằng kỹ thuật cửa số không xếp chồng dữ liệu - 42

Hình 2.4 Phân đoạn dit liệu bằng kỹ thuật cửa số xếp chồng dữ liệu - 42

Hình 2.5 Các DWS phổ biến trong HAR [7] - 43

Hình 2.6 Hệ trục tọa độ biểu diễn các trục quay của SP trong không gian - 50

Hình 2.7 Hiệu suất các mô hình ML khi sử dụng 10 bộ đặc trưng để phân loại tất cả các hoạt động trong bộ dữ liệu MobiAct (DWS 128 mẫu và DOR 80%) - 58

Hình 2.8 Hiệu suất các mô hình ML khi sử dụng 10 bộ đặc trưng dé phan loai tất cả các hoạt động trong bộ dữ liệu UP-Fall (DWS 128 mẫu và DOR 80%) - 58

Hình 2.9 Hiệu suất các mô hình ML khi sử dung 10 bộ đặc trưng dé phân loại các hoạt động bình thường trong bộ dữ liệu MobiAct (DWS 128 mẫu và DOR 80%) 59 Hình 2.10 Hiệu suất các mô hình ML khi sử dụng 10 bộ đặc trưng đề phân loại các hoạt động bình thường trong bộ dữ liệu UP-Fall (DWS 128 mẫu và DOR 80%)60 Hình 2.11 Hiệu suất các mô hình phân loại khi sử dụng 10 bộ đặc trưng dé phan loai cac su kiện ngã trong bộ đữ liệu MobiAct (DWS 128 mẫu va DOR 80%) - 61

XI

Trang 14

Hình 2.12 Hiệu suất các mô hình phân loại khi sử dụng 10 bộ đặc trưng dé phan loai cac su

kiện ngã trong bộ đữ liệu UP-Fall (DWS 128 mẫu va DOR 80%) - 61

Hinh 2.13 Anh hưởng cua DOR dén hiéu suat phân loại các hoạt động trong bộ dữ liệu

MobiAct v2.Ú ~ -~~ ~~~~=~~======z========================r====~==~=mr 68

Hình 2.14 Ảnh hưởng cua DOR dén hiéu suat nhan dang cua mô hinh - 68Hình 2.15 Hiệu suất chi tiết của Chatzaki và cộng sự [25] và mô hình đề xuất của NCS trong

việc phát hiện ADL và ngã - 70

Hình 2.16 Ma trận nhằm lẫn của 16 hoạt động trong bộ MobiAct v2.0 (a) Chatzaki và cộng

sự [25], (b) Phương pháp NCS đề xuất - 71Hình 2.17 Hiệu suất chỉ tiết của phương pháp Res-TCN [12] và OP-Tanish [122] bộ đặc

trưng TFDHD đề xuất trong việc phát hiện ADL và các sự kiện ngã - 73

Hình 2.18 Ma trận nhằm lẫn của 11 hoạt động trong bộ dữ liệu UP-Fall Hàng là các lớp dự

đoán; cột là các lớp thực tế Ma trận con 5 x 5 (FH, FF, FB, FS và FE) là các lớpngã (a) Kết qua của Lai và cộng sự [12] sử dung mô hình Res-TCN (b) MG hinh

RF dự đoán dựa trên bộ đặc trưng TFDHD dé xuất - 74

Hình 3.1 Thuật toán GA4RF - 84 Hình 3.2 Quá trình lai ghép trong GA - 89

Hình 3.3 Ảnh hưởng của hàm logarit trong việc tăng cường khả năng phân biệt các giá trị

fitness gần nhau (với k = 0.75) - 93

Hình 3.4 Giá trị hàm thích nghỉ theo NMCC trong 50 thé hệ cuối cùng trước khi thỏa mãn

điều kiện dừng thứ ba trên bộ dữ liệu MobiAct v2.0 - 95Hình 3.5 Giá trị hàm thích nghỉ theo NMCC trong 50 thé hệ cuối cùng trước khi thỏa mãn

điều kiện dừng thứ ba trên bộ dữ liệu UP-Fall - 95Hình 3.6 So sánh hiệu suất của thuật toán GA4RF với thuật toán SSRDC [43], IBk [25] và

RF mặc định thực hiện trên bộ dữ liệu MobiAct v2.0 - 104Hình 3.7 So sánh hiệu suất của thuật toán GA4RF với thuật toán OP-Tanish [122], Res-

TCN [12] va RF mặc định thực hiện trên bộ dữ liệu UP-Fall - 105

XI

Trang 15

Hình 3.8 Biểu diễn một sự kiện ngã điền hình của người đi bộ được thu thập bang cảm biến

gia tốc ba trục của điện thoại thông minh - 108Hình 3.9 Ý tưởng thiết kế FEDM, với LWS là kích thước cửa số đài, sWS là kích thước cửa

SO ngan - 110

Hình 3.10 Mô hình tổng quan phát hiện các sự kiện ngã - 111

Hình 3.11 Quy trình thực hiện nhận dang va phát hiện sự kiện ngã - 115

xiii

Trang 16

MỞ ĐẦU

Lý do chọn đề tài

Ngã là một trong những rủi ro sức khỏe nghiêm trọng đối với người cao tuổi TheoWHO, mỗi năm có khoảng 684.000 ca tử vong do ngã, tập trung chủ yếu tại các nướcthu nhập thấp và trung bình ở khu vực Tây Thái Bình Dương và Đông Nam A [1]

Tỷ lệ người trên 65 tuổi bị ngã mỗi năm dao động từ 28% đến 35% [2], trong đó 40%các trường hợp ngã tái phát [3] và một nửa trong số đó không thê tự đứng dậy sau khingã [4] Hậu quả của ngã gây mất 38 triệu năm sống được điều chỉnh theo mức độtan tật (DALYs) mỗi năm, vượt quá tổng DALYs của tai nạn giao thông, đuối nước,

bỏng và ngộ độc [1].

Trước thực trạng này, nhiều giải pháp hỗ trợ phát hiện ngã đã được nghiên cứu và

phát triển Các giải pháp này chủ yếu thuộc ba nhóm: Hệ thống dựa trên cảm biếnmôi trường, thiết bị đeo được và hệ thong lai [5, 6] Hé thống dựa trên cảm biến môitrường sử dụng các thiết bị như camera, cảm biến ap suất san, radar hoặc cảm biếnchuyên động dé theo dõi và phát hiện ngã Trong khi đó, thiết bị đeo được, bao gồmcảm biến quán tính (IMU), đồng hồ thông minh (SW) và điện thoại thông minh (SP)

Hệ thống lai kết hợp các loại cảm biến từ hai nhóm trên để cải thiện độ chínhxác Trong số các thiết bị này, điện thoại thông minh nổi bật với chi phí thấp, tinh

phổ biến cao [7], tích hợp đa dạng cảm biến [8, 9] và khả năng kết nối mạnh mẽ [10,

11] Những đặc điểm này giúp hệ thống phát hiện ngã dựa trên SP dễ dàng triển khaitrong thực tế mà không mất tiền đầu tư thiết bị

Tuy nhiên, SP cũng có han chế nhất định, chất lượng thu thập dữ liệu không ồn địnhnhư các thiết bị chuyên dụng do cách sử dụng của người dùng Vì thế, một số nghiêncứu đã kết hợp nhiều loại cảm biến dé cải thiện hiệu năng mô hình [12—15], nhưngphương pháp này làm tăng độ phức tạp của hệ thống, tăng chi phí tính toán và tiêutốn nhiều năng lượng của thiết bị [16, 17] Vì vậy, luận án nhận thấy chỉ sử dụng cảmbiến gia tốc dé thu thập đữ liệu, giúp đơn giản hóa hệ thống và kéo dài thời gian hoạt

Trang 17

động của thiết bị Tuy nhiên, việc sử dụng duy nhất cảm biến gia tốc có thể làm giảmhiệu suất của mô hình phát hiện ngã Do đó, luận án sẽ tập trung vào các giải pháptiền xử lý dữ liệu, trích rút đặc trưng và tôi ưu mô hình dé vẫn đảm bảo hiệu suấttương đương với các hệ thống đa cảm biến đã có.

Trong tiền xử lý dữ liệu từ cảm biến gia tốc, các nghiên cứu về nhận dạng hoạt động

và phát hiện ngã thường sử dụng bộ lọc thông thấp để lại bỏ nhiễu [18-21] Tuynhiên, phương pháp này không loại bỏ được nhiễu tần số thấp (0.1 - 0.5 Hz) phát sinh

từ trong lực, chuyền động cơ hoặc nhịp tim của người dùng [22, 23]

Về vấn đề trích rút đặc trưng từ đữ liệu gia tốc, các nghiên cứu chủ yếu tập trung vàomiền thời gian [10, 15, 24] Tuy nhiên, đặc trưng ở miền này dễ bị nhiễu và khó phân

biệt ngã với các hoạt động tương tự như ngồi xuống hoặc cúi nhặt đồ vật [10, 15, 25],

dẫn đến hiệu suất phân loại sự kiện ngã của hệ thống không tốt Đề cải thiện khả năngphân loại ngã, một số nghiên cứu đã bé sung các đặc trưng miền tần số [26-28] Tuynhiên, ngay cả khi kết hợp đặc trưng từ hai miền này vẫn chưa mô tả đầy đủ các trạngthái bất thường và độ phức tạp trong hoạt động của người dùng [28, 29]

Về mặt tối ưu mô hình, theo kết quả khảo sát các nghiên cứu liên quan [12, 30-33]

và các kết quả đã thực nghiệm trong quá trình nghiên cứu ([CT1], [CT2], [CT3]), đềucho thấy hiệu suất của RF tốt hơn so với các mô hình học máy khác trong nhiệm vụ

phát hiện ngã trên điện thoại thông minh Do đó, luận án chọn RF làm mô hình phân

loại cho hệ thống phát hiện ngã Tuy nhiên, hiệu suất của RF phụ thuộc nhiều vàoviệc lựa chọn siêu tham số [34-38] Vì vậy, cần phải có giải pháp dé tối ưu các siêutham số cho RF nhăm nâng cao hiệu suất phát hiện ngã của mô hình

Từ những phân tích trên, nghiên cứu sinh đề xuất đề tài “Nghiên cứu phát triển một

số kỹ thuật trích rút đặc trưng và toi uu mô hình Random Foest trong phát hiện sựkiện ngã của con người bằng điện thoại thông minh ” nhằm giải quyết câu hỏi “Làmthé nào dé phat trién mot hé thong phat hiện sự kiện ngã chính xác, hiệu quả voi ditliệu ngã khó thu thập và gan nhãn trong thé giới thực?”

Trang 18

Mục tiêu của đề tài

Luận án này hướng đến mục đích xây dựng một ứng dụng phát hiện ngã phù hợp vớithực tế, dễ dùng với các cảm biến sẵn có trên điện thoại thông minh Đề hiện thực

hóa mục đích này, luận án tập trung vào hai mục tiêu cụ thể: Mục tiêu thứ nhất

-Phát triển phương pháp trích rút đặc trưng hiệu quả từ dir liệu cảm biến gia tốc trên

điện thoại thông minh để nâng cao độ chính xác trong phát hiện sự kiện ngã Mục tiêu thứ hai - Đề xuất giải pháp tối ưu hiệu suất mô hình RF trong bài toán phát hiện

ngã Đồng thời xây dựng mô hình phát hiện hành vi bất thường trong thế giới thực.Đối tượng và phạm vi nghiên cứu

Luận án tập trung nghiên cứu các mô hình phát hiện sự kiện ngã của con người dựa

trên dữ liệu cảm biến gia tốc tích hợp trong thiết bị đeo thông minh Sự kiện ngã làvan dé quan trọng vì có thé gây hậu quả nghiêm trọng như giảm chất lượng cuộcsông, hạn chế khả năng vận động và giao tiếp, ảnh hưởng tiêu cực đến sinh hoạt hàngngày, thậm chí dẫn đến tử vong Do đó, iéc phát hiện chính xác và kip thời các sựkiện ngã nhằm hỗ trợ nhanh chóng cho nạn nhân là nhiệm vụ cấp thiết

Nghiên cứu này hướng đến việc xây dựng một mô hình có khả năng phân biệt chínhxác giữa các sự kiện ngã và hoạt động bình thường của con người, đặc biệt trong bốicảnh dữ liệu ngã khó thu thập Dé đạt được điều này, nghiên cứu không chi tập trung

vào việc nhận dạng các sự kiện ngã ma còn mở rộng phân tích sang các hoạt động

hàng ngày Trọng tâm là phát triển các phương pháp trích rút đặc trưng từ dữ liệu thôthu bằng cảm biến gia tốc, nhằm nâng cao độ chính xác trong việc phát hiện ngã.Đồng thời, nghiên cứu tích hợp các kỹ thuật tối ưu dé cải thiện hiệu suất phân loạingã của mô hình RF.

Ý nghĩa khoa học và thực tiễn của đề tài

Nghiên cứu này có một số đóng góp nhất định cả về mặt khoa học lẫn thực tiễn Vềmặt khoa học, đề tài đã cải tiến và phát triển các kỹ thuật trích rút đặc trưng từ dữ liệucảm biến gia tốc trên SP, góp phần làm phong phú tài liệu nghiên cứu và mở rộng các

Trang 19

phương pháp tiếp cận trong xử lý tín hiệu và học máy Ngoài ra, nghiên cứu đã phântích và đánh giá các yếu tô ảnh hưởng đến hiệu suất của mô hình RF, cung cấp thêm

các giải pháp dé tối ưu siêu tham số cho các bài toán phân loại tương tự Việc phát

triển mô hình thích ứng với dữ liệu ngã khó thu thập đã mở ra hướng tiếp cận mớitrong xử lý dit liệu không cân bang và thiếu nhãn, góp phan thúc day ứng dụng họcmáy trong điều kiện đữ liệu hạn chế

Về mặt thực tiễn, đề tài mang lại những ứng dụng thiết thực với tính khả thi cao, khi

sử dụng SP làm thiết bị thu thập đữ liệu và phát hiện ngã, giúp hệ thống trở nên dễtiếp cận, giảm chi phí và tận dụng hiệu quả công nghệ sẵn có, khuyến khích áp dụngrộng rãi trong cộng đồng Sản phẩm từ nghiên cứu có thé phát triển thành phan mềm

miễn phí cài đặt trên SP hoặc SW, giúp người dùng tự theo dõi hoạt động và phòng

ngừa nguy cơ ngã, đồng thời có thé tích hợp vào các dich vụ y tế cộng đồng, góp phan

nâng cao chât lượng chăm sóc sức khỏe của người dân.

Đóng góp của luận án

Luận án mang lại hai đóng góp chính với giá trị khoa học và ứng dụng có nhiều triểnvọng trong lĩnh vực phát hiện sự kiện ngã Đóng góp thứ nhất là đề xuất phươngpháp trích rút đặc trưng đa mién từ dit liệu gia tốc ba trục, tích hợp thông tin từ miềnthời gian, miền tan số, các tham số định hướng và tham số Hjorth Sự kết hợp đachiều này cho phép mô tả toàn diện các đặc điểm của sự kiện ngã, bao gồm: thay đổiđột ngột từ miền thời gian, chu kỳ dao động từ miền tần số, góc nghiêng bất thường

từ tham số định hướng va mức độ phức tạp từ tham số Hjorth Nhờ đó, hệ thống có

khả năng phân biệt chính xác giữa sự kiện ngã và các hoạt động thông thường Các

kết quả nghiên cứu này đã được công bố trong các công trình [CT1], [CT2] và [CT3].Đóng góp thứ hai là đề xuất thuật toán GA4RF và phát triển mô hình phát hiện sựkiện ngã (FEDM) GA4REF sử dụng giải thuật đi truyền dé tìm bộ siêu tham số tối ưucho Random Forest với điểm mới là thiết kế cau trúc nhiễm sắc thé, không gian tim

kiếm và hàm thích nghi phù hợp với đặc điểm của dữ liệu ngã FEDM sử dụng kỹ

thuật so khớp dữ liệu linh hoạt và kỹ thuật ngưỡng đề phát hiện các hành vi bất thường

Trang 20

dựa trên phân tích dữ liệu các hoạt động thường ngày Các kết quả nghiên cứu này đã

được công bố trong các công trình [CT2], [CT3], [CT4] va [CTS]

phù hợp, bước thứ tư tập trung vào việc tìm kiếm giải pháp tối ưu nhằm nâng cao

hiệu suất phân loại ngã cho mô hình này Cuối cùng, dé đảm bảo tính thực tiễn, nghiêncứu chú trọng phát triển mô hình có khả năng hoạt động tốt trên dữ liệu thực tế, baogồm cả các trường hợp ngã khó thu thập

Phương pháp nghiên cứu

Luận án kết hợp cả phương pháp lý thuyết lẫn thực nghiệm Phần lý thuyết tập trungnghiên cứu chuyên sâu về các khái niệm, nguyên lý, phương pháp xử lý tín hiệu, khai

phá dit liệu và học máy Đặc biệt chú trọng vào các phương pháp lọc nhiễu, trích rút

đặc trưng, tối ưu mô hình phân loại và phát triển mô hình phát hiện sự kiện ngã Qua

trình này đòi hỏi việc tham khảo và đánh giá kỹ lưỡng các nghiên cứu trong và ngoài

nước nhằm tìm ra giải pháp phù hợp cho bài toán phát hiện ngã bằng SP

Phần thực nghiệm bắt đầu từ dữ liệu thô được thu thập bằng cảm biến gia tốc của SP

và các thiết bị đeo Dữ liệu này được phân đoạn và trích rút đặc trưng theo các phươngpháp đề xuất trong phan lý thuyết Sau đó, nghiên cứu tiến hành huấn luyện các thuậttoán phân loại và các mô hình đề xuất trên bộ dữ liệu đã qua xử lý Cuối cùng, nghiêncứu sẽ tập trung vào việc đánh giá và so sánh hiệu suất phân loại hoạt động và phát

Trang 21

hiện ngã của các giải pháp đề xuất với các nghiên cứu liên quan trên cùng bộ dữ liệu.Việc này đảm bảo tính công bằng và khách quan trong đánh giá, đồng thời giúp xácđịnh hiệu quả của các kỹ thuật trích rút đặc trưng, phương pháp tối ưu và hiệu suất

của mô hình dé xuât.

Bo cục của luận án

Cấu trúc bao gồm năm phần chính: Mở đầu, ba chương nội dung và Kết luận - Kiến

nghị, được minh họa trong Hình MD.1 Cấu trúc này đảm bảo tính logic và kết nối

chặt chẽ giữa các nội dung của nghiên cứu về phát hiện sự kiện ngã dựa trên SP

Phần Mở đầu giới thiệu bối cảnh nghiên cứu, tầm quan trọng của việc phát hiện ngã,

lý do chọn đề tài, câu hỏi nghiên cứu, mục tiêu nghiên cứu, ý nghĩa khoa học va thực

tiễn, cùng với các đóng góp chính của luận án Phương pháp nghiên cứu được mô tả

khái quát dé định hướng cho các chương tiếp theo

Chương 1 cung cấp tổng quan về các nghiên cứu liên quan đến hệ thống nhận dạng

hoạt động (nhận dạng hoạt động của con người - HAR) và phát hiện ngã Chương này giới thiệu các khái niệm cơ bản, phân tích đánh giá các nghiên cứu liên quan và trình

bày các khoảng trống nghiên cứu cùng giải pháp đề xuất Mục đích của chương nàylàm rõ ba lý do chính cho hướng tiếp cận của nghiên cứu: (i) sử dung SP dé phát hiện

sự kiện ngã; (ii) chi sử dụng cảm biến gia tốc làm nguồn thu thập dữ liệu và trích rút

đặc trưng; (iii) sử dụng mô hình học máy RF cho hệ thống phát hiện sự kiện ngã

Chương2 tập trung vào các phương pháp tiền xử lý dữ liệu cảm biến và trích rút đặctrưng dé phát hiện ngã Chương này trình bày quá trình xác định tập đặc trưng phùhợp, tối ưu các thông số quan trọng như kích thước cửa số dữ liệu (kích thước cửa số

dữ liệu - DWS) và tỷ lệ xếp chồng dữ liệu (tỷ lệ xếp chồng đữ liệu - DOR) và so sánhhiệu suất của các mô hình phân loại khác nhau Kết quả nghiên cứu được công bố

trong các công trình [CT1], [CT2] và [CT3].

Trang 22

Chương 3 nghiên cứu về giải pháp xây dựng mô hình phát hiện sự kiện ngã Chươngnày trình bày giải pháp tối ưu mô hình Random Forest và phát triển mô hình pháthiện sự kiện ngã phủ hợp với điều kiện dữ liệu thực tế Các kết quả nghiên cứu đượccông bố trong các công trình [CT2], [CT5], [CT4] va [CTSI.

Cuối cùng, phần Kết luận và kiến nghị tóm tắt những kết quả đạt được, phân tíchhạn chế và vấn đề chưa hoàn thiện, đồng thời đề xuất hướng nghiên cứu và giải pháp

bổ sung trong tương lai

Chương 1 TONG QUAN

Trang 23

Chương 1 TONG QUAN

Chương | của luận án tập trung vào việc xây dựng bối cảnh và cơ sở lý thuyết cho hệ

thông nhận dạng hoạt động và phát hiện ngã của con người Nghiên cứu xác định câu

hỏi trọng tâm là làm thé nào dé phát triển FDS hiệu quả, tiết kiệm năng lượng và khathi khi triển khai trên thiết bị di động Thông qua phân tích tổng quan về các kháiniệm cơ bản, cau trúc của HAR và đánh giá các nghiên cứu liên quan, chương đã chỉ

ra hai khoảng trồng nghiên cứu chính: (1) thiếu một phương pháp trích rút đặc trưng

toàn diện kết hợp thông tin từ nhiều miền khác nhau; (2) chưa có giải pháp tối ưu hiệuquả cho mô hình RF trong bài toán phát hiện ngã Dé khắc phục những hạn chế này,nghiên cứu đề xuất hai giải pháp: (i) phương pháp trích rút đặc trưng đa miền, kếthợp các thông tin từ miền thời gian, tần số và các tham số định hướng; (ii) tối ưu môhình RF bằng GA Cách tiếp cận này không chỉ hứa hẹn nâng cao độ chính xác trongphát hiện ngã mà con mang tính khả thi khi triển khai trên thiết bi di động

1.1 Một số khái niệm co bản

Việc đánh giá một hành động là bình thường hay bất thường không đơn giản do sựchủ quan trong nhận định của mỗi người Đề đảm bảo tính nhất quán trong luận án,các khái niệm sau đây được thống nhất định nghĩa và sử dụng:

(i) Hanh vi là những phản ứng, cách cư xử, biêu hiện ra ngoài của một người trong

một hoàn cảnh cụ thể [39];

(ii) Bình thường là những sự việc, hành động không có gì đặc biệt hoặc khác thường

[39]: Bat thường là những sự việc, hành động không tuân theo lệ thường, khác

biệt so với bình thường [39];

(iii) Hành vi bình thường là các hoạt động thường ngày của con người như ngồi,

năm, đứng, đi bộ, chạy, nhảy, đi lên/xuống cầu thang, v.v Hanh vi bắt thường

là các hoạt động khác biệt so với các hành vi bình thường, trong luận án này là hành vi ngã.

Trang 24

(iv) Ngã được định nghĩa là sự di chuyền đột ngột và không chủ ý của cơ thể con

người từ vị trí cao xuống vị trí thấp [1, 40] Đây là một tình trạng không mongmuốn, tiềm ẩn nhiều nguy cơ gây chan thương cho mọi người, đặc biệt là người

già và người bệnh.

1.2 Cấu trúc chung của hệ thống nhận dạng hoạt động

Hệ thống nhận dạng hoạt động của con người thường bao gồm ba thành phần chính.Phần này sẽ trình bày tổng quan về HAR và các thành phần cấu thành của nó, đượcminh họa cụ thể như trong Hình 1.1

THU THẬP DỮ LIỆU Ậ TRUYỀN TIN CẢNH BÁO

Deep learning.

Hình 1.1 Cau trúc chung của hệ thống HAR [41-44]

(1) Thu thập dữ liệu: Hệ thống này có nhiệm vụ ghi nhận các tín hiệu mô tả hoạt

động của con người thông qua các cảm biến Dữ liệu này sẽ hỗ trợ cho quá

trình phát hiện hoạt động và các sự kiện ngã.

(2) Mô hình nhận dạng hoạt động: Phần này thường sử dụng các thuật toán học

máy hoặc học sâu dé phân tích dữ liệu đã thu thập Mục đích là xác định trạng

thái hoạt động của người dùng, bao gồm việc đánh giá nguy cơ ngã

(3) Hệ thống truyền thông tin cảnh báo: Dam bảo rằng khi phát hiện nguy co,

thông điệp cảnh báo sẽ được gửi ngay lập tức đến người chăm sóc Điều nàycho phép cung cấp sự trợ giúp kịp thời trong trường hợp xảy ra sự có

Trang 25

Bằng cách kết hợp ba thành phan này, hệ thống HAR có thé theo dõi, phân tích và

phản ứng hiệu quả đối với các hoạt động của con người nói chung và trong việc phát

hiện, ngăn ngừa các sự kiện ngã nói riêng.

1.2.1 Thu dữ thập liệu cho HAR

Hiệu suất của HAR phụ thuộc nhiều vào phương thức sử dụng cảm biến dé thu thập

dữ liệu Các hệ thống HAR thường được phân thành các nhóm dựa trên vị trí gắn cảmbiến thu dit liệu, điển hình là: (i) dựa trên các loại cảm biến môi trường xung quanh,(ii) dựa trên các loại cảm biến trên thiết bị đeo được và (iii) công nghệ cảm biến lai[5, 6] Các loại cảm biến thông dụng của mỗi nhóm được thống kê như Hình 1.2

Cảm biến

môi trường xung quanh

Các loại cảm biến của thiết bị đeo

Hình 1.2 Các loại cảm biến thường dùng trong HAR

1.2.1.1 Các loại cảm biến môi trường xung quanh

Hệ thống phát hiện ngã sử dụng nhiều loại cảm biến môi trường như camera, cảmbiến âm thanh, áp suất sàn, chuyền động PIR, radar hay siêu âm dé theo dõi hoạt động

và phát hiện sự kiện ngã của con người [45] Những hệ thống này thường được áp dụng trong không gian hạn chế như viện dưỡng lão, phòng chăm sóc bệnh nhân và

nhà riêng Phương pháp này có một số hạn chế như chi phí lắp đặt và bảo trì cao,

không gian giám sát bị giới han, dé bi ảnh hưởng bởi nhiễu môi trường [45] và có thể

gây cảm giác xâm phạm quyền riêng tu cho đối tượng được chăm sóc [6, 45]

10

Trang 26

Mỗi loại cảm biến trong FDS đều có những hạn chế riêng [46] Camera đòi hỏi băngthông và chi phi xử lý lớn, dé bi ảnh hưởng bởi điều kiện ánh sáng và vật cản, khiếnviệc phát hiện trường hợp ngã một cách chính xác gặp khó khăn Cảm biến âm thanh

dễ bị tác động bởi tiếng ồn bên ngoài và có thê khó phân biệt tiếng ngã với các âmthanh khác, dé bỏ lọt trường hop ngã không gây ra tiếng động mạnh Cảm biến ápsuất sàn chỉ có thé phát hiện khi ngã xảy ra trên sàn và dé bị kích hoạt bởi các hoạtđộng khác như đi lại Cảm biến PIR lại nhạy cảm với chuyền động của vật nuôi hoặc

đồ vật xung quanh, dé bỏ lọt trường hợp ngã chậm Radar tiêu tốn năng lượng lớn,giá thành cao, lắp đặt phức tạp và có nguy cơ phát xạ điện từ Cuối cùng, cảm biếnsiêu âm dé bị ảnh hưởng bởi vật cản và có góc nhìn hẹp, hạn chế khả năng phát hiệnngã trong một số trường hợp

Với những hạn chế đã nêu, có thé nhận thấy các hệ thống FDS dựa trên cảm biến môitrường chưa thực sự tối ưu và phù hợp với mọi bối cảnh, đặc biệt khi cần đảm bảoquyền riêng tư, hiệu quả trong giám sát và chi phí hợp lý Điều nay đặt ra nhu cầunghiên cứu và phát triển các giải pháp thay thế hoặc cải tiến phù hợp hơn cho việcphát hiện ngã trong nhiều môi trường khác nhau

1.2.1.2 Các loại cảm biến trên thiết bị đeo

Trong những năm gần đây, việc xây dựng FDS từ tín hiệu quán tính đã thu hút sự chú

ý của nhiều nhà nghiên cứu Xu hướng nay chủ yếu do hai yếu tố: chi phí phần cứngngày càng giảm và sự phô biến của các thiết bị di động được trang bị sẵn cảm biếnquán tính [7] FDS dựa trên thiết bị có thể đeo được (bao gồm SP, SW và cảm biếntrên IMU) thu thập dữ liệu về hoạt động hàng ngày và sự kiện ngã thông qua cảmbiến gia tốc, con quay hồi chuyển và cảm biến định hướng Ưu điểm nổi bật của hệ

thống này là phạm vi giám sát không giới hạn, tính cơ động cao, ít chịu ảnh hưởng

bởi nhiễu môi trường và chỉ phí triển khai thấp

Mặc dù chất lượng dữ liệu thu thập từ các thiết bị đeo chuyên dụng như IMU rất tốt,

những thiết bị này thường không hoạt động độc lập Chúng cần kết hợp với các hệ

11

Trang 27

thống Internet vạn vật (IoT) và/hoặc điện thoại thông minh để xây dựng FDS vàtruyền bản tin cảnh báo Tuy nhiên, kiến trúc phần cứng của các hệ thống IoT có thêkhá công kênh và nặng, gây nên sự khó chịu va bat tiện cho người sử dung [47].

Một thách thức khác đối với các nhà nghiên cứu là nguồn cấp điện cho hệ thống này

Do các cảm biến đeo thường có tính di động và hoạt động độc lập với nguồn điệnlưới, việc sử dụng điện năng tiết kiệm là một mối quan tâm lớn Trang bi pin lớn chomột thiết bị đeo nhỏ có thé khiến thiết bi trở nên cồng kénh hơn, trong khi sử dụng

pin nhỏ sẽ buộc người dùng phải sạc lại thường xuyên [48] Điều này tạo ra một sự

đánh đổi giữa kích thước thiết bị và thời gian sử dụng, đòi hỏi các nhà thiết kế phải

cân nhắc kỹ lưỡng dé tối ưu trải nghiệm người dùng

1.2.1.3 Dữ liệu thu bằng cảm biến gia tốc

Cảm biến gia tốc là một loại cảm biến được thiết kế dé ghi nhận sự thay đổi vận tốccủa vật thể theo thời gian Loại cảm biến này được ứng dụng phô biến trong HAR vìkhả năng đo lường chuyên động có hướng của đối tượng theo thời gian [49,

50] Trong SP, cảm biến gia tốc đo lường gia tốc của thiết bi theo ba trục x, y va z.Các thông số này cung cấp thông tin chi tiết về sự thay đồi tốc độ theo từng hướng,

hỗ trợ theo dõi chính xác chuyên động của thiết bị Giá trị gia tốc thường được đobằng m/s?, phản ánh lực tác động lên thiết bị từ chuyên động hoặc môi trường xungquanh Ngoài ra, cảm biến này còn cung cấp thông tin về hướng và góc nghiêng củathiết bị, bao gồm các góc xoay (9-roll), góc nghiêng (0-pitch) và góc đảo (w-yaw)

Chất lượng dữ liệu thu được từ cảm biến gia tốc phụ thuộc vào nhiều yếu tố như đảiđộng và độ phân giải của cảm biến Dải động là khoảng gia tốc mà cảm biến có thể

phát hiện, ảnh hưởng đến khả năng theo dõi các chuyên động khác nhau Độ phân giải phan ánh độ nhạy của cảm biến đối với những thay đổi nhỏ về gia tốc, đóng vai

trò quan trọng trong việc nhận biết chỉ tiết nhỏ trong chuyền động Tần số lay maucũng là một yếu tố quan trọng; tần số cao cung cấp thông tin chỉ tiết hơn nhưng tiêu

thụ nhiều năng lượng hơn Đối với các hoạt động đơn giản như đi bộ, đứng và ngồi,

12

Trang 28

tần số lay mẫu 20Hz thường là đủ Tuy nhiên, để ghi lại chi tiết các chuyên độngnhanh và thay đôi đột ngột, tần số lấy mẫu cần đạt từ 100Hz trở lên Hình 1.3 minhhọa một mẫu dữ liệu điên hình được thu thập bang cảm biến gia tốc ba trục trong SP.

Hình 1.3 Mẫu dữ liệu ngã thu bằng cảm biến gia tốc của SP

1.2.2 Một số mô hình phân loại thông dụng trong HAR

Trong bài toán HAR, việc lựa chọn thuật toán và phương pháp giải quyết đóng vaitrò quyết định đến hiệu quả của hệ thống Theo nghiên cứu của Ferrari và cộng sự

[7] giai đoạn 2015 — 2020 chứng kiến sự phô biến của các thuật toán học máy truyền

thống như SVM, kNN, ANN, J48 và RF trong các ứng dụng phát hiện ngã, như minh

họa trong Hình 1.4.

Sự phổ biến này có thé được giải thích bởi nhiều yếu tố Thứ nhất, các thuật toán nàythể hiện hiệu suất cao ngay cả với dữ liệu được gán nhãn hạn chế và tiêu tốn ít tainguyên tính toán hơn so với các phương pháp học sâu Đây là lợi thế đáng kể trongcác ứng dung HAR, nơi việc thu thập dữ liệu thường gặp nhiều thách thức Thứ hai,mỗi thuật toán sở hữu những đặc điểm kỹ thuật độc đáo: SVM vượt trội trong việctìm siêu phăng quyết định tối ưu nhờ các phép biến đổi kernel, KNN được đánh giácao bởi tính đơn giản và hiệu quả khi không yêu cầu học tham số trong quá trình huấnluyện, RF cho thấy khả năng xử lý tốt với đữ liệu nhiều chiều thông qua việc tăng sốlượng cây quyết định trong khi J48 mang lại các quy tắc phân loại dễ hiểu, thuận tiệncho việc giải thích kết quả Thứ ba, các thuật toán này hoạt động hiệu quả với các đặctrưng được thiết kế dựa trên tri thức chuyên gia, vốn chủ yếu được sử dụng trong giai

13

Trang 29

đoạn này Những đặc trưng này có độ phức tạp tính toán thấp và dé dàng trong việc

xử lý Cuối cùng, về mặt triển khai thực tế, các thuật toán này không đòi hỏi phần

cứng đắt tiền hay tập dữ liệu lớn để huấn luyện, tạo điều kiện thuận lợi cho việcnghiên cứu và phát triển trong lĩnh vực HAR

Mặc dù hiệu suất của các thuật toán học máy truyền thống phụ thuộc nhiều vào kỹ

thuật trích rút đặc trưng và kiến thức chuyên gia [7], nhưng chúng vẫn giữ được tínhphù hợp trong suốt thời gian dài nhờ những ưu điểm thực tế và hiệu quả đã đượcchứng minh Những đặc điểm như tính linh hoạt, hiệu quả tính toán, khả năng xử lýtốt dữ liệu cảm biến và khả năng hoạt động 6n định trên tập dữ liệu nhỏ đến vừa đãgiúp các thuật toán này trở thành lựa chon tốt dé giải quyết thách thức trong HAR vàphát triển các hệ thống nhận dạng hoạt động đơn giản và hiệu quả

1.2.2.1 Cây quyết định

Cây quyết định là một mô hình phân loại có cấu trúc dạng cây, bao gồm gốc, thân,cành và lá Với cau trúc này, moi nút bên trong đại diện cho một thuộc tính va môi

14

Trang 30

nút lá đại diện cho một nhãn lớp Dự đoán được thực hiện thông qua quá trình suy

luận quy nạp, đi từ gốc cây đến các nút lá theo các điều kiện trên thuộc tính Cây

quyết định là một bộ phân loại dé hiểu, chúng mô phỏng cách thức con người suyluận dựa trên các đặc điểm của mẫu [51] Cây quyết định đã được chứng minh là hiệuquả trong nhiều lĩnh vực và yêu cầu ít tham số hơn so với các thuật toán khác [52]

Có hai quy tắc chính cần được xem xét khi xây dựng cây quyết định: Một là tiêu chídừng, xác định thời điểm ngừng phát triển cây và tạo ra các nút lá [53] Quy tắc nàyquy định sự phát triển của cây phải kết thúc nếu tất cả các mẫu trong một nút thuộc

cùng một lớp [54] Hai là cách gan nhãn lớp cho nút lá, Xác định cách thức gán nhãn

lớp cho các nút lá [55] Quy tắc này nhấn mạnh tầm quan trọng của việc thiết lập mộtngưỡng dé quyết định nhãn lớp cho nút lá [56] Cây quyết định có nhiều biến thé,trong đó có ID3, C4.5 va CART J48 là một triển khai của thuật toán C4.5 và được

sử dụng rộng rãi do hiệu suất tốt và khả năng xử lý đữ liệu hiệu quả

1.2.2.2 Random Forest

Random Forest là một thuật toán học có giám sat tiên tiễn, được phát triển bởi LeoBreiman [57] dựa trên việc mở rộng và cải tiến từ cây quyết định và phương pháptổng hợp bootstrap RF xây dựng một tập hợp lớn các cây quyết định không tươngquan trong quá trình huấn luyện để tạo thành một mô hình tổng hợp [58] Thuật toán

RF áp dụng hai bước ngẫu nhiên hóa quan trọng trong quá trình xây dựng mô hình.

Thứ nhất là lay mẫu ngẫu nhiên theo phương pháp bootstrap có hoàn lại từ tập dit liệu

huấn luyện để tạo các tập dữ liệu con đa dạng Thứ hai là chọn ngẫu nhiên một tập

con các đặc trưng cho mỗi cây Hai bước ngẫu nhiên này tạo ra các tập dữ liệu con

có tính đa dạng cao và ít liên quan đến nhau, giúp giảm lỗi phương sai [57] Khi dự

đoán, mỗi cây trong rừng đưa ra một dự đoán độc lập Kết quả cuối cùng được xácđịnh bằng phương pháp bỏ phiếu đa số cho bài toán phân lớp hoặc lấy trung bình cho

bài toán hồi quy Cách tiếp cận này giảm nguy cơ quá khớp và cải thiện khả năng

tổng quát hóa đối với dit liệu mới RE có kha năng kháng nhiễu tốt và có thé xử lý

các tập dữ liệu lớn và nhiêu chiêu.

15

Trang 31

1.2.2.3 May vectơ hỗ trợ

Máy vector hỗ trợ (SVM) là thuật toán học có giám sát được sử dụng rộng rãi trong

HAR [7] SVM hoạt động bằng cách tìm kiếm một siêu phăng tối ưu dé phân tachcác lớp dit liệu trong không gian nhiều chiều, nhằm tối da hóa khoảng cách giữa cáclớp, giúp mô hình tổng quát hóa tốt hơn và giảm nguy cơ quá khớp Đối với dữ liệu

không thé tách biệt tuyến tính, SVM sử dụng các hàm kernel (như tuyến tính, đa thức

hoặc hàm cơ sở xuyên tâm) dé ánh xa dữ liệu vào không gian có chiều cao hơn, nơi

có thể thực hiện phân tách tuyến tính Ban đầu được thiết kế cho phân loại nhị phân,thuật toán chỉ cho phép một siêu phang duy nhất trong mỗi bài toán Thông quaphương pháp mã hóa one-vs-one, chúng ta có thể mở rộng SVM cho bài toán phânloại đa lớp Với bài toán phân loại đa lớp cần sử dụng một tập hợp các SVM dé xử lýtat cả các cặp lớp Phương pháp one-vs-one là một kỹ thuật phô biến, trong đó mỗicặp lớp được phân loại với nhau, tạo ra phiêu bầu cho mỗi lớp Lớp có tông số phiếu

bau cao nhat sẽ là lớp dự đoán cuôi cùng.

1.2.2.4 Mạng no-ron nhân tạo

Mạng nơ-ron nhân tạo (ANN) lay cảm hứng từ hoạt động của bộ não con người, đượcthiết kế dé nhận dạng các mẫu và mối quan hệ phức tap trong dữ liệu ANN mô phỏngchiến lược hoạt động của các tế bào thần kinh sinh học trong não, truyền tín hiệu kíchhoạt thông qua các hàm kích hoạt và mã hóa kiến thức trong các liên kết mạng TheoKukreja và cộng sự [59], các mô hình ANN bao gồm nhiều nút tính toán phi tuyếnđược sắp xếp trong nhiều lớp: lớp đầu vào, lớp ân và lớp đầu ra, cho phép xử lý songsong Các nút trong ANN được kết nối với nhau thông qua các trọng số được khởitạo ngẫu nhiên và được cập nhật trong quá trình huấn luyện thông qua thuật toán lantruyền ngược ANN đủ mạnh dé xử lý các van đề phân loại phi tuyến tính Các đơn

vị ân (nút ân) thực hiện ánh xạ phi tuyến thông qua các hàm cơ sở phi tuyến, trongkhi đầu vào và đầu ra của ANN là sự kết hợp tuyến tính của các nút này Mô hìnhANN có thé bao gồm nhiều lớp an với các trọng số tương ứng Mỗi lớp có thé tínhtoán các hàm phi tuyến dé xử lý các mẫu phức tạp hơn từ lớp đầu vào

16

Trang 32

1.2.2.5 K láng giéng gan nhất

K láng giéng gần nhất (KNN) là một trong những thuật toán học có giám sát đơn giản,được sử dụng rộng rãi trong nghiên cứu về HAR [7] Thuật toán KNN hoạt động bằngcách xác định k điểm dữ liệu gần nhất trong không gian đặc trưng so với một đầu vào

và gán lớp phô biến nhất trong số các láng giềng này cho đầu vào đó Việc lựa chọn

giá trị của k ảnh hưởng đáng kê đến hiệu suất của mô hình; k nhỏ có thé khiến mô

hình nhạy cảm với nhiễu, trong khi k lớn có thé làm mờ ranh giới giữa các lớp KNN

là phương pháp phi tham số, không đưa ra giả định về phân phối dữ liệu và hiệu quảtrong các trường hợp ranh giới quyết định không đều Tuy nhiên, kNN có thé tốn kém

về tính toán với các tập dir liệu lớn do cần xác định khoảng cách giữa đầu vào và tat

cả các diém trong tập dir liệu.

1.2.3 Các phương pháp đánh giá hiệu năng của mô hình

Các độ đo như ma trận nhằm lẫn, độ chính xác, độ chính xác dương tính, độ nhạy, độđặc hiệu và điểm trung bình điều hòa F1 thường được sử dụng dé phản ánh hiệu năng

của mô hình Đặc điêm của các thước đo này được khái quát như sau:

1.2.3.1 Ma trận nhằm lẫn

Ma trận nhằm lẫn là một công cụ đánh giá hiệu suất quan trọng trong các bài toán phân loại Nó trình bày một bảng so sánh giữa kết quả phân loại thực tế và kết quả dự

đoán của thuật toán phân loại cho một tập dữ liệu cụ thé Ma trận nay giup chung ta

hiéu rõ về độ chính xác cua mô hình va các loại lôi ma mô hình mặc phải.

Đối với bài toán phân loại nhị phân, ma trận nhằm lẫn được thé hiện như trong Bảng1.1 Trong trường hợp phân loại đa lớp (có nhiều hơn hai lớp), ma trận nhằm lẫn được

mở rộng như minh họa trong Bảng 1.2 Các bảng này cung cấp một cái nhìn tổngquan về hiệu suất của mô hình, cho phép chúng ta đánh giá không chỉ độ chính xáctong thé mà còn cả khả năng phân biệt giữa các lớp khác nhau của mô hình

17

Trang 33

Bang 1.1 Ma trận nham lan trong phân lớp nhị phân

FN

(Lỗi loại II)

Bang 1.2 Ma trận nhằm lẫn trong phân loại da lớp

P (+) TP

Thực tê

Thực tế

Ma trận nhằm lẫn được xây dựng từ các thành phan như sau:

— TP (True Positive) — Mẫu dit liệu của sự kiện ngã, mô hình dự đoán đúng (True)

là sự kiện ngã (Positive) (dự đoán đúng).

— TN (True Negative) — Mẫu dữ liệu của hoạt động bình thường, mô hình dự đoán

đúng (True) là hoạt động bình thường (Negative) (dự đoán đúng).

— FP (False Positive) — Mẫu dữ liệu của hoạt động bình thường, mô hình dự đoán

sai (False) thành sự kiện ngã (Positive) (Lỗi loại I— Dương tính giả).

— FN (False Negative) — Mẫu dữ liệu của sự kiện ngã, mô hình dự đoán sai (False)

thành hoạt động bình thường (Negative) (Lỗi loại II — âm tính giả).

True (T) cho biết thuật toán đã phân loại đúng False (F) cho biết thuật toán đã phân

loại sai Positive (P) cho biết thuật toán đã phân loại đối tượng vào lớp P Negative

(N) cho biết thuật toán đã phân loại đối tượng vào lớp N

18

Trang 34

hiện hoạt động ngã không chính xác Do đó, ACC chỉ phù hợp với bài toán phân loại

cân băng Các chỉ số như độ chính xác dương tính, độ phủ/độ nhạy, độ đặc hiệu và

điểm trung bình điều hòa thường được ưu tiên sử dụng dé đánh giá hiệu suất mô hình

phát hiện ngã một cách chính xác hon.

1.2.3.3 Độ chính xác dương tinh

Độ chính xác đương tính (precision) là một chỉ số quan trọng trong đánh giá hiệu suấtcủa mô hình phân loại, đặc biệt trong FDS Chỉ số này đo lường khả năng của mô

hình trong việc xác định chính xác các trường hợp ngã mà không gây ra các dự đoán

sai Precision được định nghĩa là tỷ lệ giữa số lượng các dự đoán đúng về trường hợpngã (TP) trên tổng số các trường hợp được dự đoán là ngã (bao gồm TP va FP).Precision được xác định theo Công thức (1.2) [60]:

lệ giữa số lượng các trường hợp được phát hiện chính xác (TP) trên tổng số trường

hợp thực tế thuộc lớp cần phát hiện trong bộ dit liệu (bao gồm TP và FN) Recall

được xác định theo Công thức (1.3) [60]:

19

Trang 35

Recall = n (1.3)

Trong bối cảnh của FDS, độ nhạy đo lường khả năng của mô hình trong việc pháthiện tất cả các trường hợp ngã mà không bỏ sót Một giá trị độ nhạy cao cho thấy môhình có khả năng xác định được phần lớn hoặc tất cả các sự kiện ngã thực tế Điềunày đặc biệt quan trọng trong FDS, vì việc bỏ sót một trường hợp ngã có thể dẫn đến

hậu quả nghiêm trọng đôi với sức khỏe và an toàn của người dùng.

1.2.3.5 Độ đặc hiệu

Trong bai toán phát hiện ngã, độ đặc hiệu là một chỉ số quan trọng bổ sung cho độ

nhạy Trong khi độ nhạy đo lường khả năng của mô hình trong việc phát hiện chính

xác các trường hợp ngã (với độ nhạy 100% nghĩa là tất cả các trường hợp ngã đềuđược phát hiện), độ đặc hiệu lại đo lường khả năng của mô hình trong việc xác định

chính xác các trường hợp không ngã.

Độ đặc hiệu (Specificity) được định nghĩa là tỷ lệ giữa số trường hợp được phân loạiđúng là không ngã trên téng số trường hợp thực sự không ngã Nói cách khác, nó chobiết khả năng của mô hình trong việc tránh các cảnh báo sai về ngã Độ đặc hiệu được

tính theo Công thức (1.4) [60]:

TN

TN+FP

Specificity= (1.4)

1.2.3.6 Điểm trung bình điều hòa

Điểm trung bình điều hòa (F1-score) là một chi số đánh giá hiệu suất tổng thể của mô hình phân loại, được tính bằng trung bình điều hòa của hai chỉ số độ chính xác đương

tính và độ nhạy Nó được tính bằng trung bình điều hòa của hai chỉ số này Đây là

một công cụ phô biến dé đánh giá hiệu suất tong thé của mô hình phân loại F1-score

được xác định theo Công thức (1.5) [60]:

(Precision Recall) _ 2.TP

scons (Precision + Recall) 2.TP+FP+FN (1.5)

20

Trang 36

Giá trị Fl-score nam trong khoảng [0, 1], với gia tri cảng cao thể hiện hiệu suất môhình càng tốt Nhiều nghiên cứu sử dung F1-score dé đánh giá hiệu suất của các mô

hình học máy, cả trong phân loại nhị phân và đa lớp [61, 62] Tuy nhiên, F1-score có

hạn chế khi áp dụng cho bộ dữ liệu không cân bằng do cung cấp thông tin khôngchính xác, đặc biệt khi một dự đoán có nhiều TP nhưng ít TN hoặc ngược lại

Dé khắc phục van dé này, các nhà nghiên cứu thường sử dụng hệ số tương quanMatthews (MCC) [60] để đánh giá hiệu suất của các mô hình phân loại trên dữ liệukhông cân bằng MCC cung cấp một giải pháp hiệu qua dé xử lý van đề không cân

bằng dir liệu [63] Ngay cả khi dự đoán có sự chênh lệch giữa TP va TN, MCC vẫn

cho kết quả đánh giá tong thể khách quan và công bằng hơn so với F1-score [60]

1.2.3.7 Hệ số trơng quan Matthew

Hệ số tương quan Matthews (MCC) là một chỉ số thống kê được sử dụng đề đánh giáhiệu suất của mô hình phân loại và hiệu quả trong trường hợp dữ liệu không cân bằng[60] MCC được tính toán dựa trên ma trận nhằm lẫn, theo Biéu thức (1.6) [60]

giá trị -1 cho thấy mô hình dự đoán hoàn toan ngược lại với thực tế.

MCC được đánh giá là một chỉ số thống kê hiệu quả, đáng tin cậy và trung thực Nó

có khả năng phản ánh chính xác các thiếu sót trong dự đoán của mô hình, bat ké tính

chất của bộ dữ liệu [60] Điểm mạnh của MCC là xem xét cân bằng tất cả các thànhphan của ma trận nhằm lẫn (TP, TN, FP, FN), trong khi chỉ số F1 không tính đến sốlượng âm tính thực sự (TN) Do đó, MCC cung cấp cái nhìn toàn diện hơn trong việcđánh giá hiệu suất mô hình Chỉ số MCC sẽ chỉ cao khi mô hình hoạt động tốt trên cảhai yêu tố tích cực và tiêu cực, đảm bảo đánh giá công bằng và chính xác hơn về hiệusuất tông thê của mô hình phân loại

21

Trang 37

1.3 Tình hình nghiên cứu trong và ngoài nước về phát hiện ngã

1.3.1 Một số nghiên cứu trên thế giới

Nhận dạng hoạt động con người đã và đang được nghiên cứu, ứng dụng rộng rãi trong

nhiều lĩnh vực như giao thông, giám sát môi trường và chăm sóc y tế [64, 65] HARkhông chỉ nhận dạng hoạt động cơ bản mà còn đánh giá mức độ hoạt động thể chất,

từ đó đưa ra gợi ý cải thiện lối sống cho người dùng [66, 67]

Trong số các giải pháp phát hiện ngã hiện có, camera là một trong những giải phápđược nghiên cứu nhiều nhiều R Alazrai [48] sử dụng hệ thống hai camera dé dựng

mô hình bộ xương kỹ thuật số và phân tích tư thế Zhang và cộng sự [68] đề xuất mô

hình đi bộ 14 liên kết (FLW) kết hợp hệ thống Vicon và gia tốc kế Tuy nhiên, giảipháp camera đối mặt với thách thức về xử ly đữ liệu lớn, băng thông cao, chi phí lớn

và vấn đề quyền riêng tư [69] Liu và cộng sự [70] đề xuất mô hình T-C3D, một kiếntrúc CNN đa cấp nhằm giảm chi phí tính toán trong nhận dang hoạt động Nghiên cứucủa Xiangbo [71] phát triển ETDA-Net bao gồm hai phần: xử lý tín hiệu loại bỏ nhiễu

và phân loại dựa trên cau trúc AlexNet, được tối ưu tự động băng NVIDIA DIGITS

6 Tác giả triển khai hai loại hệ thống: FDS phòng vệ sinh dựa trên so sánh độ sáng

tại các vùng nguy hiểm và FDS phòng khách sử dụng camera Kinect kết hợp với tựđộng nhận dạng độ cao dé chọn phương pháp phát hiện phù hợp

Mặc dù hệ thống camera trong phát hiện ngã có nhiều ưu điểm nhưng chúng vẫn đốimặt với nhiều thách thức Hệ thống đòi hỏi khả năng xử lý đữ liệu lớn, băng thôngRỘNG và năng lực tính toán mạnh Điều này làm tăng chi phí lắp đặt, vận hành vàkhó khăn trong việc triển khai Đặc biệt, khi áp dụng tại gia đình, vẫn đề bảo vệ quyền

riêng tư trở nên nhạy cảm Những rào cản này hạn chế khả năng ứng dụng rộng rãi

của công nghệ camera trong FDS.

Ngoài giải pháp sử dụng camera, các cảm biến áp suất sàn cũng là một hướng nghiêncứu được quan tam Cảm biến này hoạt động dựa trên nguyên lý áp điện dé phát hiệnrung động khi ngã [72] Tuy nhiên, biên độ rung động biến đổi theo loại sàn, gây khó

22

Trang 38

khăn trong thiết lập ngưỡng phát hiện M Alwan và cộng sự [73] đề xuất mạng cảmbiến địa chan đề giảm báo động giả, nhưng quá trình cài đặt, thử nghiệm vẫn rat phứctạp trong triển khai thực tế.

Một hướng tiếp cận khác đáng chú ý là sử dụng công nghệ cảm biến siêu âm, pháthiện ngã bang cách do sự thay đổi độ cao dựa trên nguyên ly Time of Flight (ToF)[74, 75] Dù Y Huang và K Newman [76] từng thử nghiệm đặt cảm biến trên trầnnhà, độ chính xác chưa cao Dùng nhiều cảm biến hơn [74, 75] có thể cải thiện hiệusuất, nhưng phức tạp trong lắp đặt và phụ thuộc môi trường Tương tự, cảm biến hồngngoại thụ động (PIR) nhận diện chuyên động dựa trên bức xạ hồng ngoại [77], songphạm vi hạn chế và nhạy cảm với môi trường làm giảm tính ứng dụng thực tế của

công nghệ này Li và cộng sự [78] sử dung dt liệu ADL dựa trên radar với nhãn thưa

thớt, gây khó khăn cho mô hình trong việc tổng quát hóa Ho đề xuất mô hình

JDS-TL trích rút đặc trưng từ dữ liệu phổ Doppler Tuy nhiên, lắp đặt và hiệu chỉnh hệthống radar phức tạp, đòi hỏi người có chuyên môn cao trong thiết kế, thi công

Internet of Things (IoT) dang được ứng dụng rộng rãi trong đời sông và đã bước đầu

triển khai cho bài toán FDS [79] Công nghệ này có ưu điểm như khả năng xử lý dữ

liệu tiên tiến, kênh liên lạc hiệu quả và tích hợp cảm biến thông minh [16, 80] Sựxuất hiện của mạng 5G với tốc độ cao và độ trễ thấp mở ra triển vọng phát triển các

hệ thống IoT hiệu quả hơn [81, 82] Tuy nhiên, các hệ thống IoT hiện tại vẫn đối mặtvới nhiều thách thức như kiến trúc phần cứng công kénh gây bat tiện cho người dùng[47], nguồn cấp cho hệ thống này còn khó khăn và việc kết hợp IoT với 5G trong

FDS đòi hỏi chỉ phí lớn và hạ tầng kỹ thuật phức tạp.

1.3.2 Một số nghiên cứu ở Việt Nam

Ở Việt Nam, nhóm tác giả Phạm Văn Cường ở Học viện Công nghệ Bưu chính Viễn

thông đã có nhiều đóng góp quan trọng trong lĩnh vực nhận dạng hoạt động và phát

hiện ngã Trong [83], nhóm đề xuất phương pháp sử dụng cảm biến Wii Remotes đeo

trên cổ tay và hông đề thu thập dữ liệu, trích rút 58 đặc trưng từ tín hiệu gia tốc và

23

Trang 39

dùng mô hình Markov ân (HMM) dé nhận dạng 13 hoạt động khác nhau, bao gồm cảngã Tiếp theo, trong [84], họ phát trién mô hình CNN-LSTM để phát hiện vận độngbat thường từ dit liệu đa cảm biến thé (gia tốc, con quay, từ tính) Mô hình CNN học

và biểu diễn đặc trưng từ dir liệu cảm biến theo không gian, còn LSTM dùng đặctrưng theo thời gian đề suy diễn hành vi Trong [85], nhóm áp dụng quy trình gồmbốn bước (xử lý dữ liệu, phân đoạn, trích rút đặc trưng và phân loại) sử dụng dữ liệugia tốc từ Samsung Galaxy Note II Từ tín hiệu gia tốc kế, hệ thống trích rút một loạtđặc trưng (không nêu rõ số lượng) được sử dụng cho các HMM và thuật toán DT

C4.5 Gần đây, nhóm tác giả Phạm Văn Cường [86] đề xuất mô hình học sâu kết hợp

tăng cường đữ liệu và lấy mẫu lại dé khắc phục khó khăn về dữ liệu ngã trong thégiới thực Họ sử dụng TCN va TAM để trích rút đặc trưng và phát hiện ngã từ nhiều

bộ dữ liệu khác nhau, đồng thời áp dụng học đa tác vụ dé thu hẹp khoảng cách hiệu

suất giữa dữ liệu mô phỏng và thực tế Tại Đại học Bách khoa Hà Nội, nhóm của

Trần Thị Thanh Hải [87] sử dụng camera 3D (Kinect) để phát hiện ngã từ dữ liệu

hình ảnh Tuy nhiên, hệ thống này có chỉ phí cao và khó áp dụng trong thực tế vì có thé nhiều đối tượng hoạt động trong vùng camera giám sát.

Ở Đại học Quốc gia Thành phố Hồ Chí Minh, nhóm nghiên cứu Đào Vũ Trường Sơn

và cộng sự [26] đề xuất thuật toán GWO và APGWO đề chọn đặc trưng quan trọngcho EDS, sau đó huấn luyện các mô hình học máy (LR, kNN, SVM, DT, NB, RF,MLP) cho bài toán phân loại nhị phan Kết quả, họ đã chọn 17 đặc trưng (bằng GWO)

và 14 đặc trưng (bang APGWO) từ 16 đặc trưng giúp đạt độ chính xác 99% và điểm

Fl 96% T.V Ha và cộng sự [88] chuẩn hóa dữ liệu cảm biến dé đạt giá trị trung bình

0 và độ lệch chuẩn 1, trích rút 28 đặc trưng, kết hợp CNN cho đữ liệu hình ảnh và sử

dụng XGBoost, CatBoost, cùng mạng nơ-ron sâu để phân loại hoạt động

Nhìn chung, các giải pháp phát hiện ngã dựa trên camera và cảm biến môi trườngmặc dù cho kết quả khả quan, nhưng vẫn gặp nhiều hạn chế như chỉ phí cao, độ phứctạp trong triển khai, thách thức về quyền riêng tư và độ chính xác phụ thuộc môitrường Một số nghiên cứu đã lựa chọn SP cho bài toán nhận dạng hoạt động nhưng

24

Trang 40

mới dừng lại ở phương pháp phân loại nhị phân [10, 15, 24, 26, 28] hoặc là phân loại các hoạt động hàng ngày [89-92] mà chưa phân loại các sự kiện ngã Vì vậy, nghiên

cứu sinh lựa chọn phát triển FDS dựa trên SP cho bài toán phân loại đa lớp, bao gồmnhiều sự kiện ngã, hướng đến ứng dụng thực tiễn

1.4 Khoảng trống nghiên cứu và đề xuất giải pháp

1.4.1 Dinh hướng nghiên cứu

Luận án lựa chọn điện thoại thông minh làm cơ sở dé phát triển hệ thống phát hiệnngã do tính phô biến và tiềm năng triển khai rộng rãi mà không cần dau tư thêm thiết

bị chuyên dụng Điện thoại thông minh tích hợp nhiều cảm biến, dé dang cài đặt ứng

dụng, cập nhật phần mềm và hỗ trợ kết nối đa dạng (Wi-Fi, 4G, 5G, SMS, BLE,NEC), tạo điều kiện thuận lợi cho việc gửi cảnh báo khi phát hiện ngã [7, 9-11]

Tuy nhiên, việc triển khai hệ thống phát hiện ngã trên SP gặp một số khó khăn nhấtđịnh Thiết bị phải chia sẻ tài nguyên xử lý và bộ nhớ cho các ứng dụng khác, trongkhi việc thu thập và xử lý dữ liệu liên tục từ cảm biến đòi hỏi tài nguyên đáng kê Khi

sử dụng nhiều loại cảm biến sẽ làm tăng độ phức tạp của hệ thống và tăng chỉ phí tínhtoán [16, 17], ảnh hưởng đến hiệu suất và thời lượng pin của thiết bị Thêm vào đó,

vị trí đặt điện thoại thay đổi theo thói quen người dùng khiến chất lượng dữ liệu thu

thập không ôn định, ảnh hưởng đến độ chính xác của hệ thống.

Dé giải quyết các thách thức đó, luận án đề xuất chỉ sử dung cảm biến gia tốc nhằmgiảm tiêu thụ năng lượng, đơn giản hóa hệ thống, giảm chỉ phí tính toán và tối ưu quátrình xử lý dữ liệu Tuy nhiên, việc chỉ sử dụng cảm biến gia tốc có thể hạn chế khảnăng ghi nhận các chuyên động phức tạp của người dùng so với khi kết hợp nhiềuloại cảm biến Do đó, luận án tập trung vào ba giải pháp: (i) tiền xử lý dữ liệu, (ii)trích rút đặc trưng toàn diện va (iii) tối ưu mô hình RF Mục tiêu là phát triển một hệ

thông đơn cảm biên có hiệu năng tương đương với các hệ thông đa cảm biên.

25

Ngày đăng: 25/01/2025, 15:19

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w