CÁCH TIẾ P C ẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨ U
Đối tượng nghiên cứ u
- Mô hình hồi quy đơn
- Mô hình hồi quy bội
- Tìm hiểu mô hình ANN
- Tìm hiểu mô hình kết hợp hồi quy và ANN
- Áp dụng hồi quy tuyến tính, mô hình ANN, mô hình kết hợp hồi quy và ANN vào dựbáo
- Xây dựng ứng dụng demo dựđoán các tập dữ liệu.
TỔNG QUAN VÀ Ứ NG D Ụ NG
CÁC BƯỚC CƠ BẢN ĐỂ TI ẾN HÀNH TRONG MỘ T D Ự BÁO
1.5 Dữ liệu và phương pháp dùng trong dựbáo
Chương 2: CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME SERIES
2.1 Các mô típ có thể xuất hiện
2.2 Các cách thể hiện dữ liệu dưới dạng time series
Chương 3: CÁC CÔNG CỤ SỬ DỤNG CHO VIỆC DỰĐOÁN
3.1 Các phương pháp dựđoán đơn giản
3.2 Chuyển đổi và điều chỉnh (Transformation and adjustment)
Chương 4: MÔ HÌNH HỒI QUY
4.3 Mô hình hồi quy theo thời gian
Chương 5: MÔ HÌNH MẠNG NEURON NHÂN TẠO (ANN)
5.1 Lịch sửphát triển của neuron nhân tạo
Chương 6: MÔ HÌNH KẾT HỢP HỒI QUY VÀ MẠNG NEURON NHÂN TẠO 6.1 Giới thiệu mô hình
6.2 Tính sai sốtoàn phương trung bình(MSE) và trọng số ( )
CHƯƠNG 7: ĐÁNH GIÁ BẰNG THỰC NGHIỆM
7.2 Các tập dữ liệu dùng trong thực nghiệm
7.3 Các trường hợp thực nghiệm
1.1 TÍNH CẤP THIẾT CỦA ĐỀTÀI 1
1.3 CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU 1
Chương 1: TỔNG QUAN VÀ ỨNG DỤNG 3
1.3 MACHINE LEARING ĐƯỢC ỨNG DỤNG VÀO NHỮNG VIỆC GÌ? 3
1.4 CÁC BƯỚC CƠ BẢN ĐỂ TIẾN HÀNH TRONG MỘT DỰBÁO 4
1.5 DỮ LIỆU VÀ PHƯƠNG PHÁP DÙNG TRONG DỰBÁO 5
Chương 2: CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME
2.1 CÁC MÔ TÍP CÓ THỂ XUẤTHIỆN 6
2.2 CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME SERIES 7
Chương 3: CÁC CÔNG CỤ SỬ DỤNG CHO VIỆC DỰ ĐOÁN 10
3.1 CÁC PHƯƠNG PHÁP DỰĐOÁN ĐƠN GIẢN 10
3.2 CHUYỂN ĐỔI VÀ ĐIỀU CHỈNH (Transformation and Adjustment) 12
Chương 4: MÔ HÌNH HỒI QUY 16
4.3 MÔ HÌNH HỒI QUY THEO THỜI GIAN 51
Chương 5: MÔ HÌNHMẠNG NEURON NHÂN TẠO (ANN) 64
5.1 LỊCH SỬPHÁT TRIỂN CỦA NEURON NHÂN TẠO 64
Chương 6: MÔ HÌNH KẾT HỢP HỒI QUY VÀMẠNG NEURON NHÂN
6.2 TÍNH SAI SỐ TOÀN PHƯƠNG TRUNG BÌNH (MSE) và trọng số ( ) 90
CHƯƠNG 7: ĐÁNH GIÁ BẰNG THỰC NGHIỆM 91
7.2 CÁC TẬP DỮ LIỆU DÙNG TRONG THỰC NGHIỆM 91
7.3 CÁC TRƯỜNG HỢP THỰC NGHIỆM 100
DANH MỤC TÀI LIỆU THAM KHẢO 113
KẾ HOẠCH THỰC HIỆN LUẬN VĂN 114
Hình 1 Biểu đồlượng bia sản xuất hàng tháng tại Úc (1956-1990) 6
Hình 2 Biểu đồ dựđoán lượng bia sản xuất hàng tháng tại Úc 6
Hình 3 Biểu đồgiá chứng khoán của công ty IBM 7
Hình 4 Biểu đồ dựđoán lượng bia sản xuất hàng tháng tại Úc 7
Hình 5 Biểu đồtương quan giữa lượng điện tiêu thụ so với nhiệt độhàng ngày 8
Hình 6 Biểu đồtương quan lượng điện tiêu thụ giữa ngày hiện tại so với trước đó 2 ngày 8
Hình 7 Biểu đồtương quan lượng điện tiêu thụ của ngày hiện tại so với những ngày trước đó 9
Hình 8 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp trung bình 10
Hình 9 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp Nạve 11
Hình 10 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp
Hình 11 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp
Hình 12 Biểu đồ dựđoán sản lượng sản xuất bia tại Úc trước khi Adjustment 13
Hình 13 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc sau khi dùng Log
Hình 14 Biểu đồ dựđoán sản lượng sản xuất bia tại Úc trước khi dùng Log
Hình 15Mô hình hồi quy đơn 17
Hình 16Hàm hồi quy mẫu và phần dư 21
Hình 19Mô hình dựđoán ví dụ 4.3.1 54
Hình 20 Mô hình dựbáo ví dụ 4.3.2 63
Hình 21 Cấu trúc neuron sinh vật 65
Hình 30 Mạng truyền thẳng nhiều lớp 67
Hình 23 Cấu trúc neuron nhân tạo 69
Hình 24 Đồ thị biểu thịhàm tuyến tính 70
Hình 25 Đồ thị biểu thịhàm sigmoid 71
Hình 26 Đồ thị biểu thịhàm tanh 72
Hình 27 Đồ thị biểu diễn hàm ReLU 73
Hình 28 Đồ thị biểu diễn hàm dấu sgn 73
Hình 29 Các dạng học tham số 74
Hình 31Mô hình cơ chế hoạt động của ANN 80
Hình 32Mô hình kết hợp hồi quy và mạng neuron nhân tạo 89
Hình 33 Biểu đồ thể hiện tập dữ liệu Air quality data set 93
Hình 34 Biểu đồ biểu hiện tập dữ liệu Jena_climate_2009_2016 94
Hình 35 Biểu đồ biểu diễn tập dữ liệu Appliance energy prediction 97
Hình 36 Biểu đồ biểu diễn tập dữ liệu Occupancy Detection Data Set 98
Bảng 2 Bảng xửlí số liệu ví dụ 4.1.1.2 18
Bảng 3 Bảng xửlí số liệu ví dụ 4.1.2.2 22
Bảng 4 Bảng xửlí số liệu ví dụ 4.1.2.2 25
Bảng 5 Xửlí số liệu ví dụ 4.1.3.2 29
Bảng 7 Bảng xửlí ví dụ 4.2.2.1 39
Bảng 8 Xửlí số liệu ví dụ 4.2.3.1 46
Bảng 9 Bảng số liệu ví dụ 4.3.1 52
Bảng 10 Bảng xửlý số liệu vídụ 4.3.1 52
Bảng 11 Bảng xửlí số liệu 4.3.1 55
Bảng 12 7 giá trịđầu của bảng số liệu ví dụ 4.3.1 59
Bảng 13 Bảng dữ liệu tuyển sinh (1998-2017) 83
Bảng 14 Dữ liệu tuyển sinh từnăm 1988 đến 2017 của Trung tâm 85
Bảng 15 Xửlí dữ liệu tuyển sinh từnăm 1988 đến 2017 của Trung tâm 86
Bảng 16 Bảng tóm tắt tập dữ liệu 99
Bảng 17 Giá trị thực nghiệm của tệp dữ liệu Air quality trên mô hình ANN với k thay đổi 102
Bảng 18 Giá trị thực nghiệm của tệp dữ liệu Air quality trên mô hình ANN với epoch thay đổi 102
Bảng 19 Giá trị sai số của tập dữ liệu Air Quality cho 3 mô hình thực nghiệm 103
Bảng 20 Thời gian thực thi của tập dữ liệu Air Quality cho 3 mô hình thực nghiệm 103
Bảng 21 Giá trị thực nghiệm của tệp dữ liệu Jena_climate_2009_2016 trên mô hình ANN với k thay đổi 104
Bảng 22 Giá trị chạy thực nghiệm của tệp dữ liệu Jena_climate_2009_2016 trên mô hình ANN với epoch thay đổi 105
Bảng 23 Giá trị sai số của tập dữ liệu Jena_climate_2009_2016 trên 3 mô hình thực nghiệm 106
Bảng 24 Thời gian thực thi của tập dữ liệu Jena_climate_2009_2016 trên 3 mô hình thực nghiệm 106
Bảng 25 Giá trị thực nghiệm của tệp dữ liệu Appliances energy prediction trên mô hình ANN với k thay đổi 107
Bảng 26 Giá trị thực nghiệm của tệp dữ liệu Appliances energy prediction trên mô hình ANN với epoch thay đổi 107
Bảng 27 Giá trị sai số của tập dữ liệu Appliances energy prediction trên 3 mô hình thực nghiệm 108
Bảng 28 Thời gian thực thi của tập dữ liệu Appliances energy prediction trên
Bảng 29 Giá trị thực nghiệm của tệp dữ liệu Occupancy Detection Data Set trên mô hình ANN với k thay đổi 109
Bảng 30 Giá trị thực nghiệm của tệp dữ liệu Occupancy Detection Data Set trên mô hình ANN với epoch thay đổi 110
Bảng 31 Giá trị sai số của tập dữ liệu Occupancy Detection trên 3 mô hình thực nghiệm 111
Bảng 32 Thời gian thực thi của tập dữ liệu Occupancy Detection trên 3 mô hình thực nghiệm 111
1.1 TÍNH CẤP THIẾT CỦA ĐỀTÀI
Ngày nay, sự phát triển của Internet, mạng xã hội và thiết bị di động dẫn đến sự gia tăng dữ liệu toàn cầu Dữ liệu được tạo ra liên tục, vì vậy ứng dụng công nghệ thông tin trong kinh doanh và quản lý là rất cần thiết Dự báo dữ liệu theo chuỗi thời gian giúp các cơ quan và doanh nghiệp định hướng phát triển tương lai dựa trên số liệu quá khứ.
Nhóm chúng tôi đã chọn đề tài “Tìm hiểu mô hình hồi quy và ứng dụng trong dự báo dữ liệu chuỗi thời gian” để giới thiệu về các mô hình hồi quy và mạng neuron nhân tạo (ANN) Bài viết sẽ khám phá sự kết hợp giữa mô hình hồi quy và ANN, cũng như cung cấp cái nhìn cơ bản về chuỗi thời gian, dự báo và ứng dụng của chúng trong việc dự báo dữ liệu chuỗi thời gian.
Nghiên cứu áp dụng mô hình hồi quy, mô hình ANN và mô hình kết hợp hồi quy với ANN trong dựbáo dữ liệu chuỗi thời gian
Mô hình hồi quy chuỗi thời gian giúp chúng ta ước lượng và dự báo giá trị trung bình của các biến phụ thuộc dựa trên giá trị của biến giải thích, từ đó xác định mối quan hệ giữa các biến Việc này không chỉ giúp hiểu rõ bản chất của hiện tượng mà còn tìm ra các biện pháp khắc phục hiệu quả Bằng cách áp dụng kiến thức này, chúng ta có thể xây dựng mô hình Demo để dự đoán các tập dữ liệu một cách chính xác.
1.3 CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU
- Mô hình hồi quy đơn
- Mô hình hồi quy bội
- Tìm hiểu mô hình ANN
- Tìm hiểu mô hình kết hợp hồi quy và ANN
- Áp dụng hồi quy tuyến tính, mô hình ANN, mô hình kết hợp hồi quy và ANN vào dựbáo
- Xây dựng ứng dụng demo dựđoán các tập dữ liệu
Gồm 03 phương pháp nghiên cứu khoa học để tiếp cận và làm rõ những vấn đề của đề tài. Đó là các phương pháp nghiên cứu sau:
Phương pháp phân tích và tổng hợp lý thuyết bao gồm việc nghiên cứu các tài liệu liên quan đến mô hình hồi quy tuyến tính, mô hình ANN, và sự kết hợp giữa hai mô hình này để dự báo Qua việc phân tích, chúng ta có thể hiểu sâu sắc từng vấn đề, đồng thời tổng hợp thông tin để có cái nhìn toàn diện và đầy đủ về các vấn đề cần nghiên cứu.
Phương pháp thực nghiệm khoa học bao gồm việc chủ động thu thập và tìm kiếm tập dữ liệu bằng công cụ Python Sử dụng mô hình hồi quy tuyến tính để dự báo và mô hình ANN để cải thiện độ chính xác, kết hợp cả hai mô hình này trong quá trình dự báo nhằm đạt được kết quả tốt nhất.
Phương pháp phân tích và tổng kết kinh nghiệm bao gồm việc nghiên cứu, phân tích và đánh giá các mô hình đã xây dựng Qua đó, chúng ta có thể từng bước phát triển một mô hình phù hợp nhất, với độ tin cậy và chính xác cao hơn.
1.4 KẾT QUẢĐẠT ĐƯỢC Áp dựng các kiến thức đã tìm hiểu Xây dựng App demo đểcó thể dễdàng dựbáo kết quả mong muốn
Chương 1: TỔNG QUAN VÀ ỨNG DỤNG 1.1 MACHINE LEARNING LÀ GÌ?
Machine Learning là một công nghệ cho phép máy tính học hỏi từ dữ liệu mà không cần lập trình cụ thể Nó hoạt động thông qua việc lặp lại quá trình học tập và có khả năng thích nghi với dữ liệu mới.
Forecasting là một quá trình đưa ra các số liệu để dựbáo cho một vấn đề cần có quyết định trong tương lai [1]
1.3 MACHINE LEARING ĐƯỢC ỨNG DỤNG VÀO NHỮNG VIỆC GÌ?
Hầu hết mọi ngành công nghiệp đang làmviệc với hàm lượng lớn dữ liệu đều sử dụng công nghệ Machine Learning. ã Cỏc dịch vụ tài chớnh
Ngân hàng và doanh nghiệp tài chính áp dụng công nghệ Machine Learning nhằm hai mục tiêu chính: xác định insights từ dữ liệu và ngăn chặn lừa đảo Công nghệ này giúp phát hiện cơ hội đầu tư và thông báo cho nhà đầu tư về thời điểm giao dịch hợp lý Ngoài ra, data mining còn có khả năng nhận diện khách hàng có hồ sơ rủi ro cao và sử dụng giám sát mạng để phát hiện các tín hiệu lừa đảo.
Các tổ chức chính phủ liên quan đến an ninh cộng đồng và tiện ích xã hội sở hữu nguồn dữ liệu phong phú có thể khai thác để thu được những thông tin quý giá Việc phân tích dữ liệu cảm biến giúp chính phủ nâng cao hiệu quả dịch vụ và tiết kiệm chi phí Ngoài ra, Machine Learning còn hỗ trợ trong việc phát hiện gian lận và giảm thiểu nguy cơ trộm cắp danh tính.
Machine Learning đang trở thành một xu hướng phát triển mạnh mẽ trong ngành chăm sóc sức khỏe, nhờ vào sự xuất hiện của các thiết bị và máy cảm ứng đeo được, giúp thu thập và phân tích dữ liệu hiệu quả.
Công nghệ Machine Learning đóng vai trò quan trọng trong việc đánh giá tình hình sức khỏe của bệnh nhân theo thời gian thực, giúp các chuyên gia y tế nhận diện các xu hướng và tín hiệu cần thiết để nâng cao hiệu quả điều trị và chẩn đoán bệnh.
Các trang web thương mại điện tử hiện nay sử dụng Machine Learning để phân tích hành vi mua hàng trước đây, từ đó đưa ra những gợi ý về sản phẩm mà khách hàng có thể quan tâm Khả năng thu thập và phân tích dữ liệu giúp cá nhân hóa trải nghiệm mua sắm và tối ưu hóa các chiến dịch marketing, đánh dấu một bước tiến quan trọng trong tương lai của ngành bán lẻ.
Tìm kiếm nguồn nguyên liệu mới và phân tích các mỏ dầu dưới đất là những bước quan trọng trong ngành công nghiệp Dự đoán tình trạng thất bại của bộ cảm biến lọc dầu giúp nâng cao hiệu quả sản xuất Sắp xếp các kênh phân phối không chỉ đạt hiệu quả mà còn tiết kiệm chi phí Sự ứng dụng của Machine Learning trong ngành công nghiệp dầu khí đang gia tăng mạnh mẽ và mở rộng ra nhiều lĩnh vực khác nhau.
Phân tích dữ liệu và xác định các xu hướng là yếu tố then chốt trong ngành vận tải, giúp tối ưu hóa hiệu suất trên từng tuyến đường và dự đoán các vấn đề tiềm ẩn nhằm tăng cường lợi nhuận Machine Learning đóng vai trò quan trọng trong việc phân tích dữ liệu và xây dựng mô hình, hỗ trợ các doanh nghiệp vận chuyển, vận tải công cộng và các tổ chức vận tải khác.
1.4 CÁC BƯỚC CƠ BẢN ĐỂ TIẾN HÀNH TRONG MỘT DỰBÁO
- Sử dụng và đánh giá mô hình
CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME
CÁC CÔNG CỤ SỬ DỤNG CHO VIỆC DỰ ĐOÁN
MÔ HÌNH HỒ I QUY
MÔ HÌNH M ẠNG NEURON NHÂN TẠ O (ANN)
MÔ HÌNH KẾ T H Ợ P H ỒI QUY VÀ M ẠNG NEURON NHÂN
ĐÁNH GIÁ BẰ NG TH Ự C NGHI Ệ M
K Ế T QU Ả TH Ự C NGHI Ệ M
ĐÓNG GÓP CỦA ĐỀ TÀI
1.1 TÍNH CẤP THIẾT CỦA ĐỀTÀI 1
1.3 CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU 1
Chương 1: TỔNG QUAN VÀ ỨNG DỤNG 3
1.3 MACHINE LEARING ĐƯỢC ỨNG DỤNG VÀO NHỮNG VIỆC GÌ? 3
1.4 CÁC BƯỚC CƠ BẢN ĐỂ TIẾN HÀNH TRONG MỘT DỰBÁO 4
1.5 DỮ LIỆU VÀ PHƯƠNG PHÁP DÙNG TRONG DỰBÁO 5
Chương 2: CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME
2.1 CÁC MÔ TÍP CÓ THỂ XUẤTHIỆN 6
2.2 CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME SERIES 7
Chương 3: CÁC CÔNG CỤ SỬ DỤNG CHO VIỆC DỰ ĐOÁN 10
3.1 CÁC PHƯƠNG PHÁP DỰĐOÁN ĐƠN GIẢN 10
3.2 CHUYỂN ĐỔI VÀ ĐIỀU CHỈNH (Transformation and Adjustment) 12
Chương 4: MÔ HÌNH HỒI QUY 16
4.3 MÔ HÌNH HỒI QUY THEO THỜI GIAN 51
Chương 5: MÔ HÌNHMẠNG NEURON NHÂN TẠO (ANN) 64
5.1 LỊCH SỬPHÁT TRIỂN CỦA NEURON NHÂN TẠO 64
Chương 6: MÔ HÌNH KẾT HỢP HỒI QUY VÀMẠNG NEURON NHÂN
6.2 TÍNH SAI SỐ TOÀN PHƯƠNG TRUNG BÌNH (MSE) và trọng số ( ) 90
CHƯƠNG 7: ĐÁNH GIÁ BẰNG THỰC NGHIỆM 91
7.2 CÁC TẬP DỮ LIỆU DÙNG TRONG THỰC NGHIỆM 91
7.3 CÁC TRƯỜNG HỢP THỰC NGHIỆM 100
DANH MỤC TÀI LIỆU THAM KHẢO 113
KẾ HOẠCH THỰC HIỆN LUẬN VĂN 114
Hình 1 Biểu đồlượng bia sản xuất hàng tháng tại Úc (1956-1990) 6
Hình 2 Biểu đồ dựđoán lượng bia sản xuất hàng tháng tại Úc 6
Hình 3 Biểu đồgiá chứng khoán của công ty IBM 7
Hình 4 Biểu đồ dựđoán lượng bia sản xuất hàng tháng tại Úc 7
Hình 5 Biểu đồtương quan giữa lượng điện tiêu thụ so với nhiệt độhàng ngày 8
Hình 6 Biểu đồtương quan lượng điện tiêu thụ giữa ngày hiện tại so với trước đó 2 ngày 8
Hình 7 Biểu đồtương quan lượng điện tiêu thụ của ngày hiện tại so với những ngày trước đó 9
Hình 8 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp trung bình 10
Hình 9 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp Nạve 11
Hình 10 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp
Hình 11 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp
Hình 12 Biểu đồ dựđoán sản lượng sản xuất bia tại Úc trước khi Adjustment 13
Hình 13 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc sau khi dùng Log
Hình 14 Biểu đồ dựđoán sản lượng sản xuất bia tại Úc trước khi dùng Log
Hình 15Mô hình hồi quy đơn 17
Hình 16Hàm hồi quy mẫu và phần dư 21
Hình 19Mô hình dựđoán ví dụ 4.3.1 54
Hình 20 Mô hình dựbáo ví dụ 4.3.2 63
Hình 21 Cấu trúc neuron sinh vật 65
Hình 30 Mạng truyền thẳng nhiều lớp 67
Hình 23 Cấu trúc neuron nhân tạo 69
Hình 24 Đồ thị biểu thịhàm tuyến tính 70
Hình 25 Đồ thị biểu thịhàm sigmoid 71
Hình 26 Đồ thị biểu thịhàm tanh 72
Hình 27 Đồ thị biểu diễn hàm ReLU 73
Hình 28 Đồ thị biểu diễn hàm dấu sgn 73
Hình 29 Các dạng học tham số 74
Hình 31Mô hình cơ chế hoạt động của ANN 80
Hình 32Mô hình kết hợp hồi quy và mạng neuron nhân tạo 89
Hình 33 Biểu đồ thể hiện tập dữ liệu Air quality data set 93
Hình 34 Biểu đồ biểu hiện tập dữ liệu Jena_climate_2009_2016 94
Hình 35 Biểu đồ biểu diễn tập dữ liệu Appliance energy prediction 97
Hình 36 Biểu đồ biểu diễn tập dữ liệu Occupancy Detection Data Set 98
Bảng 2 Bảng xửlí số liệu ví dụ 4.1.1.2 18
Bảng 3 Bảng xửlí số liệu ví dụ 4.1.2.2 22
Bảng 4 Bảng xửlí số liệu ví dụ 4.1.2.2 25
Bảng 5 Xửlí số liệu ví dụ 4.1.3.2 29
Bảng 7 Bảng xửlí ví dụ 4.2.2.1 39
Bảng 8 Xửlí số liệu ví dụ 4.2.3.1 46
Bảng 9 Bảng số liệu ví dụ 4.3.1 52
Bảng 10 Bảng xửlý số liệu vídụ 4.3.1 52
Bảng 11 Bảng xửlí số liệu 4.3.1 55
Bảng 12 7 giá trịđầu của bảng số liệu ví dụ 4.3.1 59
Bảng 13 Bảng dữ liệu tuyển sinh (1998-2017) 83
Bảng 14 Dữ liệu tuyển sinh từnăm 1988 đến 2017 của Trung tâm 85
Bảng 15 Xửlí dữ liệu tuyển sinh từnăm 1988 đến 2017 của Trung tâm 86
Bảng 16 Bảng tóm tắt tập dữ liệu 99
Bảng 17 Giá trị thực nghiệm của tệp dữ liệu Air quality trên mô hình ANN với k thay đổi 102
Bảng 18 Giá trị thực nghiệm của tệp dữ liệu Air quality trên mô hình ANN với epoch thay đổi 102
Bảng 19 Giá trị sai số của tập dữ liệu Air Quality cho 3 mô hình thực nghiệm 103
Bảng 20 Thời gian thực thi của tập dữ liệu Air Quality cho 3 mô hình thực nghiệm 103
Bảng 21 Giá trị thực nghiệm của tệp dữ liệu Jena_climate_2009_2016 trên mô hình ANN với k thay đổi 104
Bảng 22 Giá trị chạy thực nghiệm của tệp dữ liệu Jena_climate_2009_2016 trên mô hình ANN với epoch thay đổi 105
Bảng 23 Giá trị sai số của tập dữ liệu Jena_climate_2009_2016 trên 3 mô hình thực nghiệm 106
Bảng 24 Thời gian thực thi của tập dữ liệu Jena_climate_2009_2016 trên 3 mô hình thực nghiệm 106
Bảng 25 Giá trị thực nghiệm của tệp dữ liệu Appliances energy prediction trên mô hình ANN với k thay đổi 107
Bảng 26 Giá trị thực nghiệm của tệp dữ liệu Appliances energy prediction trên mô hình ANN với epoch thay đổi 107
Bảng 27 Giá trị sai số của tập dữ liệu Appliances energy prediction trên 3 mô hình thực nghiệm 108
Bảng 28 Thời gian thực thi của tập dữ liệu Appliances energy prediction trên
Bảng 29 Giá trị thực nghiệm của tệp dữ liệu Occupancy Detection Data Set trên mô hình ANN với k thay đổi 109
Bảng 30 Giá trị thực nghiệm của tệp dữ liệu Occupancy Detection Data Set trên mô hình ANN với epoch thay đổi 110
Bảng 31 Giá trị sai số của tập dữ liệu Occupancy Detection trên 3 mô hình thực nghiệm 111
Bảng 32 Thời gian thực thi của tập dữ liệu Occupancy Detection trên 3 mô hình thực nghiệm 111
1.1 TÍNH CẤP THIẾT CỦA ĐỀTÀI
Ngày nay, sự phát triển của Internet, mạng xã hội và thiết bị di động đã dẫn đến một lượng dữ liệu khổng lồ được sinh ra liên tục Việc ứng dụng công nghệ thông tin vào kinh doanh và quản lý trở nên cần thiết hơn bao giờ hết Dự báo dữ liệu theo chuỗi thời gian giúp các cơ quan và doanh nghiệp định hướng phát triển tương lai dựa trên số liệu quá khứ.
Nhóm chúng tôi đã chọn đề tài “Tìm hiểu mô hình hồi quy và ứng dụng trong dự báo dữ liệu chuỗi thời gian” nhằm giới thiệu các mô hình hồi quy và mạng neuron nhân tạo (ANN) Bài viết sẽ khám phá sự kết hợp giữa hai mô hình này, đồng thời cung cấp kiến thức cơ bản về chuỗi thời gian, quy trình dự báo và ứng dụng của chúng trong việc dự báo dữ liệu chuỗi thời gian.
Nghiên cứu áp dụng mô hình hồi quy, mô hình ANN và mô hình kết hợp hồi quy với ANN trong dựbáo dữ liệu chuỗi thời gian
Mô hình hồi quy chuỗi thời gian giúp chúng ta ước lượng và dự báo giá trị trung bình của các biến phụ thuộc dựa trên biến giải thích, từ đó xác định mức độ quan hệ giữa các biến Qua đó, chúng ta có thể hiểu rõ hơn về bản chất của hiện tượng và tìm ra các biện pháp khắc phục Việc áp dụng kiến thức này để xây dựng mô hình Demo sẽ hỗ trợ trong việc dự đoán các tập dữ liệu hiệu quả.
1.3 CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU
- Mô hình hồi quy đơn
- Mô hình hồi quy bội
- Tìm hiểu mô hình ANN
- Tìm hiểu mô hình kết hợp hồi quy và ANN
- Áp dụng hồi quy tuyến tính, mô hình ANN, mô hình kết hợp hồi quy và ANN vào dựbáo
- Xây dựng ứng dụng demo dựđoán các tập dữ liệu
Gồm 03 phương pháp nghiên cứu khoa học để tiếp cận và làm rõ những vấn đề của đề tài. Đó là các phương pháp nghiên cứu sau:
Phương pháp phân tích và tổng hợp lý thuyết là quá trình nghiên cứu các tài liệu liên quan đến mô hình hồi quy tuyến tính, mô hình ANN và sự kết hợp giữa hai mô hình này để dự báo Qua việc phân tích, chúng ta có thể hiểu sâu sắc từng vấn đề, đồng thời tổng hợp thông tin để có cái nhìn tổng quan và đầy đủ về các khía cạnh cần tìm hiểu.
Phương pháp thực nghiệm khoa học bao gồm việc chủ động thu thập và tìm kiếm tập dữ liệu bằng công cụ Python Sau đó, áp dụng mô hình hồi quy tuyến tính để dự báo và sử dụng mô hình ANN để nâng cao độ chính xác Cuối cùng, sự kết hợp của hai mô hình này giúp cải thiện kết quả dự báo.
Phương pháp phân tích và tổng kết kinh nghiệm bao gồm việc nghiên cứu, phân tích và đánh giá các mô hình đã được xây dựng Qua đó, chúng ta có thể từng bước phát triển một mô hình phù hợp nhất, với độ tin cậy và chính xác cao hơn.
1.4 KẾT QUẢĐẠT ĐƯỢC Áp dựng các kiến thức đã tìm hiểu Xây dựng App demo đểcó thể dễdàng dựbáo kết quả mong muốn
Chương 1: TỔNG QUAN VÀ ỨNG DỤNG 1.1 MACHINE LEARNING LÀ GÌ?
Machine Learning là một chương trình máy tính có khả năng học hỏi từ dữ liệu mà không cần lập trình cụ thể Nó lặp đi lặp lại quá trình học để cải thiện khả năng thích ứng với dữ liệu mới.
Forecasting là một quá trình đưa ra các số liệu để dựbáo cho một vấn đề cần có quyết định trong tương lai [1]
1.3 MACHINE LEARING ĐƯỢC ỨNG DỤNG VÀO NHỮNG VIỆC GÌ?
Hầu hết mọi ngành công nghiệp đang làmviệc với hàm lượng lớn dữ liệu đều sử dụng công nghệ Machine Learning. ã Cỏc dịch vụ tài chớnh
Ngân hàng và các doanh nghiệp tài chính áp dụng công nghệ Machine Learning với hai mục đích chính: xác định thông tin quan trọng từ dữ liệu và ngăn chặn hành vi lừa đảo Công nghệ này giúp phát hiện cơ hội đầu tư và thông báo cho nhà đầu tư về thời điểm giao dịch hợp lý Ngoài ra, việc khai thác dữ liệu còn cho phép nhận diện khách hàng có hồ sơ rủi ro cao và sử dụng giám sát mạng để phát hiện các tín hiệu lừa đảo.
Các tổ chức chính phủ liên quan đến an ninh cộng đồng và tiện ích xã hội sở hữu nhiều nguồn dữ liệu quý giá để khai thác thông tin Việc phân tích dữ liệu cảm biến giúp chính phủ nâng cao hiệu quả dịch vụ và tiết kiệm chi phí Ngoài ra, Machine Learning còn đóng vai trò quan trọng trong việc phát hiện gian lận và giảm thiểu rủi ro trộm cắp danh tính.
Machine Learning đang trở thành một xu hướng phát triển mạnh mẽ trong ngành chăm sóc sức khỏe, nhờ vào sự xuất hiện của các thiết bị và máy cảm ứng đeo được, giúp thu thập và phân tích dữ liệu hiệu quả.
Công nghệ Machine Learning đóng vai trò quan trọng trong việc đánh giá tình hình sức khỏe của bệnh nhân theo thời gian thực, giúp các chuyên gia y tế nhận diện các xu hướng và tín hiệu quan trọng Điều này không chỉ cải thiện khả năng chẩn đoán bệnh mà còn nâng cao hiệu quả điều trị.
Dựa vào hành vi mua sắm trước đây, các trang web áp dụng Machine Learning để phân tích lịch sử mua hàng, từ đó gợi ý những sản phẩm mà người tiêu dùng có thể quan tâm Việc tiếp nhận, phân tích và sử dụng dữ liệu để cá nhân hóa trải nghiệm mua sắm và triển khai các chiến dịch Marketing chính là xu hướng tương lai của ngành bán lẻ.
Trong ngành công nghiệp vận tải, việc tìm kiếm nguồn nguyên liệu mới và phân tích các mỏ dầu dưới đất là rất quan trọng Đồng thời, dự đoán tình trạng thất bại của bộ cảm biến lọc dầu và sắp xếp các kênh phân phối để tối ưu hóa hiệu quả và tiết kiệm chi phí cũng đóng vai trò then chốt Sự ứng dụng Machine Learning trong lĩnh vực này đang ngày càng gia tăng và mở rộng.
Phân tích dữ liệu để xác định các xu hướng là rất quan trọng trong ngành vận tải, nơi mà việc tối ưu hóa hiệu suất trên từng tuyến đường và dự đoán các vấn đề tiềm ẩn có thể gia tăng lợi nhuận Machine Learning đóng vai trò thiết yếu trong việc phân tích dữ liệu và xây dựng mô hình cho các doanh nghiệp vận chuyển, vận tải công cộng và các tổ chức vận chuyển khác.
1.4 CÁC BƯỚC CƠ BẢN ĐỂ TIẾN HÀNH TRONG MỘT DỰBÁO
- Sử dụng và đánh giá mô hình
1.5 DỮ LIỆU VÀ PHƯƠNG PHÁP DÙNG TRONG DỰBÁO
Các phương pháp dựbáo thích hợp phụ thuộc phần lớn vào dữ liệu nào có sẵn
D ự báo định lượ ng (quantitative forecasting) có thể được áp dụng khi hai điều kiện được thỏa mãn:
- Có dữ liệu dạng sốphù hợp với việc dựđoán.
- Có một giả thiết có cơ sở về những mô típ trong quá khứ và vẫn sẽ tiếp tục trong tương lại
Hầu hết các vấn đề dự đoán định lượng dựa vào dữ liệu chuỗi thời gian, được thu thập tại các khoảng thời gian đều đặn, hoặc dữ liệu cắt ngang, được thu thập tại một thời điểm duy nhất.
Nếu không có dữ liệu khả dụng hoặc nếu dữ liệu khả dụng không liên quan đến dựbáo thì phải sử dụng phương pháp d ựbáo định tính(qualitative forecasting)
Chương 2: CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME SERIES
2.1 CÁC MÔ TÍP CÓ THỂ XUẤT HIỆN ã Xu hướng (Trend)
Dùng để miêu tảtrường hợp trong dữ liệu xuất hiện hiện tượng giá trịtăng hoặc giảm trong thời gian dài [1] ãMựa (Seasonal)
HƯỚNG PHÁT TRIỂ N
1.1 TÍNH CẤP THIẾT CỦA ĐỀTÀI 1
1.3 CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU 1
Chương 1: TỔNG QUAN VÀ ỨNG DỤNG 3
1.3 MACHINE LEARING ĐƯỢC ỨNG DỤNG VÀO NHỮNG VIỆC GÌ? 3
1.4 CÁC BƯỚC CƠ BẢN ĐỂ TIẾN HÀNH TRONG MỘT DỰBÁO 4
1.5 DỮ LIỆU VÀ PHƯƠNG PHÁP DÙNG TRONG DỰBÁO 5
Chương 2: CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME
2.1 CÁC MÔ TÍP CÓ THỂ XUẤTHIỆN 6
2.2 CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME SERIES 7
Chương 3: CÁC CÔNG CỤ SỬ DỤNG CHO VIỆC DỰ ĐOÁN 10
3.1 CÁC PHƯƠNG PHÁP DỰĐOÁN ĐƠN GIẢN 10
3.2 CHUYỂN ĐỔI VÀ ĐIỀU CHỈNH (Transformation and Adjustment) 12
Chương 4: MÔ HÌNH HỒI QUY 16
4.3 MÔ HÌNH HỒI QUY THEO THỜI GIAN 51
Chương 5: MÔ HÌNHMẠNG NEURON NHÂN TẠO (ANN) 64
5.1 LỊCH SỬPHÁT TRIỂN CỦA NEURON NHÂN TẠO 64
Chương 6: MÔ HÌNH KẾT HỢP HỒI QUY VÀMẠNG NEURON NHÂN
6.2 TÍNH SAI SỐ TOÀN PHƯƠNG TRUNG BÌNH (MSE) và trọng số ( ) 90
CHƯƠNG 7: ĐÁNH GIÁ BẰNG THỰC NGHIỆM 91
7.2 CÁC TẬP DỮ LIỆU DÙNG TRONG THỰC NGHIỆM 91
7.3 CÁC TRƯỜNG HỢP THỰC NGHIỆM 100
DANH MỤC TÀI LIỆU THAM KHẢO 113
KẾ HOẠCH THỰC HIỆN LUẬN VĂN 114
Hình 1 Biểu đồlượng bia sản xuất hàng tháng tại Úc (1956-1990) 6
Hình 2 Biểu đồ dựđoán lượng bia sản xuất hàng tháng tại Úc 6
Hình 3 Biểu đồgiá chứng khoán của công ty IBM 7
Hình 4 Biểu đồ dựđoán lượng bia sản xuất hàng tháng tại Úc 7
Hình 5 Biểu đồtương quan giữa lượng điện tiêu thụ so với nhiệt độhàng ngày 8
Hình 6 Biểu đồtương quan lượng điện tiêu thụ giữa ngày hiện tại so với trước đó 2 ngày 8
Hình 7 Biểu đồtương quan lượng điện tiêu thụ của ngày hiện tại so với những ngày trước đó 9
Hình 8 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp trung bình 10
Hình 9 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp Nạve 11
Hình 10 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp
Hình 11 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc dùng phương pháp
Hình 12 Biểu đồ dựđoán sản lượng sản xuất bia tại Úc trước khi Adjustment 13
Hình 13 Biểu đồ dự đoán sản lượng sản xuất bia tại Úc sau khi dùng Log
Hình 14 Biểu đồ dựđoán sản lượng sản xuất bia tại Úc trước khi dùng Log
Hình 15Mô hình hồi quy đơn 17
Hình 16Hàm hồi quy mẫu và phần dư 21
Hình 19Mô hình dựđoán ví dụ 4.3.1 54
Hình 20 Mô hình dựbáo ví dụ 4.3.2 63
Hình 21 Cấu trúc neuron sinh vật 65
Hình 30 Mạng truyền thẳng nhiều lớp 67
Hình 23 Cấu trúc neuron nhân tạo 69
Hình 24 Đồ thị biểu thịhàm tuyến tính 70
Hình 25 Đồ thị biểu thịhàm sigmoid 71
Hình 26 Đồ thị biểu thịhàm tanh 72
Hình 27 Đồ thị biểu diễn hàm ReLU 73
Hình 28 Đồ thị biểu diễn hàm dấu sgn 73
Hình 29 Các dạng học tham số 74
Hình 31Mô hình cơ chế hoạt động của ANN 80
Hình 32Mô hình kết hợp hồi quy và mạng neuron nhân tạo 89
Hình 33 Biểu đồ thể hiện tập dữ liệu Air quality data set 93
Hình 34 Biểu đồ biểu hiện tập dữ liệu Jena_climate_2009_2016 94
Hình 35 Biểu đồ biểu diễn tập dữ liệu Appliance energy prediction 97
Hình 36 Biểu đồ biểu diễn tập dữ liệu Occupancy Detection Data Set 98
Bảng 2 Bảng xửlí số liệu ví dụ 4.1.1.2 18
Bảng 3 Bảng xửlí số liệu ví dụ 4.1.2.2 22
Bảng 4 Bảng xửlí số liệu ví dụ 4.1.2.2 25
Bảng 5 Xửlí số liệu ví dụ 4.1.3.2 29
Bảng 7 Bảng xửlí ví dụ 4.2.2.1 39
Bảng 8 Xửlí số liệu ví dụ 4.2.3.1 46
Bảng 9 Bảng số liệu ví dụ 4.3.1 52
Bảng 10 Bảng xửlý số liệu vídụ 4.3.1 52
Bảng 11 Bảng xửlí số liệu 4.3.1 55
Bảng 12 7 giá trịđầu của bảng số liệu ví dụ 4.3.1 59
Bảng 13 Bảng dữ liệu tuyển sinh (1998-2017) 83
Bảng 14 Dữ liệu tuyển sinh từnăm 1988 đến 2017 của Trung tâm 85
Bảng 15 Xửlí dữ liệu tuyển sinh từnăm 1988 đến 2017 của Trung tâm 86
Bảng 16 Bảng tóm tắt tập dữ liệu 99
Bảng 17 Giá trị thực nghiệm của tệp dữ liệu Air quality trên mô hình ANN với k thay đổi 102
Bảng 18 Giá trị thực nghiệm của tệp dữ liệu Air quality trên mô hình ANN với epoch thay đổi 102
Bảng 19 Giá trị sai số của tập dữ liệu Air Quality cho 3 mô hình thực nghiệm 103
Bảng 20 Thời gian thực thi của tập dữ liệu Air Quality cho 3 mô hình thực nghiệm 103
Bảng 21 Giá trị thực nghiệm của tệp dữ liệu Jena_climate_2009_2016 trên mô hình ANN với k thay đổi 104
Bảng 22 Giá trị chạy thực nghiệm của tệp dữ liệu Jena_climate_2009_2016 trên mô hình ANN với epoch thay đổi 105
Bảng 23 Giá trị sai số của tập dữ liệu Jena_climate_2009_2016 trên 3 mô hình thực nghiệm 106
Bảng 24 Thời gian thực thi của tập dữ liệu Jena_climate_2009_2016 trên 3 mô hình thực nghiệm 106
Bảng 25 Giá trị thực nghiệm của tệp dữ liệu Appliances energy prediction trên mô hình ANN với k thay đổi 107
Bảng 26 Giá trị thực nghiệm của tệp dữ liệu Appliances energy prediction trên mô hình ANN với epoch thay đổi 107
Bảng 27 Giá trị sai số của tập dữ liệu Appliances energy prediction trên 3 mô hình thực nghiệm 108
Bảng 28 Thời gian thực thi của tập dữ liệu Appliances energy prediction trên
Bảng 29 Giá trị thực nghiệm của tệp dữ liệu Occupancy Detection Data Set trên mô hình ANN với k thay đổi 109
Bảng 30 Giá trị thực nghiệm của tệp dữ liệu Occupancy Detection Data Set trên mô hình ANN với epoch thay đổi 110
Bảng 31 Giá trị sai số của tập dữ liệu Occupancy Detection trên 3 mô hình thực nghiệm 111
Bảng 32 Thời gian thực thi của tập dữ liệu Occupancy Detection trên 3 mô hình thực nghiệm 111
1.1 TÍNH CẤP THIẾT CỦA ĐỀTÀI
Ngày nay, sự phát triển mạnh mẽ của Internet, mạng xã hội và thiết bị di động đã dẫn đến sự gia tăng dữ liệu toàn cầu không ngừng Dữ liệu được tạo ra liên tục, vì vậy việc ứng dụng công nghệ thông tin trong kinh doanh và quản lý trở nên cần thiết hơn bao giờ hết Dự báo dữ liệu theo chuỗi thời gian giúp các cơ quan và doanh nghiệp định hướng phát triển tương lai dựa trên số liệu quá khứ.
Nhóm chúng tôi đã chọn đề tài “Tìm hiểu mô hình hồi quy và ứng dụng trong dự báo dữ liệu chuỗi thời gian” để giới thiệu về các mô hình hồi quy và mô hình mạng neuron nhân tạo (ANN) Bài viết sẽ khám phá sự kết hợp giữa hai mô hình này, cũng như cung cấp kiến thức cơ bản về chuỗi thời gian, quy trình dự báo và ứng dụng của chúng trong dự báo dữ liệu chuỗi thời gian.
Nghiên cứu áp dụng mô hình hồi quy, mô hình ANN và mô hình kết hợp hồi quy với ANN trong dựbáo dữ liệu chuỗi thời gian
Mô hình hồi quy chuỗi thời gian giúp chúng ta ước lượng và dự báo giá trị trung bình của các biến phụ thuộc dựa trên biến giải thích, từ đó xác định mức độ quan hệ giữa các biến Qua đó, chúng ta có thể hiểu rõ bản chất của hiện tượng và tìm ra các biện pháp khắc phục Áp dụng kiến thức này, chúng ta có thể xây dựng mô hình Demo để dự đoán các tập dữ liệu hiệu quả.
1.3 CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU
- Mô hình hồi quy đơn
- Mô hình hồi quy bội
- Tìm hiểu mô hình ANN
- Tìm hiểu mô hình kết hợp hồi quy và ANN
- Áp dụng hồi quy tuyến tính, mô hình ANN, mô hình kết hợp hồi quy và ANN vào dựbáo
- Xây dựng ứng dụng demo dựđoán các tập dữ liệu
Gồm 03 phương pháp nghiên cứu khoa học để tiếp cận và làm rõ những vấn đề của đề tài. Đó là các phương pháp nghiên cứu sau:
Phương pháp phân tích và tổng hợp lý thuyết là nghiên cứu các tài liệu về mô hình hồi quy tuyến tính, mô hình ANN và sự kết hợp giữa hai mô hình này để dự báo Qua việc phân tích, chúng ta có thể hiểu sâu hơn về từng vấn đề, đồng thời tổng hợp thông tin để có cái nhìn toàn diện và đầy đủ về các khía cạnh cần tìm hiểu.
Phương pháp thực nghiệm khoa học bao gồm việc chủ động thu thập và tìm kiếm tập dữ liệu bằng công cụ Python Sử dụng mô hình hồi quy tuyến tính để dự báo và áp dụng mô hình ANN nhằm cải thiện độ chính xác trong dự báo Kết hợp hai mô hình này sẽ mang lại kết quả dự báo tối ưu hơn.
Phương pháp phân tích và tổng kết kinh nghiệm bao gồm việc nghiên cứu, phân tích và đánh giá các mô hình đã được xây dựng Qua đó, chúng ta có thể từng bước phát triển một mô hình tối ưu, đảm bảo độ tin cậy và chính xác cao hơn.
1.4 KẾT QUẢĐẠT ĐƯỢC Áp dựng các kiến thức đã tìm hiểu Xây dựng App demo đểcó thể dễdàng dựbáo kết quả mong muốn
Chương 1: TỔNG QUAN VÀ ỨNG DỤNG 1.1 MACHINE LEARNING LÀ GÌ?
Machine Learning là một chương trình máy tính có khả năng học hỏi từ dữ liệu mà không cần lập trình chi tiết Nó lặp đi lặp lại quá trình học để cải thiện hiệu suất và có khả năng thích nghi khi tiếp xúc với dữ liệu mới.
Forecasting là một quá trình đưa ra các số liệu để dựbáo cho một vấn đề cần có quyết định trong tương lai [1]
1.3 MACHINE LEARING ĐƯỢC ỨNG DỤNG VÀO NHỮNG VIỆC GÌ?
Hầu hết mọi ngành công nghiệp đang làmviệc với hàm lượng lớn dữ liệu đều sử dụng công nghệ Machine Learning. ã Cỏc dịch vụ tài chớnh
Ngân hàng và doanh nghiệp tài chính áp dụng công nghệ Machine Learning chủ yếu để xác định thông tin quan trọng từ dữ liệu và ngăn chặn gian lận Công nghệ này giúp phát hiện cơ hội đầu tư và thông báo thời điểm giao dịch hợp lý cho nhà đầu tư Ngoài ra, việc khai thác dữ liệu cũng cho phép xác định khách hàng có hồ sơ rủi ro cao và sử dụng giám sát mạng để phát hiện các tín hiệu gian lận.
Các tổ chức chính phủ liên quan đến an ninh cộng đồng và tiện ích xã hội sở hữu nhiều nguồn dữ liệu giá trị để khai thác thông tin Việc phân tích dữ liệu cảm biến giúp chính phủ nâng cao hiệu quả dịch vụ và tiết kiệm chi phí Bên cạnh đó, Machine Learning còn hỗ trợ trong việc phát hiện gian lận và giảm thiểu rủi ro trộm cắp danh tính, góp phần cải thiện chăm sóc sức khỏe.
Machine Learning đang trở thành một xu hướng phát triển nhanh chóng trong ngành chăm sóc sức khỏe, nhờ vào sự xuất hiện của các thiết bị và máy cảm ứng đeo Những công nghệ này tận dụng dữ liệu để cải thiện chất lượng dịch vụ y tế và tối ưu hóa quy trình chăm sóc bệnh nhân.
Công nghệ Machine Learning đang được áp dụng để đánh giá tình hình sức khỏe của bệnh nhân trong thời gian thực, giúp các chuyên gia y tế phát hiện xu hướng và tín hiệu quan trọng nhằm cải thiện khả năng điều trị và chẩn đoán bệnh.
Dựa trên hành vi mua hàng trước đây, các trang web sử dụng Machine Learning để phân tích lịch sử mua sắm, từ đó giới thiệu những sản phẩm mà bạn có thể quan tâm Khả năng tiếp nhận và phân tích dữ liệu giúp cá nhân hóa trải nghiệm mua sắm, đồng thời hỗ trợ thực hiện các chiến dịch Marketing hiệu quả, đánh dấu tương lai của ngành bán lẻ.
Tìm kiếm nguồn nguyên liệu mới và phân tích các mỏ dầu dưới đất là những yếu tố quan trọng trong ngành công nghiệp Việc dự đoán tình trạng thất bại của bộ cảm biến lọc dầu và sắp xếp các kênh phân phối giúp đạt hiệu quả và tiết kiệm chi phí Số lượng ứng dụng Machine Learning trong ngành này rất lớn và ngày càng mở rộng.
Phân tích dữ liệu để xác định các xu hướng là yếu tố then chốt trong ngành vận tải, giúp tối ưu hóa hiệu suất trên từng tuyến đường và dự đoán các vấn đề tiềm ẩn nhằm tăng lợi nhuận Machine Learning đóng vai trò quan trọng trong việc phân tích dữ liệu và mô hình hóa, hỗ trợ các doanh nghiệp vận chuyển, vận tải công cộng và các tổ chức vận chuyển khác.
1.4 CÁC BƯỚC CƠ BẢN ĐỂ TIẾN HÀNH TRONG MỘT DỰBÁO
- Sử dụng và đánh giá mô hình
1.5 DỮ LIỆU VÀ PHƯƠNG PHÁP DÙNG TRONG DỰBÁO
Các phương pháp dựbáo thích hợp phụ thuộc phần lớn vào dữ liệu nào có sẵn
D ự báo định lượ ng (quantitative forecasting) có thể được áp dụng khi hai điều kiện được thỏa mãn:
- Có dữ liệu dạng sốphù hợp với việc dựđoán.
- Có một giả thiết có cơ sở về những mô típ trong quá khứ và vẫn sẽ tiếp tục trong tương lại
Hầu hết các vấn đề dự đoán định lượng sử dụng dữ liệu chuỗi thời gian, được thu thập theo các khoảng thời gian đều đặn, hoặc dữ liệu cắt ngang, thu thập tại một thời điểm duy nhất.
Nếu không có dữ liệu khả dụng hoặc nếu dữ liệu khả dụng không liên quan đến dựbáo thì phải sử dụng phương pháp d ựbáo định tính(qualitative forecasting)
Chương 2: CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME SERIES
2.1 CÁC MÔ TÍP CÓ THỂ XUẤT HIỆN ã Xu hướng (Trend)
Dùng để miêu tảtrường hợp trong dữ liệu xuất hiện hiện tượng giá trịtăng hoặc giảm trong thời gian dài [1] ãMựa (Seasonal)