Nhận ra tầm quan trọng của vấn đề này, nhóm tác giả quyết định chọn đề tài: „Dự báo lượng khách quốc tế đến Việt Nam bằng mô hình SARIMA‟ nhằm đưa ra một số hàm ý chính sách để giúp du l
Trang 1TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG KHOA KINH TẾ QUỐC TẾ
- -
BÀI GIỮA KỲ MÔN DỰ BÁO KINH TẾ
DỰ BÁO LƯỢNG KHÁCH QUỐC TẾ ĐẾN VIỆT
NAM SỬ DỤNG MÔ HÌNH ARIMA
Trang 2MỤC LỤC
1 Các nghiên cứu liên quan 2
2 Dữ liệu và phương pháp nghiên cứu 3
2.1 Dữ liệu 3
2.2 Phương pháp nghiên cứu 3
2.3 Quy trình dự báo 5
3 Kết quả 7
4 Kết luận và gợi ý chính sách 17
4.1 Kết luận 17
4.2 Gợi ý chính sách 18
5 Danh mục tài liệu tham khảo 19
Trang 3đề rất quan trọng trong việc mở rộng và phát triển du lịch quốc tế
Việc khai thác hiệu quả các tiềm năng du lịch, cũng như khắc phục những rủi ro trong kinh doanh dịch vụ du lịch và lên kế hoạch cho những chặng đường phát triển tiếp theo
là vấn đề cấp thiết để phát triển ngành kinh tế du lịch Đồng thời, việc tạo dấu ấn trong lòng du khách sẽ giúp thu hút lượng khách quốc tế đến Việt Nam và nâng cao chất lượng của ngành du lịch Việt Nam
Nhận ra tầm quan trọng của vấn đề này, nhóm tác giả quyết định chọn đề tài: „Dự báo lượng khách quốc tế đến Việt Nam bằng mô hình SARIMA‟ nhằm đưa ra một số hàm
ý chính sách để giúp du lịch Việt Nam phát triển trong thời gian tới
Trang 41 Các nghiên cứu liên quan
xuất bản
Nội dung
Engin Yilmaz
Forecasting tourist arrivals to Turkey
2015 Dự báo lượng khách du lịch đến Turkey bằng mô
hình SARIMA
Kết quả nghiên cứu cho thấy, mô hình SARIMA cho kết quả với sai số dự báo nhỏ hơn mô hình STM (sai số MAPE của mô hình SARIMA là 2.95%, trong khi sai số MAPE của mô hình STM
là 4.90%) Như vậy, việc xây dựng mô hình SARIMA để dự báo lượng khách du lịch đến Turkey cho kết quả có độ đáng tin cậy cao hơn
Chế Minh Hải Bùi Lê Tuấn Đạt
Khóa luận tốt nghiệp: Các phương pháp
dự báo kinh
tế
2016 Dự báo lượng khách du lịch đến Việt Nam bằng
các mô hình dự báo đơn giản: mô hình trung bình
di động, mô hình trung bình di động có trọng số,
mô hình san mũ đơn giản, mô hình san mũ kép và
mô hình san mũ Holt-Winters
Kết quả nghiên cứu cho thấy các mô hình tác giả
sử dụng để dự báo đều cho sai số MAPE > 10%
Trong đó, mô hình san mũ Holt- Winters (mô hình nhân) cho sai số dự báo nhỏ nhất là 10.0976%
Nghiêm Phúc Hiếu
Ứng dụng mô hình
SARIMA dự báo lượng khách du lịch đến Việt Nam
2017 Bài viết xây dựng mô hình SARIMA để đưa ra dự
báo thử nghiệm về lượng khách quốc tế đến Việt Nam những tháng cuối năm 2017 và dự báo lượng
du khách trong 3 năm tới
Kết quả dự báo cho thấy, sai số dự báo MAPE chỉ
từ 1.7% đến 12.4% và dự báo lượng khách quốc tế
Trang 52 Dữ liệu và phương pháp nghiên cứu
2.1 Dữ liệu
Số liệu phục vụ cho đề tài được tổng hợp từ dữ liệu báo cáo của tổng cục du lịch Việt Nam Cụ thể, nhóm tác giả thu thập lượng khách quốc tế đến Việt Nam (TRAVEL) từ tháng 01/2014 đến tháng 2/2019 gồm 62 quan sát
2.2 Phương pháp nghiên cứu
Mô hình tích hợp trung bình trượt tự hồi quy (mô hình ARIMA – Auto Regressive Integrated Moving Average) được tích hợp từ 3 quá trình: Tự hồi quy (AR) đối với các
số liệu kinh tế - xã hội, trung bình trượt (MA) đối với phần sai số của số liệu (hay phần nhiễu ngẫu nhiên) và quá trình tích hợp hay sai phân (I) nhằm biến đổi chuỗi không dừng thành chuỗi dừng trước khi thực hiện các thao tác phân tích và dự báo khác Bản chất của mô hình ARIMA là dự báo giá trị tương lai của một biến số (biểu thị theo chuỗi thời gian) dựa trên giá trị quá khứ và các sai số ngẫu nhiên Tuy nhiên, mô hình ARIMA chỉ thích hợp cho việc phân tích, dự báo dữ liệu chuỗi thời gian không có yếu
tố mùa vụ
Một đặc điểm rất quan trọng của các dữ liệu chuỗi thời gian về kinh tế - xã hội là có yếu tố mùa vụ cao, chẳng hạn như trong chính nghiên cứu của nhóm, lượng khách quốc tế đến Việt Nam thường tăng vào các tháng hè hoặc dịp lễ hội Ngoài ra, nhóm tác giả phát hiện chuỗi có yếu tố mùa vụ khi chạy lệnh graph seasonal và thu được kết quả:
Trang 6400,000 600,000 800,000 1,000,000 1,200,000 1,400,000 1,600,000
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
Means by Season TRAVEL by Season
Hình 1 Đồ thị xem xét yếu tố mùa vụ trong chuỗi TRAVEL
Từ hình trên, ta thấy khoảng cách biên độ lượng khách du lịch giữa các khoảng thời gian khá lớn nên chuỗi số liệu này có yếu tố mùa vụ Vì vậy, nhóm tác giả sử dụng mô hình ARIMA tách yếu tố mùa vụ để dự báo cho chuỗi số liệu này
Mô hình ARIMA
Mô hình ARIMA được kết hợp bởi 3 thành phần chính: AR (thành phần tự hồi quy), I
(tính dừng của chuỗi thời gian) và MA (thành phần trung bình trượt)
Mô hình tự tương quan bậc p (viết tắt là AR(p)) là quá trình phụ thuộc tuyến tính của các giá trị trễ và sai số ngẫu nhiên được diễn giải như sau:
Mô hình trung bình trượt bậc q, viết tắt là MA(q), là quá trình được mô tả hoàn toàn bằng phương trình tuyến tính có trọng số của các sai số ngẫu nhiên hiện hành và các giá trị trễ của nó Mô hình được viết như sau:
Trang 7có biên độ dao động không đổi thì sử dụng mô hình cộng tính
Sau đó sử dụng phương pháp trung bình trượt để tách yếu tố mùa vụ với mô hình phụ hợp để cho chuỗi mới đã loại bỏ yếu tố mùa vụ
+ Nếu sai phân bậc 1 của chuỗi dừng ta có I(d=1)
+ Nếu sai phân bậc 2 của chuỗi dừng ta có I(d=2)
Trang 8+ Nếu chuỗi có dạng MA(q) thì biểu đồ ACF sẽ có các hệ số tương quan có ý nghĩa thống kê từ 1 tới q và các giá trị sau đó sẽ giảm nhanh về không Còn đối với PACF, các hệ số tương quan riêng phần sẽ giảm dần về không
Bước 4: Ước lượng mô hình
+ Kiểm định ý nghĩa thống kê của mô hình
+ Kiểm định tính ổn định và khả nghịch Nếu kiểm định mô hình được lựa chọn không thỏa mãn thì quay lại từ giai đoạn nhận dạng để lựa chọn mô hình khác hợp lý hơn
Bước 5: Kiểm định nhiễu trắng
Mô hình được kiểm tra mức độ phù hợp với chuỗi dữ liệu nghiên cứu bằng kiểm định phần dư, theo quy định về kiểm định phần dư yêu cầu mô hình phải vượt qua kiểm định tự tương quan ở ít nhất 12 độ trễ liên tiếp
Nếu kiểm định mô hình được lựa chọn không thỏa mãn thì quay lại từ giai đoạn nhận dạng để lựa chọn mô hình khác hợp lý hơn
Bước 6: Dự báo
Dự báo sau khi kiểm định sai số, nếu mô hình là phù hợp, mô hình sẽ được sử dụng vào việc dự báo bằng cách nhân hoặc cộng chuỗi hiện tại đã tách yếu tố mùa vụ lại với yếu tố mùa vụ đã tách Các tiêu chí được sử dụng để so sánh hiệu quả dự báo là RMSE, MAE và R2
Trang 93 Kết quả Tách yếu tố mùa vụ
Để tách yếu tố mùa vụ ra khỏi chuỗi, nhóm tác giả thực hiện xác định mô hình là mô hình nhân tính hay mô hình cộng tính bằng cách sử dụng lệnh line Nhóm tác giả thu được đồ thị:
400,000 600,000 800,000 1,000,000 1,200,000 1,400,000 1,600,000
I II III IV I II III IV I II III IV I II III IV I II III IV I
Hình 2 Số lượng khách quốc tế đến Việt Nam từ tháng 1 năm 2014 đến tháng 2 năm
2019 Qua đồ thị, chúng ta nhận thấy dữ liệu có biên độ dao động thay đổi Do đó, nhóm tác giả thực hiện tách yếu tố mùa vụ bằng phương pháp trung bình trượt đối với mô hình nhân tính và thu được bảng sau:
Trang 11Null Hypothesis: D(TRAVELSA) has a unit root Exogenous: Constant
Lag Length: 0 (Automatic - based on SIC, maxlag=10)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -11.93914 0.0000
Test critical values: 1% level -3.544063
Trang 12Autocorrelation
Partial Correlation AC PAC Q-Stat Prob
***| | ***| | 1
0.421
0.421 11.377 0.001
| | .*| | 2 0.048
0.158 11.526 0.003 | | | | 3 0.073 0.037 11.877 0.008
| | | | 4
0.003 0.068 11.877 0.018 | | |* | 5 0.040 0.092 11.988 0.035
| | | | 6
0.009 0.048 11.993 0.062 | | | | 7 0.048 0.071 12.160 0.095
| | | | 8
0.010 0.035 12.167 0.144 | | | | 9 0.029 0.041 12.229 0.201 | | | | 10 0.041 0.070 12.353 0.262 |* | |** | 11 0.179 0.282 14.817 0.191
**| | | | 12
0.217
0.031 18.493 0.102 |* | | | 13 0.135 0.011 19.954 0.096
*| | .*| | 14
0.075
0.107 20.419 0.117
| | .*| | 15
0.031
0.145 20.501 0.154
Trang 130.053 0.224 |* | | | 17 0.117 0.010 21.942 0.187
*| | .*| | 18
0.121
0.094 23.248 0.181 |* | | | 19 0.089 0.062 23.974 0.197 | | |* | 20 0.060 0.142 24.316 0.229
*| | .*| | 21
0.171
0.099 27.122 0.167 |* | | | 22 0.164 0.042 29.760 0.124
*| | | | 23
0.096 0.060 30.687 0.131
*| | .*| | 24
0.066
0.119 31.144 0.150
| | | | 25
0.016
0.059 31.170 0.183
| | | | 26
0.028
0.061 31.259 0.219 | | | | 27 0.070 0.052 31.818 0.239
| | | | 28
0.064
0.036 32.293 0.263 Bảng 3 Biểu đồ hàm tự tương quan ACF và tự tương quan từng phần PACF Nhìn vào bảng 3, nhóm tác giả sử dụng các hệ số ACF để chọn bậc q cho MA và PACF để chọn bậc p cho AR Vì D(TRAVELSA) là chuỗi dừng nên ta chọn p,q là những giá trị nằm ngoài khoảng tin cậy (mức ý nghĩa 5%) Do đó, nhóm tác giả lựa chọn AR(1) và MA(1,2)
Trang 14Bảng 4 Kết quả ước lượng của mô hình Kết quả hồi quy bảng 4 cho thấy, có ba hệ số có ý nghĩa ở mức 1 % Từ đó nhóm tác giả đi đến kết luận mô hình có ý nghĩa thông kê
Tiếp đến, chúng ta nhìn vào hai chỉ số inverted AR Roots và Inverted MA Roots, cả hai chỉ số này đều nằm trong khoảng từ (-1 ; 1) Nhóm tác giả đi đến kết luận mô hình ổn định và khả nghịch
Trang 15Bảng 5 Biểu đồ tương quan của bình phương phần dư Biểu đồ ACF của phần dư ở bảng 5 cho thấy, không có thanh nào vượt quá hai đường biên hay nói cách khác, không có tự tương quan ở 12 độ trễ liên tiếp Do đó, sai số là một nhiễu trắng, mô hình thông qua kiểm định nhiễu trắng
Dự báo
Để thực hiện dự báo, nhóm tác giả tiến hành dự báo toàn mẫu từ tháng 1 năm 2014 đến tháng 2 năm 2019 và thu được kết quả:
Trang 16-500,000 0 500,000 1,000,000 1,500,000 2,000,000 2,500,000
I II III IV I II III IV I II III IV I II III IV I II III IV I
2014 2015 2016 2017 2018 2019
TRAVELSAF ± 2 S.E.
Forecast: TRAVELSAF Actual: TRAVELSA Forecast sample: 2014M01 2019M02 Adjusted sample: 2014M03 2019M02 Included observations: 60
Root Mean Squared Error 175129.2 Mean Absolute Error 149184.2 Mean Abs Percent Error 16.16709 Theil Inequality Coefficient 0.094635 Bias Proportion 0.039058 Variance Proportion 0.885102 Covariance Proportion 0.075840 Theil U2 Coefficient 3.311885 Symmetric MAPE 16.09700
Hình 3 Kết quả dự báo chuỗi TRAVELSA từ tháng 1 năm 2014 đến tháng 2 năm 2019 Sau đó sử dụng lệnh “line” để xem xét vị trí tương quan của hai đường TRAVELSA và TRAVELSAF Từ đó chọn ra đoạn có sai số nhỏ nhất để xem kết quả dự báo có đáng tin cậy hay không
500,000 600,000 700,000 800,000 900,000 1,000,000 1,100,000 1,200,000 1,300,000 1,400,000
I II III IV I II III IV I II III IV I II III IV I II III IV I
2014 2015 2016 2017 2018 2019
TRAVELSA TRAVELSAF
Hình 4 Đồ thị phân phối của chuỗi TRAVELSA và chuỗi TRAVELSAF
Trang 17Quan sát hình 4, chúng ta nhận thấy ở đoạn từ tháng 1 năm 2016 đến tháng 6 năm
2016, hai đường TRAVELSA và TRAVELSAF cắt nhau và có chênh lệch không đáng
kể Do đó, nhóm tác giả quyết định chọn đoạn để xem xét chất lượng dự báo là đoạn 2016m01-2016m06
640,000 680,000 720,000 760,000 800,000 840,000 880,000 920,000 960,000 1,000,000
2016 TRAVELSAF ± 2 S.E.
Forecast: TRAVELSAF Actual: TRAVELSA Forecast sample: 2016M01 2016M06 Included observations: 6
Root Mean Squared Error 29300.85 Mean Absolute Error 26162.15 Mean Abs Percent Error 3.511622 Theil Inequality Coefficient 0.019035 Bias Proportion 0.235391 Variance Proportion 0.276336 Covariance Proportion 0.488274 Theil U2 Coefficient 0.565870 Symmetric MAPE 3.450525
Hình 5 Kết quả dự báo chuỗi TRAVELSA từ tháng 1 năm 2016 đến tháng 6 năm 2016 Chúng ta thấy chỉ số mean Abs.Percent Error = 3.511622 % < 5%, chứng minh kết quả
dự báo có thể tin cậy, có thể tiến hành dự báo ngoài mẫu
Trang 18Để thực hiện dự báo ngoài mẫu, nhóm tác giả mở rộng bộ dữ liệu đến tháng 6 năm
2019 và tiến hành dự báo lượng khách quốc tế đến Việt Nam từ tháng 3 năm 2019 đến tháng 6 năm 2019
1,200,000 1,250,000 1,300,000 1,350,000 1,400,000 1,450,000 1,500,000
2019m3 2019m4 2019m5 2019m6
TRAVELSAF ± 2 S.E.
Hình 6 Kết quả dự báo chuỗi TRAVELSA từ tháng 3 năm 2019 đến tháng 6 năm 2019 Bước tiếp theo, chúng ta dự báo cho chuỗi gốc TRAVEL bằng cách sử dụng lệnh “genr travel=travelsa*s” và thu được bảng kết quả:
Thời gian Lượng khách quốc tế đến Việt Nam
Trang 19Sau đó, dùng lệnh “line travelf travel” để vẽ đồ thị dự báo cho chuỗi gốc
400,000 600,000 800,000 1,000,000 1,200,000 1,400,000 1,600,000
I II III IV I II III IV I II III IV I II III IV I II III IV I II
Tháng 3 năm 2019, dự báo lượng khách du lịch giảm từ 1588161 lượt xuống còn
1395751 lượt Nhưng đến tháng 4 năm 2019, lượng du khách được dự báo tăng lên
1428420 lượt (tức tăng khoảng 32669 lượt khách) Tháng 6 năm 2019, lượng du khách
dự báo giảm đáng kể xuống còn 1191643 lượt khách
Trang 20Tuy nhiên, do có nhiều yếu tố tác động đến lượng khách du lịch đến Việt Nam như thời tiết, thị hiếu du lịch, và có thể ảnh hưởng đến kết quả dự báo, do đó việc dự báo lượng khách du lịch đến Việt Nam trong tương lai sẽ tồn tại những sai số nhất định Dù vậy kết quả nghiên cứu này cũng phần nào cung cấp thông tin nghiên cứu thiết thực cho các nhà làm chính sách và các công ty du lịch trong việc tìm kiếm những giải pháp thích hợp để phòng ngừa rủi ro và phát triển ngành kinh tế du lịch Việt Nam
4.2 Gợi ý chính sách
Với kết quả dự báo trên, nhóm tác giả nhận thấy lượng khách du lịch quốc tế đến Việt Nam có xu hướng giảm trong thời gian tới, vì vậy nhóm tác giả gợi ý một số hàm ý chính sách nhằm thu hút khách du lịch quốc tế, tạo ấn tượng tốt với các du khách Do
đó, ngành du lịch cần chú trọng phát triển cơ sở vật chất hạ tầng du lịch, nâng cao chất lượng ngành dịch vụ, chuân bị tốt nguồn nhân lực đáp ứng yêu cầu về chất lượng, ngoại ngữ tốt, cơ cấu ngành nghề và tính chuyên nghiệp Bên cạnh đó, ngành du lịch nên tăng cường công nghệ thông tin hiện đại, khai thác hiệu quả Internet, báo chí và truyền thông để phục vụ cho công tác quảng bá du lịch Việt Nam tại các thị trường trọng điểm Đồng thời, việc tăng cường hội nhập hợp tác quốc tế về du lịch là một giải pháp hiệu quả trong việc mở rộng và phát triển du lịch Việt Nam
Trang 215 Danh mục tài liệu tham khảo
TIẾNG VIỆT GS.TS Nguyễn Quang Dong, TS.Nguyễn Thị Minh, khoa Toán kinh tế, Đại học Kinh
tế Quốc dân, 2013, Giáo trình Kinh tế lượng
Chế Minh Hải và Bùi Lê Tuấn Đạt, 2016, Các phương pháp dự báo kinh tế, Trường Đại học Sài Gòn, Khóa luận tốt nghiệp
Trường ĐH Kinh tế - Luật, tháng 5 năm 2018, Chuyên san Kinh tế Tài chính Ngân hàng số 15
Nghiêm Phúc Hiếu, 2017, Ứng dụng mô hình SARIMA dự báo lượng khách du lịch đến Việt Nam tới năm 2020
TIẾNG ANH Engin Yilmaz, 2015, Forecasting tourist arrivals to Turkey
NGUỒN SỐ LIỆU:
Tổng cục Du lịch Việt Nam