Từ cáccông trình ban đầu về chuỗi thời gian hiện nay mô hình này đang được sửdụng để dự báo rất nhiều lĩnh vực trong kinh tế hay xã hội như trong lĩnh vựcgiáo dục để dự báo số sinh viên
Trang 1LỜI MỞ ĐẦU
Nền kinh tế ngày càng phát triển đặc biệt các lĩnh vực dịch vụ, tàichính, ngân hàng, chứng khoán,….Và kinh tế thế giới đang có nhiều biếnđộng khủng hoảng do thị trường tài chính mang lại Song hành là nhu cầuđầu tư, mở rộng sản xuất ngày càng lớn Dẫn đến nhu cầu dự báo về các đạilượng kinh tế càng mở rộng đề làm cơ sở cho việc hoạch định chính sách,vạch kế hoạch kinh doanh đầu tư
Các mô hình kinh tế lượng ngày càng được ứng dụng nhiều trong thực
tế Mô hình hồi quy đơn, hồi quy bội, phân tích tác đông của các yếu tố tớibiến số kinh tế nào đó và dự báo sự thay đổi khi các biến độc lập thay đổi Và
mô hình đươc sử dụng nhiều trong lĩnh vực tài chính, chứng khoán, …có khảnăng dự báo rất tốt đó là mô hình ARIMA Chuỗi thời gian đang được sửdụng như một công cụ hữu hiệu để phân tích trong kinh tế, xã hội cũng nhưtrong nghiên cứu khoa học Chính do tầm quan trọng của phân tích chuỗi thờigian, rất nhiều tác giả đã đề xuất các công cụ để phân tích chuỗi thời gian.Trong những năm trước, công cụ chủ yếu để phân tích chuỗi thời gian là
sử dụng các công cụ thống kê như hồi qui, phân tích Furie và một vài công cụkhác Nhưng hiệu quả nhất có lẽ là mô hình ARIMA của Box-Jenkins Từ cáccông trình ban đầu về chuỗi thời gian hiện nay mô hình này đang được sửdụng để dự báo rất nhiều lĩnh vực trong kinh tế hay xã hội như trong lĩnh vựcgiáo dục để dự báo số sinh viên nhập trường, hay trong lĩnh vực dự báo thấtnghiệp, trong lĩnh vực dân số, chứng khoán, tài chính, dự báo các biến kinh
tế vĩ mô và trong nhiều lĩnh vực khác như tiêu thụ điện, hay dự báo nhiệt độcủa thời tiết
Nghiên cứu dự báo chuỗi thời gian luôn là một bài toán gây được sựchú ý của các nhà toán học, kinh tế, xã hội học, Các quan sát trong thực tếthường được thu thập dưới dạng chuỗi số liệu Từ những chuỗi số liệu này
Trang 2người ta có thể rút ra được những quy luật của một quá trình được mô tảthông qua chuỗi số liệu.
Nhưng ứng dụng quan trọng nhất là dự báo khả năng xảy ra khi chomột chuỗi số liệu Những thí dụ dẫn ra trong các bài báo đều đưa ra khả năng
dự báo trong kinh tế như dự báo chỉ số chứng khoán, mức tăng dân số, dựbáo nhu cầu sử dụng điện, dự báo số lượng sinh viên nhập học của một trườngđại học Các thí dụ này đều có thể dẫn ra trong mỗi ngành kinh tế kỹ thuật
Như đã trình bày ở phần trên, có khá nhiều phương pháp dự báo chuỗithời gian Thông thường để dự báo, người ta sử dụng một công cụ khá mạnhcủa thống kê là mô hình ARIMA Mô hình này thích ứng hầu hết cho chuỗithời gian dừng và tuyến tính Trong mỗi bộ chương trình xử lý số liệu đều cómột phần để dự báo chuỗi thời gian
Xuất phát từ thực tế ứng dụng lớn của mô hình ARIMA em chọn đề tài
nghiên cứu về “ Mô hình ARIMA và phương pháp Box-Jenkins và ứng
dụng dự báo chỉ số vn-index” Nội dung đề án gồm 2 chương:
Chương 1: Cơ sở lý luận
Chương 2: Ứng dụng mô hình ARIMA và phương pháp JENINS dự báo chỉ số VN –INDEC.
BOX-Nhân đây em xin cảm ơn T.S Nguyễn Thị Minh đã hướng dẫn và chỉbảo tận tình giúp em hoàn thành đề tài này Mặc dầu vậy do còn nhiều hạnchế nên bài viết của em còn nhiều thiếu sót mong nhận được ý kiến đóng gópcủa các thầy cô cũng như các bạn để em hoàn thành baì viết hơn
Em xin chân thành cảm ơn!
Trang 3CHƯƠNG 1: CƠ SỞ LÝ LUẬN
Trong chương này chúng ta sẽ tìm hiểu một số khái niệm về quáytinhf trung bình trượt, đồng liên kết, tự hồi quy và phương pháp Box-Jenkins
kê, kinh tế lượng và toán tài chính, một chuỗi thời gian là một chuỗi các điểm
dữ liệu, thường được đo ở lần liên tiếp cách nhau khoảng thời gian thốngnhất Ví dụ về chuỗi thời gian là những giá trị đóng cửa hàng ngày của chỉ sốVN-Indexc, chuỗi gá cổ phiêú, tỷ giá, lãi suất hoặc tổng sản phẩm quốc nộiGDP của Việt Nam do Tổng cục thống kê chịu trách nhiệm đăng tải hàngnăm Phân tích chuỗi thời gian gồm phương pháp phân tích dữ liệu chuỗi thờigian để lấy số liệu thống kê đầy ý nghĩa và đặc tính khác của dữ liệu Dự báochuỗi thời gian là sử dụng một mô hình dự báo các sự kiện tương lai dựa trên
sự kiện quá khứ được biết: để dự đoán điểm dữ liệu trước khi chúng được đo.Một ví dụ về dự báo chuỗi thời gian trong kinh tế lượng là dự đoán chỉ số giá(lạm phát) của một nền kinh tế dựa vào mô hình đáng tin cậy Để có thể dựbáo được bằng các mô hình kinh tế lượng thì đòi hỏi các chuỗi thời gian phảidừng Vậy chuỗi dừng là như thế nào?
a Định nghĩa
Chuỗi dừng được định nghĩa :
Trang 4-Var( với mọi t.
Ý nghĩa: là trung bình,phương sai và hiệp phương sai là “ dừng” theothời gian
Trên đây ta đã hiểu thế nào là chuỗi dừng vậy làm thế nào để biết được chuỗidừng? Khi chuỗi không dừng có cách nào làm cho chuỗi dừng hay không?
b Kiểm định tính dừng
Sau đây em xin trình bày hai phương pháp kiểm định tính dừng
♦ Kiểm định tính dừng dựa trên lược đồ tự tương quan
Để kiểm định tính dừng này một trong các kiểm định đơn giản là kiểmđịnh dựa trên lược đồ tự tương quan
Hàm tự tương quan ACF(k)=
= Var(
Hàm tự tương quan riêng PACF(k):
hưởng cuả các giá trị của y tại thời điểm t khác Ví dụ ta kiểm định tính dừng
Trang 5của chuỗi lợi suất cổ phiếu SJS từ ngày 2/1/2009 đến ngày 3/1/2010 Nguốn
số liệu cophieu68.com
Từ bảng kết quả ước lượng cho ta kết quả chuỗi dừng
♦ Kiểm định nghiệm đơn vị (unit root test)
Xét mô hình sau đây:
Trang 6cũng kiểm định tính dừng cho chuỗi lợi suất cổ phiếu SJS nói trên.
Trang 7Như vậy ta có thể thấy trị tuyệt đối giá trị quan sát đều lớn hơn các giátrị mức ý nghĩa anpha bằng 10%, 5%, 1% Nên ta có kết quả chuỗi dừng.
Cả hai phương pháp đều cho ta kết quả giống nhau là chuỗi dừng.Trong thực tế khi thực hiện ta có thể sử dụng một trong hai phương pháp hoặc
cả hai phương pháp để xem xét một cách chính xác hơn
1.1.2 Quá trình tự hồi quy AR
Qúa trình tự hồi quy bậc p có dạng như sau:
Trong đó là nhiễu trắng
Trang 8Điều kiện để AR(p) dừng là với i=1,2,3…p.
1.1.3 Qúa trình trung bình trượt MA
Qúa trình MA(q) là quá trình có dạng :
Trong đó u là nhiễu trắng
MA(q) khả nghịch nếu biểu diễn dưới dạng AR
1.1.4 Qúa trình trung bình trượt và tự hồi quy ARMA
Cơ chế sản sinh ra Y không chỉ có AR hoặc MA mà có thể kết hợp cảhai yếu tố naỳ Khi kết hợp cả hai yếu tố này ta có quá trình trung bình trượt
và tự hồi quy ARMA
ARMA(1,1) nếu y có thể biêur diễn dưới dạng :
1.1.5 Qúa trình trung bình trượt, đồng liên kết, tự hồi quy ARIMA
Chuỗi tời gian xuất phát có thể dừng hoặc không dừng Để làm chuỗidừng có chúng ta sẽ lấy sai phân Chuỗi được gọi là đồng liên kết bậc d nếuchuỗi sai phân bậc d là chuỗi dừng Áp dụng mô hình ARIMA (p,q) cho taquá trình trung bình trượt, đồng liên kết, tự hồi quy ARIMA(p,d,q)
Trang 91.2 Phương pháp BOX_JENKINS
Phương pháp này là sử dụng chuỗi thời gian trong quá khứ để dự báocho tương lai Đối với những chuỗi thời gian dừng thì chúng ta có thể sử dụngphương pháp trung bình trượt, làm trơn chuỗi, ngoại suy giản đơn,…Cònnhững chuỗi thời gian không dừng thì thế nào ? Làm thế nào để chuỗi dừng ?
Và dự báo như thế nào ? Việc kết hợp mô hình ARIMA trình bày ở trên vàphương pháp Box-Jenkins sẽ giúp ta xử lý vấn đề này Nội dung của phươngpháp gồm 4 bước cơ bản :
Bước 1 : Định dạng mô hình Tìm ra các gía trị p,d,q
Bước 2 : Ước lương mô hình
Buớc 3 : Kiểm định giả thiết Ở bước này cần ra mô hình phù hợpnhất với số liêụ hiện có Kiểm định đơn giản nhất là kiểm đinh tính dừng củaphần dư Nếu phần dư có tính dừng thì mô hình là châp nhận được
Bước 4 :Dự báo Dự báo trong ngắn hạn tỏ ra hiệu quả hơn mô hìnhkinh tế lượng truyền thống
♦ Định dạng
Định dạng mô hình tức là chúng ta phải tìm ra các giá trị p,q và d Đểtìm được d ta dùng kiểm định nghiệm đơn vị DF hoặc ADF, kiểm đinhnghiệm đơn vị (làm chuỗi dừng ) Từ chuỗi dừng nhận được ta phải tìm ra giátrị p,q Người ta dùng nhiều phương pháp để so sánh chọn ra các giá trị p,qthích hợp Quá trình tìm p,q là cả quá trình nghệ thuật đòi hỏi nhiều kinhnghiệm Ngày nay đã có phần mềm trợ giúp như eviews, stata, …nên việctính toán đơn giản hơn nhiều
● Dựa vào lược đồ tương quan và tự tương quan riêng
Trên lược đò này vẽ ACF và PACF theo độ dài của trễ Đồng thờicũng vẽ đường phân dải chỉ khoảng tin cậy 95% cho hệ số tự tương quan và
hệ số tự tương quan riêng Dựa trên các lược đồ này ta biết các hệ số tự tương
Trang 10quan và các hệ số tự tương quan khác không Từ đó đưa ra đoán nhận về p,qcủa các quá trình AR(p) và MA(q).
i=1,2.3….giảm theo hàm mũ hoặc hình sin thì ta có quá trình AR(p)
quá trình MA(q).Ta có bảng tổng kết một số trường hợp :
(p,d,0) Giảm dạng mũ hoặc giảm hình sin với k>p
hình sin (1,d,1) sau đó giảm dạng mũ hoặc hình sin sau đó giảm dạng
mũ hoặc hình sin (1,d ,2) , sau đó giảm dạng mũ hoặc hình
sin
sau đó giảm dạng
mũ hoặc hình sin (2,d,1) sau đó giảm dạng mũ hoặc hình sin , sau đó giảm
dạng mũ hoặc hình sin (2,d,2) , sau đó giảm dạng mũ hoặc hình
sin
, sau đó giảm dạng mũ hoặc hình sinCác quá trình bậc cao hơn cần phải thử và kết hợp các phương phápđịnh dạng khác nhau Từ lược đồ tương quan có thể cho ta kết qủa nhiều giátrị p, q khác nhau nên ta có các mô hình ARIMA khác nhau Các mô hìnhkhác nhau thì cho ta kết quả dự báo khác nhau, thế mô hình nào cho ta kết quả
dự báo tốt nhất Giải quyết vấn đề này ta dựa trên các tiêu chuẩn lựa chọn
Trang 11● Các tiêu chuẩn lựa chọn mô hình
٭ Tiêu chuẩn Akaike,schwaz
Sau khi sử dụng lược đồ tự tương quan ta có thể lựa chọn được nhiều
mô hình Vậy vấn đề đặt ra là mô hình nào cho ta kết quả ước lượng tốt nhất
Có nhiều tiêu chuẩn để lựa chọn một mô hình thích hợp Hầu hết các tiêuchuẩn này đều xuất phát từ lược đồ tương quan Một trong số đó là tiêuchuẩn Akaike, Schwarz
Akaike (1974) đề xuất :
Schwaz (1978) đưa ra tiêu chuẩn tương tự :
Trong 2 tiêu chuẩn trên tập P,Q đều chưa biết Haman (1980) chỉ ra
Trên cơ sở 2 tiêu chuẩn này Poskitt và Treymane(1987) đưa ra ý tưởng
định nhưng chưa chắc đã là các giá trị thực của mô hình và cần phải xem xét
đưa ra:
Trang 12Tremayne đè nghị rằng nếu R<10 không đủ chứng tỏ để loại bỏ mô hình
٭ Kiểm định nhân tử Lagrange(LM)
Kiểm định giả thiết :
dạng của mô hình ARMA(p,q)Giả thiết đối có hai dạng sau đây :
dạng của mô hình ARMA(p+r,q) dạng của mô hình ARMA(p,q+s)
Để kiểm định các cặp giả thiết trên trước hết ta ước lượng mô hình
không thì là chuỗi sai phân tương ứng ) Từ kết quả này thu được các phần
Trang 13Tương tự cặp giả thiết :
dạng của mô hình ARMA(p,q) dạng của mô hình ARMA(p,q+s) Ngoài tiêu chuẩn ở trên còn có thể dựa trên tiêu chuẩn F dựa trên môhình hồi quy có điều kiện ràng buộc
♦ Ước lượng mô hình
Sau khi định dạng mô hình ta biết bậc sai phân d của chuỗi xuất phát
để thu được chuỗi dừng Và ta cũng đã biết p,q Do đó ta dùng phương phápbình phương nhỏ nhất để ước lượng mô hình ARIMA này Sử dụng phầnmềm eviews, stata, spss chúng ta dễ dàng ước lượng mô hình này bằngphương pháp bình phương nhỏ nhất
♦ Kiểm định tính dừng của mô hình
Bằng cách nào ta biết mô hình đã lựa chọn phù hợp với thực tế Nếunhư mô hình là thích hợp thì các yếu tố ngẫu nhiên là nhiễu trắng Do đó đểxem mô hình có phù hợp hay không ta phải kiểm định phần dư Kết quả ướclượng từ mô hình ARIMA cho ta phần dư Dùng DF để kiểm định xem cóphải là nhiễu trắng hay không
quá trình đó cứ tiếp tục cho đến khi thu được mô hình thích hợp
Trang 14♦ Dự báo
Sau khi đã ước lượng được mô hình tốt ta dùng mô hình này để dự báo
Để đơn giản ta giả sử có mô hình ARIMA(1,1,0).Ta đã ước lượng được môhình này :
Dự báo ở thòi kỳ tiếp theo :
hay :+
٭ Sai số dự báo :
٭ Sai số dự báo trung bình
Trang 15
Hai loại sai số này là sai số hệ thống
٭ Tổng bình phương các sai số dự báo:
٭ Căn bậc hai sai số bình phương trung bình:
٭ Sai số tuyệt đối trung bình :
Kiểm định sai sự bằng nhau của sai số trong thời kỳ ước lượng và thời
kỳ dự báo –kiểm định Chow Dùng kiểm định Chow để so sánh phương saitrong hai thời kỳ ước lượng
Trong thực tế mô hình ARIMA được ứng dụng nhiều vào dự báo cácbiến kinh tế vĩ mô như: tăng trưởng, lạm phát, thất nghiệp, cung tiền, giúpcho các nhà hoạch định chính sách có thể đưa ra được chính sách phù hợp.Ngoài ra nó còn được ứng dụng trong lĩnh vực khí tượng thủy văn để dự báotốc độ gió, dự báo mực nước trên các dòng sông, dự báo lũ lụt Các công ty cóthể dự báo doanh số công ty có thể đạt được và nhiều ứng dụng khác nữa
CHƯƠNG 2
MÔ HÌNH ARIMA DỰ BÁO CHỈ SỐ VN-INDEX
Trang 16Chúng ta đã biết hiện nay thị trường chứng khoán đang phát triển mạnh
mẽ trên thế giới và cả ở nước ta Hấu hết các công ty đều niêm yết cổ phiếutrên thị trường chứng khoán Nó là nơi hấp dẫn các nhà đầu tư bởi mức sinhlợi cao Tuy nhiên đây cũng là nơi hoạt động tiềm ẩn nhiều rủi ro Vì thế việcđưa ra dự báo xu hướng biến động của chỉ số giá chứng khoán để có một sáchlược phù hợp cho hoạt động đầu tư của các cá nhân tổ chức thu hút đượcnhiều sự quan tâm Thị trường chứng khoán việt nam ra đời từ năm 2000,đến nay đã phát triển được 11 năm, là một kênh hấp dẫn đối với các nhà đầu
tư, bên cạnh mưc sinh lợi cao và nhanh thì nó cũng tiềm ẩn nhiều rủi ro cao
Do đó việc dự báo chính xác sự biến động của giá cổ phiếu để có một sáchlược đầu tư phù hợp phục vụ cho công tác kinh doanh của các nhà đầu tư
● Khái niệm chỉ số vn_index
Chỉ số VN - Index thể hiện biến động giá cổ phiếu giao dịch tại TTGDCKTP.HCM Công thức tính chỉ số áp dụng đối với toàn bộ các cổ phiếu niêm yết tạiTTGDCK nhằm thể hiện xu hướng giá cổ phiếu hàng ngày Chỉ số VN -Index sosánh giá trị thị trường hiện hành với giá trị thị trường cơ sở vào ngày gốc 28-7-
2000 khi thị trường chứng khoán chính thức đi vào hoạt động
Giá trị thị trường cơ sở trong công thức tính chỉ số được điều chỉnhtrong các trường hợp như niêm yết mới, huỷ niêm yết và các trường hợp cóthay đổi về vốn niêm yết
Trang 17Qit: Số lượng niêm yết hiện hành của cổ phiếu i
Pi0: Giá thị trường vào ngày gốc của cổ phiếu i
Qi0: Số lượng niêm yết vào ngày gốc của cổ phiếu i
Tại thị trường việt nam chỉ số vn indec phản ánh rủi ro hệ thống vì vậyviệc dự báo sự tăng giảm của chỉ số vn_indec cũng đồng thời giúp các nhàđầu tư dự báo được giá cổ phiếu trên thị trường này
2.2 Xây dựng mô hình ARIMA cho chỉ số VN_INDEC
2.2.1 Nguồn số liệu
Nguồn cập nhật số liệu là trang web cophieu68.com
Số liệu được cập nhật từ ngày 25/12/2009 đến ngày 4/1/2011
Trang 182.2.2 Kiểm định tính dừng của chuỗi
Ta có đồ thị của chuỗi:
Kiểm định ADF ta có kết quả :
Từ đồ thị và kết quả kiểm định ADF cho p_values >0.05 ta có kết luậnchuỗi y không dừng
Kiểm định tính dừng của sai phân bậc nhất d(y) :
Trang 19Từ bảng kết quả cho ta thấyTqs =-14.84630, các giá trị tới hạn mức ýnghĩa 1%là -3.452442 ; mức ý nghĩa 5%là -2.871161 ; mức ý nghĩa 10%là-2.571968 =>|Tqs|>| |
Chuỗi d(Y)là dừng
Xác định p,q :
Ta có lược đồ tương quan của d(y) :
Trang 20Từ lược đồ ta có thể dự đoán p=1, q=0; p=0, q=1 Ta có thể có mô hìnhARIMA(1,1,0) ; ARIMA(0,1,1).
Trang 212.2.3 Ước lượng mô hình
Ta có p_values <0.05=>các hệ số có ý nghĩa thống kê
D(y)=-0.086+0.126*ma(1)
D(y)=-0.076+0.139*ar(1)
Trang 23Từ lược đồ tương quan và kiểm định B-G đều cho p_values
>0.05=>phần dư là nhiễu trắng
Cả 2 mô hình đều cho ta kết quả phần dư là nhiễu trắng
So sánh hệ số akaike và schwazar của 2 mô hình:
Mô hình arima(0,1,1) có hệ số akaike và schwzar đều nhỏ hơn
Ta lưa chọn mô hình arima (0,1,1)
2.2.5 Khả năng dự báo
Vậy ta có sai số 1.77%<5%
Mô hình có thể sử dung để dự báo khá tốt
٭ Dự báo mở rộng