Chương 2. MÔ HÌNH MARKOV ẨN TRONG DỰ BÁO CHUỖI THỜI GIAN
2.6. Hạn chế của mô hình dự báo với phân phối tất định
Mục này luận án sử dụng một số thống kê mô tả để chỉ ra rằng phân phối chuẩn (thường dùng trong các mô hình dự báo) không phản ánh đúng thực tế của chuỗi thời gian chẳng hạn như chuỗi tài chính.
Ta sẽ tập trung vào hai vấn đề chính.
Ta thấy rằng logarit lợi suất thực tế không thể hiện theo một phân phối chuẩn.
Các dao động hay các tham số dùng để ước lượng sự không chắc chắn của nó (hay nói chung là môi trường) thay đổi ngẫu nhiên trên toàn bộ
thời gian và được cộng gộp.
2.6.1. Phân phối chuẩn
Định nghĩa 2.6.1. [66] Phân phối chuẩn, Normal( , 2) là phân phối có trung bình
và phương sai 2 0. Hàm đặc trưng của nó được cho bởi
1 2 2
2 2
( ; , ) iu u
Normal u e e
và hàm mật độ là
2 2
( )
2 2
2
( ; , ) 1 .
2
x Normal
f x e
Tính chất [66]
Phân phối chuẩn Normal( , 2) đối xứng quanh trung bình của nó và có độ nhọn bằng 3:
( , 2) Normal
Trung bình
Phương sai 2
Độ lệch đối xứng 0
Độ nhọn 3
2.6.2. Các tham số tương ứng từ dữ liệu thực Không đối xứng và độ nhọn vượt chuẩn
Với một biến ngẫu nhiênX , ta ký hiệu X E X[ ] là trung bình của nó và var[ ]X E X[( X) ]2 0 là phương sai. Căn bậc hai của phương sai var[ ]X được gọi là độ lệch chuẩn (SD). Chú ý rằng độ lệch chuẩn của một biến ngẫu nhiên có phân phối chuẩn N( , 2) bằng 0.
Bảng 2.6.1. Trung bình, độ lệch chuẩn, độ lệch đối xứng, độ nhọn của một số chỉ số có VN-index
Chỉ số Trung bình SD Độ lệch đối
xứng
Độ nhọn
VN-index (2009-2010) -0,000786 0,012378 -0,133837 4,658174
S&P 500 (1997-1999) 0,0009 0,0119 -0,4409 6,94
Nasdaq-Composite 0,0015 0,0154 -0,5439 5,78
DAX 0,0012 0,0157 -0,4314 4,65
SMI 0,0009 0,0141 -0,3584 5,35
CAC-40 0,0013 0,0143 -0,2116 4,64
Trong bảng 2.6.1 ta tóm tắt theo thống kê trung bình, độ lệch chuẩn cho một tập hợp chỉ số bao gồm chỉ số VN-index bộ dữ liệu 2009-2010. Ta thấy một cách khái quát về sự không đối xứng và độ nhọn cao của phân phối thống kê.
Độ lệch đối xứng
Độ lệch đối xứng đo mức độ đối xứng của một phân phối. Được tính bởi:
3 3/ 2
[( ) ]
(var[ ]) . E X X
X
Với một phân phối đối xứng (như phân phối chuẩn N( , 2)), độ lệch đối xứng bằng 0.
Nếu ta nhìn vào loga lợi suất hàng ngày của các chỉ số trên, ta thấy một số độ lệch đối xứng âm đáng kể. Trong bảng 2.6.1, ta thấy độ lệch đối xứng theo thống kê của loga lợi suất hàng ngày của chỉ số VN-index là âm, trong khi phân phối chuẩn có độ lệch đối xứng bằng không.
Độ nhọn vượt mức
Tiếp theo, ta cũng chỉ ra rằng các biến động lớn trong giá tài sản xảy ra thường xuyên hơn trong một mô hình với số gia là phân phối chuẩn. Mức độ thường xuyên của sự biến động này thường được xác định khi độ nhọn vượt mức cũng như phần đuôi của phân phối bành trướng bất thường.
Cách để đo độ nhọn vượt mức này là sử dụng công thức
4 2
[( ) ]
var[ ] . E X X
X
Với phân phối chuẩn, độ nhọn (mesokurtic) bằng 3. Nếu phân phối có đỉnh phẳng hơn (platykurtic), thì độ nhọn nhỏ hơn 3. Nếu phân phối có chỏm cao (leptokurtic), thì độ nhọn lớn hơn 3.
Trong bảng 2.6.1, ta dễ thấy rằng dữ liệu của ta luôn luôn có độ nhọn lớn hơn 3,
cho thấy rằng phần đuôi của phân phối chuẩn đi về 0 nhanh hơn nhiều các dữ liệu thống kê và điều đó có nghĩa phân phối thống kê có chóp cao hơn nhiều phân phối chuẩn. Thực tế những phân phối có chỏm cao hơn phân phối chuẩn (leptokurtic) đã được chú ý bởi Fama (1965) [26].
Sự ước lượng mật độ
Cuối cùng, ta sẽ nhìn vào bức tranh về mật độ theo thống kê và so sánh với mật độ phân phối chuẩn.
Hạt nhân ước lượng mật độ
Để ước lượng mật độ theo lối thực nghiệm, ta sử dụng hạt nhân ước lượng mật độ.
Mục đích của sự ước lượng mật độ là xấp xỉ hàm mật độ xác suất f x( ) của biến ngẫu nhiên X . Giả sử rằng ta có n quan sát độc lập x x1, 2, ,xn từ biến ngẫu nhiênX . Hạt nhân nước lượng mật độ f xh( ) cho sự ước lượng của hàm mật độ f x( ) tại điểm x
được định nghĩa là
1
( ) 1
n i h
i
x x
f x K
nh h
trong đó K x( ) gọi là hàm hạt nhân và h là băng thông. Trong lậun án này ta sử dụng hạt nhân Gauss: ( ) 1 2/ 2
2 K x e x
. Tuy nhiên, còn có các hàm hạt nhân tiêu biểu khác là hạt nhân đồng dạng, hạt nhân tam giác, toàn phương và hạt nhân cosin. Trong công thức ở trên ta cũng phải chọn băng thôngh. Với hạt nhân Gauss, ta sử dụng giá trị
"quy tắc ngón tay cái" của Silverman h1.06n1/5 (xem Silverman 1986)[59].
Hạt nhân ước lượng mật độ Gauss dựa trên loga lợi suất hàng ngày của VN- Index suốt thời gian từ 2009 đến 2010 được chỉ ra trong hình 2.6.1. Ta thấy đó là một phân phối có chóp nhọn. Điều này cho ta thấy, hầu hết các thời điểm, giá cổ phiếu không thay đổi nhiều; có một khối lượng đáng kể trong tổng số mật độ chuyển động quanh 0. Cùng được vẽ trong hình 2.6.1 là mật độ chuẩn với trung bình
0.000786321
và 0.01237793, tương ứng với trung bình và độ lệch chuẩn của loga lợi suất hàng ngày.
Hình 2.6.1. (a) Hạt nhân ước lượng mật độ Gauss và phân phối chuẩn và (b) loga các mật độ của loga lợi suất hàng ngày của VN-Index
Phân phối nửa nặng đuôi (Semi-heavy tailed distribution)
Đồ thị hàm mật độ tập trung vào trung tâm; tuy nhiên, dáng vẻ của phần đuôi cũng rất quan trọng. Do đó, ta nhìn vào hình 2.6.1 loga mật độ, nghĩa là logf xh( )và tương ứng là loga của mật độ chuẩn. Loga mật độ của phân phối chuẩn có sự phân tán bậc hai, trong khi loga mật độ thống kê dường như có nhiều sự phân tán tuyến tính hơn.
Đặc trưng này điển hình cho dữ liệu tài chính và thường được đề cập đến như là sự
"nửa nặng đuôi (semi-heavy tail)".