CƠ SỞ LÍ THUYẾT
I Các khuyết tật của mô hình
Khi đó α^1 trở thành ước lượng vững của β 1 và α^2là ước lượng không chệch của β 2 nhưng nó không còn hiệu quả
Phương sai của hàm hồi quy trở thành ước lượng vững.
- TH1: Nếu biến cần X k có số liệu
+ Ước lượng mô hình có thêm X k
+ Kiểm tra hàm số của X k =0
- TH2 : Không biết số liệu của X k
Kiểm định Reset of Ramsey
B1: Ước lượng mô hình gốc ban đầu:
3 Đa cộng tuyến: a) Khái niệm
Trong mô hình hồi quy tuyến tính cổ điển (CLRM), một trong những giả định quan trọng là các biến độc lập không có mối quan hệ tuyến tính chính xác Khi giả thiết này bị vi phạm, hiện tượng đa cộng tuyến xuất hiện, trong đó các biến độc lập trong mô hình phụ thuộc lẫn nhau và có thể được thể hiện dưới dạng hàm số Điều này ảnh hưởng đến độ chính xác của các ước lượng trong mô hình hồi quy.
Xét mô hình hồi quy tuyến tính cổ điển nhiều biến:
- Đa cộng tuyến hoàn hảo ( toàn phần )
Nếu tồn tại i không đồng thời bằng 0 thõa mãn:
= 0 ∀ i thì mô hình có đa cộng tuyến hoàn hảo
- Đa cộng tuyến không toàn phần
Nếu tồn tại i không đồng thời bằng 0 và ∀ i thõa mãn:
=> Mô hình xảy ra hiện tượng đa cộng tuyến không toàn phần
Nhận xét: Trong thực tế chủ yếu gặp phải đa cộng tuyến không toàn phần.
Có 3 cách phát hiện đa cộng tuyến:
Cách 1: Tìm ma trận tương quan giữa các biến giải thích trong mô hình
Hệ số R 2 lớn nhưng tỷ số t nhỏ
Trong trường hợp R 2 cao (thường R 2 > 0,8) mà tỷ số t thấp thì đó chính là dấu hiệu của hiện tượng đa cộng tuyến.
Nhược điểm: Chỉ thể hiện rõ khi có đa cộng tuyến ở mức độ cao.
Cách 2: Hệ số tương quan cặp
=> Mô hình có cơ sở để khẳng định đa cộng tuyến
Cách 3: Thực hiện mô hình hồi quy phụ (hồi quy của mỗi biến độc lập theo các biến độc lập còn lại)
F = nếu H0 đúng thì F Với α cho trước ta tìm được C = f α (k−1, n−k)
Nếu F > C, bác bỏ H 0 c) Khắc phục đa cộng tuyến
Giải pháp 1 cho vấn đề này là loại bỏ một số biến độc lập, với giả định rằng việc loại bỏ không ảnh hưởng đến mối quan hệ giữa biến phụ thuộc và các biến độc lập còn lại trong mô hình.
- Giải pháp 2: Bổ sung dữ liệu hoặc tìm dữ liệu mới, tìm mẫu dữ liệu khác hoặc gia tăng cỡ mẫu.
Giải pháp 3: Thay đổi dạng mô hình trong kinh tế lượng có thể được thực hiện bằng cách sử dụng các dạng hàm khác nhau Việc thay đổi dạng mô hình đồng nghĩa với việc tái cấu trúc mô hình để cải thiện độ chính xác và tính khả thi của các dự đoán.
- Giải pháp 4: Sử dụng phương trình sai phân cấp 1
4 Phương sai sai số thay đổi: a) Kiểm định Park:
T = nếu H0 đúng thì T Dựa vào bảng kiểm định park bằng phần mềm Eviews ta có được: p-value
Với α cho trước, nếu p-value < α= 5%, bác bỏ H0 b) Kiểm định White:
Dựa vào bảng kiểm định white bằng phần mềm Eviews ta có được p- value Với α cho trước, nếu p-value < α=5%, bác bỏ H0 c) Kiểm định Glijser:
T = nếu H0 đúng thì T Dựa vào bảng kiểm định white bằng phần mềm Eviews ta có được p- value Với α cho trước, nếu p-value < α= 5%, bác bỏ H0 d) Kiểm định G-Q:
5 Tự tương quan: a) Kiểm định B-G:
Xét mô hình: Yt = b1+ b2Xt + Ut (1) với Ut =r1Ut-1+ r2Ut-2 +…+ rpUt-p+ et et thỏa mãn các giả thiết của mô hình cổ điển cần kiểm định
= (n nếu H0 đúng thì Dựa vào bảng kiểm định B-G bằng phần mềm Eviews ta có được: p- value Với α cho trước, nếu p-value < α= 5%, bác bỏ H0 b) Kiểm định D-W:
Xét mô hình hồi qui có tự tương quan bậc nhất (Ut =rUt-1+et (-1 £ r £1)
TCKĐ: d Trường hợp tự tương quan bậc nhât ( với n và k’, tra bảng thống kê d ta tìm được và ):
- Nếu 0 < d < d l : có tự tương quan dương
- Nếu d l ≤ d ≤ d u , 4−d u ≤ d ≤ 4−d l :không đủ cơ sở để kết luận
- Nếu d u Bác bỏ H 0 , chấp nhận H 1
Kết luận: Với mức ý nghĩa α =5 % , không nên loại bỏ biến năng suất (X) ra khỏi mô hình
TH2: Với mức ý nghĩa α=0,05 có nên loại bỏ biến chỉ số giá tiêu dùng (Z) khỏi mô hình không?
Giả sử mô hình đúng: Y t =β 1+ β 2 X t + β 3 Z t + β 4 M t + β 5 S t + β 6 K t +U t
BTKĐ: { H 0 : β 3 =0(bi ế n c hỉ s ố gi á ti êu d ù ng k hô ng ả n h hưở ng đế n gi á tr ị xu ấ t k hẩ u)
H 1 : β 3 ≠ 0( bi ế n c hỉ s ố giá ti ê u d ù ng c ó ả n hhưở ng đế n giátr ị xu ấ t k hẩ u)
Ta thấy: P value =0,0329 Bác bỏ H o , chấp nhận H 1
Kết luận : : Với mức ý nghĩa α=5%, không nên loại bỏ biến chỉ số giá tiêu dùng (Z) ra khỏi mô hình
TH3 : Với mức ý nghĩa α=0,05 có nên loại bỏ biến diện tích gieo trồng
Giả sử mô hình đúng : Y t =β 1+ β 2 X t + β 3 Z t + β 4 M t + β 5 S t + β 6 K t +U t
BTKĐ: { H 0 : β 4 =0( bi ế n di ệ n t í c h gieotr ồ ng k hô ng ả n hhưở ng đế n gi á tr ị xu ấ t k hẩ u)
H 1 : β 4 ≠ 0(bi ế n di ệ n t í c h gieo tr ồ ng c ó ả nh hưở ng đế n gi á tr ị xu ấ t k hẩ u)
Ta thấy: P value =0,3653 >5% => Chấp nhận H o , bác bỏ H 1
Kết luận : : Với mức ý nghĩa α=5%, nên loại bỏ biến diện tích gieo trồng (M) ra khỏi mô hình
TH4 : Với mức ý nghĩa α=0,05 có nên loại bỏ biến sản lượng trong nước (S) khỏi mô hình không?
Giả sử mô hình đúng : Y t =β 1+ β 2 X t + β 3 Z t + β 4 M t + β 5 S t + β 6 K t +U t
BTKĐ: { H 0 : β 5 =0(bi ế n s ả n l ượ ng trong n ướ c k hô ng ả nh hưở ng đế n giá tr ị xu ấ t k hẩ u)
H 1 : β 5 ≠ 0( bi ế n s ả n l ượ ng trong n ướ c c ó ả n hhưở ng đế n giá tr ị xu ấ t k hẩ u)
Ta thấy: P value =0,0062 Bác bỏ H o , chấp nhận H 1
Kết luận : Với mức ý nghĩa α=5%, không nên loại bỏ biến sản lượng trong nước
TH5: Với mức ý nghĩa α=0,05 có nên loại bỏ biến thu nhập bình quân đầu người (K) khỏi mô hình không?
Giả sử mô hình đúng : Y t =β 1+ β 2 X t + β 3 Z t + β 4 M t + β 5 S t + β 6 K t +U t
{ H 0 : β 6 =0(bi ế n t hu n hậ p bì n h qu â n đầ u ng ườ i k hô ng ả n h hưở ng đế n gi átr ị xu ấ t k hẩ u)
H 1 : β 6 ≠ 0( bi ế n t h u n hậ p b ìn h qu â n đầ u ng ườ ic ó ả n h hưở ngđế n gi á tr ị xu ấ t k hẩ u)
Ta thấy: P value =0,0408 Bác bỏ H o , chấp nhận H 1
Kết luận : Với mức ý nghĩa α=5%, không nên loại bỏ biến thu nhập bình quân đầu người (K) ra khỏi mô hình
Sau khi kiểm tra về thừa biến, ta thấy M bị loại khỏi mô hình Mô hình còn lại X, Z, S và K.
Mô hình sau khi kiểm tra thừa biến là:
Omitted Variables: Squares of fitted values t-statistic
Ta thấy: P value =0,6092 > 5% => Chấp nhận H 0, bác bỏ H 1
Kết luận: Mô hình không thiếu biến.
Kiểm tra khuyết tật mô hình
3.1 Phương sai sai số thay đổi
K t + U t Ước lượng mô hình có dạng: e 2 i =β 1 + β 2 X i + β 3 Z i + β 4 S i + β 5 K i +α 2 X 2 i + α 3 Z 2 i +α 4 K 2 i + γ 1 XZ +γ 2 X S+ γ 3 X K +γ 4 ZS +γ 5 ZK +γ 6 SK + v i
Thực hiện kiểm định White trên phần mềm Eviews ta có kết quả như sau:
H 0 : Mô hìnhkhông có PSSS thay đổi
{ H 1 : Môhình có PSSS thay đổi
P- value = 0.3704 > α =0.05 => Chấp nhận H 0 , bác bỏ H 1
Kết luận: Mô hình không có hiện tượng phương sai sai số thay đổi
U t Ước lượng mô hình có dạng: ln e 2 i =α 1 +α 2 ln X i +α 3 ln Z i +α 4 ln S i + α 5 ln K i +v i Thực hiện kiểm định Park trên phần mềm Eviews ta có kết quả như sau:
H 0 : Mô hìnhkhông có PSSS thay đ ổi
{ H 1 : Môhình có PSSS thay đ ổi
Tiêu chuẩn kiểm định: F Nếu H 0 đúng thì F F (k−1 ;n−k)
Kết luận: Mô hình không có hiện tượng phương sai sai số thay đổi
Xét mô hình sau: Y t =β 1+ β 2 X t + β 3 Z t + β 4 S t + β 5 K t + U t Ước lượng mô hình có dạng: | e i |=α 1 +α 2 X i + α 3 Z i +α 4 S i +α 5 K i + v i
Thực hiện kiểm định Gleijer trên phần mềm Eviews ta có kết quả như sau:
H 0 : Mô hìnhkhông có PSSS thay đ ổi
{ H 1 : Môhình có PSSS thay đ ổi
Tiêu chuẩn kiểm định: F Nếu H 0 đúng thì F F (k−1 ;n−k)
P- value = 0.6313 > α =0.05 => Chấp nhận H 0 , bác bỏ H 1
Kết luận: Mô hình không có hiện tượng phương sai sai số thay đổi
Tiêu chuẩn kiểm định: d Sử dụng phần mềm Eviews để thực hiện kiểm định Durbin-Waston, ta có kết quả như sau:
Trong bảng kết quả trên, ta thấy giá trị thống kê Durbin – Waston là: d = 1.592742
Vì d L < d < d U => Không có kết luận về tự tương quan
Kết luận: Không có kết luận về tự tương quan.
Xét mô hình sau: Y t =β 1+ β 2 X t + β 3 Z t + β 4 S t + β 5 K t + U t Ước lượng mô hình: e i =β 1 + β 2 X i + β 3 Z i + β 4 S i + β 5 K i + ρ 1 e t −1 + …+ ρ p e t− p + v i
Với p = 1, ta có bảng Eviews:
Breusch-Godfrey Serial Correlation LM Test:
Presample missing value lagged residuals set to zero.
P – value = 0.3914 > α =¿ 0.05 => Chấp nhận H 0, bác bỏ H 1
Kết luận: Mô hình không có tương quan chuỗi bậc 1
Xét mô hình sau: Y t =β 1 + β 2 X t + β 3 Z t + β 4 S t + β 5 K t + U t Ước lượng mô hình: e i =β 1 + β 2 X i + β 3 Z i + β 4 S i + β 5 K i + ρ 1 e t −1+ …+ ρ p e t− p + v i
Với p = 2, ta có bảng Eviews:
Breusch-Godfrey Serial Correlation LM Test:
Presample missing value lagged residuals set to zero.
P – value = 0.6161 > α =¿ 0.05 => Chấp nhận H 0, bác bỏ H 1
Kết luận: Mô hình không có tương quan chuỗi bậc 2
3.3.1 Hệ số xác định bội R 2cao, t thấp
Từ bảng kết quả Eviews:
=> Mô hình hồi quy phù hợp t ( x) =5.827085 t ( z)=¿ 3.248515 t (s ) =4.050068 t (k ) =−2.319560
>t ( α n−k) => Mô hình không xảy ra hiện tượng đa cộng tuyến
3.3.2 Hệ số tương quan cặp giữa các biến giải thích cao
Ta có bảng thể hiện hệ số tương quan cặp giữa các biến:
Các hệ số tương quan giữa các biến được phân tích cho thấy không có đa cộng tuyến đáng kể Cụ thể, |r(X,Z)| = 0.374369, |r(X,S)| = 0.272672, |r(X,K)| = 0.569069, |r(Z,S)| = 0.427574, và |r(Z,K)| = 0.566173 đều nhỏ hơn 0,8, cho thấy mối quan hệ giữa các biến X, Z, S và K là thấp Tuy nhiên, |r(S,K)| = 0.856223 lớn hơn 0,8, chỉ ra rằng có thể tồn tại một mối quan hệ tuyến tính giữa S và K.
=> Có cơ sở kết luận có đa cộng tuyến trong mô hình
* Tiến hành hồi quy X theo Z
P-value = 0.1531 > 0.05 => Chấp nhận H 0 , bác bỏ H 1
=> Mô hình không có hiện tượng đa cộng tuyến
* Tiến hành hồi quy X theo S
P-value = 0.3069 > 0.05 => Chấp nhận H 0 , bác bỏ H 1
=> Mô hình không có hiện tượng đa cộng tuyến
* Tiến hành hồi quy X theo K
0.05 => Bác bỏ H 0 , chấp nhận H 1 => Mô hình xảy ra hiện tượng đa cộng tuyến
Khắc phục hiện tượng đa cộng tuyến (bỏ bớt biến độc lập )
Ta thấy R 2 K có giá trị lớn nhất nên quyết định bỏ biến K
Sau khi bỏ biến K, các giá trị P đều bé hơn α = 0.05, mô hình đã khắc phục được đa cộng tuyến.
Mô hình cuối và ý nghĩa của mô hình hồi quy
Công bố mô hình và ý nghĩa của mô hình hồi quy:
Sau khi đưa ra mô hình hàm hồi quy mẫu:
Nhóm đã sử dụng Eviews để kiểm tra biến và các khuyết tật Cuối cùng nhóm thu về được mô hình hồi quy mẫu cuối:
+ Y: Giá trị xuất khẩu gạo (Triệu USD)
+ X: Năng suất lúa (Tạ/ha)
+ Z: Chỉ số giá tiêu dùng (%)
+ S: Sản lượng trong nước (Nghìn tấn) Ý nghĩa mô hình hàm hồi quy mẫu:
Khi chỉ số giá tiêu dùng và sản lượng trong nước giữ nguyên, việc tăng năng suất lúa thêm 1 đơn vị sẽ dẫn đến sự gia tăng trung bình trong sản lượng xuất khẩu gạo khoảng 160,8279 triệu USD.
Khi năng suất lúa và sản lượng trong nước không thay đổi, việc chỉ số giá tiêu dùng tăng lên 1 đơn vị sẽ dẫn đến sự gia tăng sản lượng xuất khẩu gạo trung bình lên 75,2437 triệu USD.
Khi chỉ số giá tiêu dùng và năng suất lúa không đổi, việc tăng sản lượng trong nước lên 1 đơn vị sẽ dẫn đến việc sản lượng xuất khẩu gạo trung bình tăng thêm 0.065414 triệu USD.