KIỂM ĐỊNH GIẢ THUYẾT
2.3. Trưởng hợp có giả thiết chuẩn
Mô hình (2.4) với các giả thiết có thể tóm tắt lại (xem (2.3a - c))
y; = aX; + 6 + i = l,n,
£■ ~ o ^ ( 0 , ơ-^); E [e-Sj) = Q , i i t j .
Khi đó ta có thể xác định luật phân phôi xác suất của các ưốc lượng â, b và (trong (2.9)). Trước hết:
â ~ oVịo, ơ^y, b ~ c v ịb , a l j ,
với ơl và ơl đã xác định trong (2.12). Tưdng tự;
(2.15)
( n - 2 ) 4 ~ / ( n - 2 ) ,
ơ (2.16)
với Để ý là ầ và 6 về m ặt lý thu yết là các biến /z 2
ngẫu nhiên độc lập với N goài ra lưu ý đến công thức của c o v (â ,b ) trong (2.12), ta có phân phối đồng thòi của â và 6 là:
a oV
1 - X
- X n
(2.17)
Các phân phối (2.15) - (2.17) đặt cơ sở cho các bài toán kiếm định giả thuyết hoặc tìm khoảng tin cậy cho các ước lượng hoặc cho các dự báo dùng hồi quy trong thực hành.
Ngưòi ta cũng chứng minh đưỢc rằng ô và 6 cũng là ưốc lượng hiệu quả của a và ò.
Đầu tiên ta tìm khoảng tin cậy 1 - a cho ước lượng ă . Theo (2.15) và (2.16):
= ~ o V {0 , 1);
4M
2 . K h o ả n g t i n c ậ y
â - a
( n - 2 ) 4 - ~ z ' ' ( n - 2 ) ,
ơ
nên thông kê:
à - a
í(n - 2).
Kết quả §4, chương V, cho ta khoảng tin cậy \ - a (xét khoảng đối xứng, các khoảng dạng khác bạn đọc dễ dàng tự tìm đưỢc):
ả -A stn-2,l-ơ/2
< a < ã + v Ị ( - . -
q f
. (2.18a)
Tương tự:
ỉ> - n 2,1—c/2 --- / ----—- \ Ỷ ỵ ( x , - X j
< 6 < 6 + _____ ị________
(2.18Ồ) (2.18c)
2 - w — y 2
^ n - 2 ; l - a / 2 ^ n - 2 ; a / 2
Thí dụ 2.3. Tìm các khoảng tin cậy 95% cho các tham số' trong thí dụ 2.1.
Giải. Trước hết lưu ý rằng phải có giả thiết chuẩn thì các khoảng (2.18a-c) mối dùng đưỢc. Bây giờ ta tra các bảng phân vị í(6) và / ( 6 )
^6; 0,975 ” 2,447; ^1-0.975 “ 14,449; ^1;0,025 “ 1,237.
Từ đó ta có các khoảng tin cậy 95% tương ứng cho a, b và 'o,0436 - 0,0436 + 0.2189-2.447'
7205,38
0,0857 - 0,2189.2,447.
^205,38
= (0,0062; 0,0810) 35893,5
8.205,38
0,0857 + 0,2189.2,447. /35893,5
0,2867 0,2876
V 8.205,38
= (-2,8049; 2,9763);
= (0,0199; 0,2325). ■ 1 4,449’ 1,237
Ta có thể lưu ý rằng:
~ Phân phôi đồng thòi (2.17) cho phép xây dựng miền tin cậy cho véctơ tham sô' (miền tin cậy đồng thòi của a và 6, đó là một hình e-líp);
- Mô hình (2.4) có thế dùng để dự báo giá trị y nếu biết X tưđng ứng và ta có thể tìm khoảng tin cậy ăốì với giá trị đó.
3. Kiểm định giả thuyết
Bằng các lý luận giông như ở trên và để ý đến chưđng V ta có thê xét các kiếm định giả thuyết về tham sô. Chang hạn xét bài toán kiềm định:
Hịy: a = Oo vối a ^ Uq.
Thông thường chưa biết và dùng tiêu chuẩn:
à - ữc
ta có miền tối hạn vối mức a (miền đôi xứng):
Ba = ị K , „ . : > C 2 ; I ^ . / 2 } - (2.19)
Bạn đọc có thể tìm các kết quả khác cho trường hỢp kiểm định một phía; tương tự cho kiểm định về tham sô" 6 và <ỷ.
Thí dụ 2.4. Vối a = 0,05 hãy kiểm định giả thuyết a = 0 vối đốì thuyết a ^ ồ (sô' liệu của thí dụ 2.1).
Giải. Như trong thí dụ 2.3 ở đây ta giả sử có giả thiết chuẩn. Khi đó giá trị ngưỡng của bài toán te 0975 = 2,447. Tính thống kê thực nghiệm (2.19), dựa vào tiêu chuẩn tương ứng:
= ~ Q 7205,38 2,8542.
0,2189 ^
Do 2,447 < 2,8542 giả thuyết Ho bị bác bỏ.
Để ý rằng giả thuyết Hq: a = 0 có ý nghĩa rất quan trọng vì nó cho phép chấp nhận hay bác bỏ sự có mặt của biến X trong mô hình đang xét. Ngoài ra ở đây;
± * 2
_ ^ r^2 _ ^
K ~ —ị ,--- , suy ra K = àA
s i Z {^ , -
/=1
và do ^ ---•'^(1; n - 2) ta có thể dùng
s ^ ' 1 - r
tiêu chuẩn này và phân phối & để kiểm định Hq. a = 0.
2.4. Hê số xác đinh • è
Để đánh giá sự phù hỢp của mô hình tuyến tính ngưòi ta sử dựng nhiều cách khác nhau, chẳng hạn dùng phương sai sai số mô hình, khoảng tin cậy của các hệ số dùng các kiểm định tương ứng, hệ số tương quan mẫu gần ±1 ... Khái niệm hệ số xác định cũng rất có ích để đánh giá chất lượng của mô hình tuyến tính.
Từ công thức (2.13) ta đã thấy;
Z(>'. - = E í x - ỳ i f + Z(>'. - ^ í -
với vế trái là tổng bình phương độ lệch của y khỏi Y (độ lệch tiên nhiệm); hai sô" hạng v ế phải lần lượt là tổng bình phương
độ lệch của y so vâi hồi quy (hay tổng phương sai dư, tổng bình phương sai sô" hồi quy) và tổng bình phương sai sô" cảm sinh bởi hồi quy. Nếu ta đem tổng thứ ba chia cho v ế trái thì:
r - = ^ 1 _ (2.20)
Z ( x - ? ) I ( : v , - ĩ )
sẽ được gọi hệ sô'xác định mẫu của mô hình hồi quy tuyến tính (2.4), giá trị mà ta đã biết ở §1 như là bình phương của hệ số tương quan. Để ý là nếu = 1, (2.20) sẽ cho ta ^ ( 3', ~ ỳ, f - 0 hay trong mọi trường hỢp y, = ỳ- (mô hình chính xác). Nói chung , r'^ cho thấy tỷ lệ tổng bình phương sai số tiên nghiệm được giải thích bởi mô hình tuyến tính (bởi biến X). Để ý rằng từ đó cho ta phần của tổng tiên nghiệm không được giải thích bởi mô hình tuyến tính.
Cuô'i cùng ước lừợng (không có điều kiện hay tiên nghiệm) của phương sai của Y, như ta biết chính là:
Còn
là ước lượng có điều kiện của phương sai E Y biết giá trị tương ứng x = X. Đấy cũng là ước lượng tốt nhất của VY = hiểu theo nghĩa không chệch mà ta đã xét trong (2.9) và ký hiệu là s^.