CHƯƠNG 2 PHÂN TÍCH THỐNG KÊ VỚI PHÂN PHỐI CHUẨN
2.4 Một số bài toán
2.4.3 Bài toán về kiểm định tham số
Trong năm trước trọng lượng trung bình trước khi xuất chuồng của bò ở một trại chăn nuôi là 380 kg. Năm nay người ta áp dụng thử một chế độ chăn nuôi với hi vọng là bò sẽ tăng trọng lƣợng nhanh hơn. Sau thời gian áp dụng thử người ta lấy ngẫu nhiên 50 con bò trước khi xuất chuồng đem cân và tính
đƣợc trọng lƣợng trung bình của chúng là 390 kg.
Vậy với mức ý nghĩa =0,01 có thể cho rằng trọng lƣợng trung bình của bò trước khi xuất chuồng có tăng lên hay không?
Giả thiết trọng lƣợng của bò là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn là 35,2 kg.
Giải
Gọi X là trọng lượng của bò trước khi xuất chuồng.
Theo giả thiết X phân phối chuẩn với = 35,2.
Vậy trọng lƣợng xuất chuồng trung bình là .
Đây là bài toán kiểm định giá trị của tham số của biến ngẫu nhiên phân phối chuẩn khi đã biết phương sai của tổng thể.
Ta có cặp giả thuyết thống kê có dạng H : 380; K: 380. Tiêu chuẩn kiểm định
, X 380
U 50
35 2
.
Trong đó X là trung bình mẫu ngẫu nhiên kích thước n = 50.
Với =0,01 ta có u() = u 0,01 = 2,33.
Từ mẫu cụ thể ta có X = 390. Vậy giá trị quan sát của tiêu chuẩn kiểm định , .
, 390 380
U 50 2 01
35 2
Ta thấy U = 2,01 < u 0,01 = 2,33.
Nhƣ vậy với mức ý nghĩa =0,01 , qua mẫu cụ thể đã cho ta chƣa có cơ sở để bác bỏ H. Kết quả trên cũng cho thấy trung bình mẫu thu đƣợc qua mẫu cụ thể đã cho không khác biệt một cách có ý nghĩa so với trung bình tổng thể.
Ví dụ 9
Trọng lƣợng đóng bao của các bao gạo trong kho là biến ngẫu nhiên phân
phối chuẩn với trọng lƣợng trung bình theo quy định là 50 kg.
Nghi ngờ bao gạo bị đóng thiếu, người ta đem cân ngẫu nhiên 25 bao và thu đƣợc các số liệu sau.
Trọng lượng bao ( kg ) Số bao tương ứng 48,0 - 48,5
48,5 - 49,0 49,0 – 49,5 49,5 – 50,0 50,0 – 50,5
2 5 10
6 2 n = 25 Với ý nghĩa = 0,01 hãy kết luận về điều nghi ngờ nói trên.
Giải
Gọi X là trọng lƣợng đóng bao. Theo giả thiết X phân phối chuẩn.
Vậy trọng lƣợng đóng bao trung bình chính là tham số . Đây chính là bài toán kiểm định giả thuyết về tham số của phân phối chuẩn N( , 2) khi chƣa biết 2.
Cặp giả thuyết thống kê
H : 50; K: 50
Xét -tn-1()= -t24 ( 0,01) = - 2,402.
Từ mẫu cụ thể ta lập bảng tính X ,s2.
xi ni nixi 2
n xi i
48,25 48,75 49,25 49,75 50,25
2 5 10
6 2
96,5 243,75
492,5 298,5 100,5
4656,125 11882,8125
24255,625 14850,375 5050,125 n = 25 1231, 75 60695, 062
Từ đó
1231,75
X 49,27
25
s = 25 60695 062, , 2 25. , , 49 27 0 27 0 53
24 25 24
.
Vậy giá trị quan sát của tiêu chuẩn kiểm định
( , )
, ,
49 27 50 25
t 6 887
0 53
.
Ta thấy t < - t24 (0,01) nên ta bác bỏ H và chấp nhận K, tức qua mẫu cụ thể này thừa nhận bao gạo bị đóng thiếu với mức ý nghĩa 0,01.
Ví dụ 10
Một nghiên cứu được thực hiện với 20 người ở 1 phường và 19 người ở một phường khác trong thành phố để xem thu nhập trung bình hàng năm ( tính bằng triệu đồng ) của dân cư hai phường đó có thực sự khác nhau hay không. Các số liệu mẫu thu đƣợc nhƣ sau:
n1 = 20 n2 = 19
X 18 27, Y 16 78,
2 8, 74
SX SY2 6,58
Vậy với mức ý nghĩa 0,05 có thể cho rằng thu nhập trung bình của dân cƣ ở hai phường đó khác nhau hay không?
Giả thiết thu nhập hàng năm của dân cư hai phường cùng phân phối chuẩn với phương sai như nhau.
Giải
Gọi X và Y tương ứng là thu nhập hàng năm của dân cư hai phường đó.
Theo giả thiết X và Y phân phối chuẩn với phương sai X2 Y2. Do đó để kiểm định cặp giả thuyết
H : X Y ; K:X Y. Ta sử dụng công thức kiểm định
; 2( )
1 1 n m 2
P
X Y
S T T t
S n m
.
Với = 0,05 tn m 2( ) t37( ,0 025) 2 021, 2
.
Từ mẫu cụ thể ta tính đƣợc
. , . ,
P ,
19 8 74 18 6 58
S 2 773
20 19 2
.
Do đó
, ,
, .
,
18 27 16 78
T 1 677
1 1
2 773
20 19
Ta thấy T = 1,677 < t37 (0,025) = 2,021.
Do đó với mức ý nghĩa 0,05 qua hai mẫu cụ thể đã cho chƣa có cơ sở để bác bỏ H tức là có thể xem trung bình hàng năm của dân cư hai phường đó là như nhau.
Ví dụ 11
Người ta cân trẻ sơ sinh ở hai khu vực thành thị và nông thôn, thu được kết quả sau
Khu vực Số trẻ đƣợc cân Trọng lƣợng trung bình
Phương sai
Nông thôn n = 2500 X 3, 0 s2X 200
Thành thị m = 500 Y 3,1 sY2 5
Với mức ý nghĩa 0,01 có thể coi trọng lƣợng trung bình của trẻ sơ sinh ở hai khu vực đó là bằng nhau đƣợc không?
Giải
Gọi trọng lượng trẻ sơ sinh ở nông thôn và thành thị tương ứng là X và Y.
Vậy trọng lƣợng trẻ sơ sinh trung bình là X và Y . Đây là bài toán kiểm định cặp giả thuyết
: X Y ; : X Y
H K . Khi chưa biết phương sai X2 và Y2.
Do n > 30 và m > 30 nên ta có công thức tiêu chuẩn kiểm định có dạng
2 2
X Y
X Y
T
s s
2500 500
.
Do 0 01, 0 05, u0 005, 2 576, 2
.
Qua mẫu cụ thể tính đƣợc
, ,
, . 3 0 3 1
U 0 33
200 5
2500 500
Ta thấy U = -0,33 < u 0,005 = 2,576 nên chƣa có cơ sở để bác bỏ H. Nhƣ vậy có thể coi trọng lƣợng trẻ sơ sinh ở nông thôn và thành thị là nhƣ nhau.
Ví dụ 12
Có hai giống lúa có năng suất lúa trung bình xấp xỉ nhƣ nhau song mức độ phân tán về năng suất có thể khác nhau. Để kiểm tra điều đó người ta gặt mẫu tại hai vùng trồng hai giống lúa đó và thu đƣợc kết quả sau
Giống lúa Số điểm gặt Phương sai
A B
n1 = 41 n 2 = 30
2
ˆ1 11, 41 s
2
ˆ2 6,52 s
Với mức ý nghĩa = 0,05 hãy kết luận về vấn đề trên, biết năng suất lúa là biến ngẫu nhiên phân phối chuẩn.
Giải
Gọi X và Y là năng suất của hai giống lúa A và B. X và Y phân phối chuẩn.
Đây là bài toán kiểm định cặp gả thuyết H: 12 22 với K: 12 22. Ta có tiêu chuẩn kiểm định có dạng
2 1
2 2
ˆ . ˆ
F s
s
Do 0 05, nên
40 ,29 40 ,29
40 ,29
29 ,40
F ( ) =F ( 0,025 ) 2,03 2
1 1
F ( 1 ) 0,52.
2 F ( ) 1,94
2
Với mẫu cụ thể ta có
, ,
, 11 41
F 1 75
6 52 .
Ta thấy F = 1,75 < F40 ,29( 0,025 )2,03 nên chƣa có cơ sở bác bỏ H hay độ phân tán của năng suất hai giống lúa trên là nhƣ nhau.
Ví dụ 13
Gặt ngẫu nhiên 200 thửa ruộngcủa một vùng thu đƣợc các số liệu sau Năng suất ( Tạ / ha ) Số thửa ruộng tương ứng
4 – 6 6 – 8 8 – 10 10 – 12 12 – 14 14 – 16 16 – 18 18 – 20 20 – 22
15 26 25 30 26 21 24 20 13 n = 200
Với mức ý nghĩa = 0,05 có thể coi năng suất của vùng đó có phân phối theo quy luật chuẩn đƣợc không?
Giải
Cặp giả thuyết thống kê
H: Năng suất lúa X phân phối chuẩn.
K: Năng suất lúa X không phân phối chuẩn.
Qua mẫu cụ thể trên, ƣớc lƣợng hợp lý tối đa của là X 12 65, , của là
2 xi
s = 22,04 và sxi= 4,695.
Để tính các xác suất
i i 1
i i 1 i
x x
p P x X x (i = 1,k )
.
Hay
i i
i i 1
i 2 2
x x
x x x x
p s s .
Với khoảng thứ nhất (x 0 – x1) ta thay bằng ,x1và khoảng cuối cùng (xk - 1 – x k ) thay bằng (xk1;) để hợp của tất cả các khoảng tạo thành toàn bộ trục số. Lập bảng tính toán sau
x i -1 - xi Ui -1 =
1
i
i x
x x
s
Ui =
i
i x
x x s
(Ui1) (Ui)
pi = (Ui)
- (Ui1)
'
i i
n np
6
6 – 8 8 – 10 10 – 12 12 – 14 14 – 16 16 – 18 18 – 20 20
-1,41 -0,99 -0,156
-0,13 0,29 0,72 1,14 1,57
-1,41 -0,99 -0,156
-0,13 0,29 0,72 1,14 1,57
-0,5 -0,4207 -0,3389 -0,2123 -0,0517 0,1141 0,2642 0,3729 0,4418
-0,4207 -0,3389 -0,2123 -0,0517 0,1141 0,2642 0,3729 0,4418
0,5
0,0793 0,0818 0,1266 0,1606 0,1658 0,1501 0,0917 0,0689 0,0582
15,86 16,36 25,32 32,12 33,16 30,02 21,74 13,78 11,6
1, 00
200
Giá trị quan sát
' 2
' 1
( )
k
i i
i i
n n
G n
= 13,32.
Do = 0,05k r 12 ( ) 62( ,0 05)12 6, .
Ta thấy 2= 13,32 > 62(0,05) 12,6 . Ta bác bỏ giả thuyết H chấp nhận K, tức là thừa nhận X không tuân theo quy luật phân phối chuẩn.