1. Trang chủ
  2. » Giáo án - Bài giảng

Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn

25 51 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 575,72 KB

Nội dung

Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê gồm có những nội dung chính: Bài toán kiểm định giả thuyết thống kê, kiểm định tham số, kiểm định giả thuyết cho trường hợp một mẫu, kiểm định giả thuyết cho trường hợp hai mẫu độc lập, so sánh hai mẫu không độc lập, kiểm định chi bình phương (goodness-of-fit-test).

Outline KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Bài tốn Nguyễn Văn Thìn Bài tốn Kiểm định tham số Nguyễn Văn Thìn Kiểm định hợp lý Kiểm định tham số Một mẫu Hai mẫu độc lập BỘ MƠN THỐNG KÊ TỐN HỌC KHOA TỐN - TIN HỌC Hai mẫu độc lập Hai mẫu không độc lập ĐẠI HỌC KHOA HỌC TỰ NHIÊN TP.HCM Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Tháng năm 2016 Kiểm định Chi bình phương (Goodness-ofFit-test) Bài tốn Kiểm định tham số Bài toán kiểm định giả thuyết thống kê Kiểm định tham số Kiểm định hợp lý Kiểm định giả thuyết cho trường hợp mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết cho trường hợp mẫu Kiểm định giả thuyết cho trường hợp hai mẫu độc lập So sánh hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-of-Fit-test) Kiểm định giả thuyết cho trường hợp hai mẫu độc lập So sánh hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-of-Fit-test) Những nội dung KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Định nghĩa giả thuyết thống kê Bài tốn Giả thuyết khơng đối thuyết Kiểm định tham số Kiểm định hợp lý Kiểm định hợp lý Một mẫu Kiểm định hợp lý Bài toán kiểm định giả thuyết thống kê Outline Nguyễn Văn Thìn Kiểm định tham số Kiểm định hợp lý Một mẫu KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Bài toán kiểm định giả thuyết thống kê Một mẫu Hai mẫu độc lập Cách đặt giả thuyết Miền bác bỏ - Tiêu chuẩn kiểm định Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Sai lầm loại I loại II p - giá trị Định nghĩa KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Nguyễn Văn Thìn Định nghĩa Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Bài toán Giả thuyết thống kê phát biểu phân phối nhiều biến ngẫu nhiên Một giả thuyết thống kê, đúng, xác định hàm phân phối xác suất gọi giả thuyết đơn Ngược lại, gọi giả thuyết hợp Kiểm định tham số Kiểm định hợp lý Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định Chi bình phương (Goodness-ofFit-test) Định nghĩa Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Định nghĩa Trong tốn kiểm định giả thuyết, giả thuyết cần kiểm định gọi Giả thuyết không (null hypothesis), ký hiệu H0 Mệnh đề đối lập với H0 gọi đối thuyết (alternative hypothesis), ký hiệu H1 Nhận xét Khơng có ngun tắc chung cho việc chọn giả thuyết thống kê làm giả thuyết không giả thuyết khác làm đối thuyết Thông thường, người ta có khuynh hướng chấp nhận giả thuyết khơng có chứng thuyết phục chống lại Phép kiểm định cho giả thuyết thống kê quy tắc cho ứng với số liệu nhận từ mẫu, ta nhận định chấp nhận hay bác bỏ giả thuyết khảo sát Miền bác bỏ phép kiểm định tập số liệu mẫu mà phép kiểm định bác bỏ giả thuyết thống kê Một mẫu Hai mẫu không độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Định nghĩa Nhận xét Một phép kiểm định xác định miền bác bỏ, ngược lại, cách chọn miền bác bỏ cho ta xác định phép kiểm định Điều có nghĩa từ “phép kiểm định” “miền bác bỏ” thay Sai lầm loại I loại II KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý ❳❳ ❳❳❳ Thực tế ❳❳❳ ❳❳❳ Quyết định ❳ Không bác bỏ H0 Bác bỏ H0 H0 H0 sai Khơng có sai lầm Sai lầm loại I Sai lầm loại II Không có sai lầm Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Với phép kiểm định xác định miền bác bỏ R ⊂ Rn cho toán kiểm định giả thuyết không H0 : θ ∈ Θ0 so với đối thuyết H1 : θ ∈ Θ1 , người ta tìm cách đánh giá nguy sai lầm Outline KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Định nghĩa Với θ ∈ Θ, giá trị KR (θ ) = P((X1 , X2 , , Xn ) ∈ R|θ = θ ) gọi lực phép kiểm định θ Hàm số KR : Θ → R Kiểm định hợp lý Một mẫu θ → KR (θ) Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ gọi hàm lực phép kiểm định cho miền bác bỏ R Giá trị α = sup KR (θ) θ∈Θ0 Nguyễn Văn Thìn Bài toán Kiểm định tham số Bài toán kiểm định giả thuyết thống kê Kiểm định tham số Kiểm định hợp lý Kiểm định giả thuyết cho trường hợp mẫu Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết cho trường hợp hai mẫu độc lập So sánh hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-of-Fit-test) gọi mức ý nghĩa phép kiểm định (hay kích thước miền bác bỏ tương ứng) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài toán Kiểm định tham số Kiểm định tham số Trong phần này, ta khảo sát mơ hình tham số F = {f (x; θ) : θ ∈ Θ}, nghĩa xét tổng thể có hàm mật độ xác suất phụ thuộc vào tham số θ lấy giá trị miền tham số Θ ⊂ Rk Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Các phép kiểm định Kiểm định tối ưu (mạnh nhất, best test) Kiểm định tối ưu (mạnh nhất, uniformly most powerful test) Kiểm định tỷ số hợp lý Kiểm định hợp lý Một mẫu Định nghĩa Cho C tập không gian liệu mẫu C gọi miền bác bỏ tối ưu kích thước α để kiểm định giả thuyết đơn H0 : θ = θ so với đối thuyết đơn H1 : θ = θ (a) P[(X1 , X2 , , Xn ) ∈ C |H0 ] = α, (b) P[(X1 , X2 , , Xn ) ∈ C |H1 ] ≥ P[(X1 , X2 , , Xn ) ∈ A|H1 ], với tập A không gian liệu mẫu cho P[(X1 , X2 , , Xn ) ∈ A|H0 ] = α Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Nhận xét Điều kiện (a) nói kích thước miền bác bỏ α Điều kiện (b) nói miền bác bỏ có kích thước α, ta chọn miền có lực phép kiểm định θ = θ lớn KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Định lí (Neyman-Pearson) Xét mẫu ngẫu nhiên X1 , X2 , , Xn lấy từ tổng thể có hàm mật độ xác suất f (x; θ) Với θ θ hai tham số phân biệt θ với số dương k cho trước; gọi C tập không gian số liệu mẫu cho L(x1 , x2 , , xn ; θ ) (a) ≤ k, với điểm L(x1 , x2 , , xn ; θ ) (x1 , x2 , , xn ) ∈ C , L(x1 , x2 , , xn ; θ ) (b) > k, với điểm L(x1 , x2 , , xn ; θ ) (x1 , x2 , , xn ) ∈ / C, (c) α = P[(X1 , X2 , , Xn ) ∈ C |H0 ] Ta có C miền bác bỏ tối ưu kích thước α kiểm định giả thuyết đơn H0 : θ = θ so với đối thuyết đơn H1 : θ = θ Nhận xét 11 Nếu H0 giả thuyết đơn xác định hàm mật độ đồng thời mẫu ngẫu nhiên g (x1 , x2 , , xn ) đối thuyết đơn H1 xác định hàm mật độ đồng thời h(x1 , x2 , , xn ), C miền bác bỏ tối ưu kích thước α phép kiểm định H0 so với H1 khi, với k > 0, g (x1 , x2 , , xn ; θ ) (a’) ≤ k, với điểm h(x1 , x2 , , xn ; θ ) (x1 , x2 , , xn ) ∈ C , g (x1 , x2 , , xn ; θ ) > k, với điểm (b’) h(x1 , x2 , , xn ; θ ) (x1 , x2 , , xn ) ∈ / C, (c’) α = P[(X1 , X2 , , Xn ) ∈ C |H0 ] Giả thuyết đơn H0 H1 không thiết phải giả thuyết liên quan đến tham số phân phối không thiết biến ngẫu nhiên X1 , X2 , , Xn phải độc lập đôi KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Nhận xét 10 Ba điều kiện (a-c) không điều kiện đủ mà điều kiện cần để C miền bác bỏ tối ưu kích thước α Với k > 0, tập C tất điểm (x1 , x2 , , xn ) thỏa Kiểm định hợp lý L(x1 , x2 , , xn ; θ ) ≤ k, L(x1 , x2 , , xn ; θ ) Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) miền bác bỏ tối ưu Giá trị k xác định từ điều kiện (c) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Định nghĩa 12 Miền bác bỏ C gọi miền bác bỏ tối ưu kích thước α để kiểm định giả thuyết đơn H0 so với đối thuyết hợp H1 tập C miền bác bỏ tối ưu kích thước α để kiểm định H0 so với giả thuyết đơn lấy từ H1 Một phép kiểm định tương ứng với miền bác bỏ C gọi kiểm định tối ưu kích thước α để kiểm định giả thuyết đơn H0 so với giả thuyết đối phức hợp H1 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Cho biết X1 , X2 , , Xn n biến ngẫu nhiên độc lập đôi, có hàm mật độ xác suất fi (xi ; θ1 , θ2 , , θm ), i = 1, 2, , n Ω = {(θ1 , θ2 , , θm )} (không gian tham số) ω ⊂ Ω Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) H0 : (θ1 , θ2 , , θm ) ∈ ω so với H1 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Phép kiểm định tỷ số hợp lý Giả thuyết H0 (1) bị bác bỏ λ(x1 , x2 , , xn ) = λ ≤ λ0 Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định hợp lý Giả sử L đạt giá trị lớn ω Ω đặt Một mẫu Kiểm định Chi bình phương (Goodness-ofFit-test) Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu không độc lập Kiểm định tham số fi (xi ; θ1 , θ2 , , θm ), i=1 L(ω) = max (θ1 , ,θm )∈ω L(θ1 , , θm ) L(Ω) = max (θ1 , ,θm )∈Ω L(θ1 , , θm ) Tỷ số hợp lý, λ(x1 , x2 , , xn ) = λ = L(ω) L(Ω) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Kiểm định hợp lý Hai mẫu độc lập L(θ1 , θ2 , , θm ) = Bài toán Hai mẫu khơng độc lập (1) n Nguyễn Văn Thìn Hai mẫu độc lập Giả thuyết cần kiểm định Hàm hợp lý (mật độ đồng thời (X1 , X2 , , Xn )), Một mẫu Giá trị λ0 < xác định từ mức ý nghĩa: α = P[λ(X1 , X2 , , Xn ) ≤ λ0 |H0 ] Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Phép kiểm định hợp lý Xét Y = u(X1 , X2 , , Xn ) thống kê mẫu ngẫu nhiên mà phân phối xác suất hồn tồn xác định giả thuyết khơng H0 Miền bác bỏ kích thước α phép kiểm định hợp lý xác định phần bù khoảng tin cậy R thống kê Y , H0 đúng, độ tin cậy γ = − α, khoảng tin cậy R chọn cách “hợp lý” tùy vào đối thuyết H1 p - giá trị (p - value) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Phép kiểm định dùng khoảng tin cậy R = (a, b), với P(Y ≤ a|H0 ) = P(Y ≥ b|H0 ) = Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập gọi phép kiểm định hai bên Khi đó, ta bác bỏ H0 Y ≤ a hay Y ≥ b Phép kiểm định dùng khoảng tin cậy R = (−∞, C ) (hay R = (C , ∞)), với P(Y ≥ C |H0 ) = α (hay P(Y ≤ C |H0 ) = α) Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) α , gọi phép kiểm định bên Khi đó, ta bác bỏ H0 YgleC (hay Y ≤ C ) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định tham số Kiểm định hợp lý Kiểm định giả thuyết cho trường hợp mẫu Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Nội dung KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn So sánh hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-of-Fit-test) Kiểm định giả thuyết cho kỳ vọng Trường hợp biết phương sai, Bài toán Kiểm định tham số Kiểm định hợp lý Kiểm định giả thuyết cho trường hợp hai mẫu độc lập Dựa vào đối thuyết H1 , bước tính p-giá trị sau: Xác định thống kê kiểm định: TS Tính giá trị thống kê kiểm định dựa mẫu (x1 , , xn ), giả sử a p-giá trị cho   P(|TS| > |a||H0 ), kiểm định hai phía p = P(TS < a|H0 ), kiểm định phía - bên trái   P(TS > a|H0 ), kiểm định phía - bên phải (2) Kết luận: Bác bỏ giả thuyết H0 p-giá trị ≤ α Kiểm định giả thuyết cho trường hợp mẫu Outline Bài toán kiểm định giả thuyết thống kê Tương ứng với giá trị thống kê kiểm định tính mẫu giá trị quan trắc xác định, p - giá trị mức ý nghĩa nhỏ dùng để bác bỏ giả thuyết H0 Bài toán Y gọi thống kê kiểm định KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Định nghĩa 13 Trường hợp phương sai, mẫu nhỏ, Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Trường hợp khơng biết phương sai, mẫu lớn Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết cho kỳ vọng TH biết σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài toán Kiểm định tham số Kiểm định giả thuyết cho kỳ vọng TH biết σ • Các giả định: Mẫu ngẫu nhiên X1 , , Xn chọn từ tổng thể có phân phối chuẩn N(µ, σ ) với kỳ vọng µ chưa biết Kiểm định tham số Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định hợp lý Cho trước giá trị µ0 , cần so sỏnh k vng vi à0 ã Bi toỏn kiểm định có trường hợp: H0 : µ = µ0 (a) H1 : µ = µ0 H0 : µ = µ (b) H1 : µ < µ0 với mức ý nghĩa α cho trước Nguyễn Văn Thìn Bài toán Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Giả thuyết H0 : µ = µ0 H1 : µ = µ0 H0 : µ = µ0 H1 : µ < µ0 H0 : µ = µ0 H1 : µ > µ0 Miền bác bỏ Wα = z0 : |z0 | > z1−α/2 Phát biểu giả thuyết không đối thuyết Xác định mức ý nghĩa α Lấy mẫu ngẫu nhiên cỡ n: X1 , , Xn tính thống kê kiểm định ¯ − µ0 X √ Z0 = (3) σ/ n Xác định miền bác bỏ Wα : bảng Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết cho kỳ vọng TH biết σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Một mẫu Hai mẫu độc lập H0 : µ = µ0 (c) H1 : µ > µ0 Các bước kiểm định Nguyễn Văn Thìn Bài tốn Phương sai σ biết Kiểm định hợp lý Một mẫu KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Kiểm định giả thuyết cho kỳ vọng TH biết σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn • Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối thuyết kết luận bác bỏ H0 p -giá trị ≤ α, với mức ý nghĩa α cho trước Cơng thức tính p - giá trị theo trường hợp xem bảng Bài toán Wα = z0 : z0 < −z1−α Kiểm định tham số Kiểm định hợp lý Wα = z0 : z0 > z1−α Bảng 1: Miền bác bỏ với đối thuyết tương ứng Kết luận: Bác bỏ H0 / Chưa đủ sở để bác bỏ H0 Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Giả thuyết H0 : µ = µ0 H1 : µ = µ0 H0 : µ = µ0 H1 : µ < µ0 H0 : µ = µ0 H1 : µ > µ0 p - giá trị p = [1 − Φ(|z0 |)] p = Φ(z0 ) p = − Φ(z0 ) Bảng 2: p-giá trị với đối thuyết tương ứng Kiểm định giả thuyết cho kỳ vọng TH biết σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Ví dụ 14 (Kiểm định phía) Dây chuyền sản xuất kem đánh P/S thiết kế để đóng hộp tuýt kem có trọng lượng trung bình oz (1 oz = 28g) Một mẫu gồm 30 tuýt kem chọn ngẫu nhiên để kiểm tra định kỳ Bộ phận điều khiển dây chuyền phải đảm bảo để trọng lượng trung bình tuýt kem oz; nhiều hơn, dây chuyền phải điều chỉnh lại Giả sử trung bình mẫu 30 tuýt kem 6.1 oz độ lệch tiêu chuẩn tổng thể σ = 0.2 oz Thực kiểm định giả thuyết với mức ý nghĩa 3% để xác định xem dây chuyền sản xuất có vận hành tốt hay không? Kiểm định giả thuyết cho kỳ vọng TH biết σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Gọi X trọng lượng tuýt kem đánh răng, giả sử X ∼ N(µ, 0.22 ) Các bước kiểm định sau: H0 : µ = H1 : µ = Bài toán Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Xác định mức ý nghĩa: α = 0.03 Tính giá trị thống kê kiểm định Hai mẫu không độc lập z0 = Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết cho kỳ vọng TH biết σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) α = 3% nên z1−α/2 = z0.985 = 2.17 Vậy bác bỏ H0 z0 < −2.17 z0 > 2.17 Kết luận: z0 = 2.74 > 2.17 nên bác bỏ H0 Ta kết luận với 97% độ tin cậy trọng lượng trung bình tt kem khơng • Sử dụng p - giá trị: 4a Tính p-giá trị, tốn kiểm định hai phía p = 2[1−Φ(|z0 |)] = 2[1−Φ(2.74)] = 2[1−0.9969] = 0.0062 5a Kết luận: với α = 0.03, ta có p = 0.0062 < 0.03 nên bác bỏ H0 Ta kết luận với 97% độ tin cậy trọng lượng trung bình tuýt kem khơng Phát biểu giả thuyết: x¯ − µ0 6.1 − 6.0 √ = 2.74 √ = σ/ n 0.2/ 30 Xác định miền bác bỏ: Bác bỏ H0 |z0 | > z1−α/2 Kiểm định giả thuyết cho kỳ vọng TH biết σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Ví dụ 15 (Kiểm định phía) Metro EMS: Một bệnh viện trung tâm thành phố cung cấp dịch vụ cấp cứu nhà Với khoảng 20 xe cấp cứu, mục tiêu trung tâm cung cấp dịch vụ cấp cứu khoảng thời gian trung bình 12 phút sau nhận điện thoại yêu cầu Một mẫu ngẫu nhiên gồm thời gian đáp ứng có yêu cầu 40 ca cấp cứu chọn Trung bình mẫu 13.25 phút Biết độ lệch tiêu chuẩn tổng thể σ = 3.2 phút Giám đốc EMS muốn thực kiểm định, với mức ý nghĩa 5%, để xác định xem liệu thời gian ca cấp cứu có bé 12 phút hay không? Kiểm định giả thuyết cho kỳ vọng TH biết σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Kiểm định giả thuyết cho kỳ vọng TH biết σ Các bước kiểm định: Phát biểu giả thuyết H0 : µ = 12: Thời gian đáp ứng dịch vụ cấp cứu đạt yêu cầu, không cần phải thay đổi H1 : µ > 12: Thời gian đáp ứng dịch vụ không đạt yêu cầu, cần thay đổi Tính giá trị thống kê kiểm định Kiểm định Chi bình phương (Goodness-ofFit-test) z0 = Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Xác định mức ý nghĩa: α = 0.05 Hai mẫu không độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Hai mẫu độc lập Nguyễn Văn Thìn x¯ − 12 13.25 − 12 √ = √ = 2.47 σ/ n 3.2/ 40 • Các giả định: Mẫu ngẫu nhiên X1 , , Xn chọn từ tổng thể có phân phối chuẩn N(µ, σ ) với kỳ vọng µ phương sai σ Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) p = − Φ(z0 ) = − Φ(2.47) = − 0.9932 = 0.0068 Kiểm định Chi bình phương (Goodness-ofFit-test) 5a Kết luận: với α = 0.05, ta có p = 0.0068 < 0.05 nên bác bỏ H0 Ta kết luận với 95% độ tin cậy Metro EMS không đáp ứng mục tiêu thời gian phục vụ khách hàng từ 12 phút trở xuống KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Các bước kiểm định Phát biểu giả thuyết không đối thuyết Xác định mức ý nghĩa α Lấy mẫu ngẫu nhiên cỡ n: X1 , , Xn tính thống kê kiểm định ¯ − µ0 X √ T0 = (4) S/ n Bài toán Sử dụng ước lượng S thay cho σ Kiểm định tham số Cỡ mẫu nhỏ: n ≤ 30 Một mẫu Kiểm định hợp lý Một mẫu 4a Tính p-giá trị, tốn kiểm định phía - bên phải Kiểm định giả thuyết cho kỳ vọng TH σ , mẫu nhỏ Bài tốn Kiểm định tham số • Sử dụng p - giá trị: Hai mẫu không độc lập Kiểm định giả thuyết cho kỳ vọng TH σ , mẫu nhỏ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Xác định miền bác bỏ: bác bỏ H0 z0 > z1−α = z0.95 = 1.645 Kết luận: z0 = 2.47 > 1.645 nên bác bỏ H0 Ta kết luận với 95% độ tin cậy, Mertro EMS không đáp ứng mục tiêu thời gian phục vụ khách hàng từ 12 phút trở xuống Kiểm định hợp lý Hai mẫu độc lập • Bài tốn kiểm định có trường hợp: H0 : µ = µ0 (a) H1 : µ = µ0 H0 : µ = µ (b) H1 : µ < µ0 với mức ý nghĩa α cho trước H0 : µ = µ0 (c) H1 : µ > µ0 Hai mẫu khơng độc lập Biến ngẫu nhiên T0 có phân phối Student với n − bậc tự Kiểm định Chi bình phương (Goodness-ofFit-test) Xác định miền bác bỏ Wα : bảng Kiểm định giả thuyết cho kỳ vọng TH σ , mẫu nhỏ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Giả thuyết H0 : µ = µ0 H1 : µ = µ0 H0 : µ = µ0 H1 : µ < µ0 H0 : µ = µ0 H1 : µ > µ0 Kiểm định giả thuyết cho kỳ vọng TH σ , mẫu nhỏ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Miền bác bỏ Nguyễn Văn Thìn n−1 Wα = t0 : |t0 | > t1−α/2 Bài toán n−1 Wα = t0 : t0 < −t1−α Kiểm định tham số Kiểm định hợp lý n−1 Wα = t0 : t0 > t1−α Một mẫu Hai mẫu độc lập Bảng 3: Miền bác bỏ với đối thuyết tương ứng (trường hợp mẫu nhỏ) Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kết luận: Bác bỏ H0 / Chưa đủ sở để bác bỏ H0 Kiểm định giả thuyết cho kỳ vọng TH σ , mẫu lớn KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số • Các giả định: Mẫu ngẫu nhiên X1 , , Xn chọn từ tổng thể có kỳ vọng µ phương sai σ Sử dụng ước lượng không chệch S thay cho σ Cỡ mẫu lớn: n > 30 Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số • Khi cỡ mẫu lớn biến ngẫu nhiên Kiểm định hợp lý ¯ − µ0 X √ Z0 = S/ n Giả thuyết H0 : µ = µ0 H1 : µ = µ0 H0 : µ = µ0 H1 : µ < µ0 H0 : µ = µ0 H1 : µ > µ0 p - giá trị p = 2P(Tn−1 ≥ |t0 |) p = P(Tn−1 ≤ t0 p = P(Tn−1 ≥ t0 ) Bảng 4: p-giá trị với đối thuyết tương ứng (trường hợp mẫu nhỏ) Kiểm định giả thuyết cho kỳ vọng TH σ Kiểm định hợp lý Một mẫu • Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối thuyết kết luận bác bỏ H0 p -giá trị ≤ α, với mức ý nghĩa α cho trước Cơng thức tính p - giá trị theo trường hợp xem bảng Một mẫu (5) hội tụ phân phối chuẩn hóa Z ∼ N(0, 1) Khi miền bác bỏ Wα p-giá trị tính tương tự trường ¯ − µ0 X √ Z0 phương hợp biết phương sai, thay σ/ n trình (5) Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Ví dụ 16 Trạm cảnh sát giao thơng đường cao tốc thực việc bắn tốc độ định kỳ địa điểm khác để kiểm tra tốc độ phương tiện giao thông Một mẫu tốc độ loại xe chọn để thực kiểm định giả thuyết sau H0 : µ = 65 H1 : µ > 65 Những vị trí mà bác bỏ H0 vị trí tốt chọn để đặt radar kiểm soát tốc độ Tại địa điểm F, mẫu gồm tốc độ 64 phương tiện bắn tốc độ ngẫu nhiên có trung bình 66.2 mph độ lệch tiêu chuẩn 4.2 mph Sử dụng α = 5% để kiểm định giả thuyết Kiểm định giả thuyết cho kỳ vọng TH σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ • Các bước kiểm định: Một mẫu Nguyễn Văn Thìn H0 : µ = 65 H1 : µ > 65 Bài toán Kiểm định hợp lý KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Phát biểu giả thuyết: Nguyễn Văn Thìn Kiểm định tham số Kiểm định giả thuyết cho kỳ vọng TH khơng biết σ Bài tốn Kiểm định tham số Xác định mức ý nghĩa: α = 0.05 Tính giá trị thống kê kiểm định σ cỡ mẫu n = 64 (lớn) Hai mẫu độc lập Hai mẫu không độc lập Kiểm định hợp lý x¯ − µ0 66.2 − 65 √ = √ z0 = = 2.286 s/ n 4.2/ 64 Kiểm định Chi bình phương (Goodness-ofFit-test) Xác định miền bác bỏ: Bác bỏ H0 z0 > z1−α = z0.95 = 1.645 Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết cho tỷ lệ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn • Bài tốn: Cho tổng thể X , tỷ lệ phần tử mang đặc tính A tổng thể p (p chưa biết) Từ mẫu ngẫu nhiên (X1 , X2 , , Xn ) kiểm định Một mẫu Hai mẫu độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ H0 : p = p (b) H1 : p < p 4a Tính p-giá trị: Với z0 = 2.286, p = − Φ(z0 ) = − Φ(2.286) = 0.0111 5a Kết luận: p = 0.0111 < 0.05 nên bác bỏ H0 , ta kết luận với 95% độ tin cậy tốc độ trung bình địa điểm F lớn 65 mph Địa điểm F địa điểm tốt để đặt radar kiểm soát tốc độ H0 : p = p0 (c) H1 : p > p0 ˆ=Y P n Bài toán Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập với mức ý nghĩa α Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) • Giả định: Kiểm định Chi bình phương (Goodness-ofFit-test) Cỡ mẫu n lớn; để phân phối chuẩn xấp xỉ phân phối nhị thức tốt cần có np0 ≥ n(1 − p0 ) ≥ • Quan sát xuất biến cố "phần tử mang đặc tính A" n phép thử độc lập Gọi Y số lần xuất biến cố Y ∼ B(n, p) Và Nguyễn Văn Thìn Kiểm định tham số H0 : p = p0 (a) H1 : p = p0 • Sử dụng p-giá trị: Kiểm định giả thuyết cho tỷ lệ Kiểm định tham số Kiểm định hợp lý Kết luận: z0 = 2.286 > 1.645 nên bác bỏ H0 , ta kết luận với 95% độ tin cậy tốc độ trung bình địa điểm F lớn 65 mph Địa điểm F địa điểm tốt để đặt radar kiểm soát tốc độ ước lượng không chệch cho p • Nếu H0 đúng, thống kê Z0 = ˆ − p0 P p0 (1 − p0 ) n có phân phối chuẩn hóa N(0, 1) Chọn Z0 làm tiêu chuẩn kiểm định Kiểm định giả thuyết cho tỷ lệ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Các bước kiểm định Nguyễn Văn Thìn Phát biểu giả thuyết đối thuyết Bài toán Bài toán Xác định mức ý nghĩa α Kiểm định tham số Tính giá trị thống kê kiểm định Một mẫu Kiểm định hợp lý Một mẫu KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Kiểm định tham số Kiểm định giả thuyết cho tỷ lệ Kiểm định hợp lý Hai mẫu độc lập Z0 = Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) ˆ − p0 P p0 (1 − p0 ) n Xác định miền bác bỏ: bảng Hai mẫu độc lập Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Ví dụ 17 Trong kỳ nghỉ giáng sinh đầu năm mới, Cục An tồn giao thơng thống kê có 500 người chết 25000 người bị thương vụ nạn giao thơng tồn quốc Theo thơng cáo Cục ATGT khoảng 50% số vụ tai nạn có liên quan đến rượu bia Khảo sát ngẫu nhiên 120 vụ tai nạn thấy có 67 vụ ảnh hưởng rượu bia Sử dụng số liệu để kiểm định lời khẳng định Cục An toàn giao thông với mức ý nghĩa α = 5% Một mẫu Hai mẫu độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Xác định mức ý nghĩa: α = 0.05 Wα = z0 : z0 > z1−α Bảng 5: Miền bác bỏ cho toán kiểm định tỷ lệ Kết luận: Bác bỏ H0 / Chưa đủ sở để bác bỏ H0 Tính giá trị thống kê kiểm định p0 (1 − p0 ) 0.5(1 − 0.5 = = 0.045644 n 120 pˆ − p0 (67/120) − 0.5 z0 = = = 1.28 σpˆ 0.045644 σpˆ = Kiểm định hợp lý Hai mẫu không độc lập H0 : p = 0.5 H1 : p = 0.5 Wα = z0 : z0 < −z1−α Kiểm định giả thuyết cho tỷ lệ Hai mẫu độc lập Phát biểu giả thuyết: Wα = z0 : |z0 | > z1−α/2 Sử dụng p-giá trị: p-giá trị tính tương tự bảng Một mẫu Các bước kiểm định: Miền bác bỏ Hai mẫu không độc lập Kiểm định giả thuyết cho tỷ lệ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Giả thuyết H0 : p = p H1 : p = p H0 : p = p H1 : p < p H0 : p = p H1 : p > p Kiểm định Chi bình phương (Goodness-ofFit-test) Xác định miền bác bỏ: bác bỏ H0 |z0 | > z0.975 = 1.96 tính p-giá trị p = [(1−Φ(z0 )] = 2[1−Φ(1.28)] = 2(1−0.8977) = 0.2006 Kết luận: z0 = 1.28 < 1.96 (hoặc p = 0.2006 > 0.05) nên kết luận chưa đủ sở để bác bỏ giả thuyết H0 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập Outline Nội dung KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn kiểm định giả thuyết thống kê Kiểm định hợp lý Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết cho trường hợp mẫu Kiểm định giả thuyết cho trường hợp hai mẫu độc lập So sánh hai mẫu không độc lập Một mẫu • Các giả định: X1 , X2 , , Xn mẫu ngẫu nhiên chọn từ tổng thể có phân phối chuẩn với kỳ vọng µ1 phương sai σ12 Y1 , Y2 , , Ym mẫu ngẫu nhiên chọn từ tổng thể có phân phối chuẩn với kỳ vọng µ2 phương sai σ22 Tổng thể (đại diện X Y ) độc lập với Kiểm định hợp lý Một mẫu Kiểm định Chi bình phương (Goodness-ofFit-test) • Bài toán kiểm định giả thuyết hai mẫu độc lập gồm dạng sau: H0 : µ1 − µ2 = D0 H1 : µ1 − µ2 = D0 (b) H0 : µ1 − µ2 = D0 H1 : µ1 − µ2 < D0 với mức ý nghĩa α cho trước Trường hợp σ12 = σ22 So sánh hai tỉ lệ So sánh hai kỳ vọng, trường hợp biết phương sai KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Các bước kiểm định Phát biểu giả thuyết H0 đối thuyết H1 Xác định mức ý nghĩa α Tính thống kê kiểm định Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Các phương sai σ12 σ22 biết (a) Trường hợp σ12 = σ22 = σ Kiểm định Chi bình phương (Goodness-ofFit-test) (Goodness-of-Fit-test) Kiểm định tham số So sánh hai phương sai Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương Bài tốn Hai mẫu không độc lập Trường hợp phương sai, mẫu nhỏ Kiểm định hợp lý Nguyễn Văn Thìn Hai mẫu độc lập Trường hợp phương sai, mẫu lớn Kiểm định tham số So sánh hai kỳ vọng, trường hợp biết phương sai KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Trường hợp biết phương sai Bài toán Kiểm định hợp lý Một mẫu So sánh hai kỳ vọng Nguyễn Văn Thìn Kiểm định tham số Bài tốn Kiểm định tham số KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (c) H0 : µ1 − µ2 = D0 H1 : µ1 − µ2 > D0 Hai mẫu độc lập Z0 = ¯ − Y¯ − (µ1 − µ2 ) X Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) thống kê Z0 ∼ N(0, 1) Xác định miền bác bỏ σ12 σ22 + n m (6) So sánh hai kỳ vọng So sánh hai kỳ vọng, trường hợp biết phương sai KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Miền bác bỏ p-giá trị tương ứng Nguyễn Văn Thìn Đối thuyết Miền bác bỏ p - giá trị H1 : µ − µ = D H1 : µ − µ < D H1 : µ − µ > D |z0 | > z1−α/2 z0 < −z1−α z0 > z1−α p = 2[1 − Φ(|z0 |)] p = Φ(z0 ) p = − Φ(z0 ) Kết luận: Nếu bác bỏ H0 , ta kết luận H1 với (1 − α)100% độ tin cậy Ngược lại ta kết luận chưa đủ sở để bác bỏ H0 với α cho trước Bài toán Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Ví dụ 18 Một cơng ty sản xuất sơn nghiên cứu loại phụ gia làm giảm thời gian khô sơn Thực thí nghiệm mẫu: mẫu thứ gồm 10 mẫu vật sơn loại sơn bình thường; mẫu thứ hai gồm 10 mẫu vật sơn với sơn có chất phụ gia Trong nghiên cứu trước, biết độ lệch tiêu chuẩn thời gian khô sau quét sơn phút không thay đổi thêm phụ gia vào Trung bình mẫu x¯ = 121 phút y¯ = 112 phút Với mức ý nghĩa 5%, cho kết luận loại sơn với chất phụ gia H0 : µ1 − µ2 = H1 : µ1 > µ2 Nguyễn Văn Thìn Bài toán Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Tính giá trị thống kê kiểm định, với x¯ = 121, y¯ = 112 σ1 = σ2 = ta có z0 = x¯ − y¯ − σ12 σ22 + n m chất phụ gia khơng có hiệu chất phụ gia có hiệu Mức ý nghĩa: α = 0.05 So sánh hai kỳ vọng, trường hợp phương sai, mẫu lớn So sánh hai kỳ vọng KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Phát biểu giả thuyết đối thuyết = 121 − 112 82 82 + 10 10 = 2.52 Xác định miền bác bỏ: bác bỏ H0 z0 > z1−α = z0.95 = 1.65 Kết luận: Ta có z0 = 2.52 > 165 nên bác bỏ H0 Ta kết luận với 95% độ tin cậy, chất phụ gia có hiệu làm giảm thời gian khô sau sơn 5a Sử dụng p - giá trị: ta có p = − Φ(z0 ) = − Φ(2.52) = 0.0059 < 0.05 nên bác bỏ H0 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số • Các giả định: X1 , X2 , , Xn mẫu ngẫu nhiên chọn từ tổng thể có kỳ vọng µ1 phương sai σ12 Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Y1 , Y2 , , Ym mẫu ngẫu nhiên chọn từ tổng thể có kỳ vọng µ2 phương sai σ22 Tổng thể (đại diện X Y ) độc lập với Cỡ mẫu lớn: n > 30 m > 30 So sánh hai kỳ vọng, trường hợp phương sai, mẫu lớn KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ So sánh hai kỳ vọng, trường hợp phương sai, mẫu lớn KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Đối với trường hợp mẫu lớn, phương sai tổng thể σ12 σ22 không biết, ta thay phương sai mẫu S12 S22 mà khơng tạo nhiều khác biệt Nguyễn Văn Thìn Bài toán Khi n > 30 m > 30, đại lượng Bài toán Kiểm định tham số Z0 = Kiểm định hợp lý Một mẫu Hai mẫu độc lập ¯ − Y¯ − (µ1 − µ2 ) X S12 S22 + n m Kiểm định tham số (7) Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập xấp xỉ phân phối chuẩn hóa N(0, 1) Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Miền bác bỏ (hoặc p - giá trị) trường hợp tính tương tự trường hợp biết phương sai (thay σ1 σ2 S1 S2 ) Kiểm định Chi bình phương (Goodness-ofFit-test) So sánh hai kỳ vọng, trường hợp phương sai, mẫu nhỏ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ • Các giả định: X1 , X2 , , Xn mẫu ngẫu nhiên chọn từ tổng thể có phân phối chuẩn với kỳ vọng µ1 phương sai σ12 khơng biết Nguyễn Văn Thìn Bài tốn Y1 , Y2 , , Ym mẫu ngẫu nhiên chọn từ tổng thể có phân phối chuẩn với kỳ vọng µ2 phương sai σ22 Kiểm định tham số Kiểm định hợp lý Một mẫu KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Tổng thể (đại diện X Y ) độc lập với Hai mẫu độc lập Hai mẫu không độc lập Cỡ mẫu nhỏ: n ≤ 30 m ≤ 30 Hai mẫu khơng độc lập • Ta xét hai trường hợp: Trường hợp phương sai σ12 Trường hợp phương sai khác σ12 = σ22 , = σ22 Khảo sát chiều cao sinh viên hai khoa Toán CNTT: chọn ngẫu nhiên 50 sinh viên khoa Tốn, tính chiều cao trung bình 163 (cm) độ lệch tiêu chuẩn (cm) Đo chiều cao 50 khoa CNTT, có trung bình mẫu 166 (cm) độ lệch tiêu chuẩn (cm) Với mức ý nghĩa α = 1%, cho kết luận chiều cao sinh viên hai khoa So sánh hai phương sai Hai mẫu độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Ví dụ 19 Kiểm định Chi bình phương (Goodness-ofFit-test) • Giả sử X1 , , Xn Y1 , , Ym hai mẫu ngẫu nhiên chọn từ hai tổng thể độc lập có phân phối chuẩn với kỳ vọng phương sai (µ1 , σ12 ) (µ2 , σ22 ) Ta cần kiểm định giả thuyết H0 : σ12 = σ22 (8) H1 : σ12 = σ22 • Nếu S12 phương sai mẫu ngẫu nhiên (X1 , , Xn ) (n − 1)S12 ∼ χ2 (n − 1) σ12 tương tự, ta có (m − 1)S22 ∼ χ2 (m − 1) σ2 (9) So sánh hai phương sai KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập So sánh hai phương sai • Khi đó, đại lượng S /σ F = 12 12 S2 /σ2 (10) Nguyễn Văn Thìn có phân phối F với (n − 1, m − 1) bậc tự • Xét biến ngẫu nhiên F ∼ F(u, v ) có hàm mật độ xác suất f (x), phân vị mức α F fα,u,v định nghĩa sau ∞ f (x)dx = α (11) P(F > fα,u,v ) = fα,u,v f1−α,u,v = fα,u,v Bài tốn Kiểm định tham số (12) Nguyễn Văn Thìn Sp2 Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) (n − 1)S12 + (m − 1)S22 = n+m−2 Kiểm định Chi bình phương (Goodness-ofFit-test) F = S12 S22 (13) có phân phối F với (n − 1, m − 1) bậc tự Xác định miền bác bỏ: bác bỏ H0 F > fα/2,n−1,m−1 F < f1−α/2,n−1,m−1 Kết luận: Nếu bác bỏ H0 , ta kết luận H1 với (1 − α) ∗ 100% độ tin cậy Ngược lại kết luận chưa đủ sở để bác bỏ H0 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn (14) Kiểm định tham số Kiểm định hợp lý Thống kê có phân phối Student với n + m − bậc tự Hai mẫu độc lập Một mẫu ¯ − Y¯ − (µ1 − µ2 ) X T0 = 1 Sp + n m Phát biểu giả thuyết H0 : σ12 = σ22 đối thuyết H1 : σ12 = σ22 Xác định mức ý nghĩa α Khi H0 đúng, thống kê So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ12 = σ22 = σ Trường hơp σ12 = σ22 = σ , ta sử dụng ước lượng chung cho σ12 σ22 Sp2 gọi phương sai mẫu chung (pooled sample variance) Bài toán Kiểm định hợp lý So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ12 = σ22 = σ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Các bước kiểm định Một mẫu Hai mẫu khơng độc lập • Phân vị mức − α F cho Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Hai mẫu độc lập (15) Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Đặt df = n + m − 2, miền bác bỏ p - giá trị trường hợp có dạng Đối thuyết Miền bác bỏ p - giá trị H1 : µ − µ = D df |t0 | > t1−α/2 p = 2P(Tdf ≥ |t0 |) H1 : µ − µ < D df t0 < −t1−α p = P(Tdf ≤ t0 ) H1 : µ − µ > D t0 > df t1−α p = P(Tdf ≥ t0 ) Kết luận: Bác bỏ H0 /Chưa đủ sở để bác bỏ H0 So sánh hai kỳ vọng, trường hợp phương sai So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ12 = σ22 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Khi σ12 = σ22 , sử dụng thống kê T0 = Nguyễn Văn Thìn ¯ − Y¯ − (µ1 − µ2 ) X Kiểm định hợp lý (16) S12 S22 + n m Bài toán Kiểm định tham số KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Ví dụ 20 Bài tốn Kiểm định tham số Khi T0 có phân phối Student với bậc tự df xác định sau Kiểm định hợp lý Một mẫu Một mẫu (s /n) + (s22 /m) df = 21 (s1 /n) (s /m)2 + n−1 m−1 Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Nguyễn Văn Thìn (17) Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Miền bác bỏ trường hợp giống trường hợp phương sai nhau, thay bậc tự df cho phương trình (17) So sánh hai kỳ vọng, trường hợp phương sai So sánh hai tỷ lệ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Ví dụ 21 Nguyễn Văn Thìn Hàm lượng thạch tín (Asen) (Đv: ppb) nước cao có hại cho sức khỏe Người ta kiểm tra hàm lượng thạch tín hai khu vực trung tâm thành phố Biên Hòa khu vực gần sân bay Biên Hòa Tại khu vực, người ta đo ngẫu nhiên hàm lượng thạch tín nước ứng với 10 địa điểm khác Số liệu cho bảng thống kê bên Trung tâm TP Khu vực gần sân bay 48 44 25 40 10 38 15 33 21 12 20 25 12 Tại thành phố, khu vực A, người ta chọn ngẫu nhiên 17 sinh viên cho làm kiểm tra để đo số IQs, thu trung bình mẫu 106 độ lệch tiêu chuẩn 10; khu vực B, số IQs trung bình mẫu gồm 14 sinh viên 109 với độ lệch tiêu chuẩn Giả sử phương sai Có khác biệt số IQs sinh viên hai khu vực A B hay không? α = 0.02 15 Với α = 0.05, kiểm tra xem có khác biệt hàm lượng thạch tín hai khu vực Bài toán Kiểm định tham số Kiểm định hợp lý • Khảo sát phần tử thỏa tính chất A hai tổng thể độc lập với tỷ lệ tương ứng p1 p2 ; từ hai tổng thể chọn hai mẫu với cỡ n m Gọi X Y số phần tử thỏa tính chất A mẫu mẫu Khi đó, ta có X ∼ B(n, p1 ) Y ∼ B(m, p2 ) • Bài tốn: so sánh tỷ lệ p1 p2 • Bài tốn kiểm định giả thuyết gồm trường hợp sau: Một mẫu Hai mẫu độc lập 18 Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) (a) H0 : p1 − p2 = D0 H1 : p1 − p2 = D0 (b) H0 : p1 − p2 = D0 H1 : p1 − p2 < D0 (c) H0 : p1 − p2 = D0 H1 : p1 − p2 > D0 • Các giả định Hai mẫu độc lập, Cỡ mẫu lớn np1 > 5; n(1 − p1 ) > mp2 > 5; m(1 − p2 ) > So sánh hai tỷ lệ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số So sánh hai tỷ lệ Nguyễn Văn Thìn Phát biểu giả thuyết H0 đối thuyết H1 Xác định mức ý nghĩa α Tính thống kê kiểm định Kiểm định hợp lý Z0 = Một mẫu Hai mẫu độc lập Pˆ1 − Pˆ2 − D0 ˆ − P) ˆ P(1 Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Các bước kiểm định với Bài toán Kiểm định tham số Kiểm định hợp lý (18) 1 + n m X Y ˆ X +Y Pˆ1 = ; Pˆ2 = ; P = n m n+m Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Xác định miền bác bỏ Đối thuyết Miền bác bỏ p - giá trị H1 : p − p = D H1 : p − p < D H1 : p − p > D |z0 | > z1−α/2 z0 < −z1−α z0 > z1−α p = 2[1 − Φ(|z0 |)] p = Φ(z0 ) p = − Φ(z0 ) Kết luận: Nếu bác bỏ H0 , ta kết luận H1 với (1 − α)100% độ tin cậy Ngược lại ta kết luận chưa đủ sở để bác bỏ H0 với α cho trước H0 đúng, Z0 ∼ N(0, 1) Outline So sánh hai tỷ lệ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Ví dụ 22 Một công ty sản xuất thuốc cần kiểm tra loại thuốc có tác dụng giảm việc xuất đau ngực bệnh nhân Công ty thực thí nghiệm 400 người, chia làm hai nhóm: nhóm gồm 200 uống thuốc nhóm gồm 200 người uống giả dược Theo dõi thấy nhóm có người lên đau ngực nhóm có 25 người lên đau ngực Với α = 0.05, hay cho kết luận hiệu thuốc sản xuất Nguyễn Văn Thìn Bài tốn Kiểm định tham số Bài toán kiểm định giả thuyết thống kê Kiểm định tham số Kiểm định hợp lý Kiểm định giả thuyết cho trường hợp mẫu Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết cho trường hợp hai mẫu độc lập So sánh hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-of-Fit-test) So sánh hai mẫu không độc lập (paired t - test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Khi hai mẫu khơng độc lập giá trị quan trắc mẫu có mối liên hệ tương ứng với giá trị quan trắc mẫu thứ hai Như vậy, ta ghép cặp giá trị hai mẫu với Nguyễn Văn Thìn Bài tốn So sánh hai mẫu không độc lập (paired t - test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Xét (X1i , X2i ), với i = 1, 2, , n, tập gồm n cặp giá trị quan trắc với giả sử kỳ vọng phương sai tổng thể đại diện X1 µ1 σ12 kỳ vọng phương sai tổng thể đại diện X2 µ2 σ22 X1i X2j (i = j) độc lập Nguyễn Văn Thìn Bài toán Việc ghép cặp kết việc Kiểm định tham số Kiểm định tham số quan trắc giá trị trước sau thực thí nghiệm Chẳng hạn đo trọng lượng trước sau thực chế độ ăn kiêng Kiểm định hợp lý Một mẫu Hai mẫu độc lập Một mẫu Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) thí nghiệm địa điểm Kiểm định Chi bình phương (Goodness-ofFit-test) Goi µD = E (Di ), D1 , , Dn biến ngẫu nhiên độc lập có phân phối, d1 , , dn giá trị D1 , , Dn , ta định nghĩa Nguyễn Văn Thìn d¯ = n Bài toán Kiểm định tham số Kiểm định hợp lý sd2 = Một mẫu n di (20) i=1 n−1 Hai mẫu độc lập n (di − d¯ )2 = i=1 n−1 n di2 − i=1 n ¯ (d ) n−1 (21) Hai mẫu không độc lập Ta cần kiểm định giả thuyết đối thuyết sau Kiểm định Chi bình phương (Goodness-ofFit-test) H0 : µ D = D (a) H1 : µ D = D Phần đọc thêm H0 : µD = D0 (b) H1 : µD < D0 H0 : µD = D0 (c) H1 : µD > D0 (19) Các Di ,i = 1, , n giả sử có phân phối chuẩn Goi µD = E (Di ), D1 , , Dn biến ngẫu nhiên độc lập có phân phối, d1 , , dn giá trị D1 , , Dn , ta định nghĩa Phần đọc thêm So sánh hai mẫu không độc lập (paired t - test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Di = X1i − X2i , i = 1, , n Hai mẫu độc lập so sánh đặc tính Định nghĩa độ sai khác cặp tập hợp giá trị quan trắc Kiểm định hợp lý Hai mẫu không độc lập thí nghiệm với thời gian Phần đọc thêm So sánh hai mẫu không độc lập (paired t - test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Các bước kiểm định Phát biểu giả thuyết H0 đối thuyết H1 Xác định mức ý nghĩa α Tính thống kê kiểm định Bài toán Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập T0 = Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) ¯ − D0 D √ SD / n (22) thống kê T0 có phân phối Student với n − bậc tự Xác định miền bác bỏ Phần đọc thêm So sánh hai mẫu không độc lập (paired t - test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Miền bác bỏ p - giá trị trường hợp có dạng Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Đối thuyết Miền bác bỏ p - giá trị H1 : µ D = D n−1 |t0 | > t1−α/2 p = 2P(Tn−1 ≥ |t0 |) H1 : µ D < D n−1 t0 < −t1−α p = P(Tn−1 ≤ t0 ) H1 : µ D > D n−1 t0 > t1−α p = P(Tn−1 ≥ t0 ) Kết luận: Nếu bác bỏ H0 , ta kết luận H1 với (1 − α) ∗ 100% độ tin cậy Ngược lại kết luận chưa đủ sở để bác bỏ H0 • Trường hợp cỡ mẫu n > 30, toán kiểm định hai mẫu phụ thuộc thực tương tự trường hợp mẫu dựa mẫu ngẫu nhiên (D1 , , Dn ) So sánh hai mẫu không độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định tham số Kiểm định hợp lý Kiểm định giả thuyết cho trường hợp mẫu Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) So sánh hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-of-Fit-test) Trước Sau 268 106 225 186 252 223 192 110 307 203 228 101 246 211 298 176 231 194 185 203 Số liệu cung cấp có đủ chứng để kết luận chế độ ăn kiêng tập thể dục có tác dụng làm giảm lượng đường máu không? α = 0.05 Phần đọc thêm Kiểm định giả thuyết phân phối KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Kiểm định giả thuyết cho trường hợp hai mẫu độc lập Một bác sĩ dinh dưỡng nghiên cứu chế độ ăn kiêng tập thể dục để làm giảm lượng đường máu bệnh nhân bị bệnh tiểu đường 10 bệnh nhân bị bệnh tiểu đường chọn để thử nghiệm chương trình này, bảng kết bên cho biết lượng đường máu trước sau bệnh nhân tham gia chương trình Phần đọc thêm Bài toán kiểm định giả thuyết thống kê Ví dụ 23 Một mẫu Outline KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) • Bài tốn: Khảo sát biến ngẫu nhiên X liên liên quan đến tổng thể có phân phối chưa biết Cần kiểm định xem phân phối tổng thể có phải F (x; θ) hay khơng? Chẳng hạn, ta cần kiểm định phân phối tổng thể xét phân phối chuẩn Kiểm định giả thuyết phân phối KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Các bước kiểm định Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Chọn mẫu ngẫu nhiên cỡ n: (X1 , , Xn ) Chia miền giá trị biến ngẫu nhiên Xi thành K khoảng không trùng l1 , l2 , , lK (Trường hợp X biến ngẫu nhiên rời rạc, ta chia thành K điểm: x1 , x2 , , xK ) Gọi Oj số giá trị mẫu nằm khoảng lj (j = 1, 2, , K ) (Trường hợp X biến ngẫu nhiên rời rạc tần số lặp lại giá trị xj ) Oj gọi tần số thực nghiệm Phát biểu giả thuyết H0 : X tuân theo luật phân phối F (x; θ) Khi đó, tính pj = P(X ∈ lj ) (hoặc P(X = xj ) X rời rạc) Đặt Ej = npj , Ej gọi tần số lý thuyết Kiểm định giả thuyết phân phối KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Thống kê kiểm định Q cho công thức Nguyễn Văn Thìn K Q2 = Bài tốn j=1 (Oj − Ej )2 Ej (23) Kiểm định tham số Q xấp xỉ phân phối χ2 với K − bậc tự Kiểm định hợp lý Một mẫu Hai mẫu độc lập Bác bỏ H0 Q ≥ χ2α,K −r −1 Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) (24) với r số tham số ước lượng Tìm χ2α,K −r −1 : tra bảng Chi - bình phương Điều kiện: Ej ≥ 5, j = 1, 2, , K Kiểm định giả thuyết phân phối KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Ví dụ 24 Bảng thống kê số vụ tai nạn xe máy/ngày quận 80 ngày Bài toán Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết phân phối KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Số ngày 34 25 11 Với mức ý nghĩa 5%, kiểm tra xem số vụ tai nạn xe máy hàng ngày có tuân theo luật phân phối Poisson hay không? Kiểm định tham số Kiểm định hợp lý Gọi X = số vụ tai nạn xe máy/ngày Q.5; phát biểu giả thuyết H0 : X tuân theo luật phân phối Poisson với tham số λ Nguyễn Văn Thìn Bài tốn Số vụ tai nạn Tính tần số thực lý thuyết Ej , j = 1, , Ej = npj = nP(X = xj ) Nếu X ∼ P(λ), xác suất pj tính sau Một mẫu Hai mẫu độc lập pj = P(X = xj ) = Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) e −λ λxj xj ! Do λ chưa biết nên ta sử dụng ước lượng λ ˆ= λ n Oi xi = i=1 Kiểm định giả thuyết phân phối KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Xác suất kết tính tần số lý thuyết cho bảng bên pi = P(X = xi ) Ei = npi p1 = Bài toán p2 = Kiểm định tham số p3 = Kiểm định hợp lý Một mẫu p4 = Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết phân phối e −1 10 0! e −1 11 1! e −1 12 2! e −1 13 3! p5 = − = 0.368 29.44 = 0.368 29.44 = 0.184 14.72 = 0.061 4.88 i=1 pi = 0.019 j=1 Nguyễn Văn Thìn Kiểm định tham số Kiểm định hợp lý Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Hai mẫu độc lập 1.52 Hai mẫu không độc lập (Oj − Ej )2 (34 − 29.44)2 (3 − 1.52)2 = + .+ = 4.67 Ej 29.44 1.52 Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Ví dụ 25 Điểm thi 200 sinh viên lớp học cho bảng bên Có ý kiến cho điểm thi sinh viên đại lượng ngẫu nhiên có phân phối chuẩn với điểm trung bình 75 độ lệch chuẩn Với α = 0.05, kiểm tra ý kiến Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Điểm thi Số sinh viên (0, 60] 12 (60, 70] 36 (70, 80] 90 Tra bảng, ta có χ20.05,3 = 7.815 Do Q = 4.67 < 7.815 nên kết luận chưa đủ sở để bác bỏ H0 Vậy, số vụ tai nạn giao thông/ ngày Q.5 tuân theo luật phân phối Poisson Kiểm định giả thuyết phân phối Một mẫu Hai mẫu không độc lập Q ≥ χ2α,K −r −1 = χ20.05,5−1−1 Một mẫu Kiểm định giả thuyết phân phối KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Bác bỏ H0 khi: Bài tốn Tính thống kê Q , Q2 = KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (80, 90] 44 (90, 100] 18 Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Ví dụ 26 Nhóm máu 500 người chọn ngẫu nhiên từ khu vực cho bảng sau A 75 B 150 AB 15 O 260 Theo từ điển y khoa tỷ lệ nhóm máu dân số 0.18, 0.28, 0.05, 0.49 Hỏi nhóm máu dân số có phù hợp với từ điển y khoa hay không? Mức ý nghĩa 1% Kiểm định giả thuyết phân phối KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Ví dụ 27 Nguyễn Văn Thìn Chọn 100 người bệnh tâm thần phân loại vào mùa mà họ sinh ra, số liệu cho bảng sau: Xuân 20 Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định giả thuyết tính độc lập Hạ 35 Thu 20 Đơng 25 Hỏi bệnh có phụ thuộc vào mùa sinh hay khơng? Mức ý nghĩa 1% • Bài toán: Giả sử phần tử tổng thể phân loại theo hai đặc tính khác nhau, gọi đặc tính X đặc tính Y X có r giá trị Y có s giá trị Gọi Pij = P(X = xi , Y = yj ) Bài toán Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập với i = 1, , r j = 1, , s Pij xác suất chọn phần tử tổng thể có đặc tính X i đặc tính Y j Gọi s Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) pi = P(X = xi ) = Pij , i = 1, , r Pij , j = 1, , s j=1 r qj = P(Y = yj ) = i=1 Kiểm định giả thuyết tính độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn pi xác suất chọn phần tử tổng thể có đặc tính X xi , qj xác suất chọn môt phần tử tổng thể có đặc tính Y yj Bài tốn Kiểm định tham số Kiểm định hợp lý Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Ta cần kiểm định xem X có độc lập với Y hay không? Phát biểu giả thuyết Một mẫu Hai mẫu độc lập Kiểm định giả thuyết tính độc lập Kiểm định tham số Kiểm định hợp lý Một mẫu H0 : Pij = pi qj ∀i = 1, , r ; j = 1, , s Hai mẫu độc lập Hai mẫu không độc lập đối thuyết H1 : ∃ (i, j) cho Pij = pi qj Kiểm định Chi bình phương (Goodness-ofFit-test) Khảo sát N phần tử, ta bảng kết quả, toán gọi bảng ngẫu nhiên (contingency table): ❍❍ Y ❍ X ❍ ❍ ❍ y1 y2 ··· ys Tổng hàng x1 x2 n11 n21 n12 n22 ··· ··· n1s n2s n1 n2 xr Tổng cột nr m1 nr m2 ··· ··· nrs ms nr N Bảng 6: đó, nij gọi tần số thực nghiệm Kiểm định giả thuyết tính độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Ước lượng pi qj ni , i = 1, , r N mj qˆj = , j = 1, , s N pˆi = Nguyễn Văn Thìn Bài tốn Kiểm định tham số Gọi Nij số phần tử có đặc tính (xi , yj ) N phần tử khảo sát, Nij ∼ B(N, Pij ) Khi đó, Kiểm định hợp lý Một mẫu Hai mẫu độc lập E(Nij ) = NPij = Npi qj H0 Hai mẫu không độc lập Đặt Kiểm định Chi bình phương (Goodness-ofFit-test) eij = N pˆi qˆj = ni mj N Kiểm định giả thuyết tính độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Định lí 28 (Pearson) Bài tốn Kiểm định tham số Với Nij Eij = NPij , biến ngẫu nhiên Kiểm định hợp lý r s Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) i=1 j=1 (Nij − Eij )2 Eij hội tụ theo phân phối biến ngẫu nhiên Chi bình phương χ2(r −1)(s−1) bậc tự eij gọi tần số lý thuyết Kiểm định giả thuyết tính độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Các bước kiểm định Nguyễn Văn Thìn Bài toán Kiểm định hợp lý Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Phát biểu giả thuyết H0 : X Y độc lập Kiểm định tham số Một mẫu Kiểm định giả thuyết tính độc lập Bài tốn Kiểm định tham số Xác định tần số thực nghiệm nij tần số lý thuyết eij = ni mj N với ni mj tổng hàng i tổng cột j tương ứng, Điều kiện: eij ≥ Kiểm định hợp lý Một mẫu Tính thống kê kiểm định r s Q2 = i=1 j=1 Kiểm định Chi bình phương (Goodness-ofFit-test) r s i=1 j=1 nij2 eij −N (25) Nếu H0 đúng, thống kê Q có phân phối Chi bình phương với (r − 1)(s − 1) bậc tự Bác bỏ H0 Hai mẫu độc lập Hai mẫu không độc lập (nij − eij )2 = eij Q > χ2(r −1)(s−1) (α) (26) 4b Sử dụng p-giá trị: p = P χ2(r −1)(s−1) ≥ Q Bác bỏ H0 khi: p ≤ α (27) Kiểm định giả thuyết tính độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Bài tốn Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Ví dụ 29 Một báo cáo khoa học y khoa tuyên bố việc sở hữu thú cưng nhà (chó mèo) làm tăng khả sống sót người chủ mà thường bị lên đau tim Một mẫu ngẫu nhiên gồm 95 người lên đau tim chọn để khảo sát Dữ liệu người khảo sát chia làm loại: - Những người sống sót/tử vong năm sau lên đau tim - Người sống sót/tử vong có ni thú cưng nhà hay không Kết cho bảng sau Sống sót Tử vong Có ni thú cưng Khơng ni thú cưng 28 44 15 Kiểm định giả thuyết tính độc lập KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Bài toán Kiểm định hợp lý Hai mẫu độc lập Hai mẫu khơng độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Nguyễn Văn Thìn Kiểm định hợp lý Hai mẫu độc lập n1 m1 72 × 36 = = 27.284; N 95 n2 m1 23 × 36 = = = 8.716; N 95 n1 m2 72 × 59 = = 44.716 N 95 n2 m2 23 × 59 = = = 14.284 N 95 e11 = e12 = e21 e22 Tính giá trị thống kê Q 2 Q2 = i=1 j=1 nij2 −n = eij 442 82 152 282 + + + −95 = 0.125 27.284 44.716 8.716 15.284 Kiểm định giả thuyết tính độc lập Nguyễn Văn Thìn Một mẫu Tính tần số thực nghiệm: với n1 = 72, n2 = 23, m1 = 36, m2 = 59 Một mẫu KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Kiểm định tham số Kiểm định tham số KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Bác bỏ H0 khi: Q > χ2(r −1)(s−1) (α) = χ21 (0.05) Tra bảng Chi - bình phương, ta χ21 (0.05) = 3.841 Q = 0.125, suy Q < 3.841 Ta kết luận chưa đủ sở để bác bỏ H0 tức bệnh lên đau tim độc lập với việc nuôi thú cưng Phát biểu giả thuyết, H0 : Bệnh lên đau tim độc lập với việc ni thú cưng, Nguyễn Văn Thìn Kiểm định giả thuyết tính độc lập Bài tốn Bài tốn Kiểm định tham số Ví dụ 30 Vé máy bay hãng hàng không Việt Nam Airline chia làm loại: Hạng thường (C), hạng trung (B) hạng doanh nhân (A) Hành khách máy bay VN Airlines nằm trong dạng sau: bay nội địa quốc tế Khảo sát 920 hành khách bay hãng, cho kết sau: Kiểm định hợp lý Một mẫu Hai mẫu độc lập Hai mẫu không độc lập Hai mẫu không độc lập Kiểm định Chi bình phương (Goodness-ofFit-test) Kiểm định Chi bình phương (Goodness-ofFit-test) Loại vé Hạng thường Hạng trung Hạng doanh nhân Loại chuyến bay Nội địa Quốc tế 29 22 95 121 518 135 Có ý kiến cho hành khách mua loại vé (A, B, C) phụ thuộc vào việc người bay nội địa hay quốc tế Với mức ý nghĩa 5%, kiểm tra ý kiến .. .Định nghĩa KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Nguyễn Văn Thìn Định nghĩa Bài toán Kiểm định tham số Kiểm định hợp lý Một mẫu Hai mẫu độc lập Bài toán... t - test) KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Các bước kiểm định Phát biểu giả thuyết H0 đối thuyết H1 Xác định mức ý nghĩa α Tính thống kê kiểm định Bài tốn Kiểm định tham số Kiểm định. .. sai KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn Thìn Các bước kiểm định Phát biểu giả thuyết H0 đối thuyết H1 Xác định mức ý nghĩa α Tính thống kê kiểm định Bài toán Kiểm định tham số Kiểm định

Ngày đăng: 08/10/2021, 13:56

HÌNH ẢNH LIÊN QUAN

Trong phần này, ta khảo sát mô hình tham số - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
rong phần này, ta khảo sát mô hình tham số (Trang 3)
KIỂM ĐỊNH GIẢ - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
KIỂM ĐỊNH GIẢ (Trang 3)
4 Xác định miền bác bỏ Wα : bảng 1 - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
4 Xác định miền bác bỏ Wα : bảng 1 (Trang 7)
Bảng 1: Miền bác bỏ với đối thuyết tương ứng - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
Bảng 1 Miền bác bỏ với đối thuyết tương ứng (Trang 7)
KIỂM ĐỊNH GIẢ - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
KIỂM ĐỊNH GIẢ (Trang 7)
4 Xác định miền bác bỏ Wα : bảng 3 - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
4 Xác định miền bác bỏ Wα : bảng 3 (Trang 9)
KIỂM ĐỊNH GIẢ - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
KIỂM ĐỊNH GIẢ (Trang 9)
Bảng 3: Miền bác bỏ với đối thuyết tương ứng (trường hợp mẫu nhỏ) - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
Bảng 3 Miền bác bỏ với đối thuyết tương ứng (trường hợp mẫu nhỏ) (Trang 10)
Bảng 4: p-giá trị với đối thuyết tương ứng (trường hợp mẫu nhỏ) - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
Bảng 4 p-giá trị với đối thuyết tương ứng (trường hợp mẫu nhỏ) (Trang 10)
KIỂM ĐỊNH GIẢ - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
KIỂM ĐỊNH GIẢ (Trang 10)
KIỂM ĐỊNH GIẢ - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
KIỂM ĐỊNH GIẢ (Trang 12)
Bảng 5: Miền bác bỏ cho bài toán kiểm định tỷ lệ - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
Bảng 5 Miền bác bỏ cho bài toán kiểm định tỷ lệ (Trang 12)
Sử dụng p-giá trị: p-giá trị tính tương tự như bảng 2. - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
d ụng p-giá trị: p-giá trị tính tương tự như bảng 2 (Trang 12)
KIỂM ĐỊNH GIẢ - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
KIỂM ĐỊNH GIẢ (Trang 21)
KIỂM ĐỊNH GIẢ - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
KIỂM ĐỊNH GIẢ (Trang 21)
Bảng thống kê số vụ tai nạn xe máy/ngày ở quận 5 trong 80 ngày - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
Bảng th ống kê số vụ tai nạn xe máy/ngày ở quận 5 trong 80 ngày (Trang 21)
3. Xác suất và kết quả tính tần số lý thuyết cho ở bảng bên dưới - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
3. Xác suất và kết quả tính tần số lý thuyết cho ở bảng bên dưới (Trang 22)
Tra bảng, ta có χ20.05,3 = 7.815. - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
ra bảng, ta có χ20.05,3 = 7.815 (Trang 22)
Điểm thi của 200 sinh viên trong một lớp học cho bởi bảng bên dưới. Có ý kiến cho rằng điểm thi của sinh viên là đại lượng ngẫu nhiên có phân phối chuẩn với điểm trung bình bằng 75 và độ lệch chuẩn bằng 8 - Bài giảng Xác suất thống kê: Kiểm định giả thuyết thống kê - Nguyễn Văn Thìn
i ểm thi của 200 sinh viên trong một lớp học cho bởi bảng bên dưới. Có ý kiến cho rằng điểm thi của sinh viên là đại lượng ngẫu nhiên có phân phối chuẩn với điểm trung bình bằng 75 và độ lệch chuẩn bằng 8 (Trang 22)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN