Chương 3: Kiểm định thống kê và ứng dụng
3.1. Giả thuyết thống kê và kết luận thống kê
Phép kiểm định thống kê gắn liền với kết luận thống kê trên cơ sở giả thuyết ban đầu cho một tham số đặc trưng nào đó của hai tập số liệu. Giả thuyết thống kê khi so sánh tham số ai và ak của hai tập số liệu này có dạng như sau:
Giả thuyết H0 (Null hypothesis): giả thuyết đưa ra với ai và ak đồng nhất, biểu thức tương ứng là ai ak hay ai – ak 0
Giả thuyết Ha (Alternative hypothesis): giả thuyết đưa ra ai và ak
không đồng nhất, biểu thức có thể là ai ak, hoặcai > ak, hoặc ai < ak. Trong đú a là tham số đặc trưng cú thể là giỏ trị trung bỡnh (à), phương sai (σ2), độ lệch chuẩn (σ),... của hai dãy số liệu tương ứng.
3.1.2. Kết luận thống kê (Statistical conclusion)
Ứng với các giả thuyết thống kê nêu trên, tùy thuộc vào kết quả tính toán dựa trên các quy luật phân phối thích hợp có thể đưa ra kết luận. Kết luận thống kê được phân loại như sau:
Kết luận loại I (Type I conclusion): Bỏc bỏ H0 (ài àk), chấp nhận Ha
(ài àk). Kết luận loại I dẫn đến sai lầm loại I.
Sai lầm loại I (Type I error): là sai lầm của kết luận loại I đó là bác bỏ H0, chấp nhận Ha. Sai lầm loại I khiến người ta kết luận rằng một mối quan hệ được cho là không tồn tại (Ha) trong khi thực tế thì có mối quan hệ và có tồn tại (H0).
Ví dụ về sai lầm loại I: Một xét nghiệm cho thấy bệnh nhân mắc bệnh nhưng thực tế là bệnh nhân đó không mắc bệnh; Một chuông báo cháy nổ hoạt động nhưng thực tế là không có đám cháy.
Kết luận loại II (type II conclusion): Chấp nhận H0 (ài àk), bỏc bỏ Ha (ài àk). Kết luận loại II dẫn đến sai lầm loại II.
Sai lầm loại II (Type II error) là sai lầm của kết luận loại II đó là chấp nhận H0, bác bỏ Ha. Thông thường, sai lầm loại II khiến người ta kết luận rằng một tác động hoặc mối quan hệ được cho là tồn tại (H0) trong khi thực tế thì không tồn tại (Ha).
Ví dụ về sai lầm loại II: Kết quả xét nghiệm cho thấy một bệnh nhân không mắc bệnh trong khi thực tế là bệnh nhân đó mắc bệnh; Một chuông báo cháy nổ không hoạt động nhưng thực tế là có đám cháy.
Thông thường, sai lầm loại II là nghiêm trọng hơn so với sai lầm loại I. Trong trường hợp chưa có sự chắc chắn khi buộc phải kết luận thống kê thì phải giữ nguyên tắc “Thà mắc sai lầm loại I còn hơn mắc sai lầm loại II”. Điều này có nghĩa là nếu không đủ bằng chứng thì thà bác bỏ giả thuyết H0, còn hơn chấp nhận giả thuyết H0.
Bảng 3.1: Phân loại giả thuyết thống kê và kết luận thống kê
Kết luận Giả thuyết H0
H0 đúng H0 sai
Bác bỏ H0 Sai lầm loại I Kết luận đúng Chấp nhận H0 Kết luận đúng Sai lầm loại II
3.1.3. Mối quan hệ giữa chuẩn thống kê và kết luận thống kê
Để thực hiện phép kiểm định thống kê (đưa ra kết luận thống kê) cho một đại lượng đặc trưng nào đó (giá trị trung bình, phương sai, độ đúng, độ tái lặp…) của một tập số liệu với một giá trị cho trước hoặc giữa các tập số liệu với nhau cần chọn các chuẩn thống kê phù hợp tương ứng.
Có thể dùng giá trị chuẩn thống kê hoặc giá trị p–value để kết luận thống kê. Về bản chất p–value chính là giá trị α = 1– P từ phép tính toán thống kê thu được với P là độ tin cậy tương ứng. Trong khi α được dùng là mức ý nghĩa chuẩn tham chiếu khi thực hiện phép kiểm định. Ví dụ trong phép kiểm định ở mức ý nghĩa 0.05 (α = 0.05), phép tính thống kê tính được p–value = 0.03 (P = 0.97), nếu so sánh ta thấy p–value < α.
Các giả thuyết cho đại lượng thống kê cần được kiểm định có thể là:
H0 : giống nhau;
Ha: khác nhau; lớn hơn; hoặc nhỏ hơn.
Các trường hợp kết luận thống kê được trình bày trong bảng 3.1.
Bảng 3.2: Kết luận thống kê theo chuẩn thống kê hoặc độ không tin cậy Giá trị chuẩn thống kê p–value Kết luận thống kê Chuẩn tính < chuẩn bảng hai phía
(two–tailed)
p–value > α Chấp nhận H0
Chuẩn tính ≥ chuẩn bảng hai phía p–value ≤ α Chấp nhận Ha Chuẩn tính ≤ chuẩn bảng phía trái
(upper–tailed)
p–value ≤ α Chấp nhận Ha
Chuẩn tính ≥ chuẩn bảng phía phải (lower–tailed)
p–value ≤ α Chấp nhận Ha
Chuẩntính còn thường được gọi là chuẩn score hoặc chuẩn stat được tính cho từng trường hợp cụ thể của tập số liệu nhất định. Chuẩn thống kê có thể là chuẩn Gauss, Student, Fisher, Chi bình phương,... tùy theo tính chất của đại lượng cần so sánh.
Hình 3.1. Biểu diễn giá trị p–value (α) trên đồ thị phân phối xác suất: (a) kiểm định hai phía; (b) kiểm định phía trái; (c) kiểm định phía phải.