Chương 3: Kiểm định thống kê và ứng dụng
3.5. Kiểm định Fisher (F–test) và ứng dụng
Phương sai là đại lượng đặc trưng cho độ lặp của một tập số liệu thực nghiệm. Để so sánh độ lặp giữa hai tập số liệu, kiểm định Fisher là một công cụ hữu hiệu nhất.
Với hai tập số liệu A và B có NA, NB giá trị và phương sai lần lượt là SA2 và SB2. Fstat cho F–test được tính theo biểu thức sau:
Fstat =SA2
SB2 (3.31)
Kiểm định Fisher cho hai tập số liệu trên có thể là một trong các trường hợp được trình bày trong bảng 3.4
Bảng 3.4. Kết luận thống kê cho kiểm định Fisher H0:SA2 ≡ SB2
Ha:SA2SB2 Ha: SA2< SB2 Ha: SA2> SB2
Dùng phân phối xác suất Fisher hai phía
Dùng phân phối xác suất Fisher phía trái
Dùng phân phối xác suất Fisher phía phải Fstat > F(α/2,fA,fB) hoặc
Fstat < F(1–α/2,fB,fA) Kết luận Ha
Fstat < F(1–α,fB,fA) Kết luận Ha
Fstat > F(α,fA,fB) Kết luận Ha
F–test thường được sử dụng để trả lời các câu hỏi sau đây khi đánh giá các tập số liệu thực nghiệm:
– Độ lặp (phương sai) của hai tập số liệu có đồng nhất?
– Độ lặp của phương pháp mới có tốt hơn so với phương pháp hiện đang sử dụng?
– Trong phép phân tích phương sai (ANOVA), F–test được sử dụng để đánh giá sự thay đổi của đại lượng ở các mức yếu tố khác nhau (between group) so với độ lặp khi thực hiện thí nghiệm trong cùng một mức (within group).
Ví dụ 3.10: Độ lặp của phương pháp phân tích aflatoxin tổng (ppb) trong nền mẫu bột đậu nành bằng phương pháp HPLC–FLD được thực hiện bởi hai kiểm nghiệm viên thu được kết quả như sau:
KNV A 0.82 0.88 0.91 0.75 0.93 0.81 0.77 0.78 0.89 0.90 KNV B 0.80 0.75 0.88 0.74 0.83 0.76 0.79 0.89
Đánh giá tính đồng nhất về độ lặp của hai nhân viên ở độ tin cậy 95%.
Độ lặp của phương pháp nêu trên có đạt yêu cầu theo khuyến cáo của AOAC?
Giải:
Sử dụng công thức tính:
Áp dụng các công thức tính toán ta thu được kết quả như tóm tắt trong bảng sau:
Đại lượng NV A NV B
Giá trị trung bình 0.844 0.805
Phương sai 0.00427 0.00329
Độ lệch chuẩn 0.065 0.057
RSD (%) 7.7 7.0
RSDr =C–0.1505 23.2 23.4
Fstat 1.3
F(0,05, 9,7) 3.7
Ta thấy Fstat=1.3 < F(0.05,9,8) = 3.7, chấp nhận H0. Hai phương sai là đồng nhất do đó độ lặp của hai nhân viên là tương đồng ở mức tin cậy 95%.
Độ lệch chuẩn tương đối (hệ số biến sai) của nhân viên A, B lần lượt là 7.7 và 7.0 nhỏ hơn nhiều so với mức yêu cầu là ⁓ 23%. Do vậy, độ lặp của phương pháp là đạt yêu cầu.
Sử dụng Excel:
Để thực hiện một cách nhanh chóng bài tập này bằng Excel, ta sử dụng công cụ F–test trong Data analysis, nhập số liệu đầu vào (theo cột hoặc dòng), khai báo đầy đủ thông tin cần thiết và vị trí xuất kết quả như trong hình sau đây:
Chọn ok thu được bảng kết quả:
Ta thấy Fstat ≈ 1.3 < Fcrit ≈ 3.7, chấp nhận H0. Hai phương sai là đồng nhất. Do đó, độ lặp của hai nhân viên là tương đồng ở độ tin cậy 95%.
Ví dụ 3.11: Hàm lượng hoạt chất cefadroxil trong thuốc viên nang Mekocefal được kiểm tra bằng phương pháp HPLC. 5 hộp thuốc mẫu được lấy ngẫu nhiên trên một lô sản phẩm. Thực hiện phân tích lặp 3 lần cho mỗi hộp thuốc, kết quả thu được như bảng sau:
N Hộp 1 Hộp 2 Hộp 3 Hộp 4 Hộp 5
1 98.79 99.31 98.83 100.07 98.77
2 99.23 99.07 98.75 99.88 99.08
3 99.43 99.03 98.87 99.24 99.85
Hàm lượng hoạt chất cefadroxil có đồng đều trong lô thuốc nói trên hay không ở độ tin cậy 95%?
Giải:
Trong bài tập này, chúng ta cần đánh giá xem hàm lượng hoạt chất có khác nhau giữa các hộp thuốc (between group) so với sự thay đổi do phép phân tích lặp lại trong mỗi hộp (within group). Về bản chất, việc đánh giá chính là so sánh giữa phương sai giữa và phương sai sai số. Kiểm định Fisher có thể dễ dàng thực hiện và có câu trả lời chính xác cho bài toán này (xem thêm chương 5, bài toán phân tích phương sai 1 yếu tố).
Gọi SA2 là phương sai giữa các nhóm, So2 là phương sai lặp lại trong mỗi nhóm.
Giả thuyết thống kê:
H0: S𝐴2 ≡ S02 Phương sai giữa đồng nhất với phương sai lặp lại Ha: S𝐴2 ≠ S02 Phương sai giữa không đồng nhất phương sai lặp lại.
Trước hết, chúng ta cần tính các giá trị phương sai cho phép kiểm định.
Thông số Hộp 1 Hộp 2 Hộp 3 Hộp 4 Hộp 5 x̅i 98.79 99.31 98.83 100.07 98.77 Si2 0.107 0.023 0.004 0.189 0.309
x̅ 99.21
– Phương sai lặp lại (within group) So2 =∑ ∑ (xij−x̅i)
n 2 j=1 k i=1
k(n−1) =∑ ∑ (xij−x̅i)
3 2 j=1 5 i=1
5(3−1) = 0.126 – Phương sai giữa các nhóm (between group) SA2 =n ∑ki=1(x̅i−x̅)2
(k−1) =3 ∑5i=1(x̅i−x̅)2
(5−1) = 0.326 Fstat =SA2
So2 =0.326
0.126=2.5 Fcrit= F(0.05, 4, 2) ≈ 19.2
Ta thấy Fstat= 2.5 << Fcrit=19.2 chấp nhận H0, phương sai giữa đồng nhất với phương sai lặp lại. Hàm lượng hoạt chất cefadroxil là đồng đều trong lô thuốc.