Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
5.1. Phân tích phương sai một yếu tố
Khi khảo sát sự ảnh hưởng của một yếu tố nào đó tới đại lượng quan tâm ta tiến hành thực nghiệm ở các mức giá trị khác nhau của yếu tố đó (yếu tố cơ bản). Tại mỗi mức giá trị của yếu tố cần thực nghiệm lặp lại một số lần nhất định để xác định yếu tố ngẫu nhiên, số lần thí nghiệm lặp tại các mức thực nghiệm khác nhau có thể giống hoặc khác nhau. Ma trận thực nghiệm của bài toán một yếu tố được mô tả như bảng 5.1.
Bảng 5.1. Ma trận thực nghiệm của bài toán ANOVA một yếu tố, a mức thực nghiệm
Thí nghiệm lặp
Yếu tố
A1 A2 ... Aa
1 y11 y21 ... ya1
2 y12 y22 ... ya2
... ... ... ... ...
... y1m y2n ... yak
Tổng ∑ y1j
m
j=1
∑ y2j
n
j=1
... ∑ yaj
p
j=1
Sự khác nhau giữa các kết quả đo khi thay đổi các mức Ai (between group) được thể hiện bởi phương sai của yếu tố. Phương sai của yếu tố sẽ càng lớn nếu ảnh hưởng của yếu tố đó tới kết quả càng lớn.
Sự sai khác khi tiến hành đo lặp lại tại mỗi mức (within group) đặc trưng bởi phương sai sai số hay phương sai dư (residue).
Phép kiểm định Fisher so sánh phương sai của yếu tố với phương sai dư cho phép kết luận sự ảnh hưởng của yếu tố đang xét tới kết quả là có ý nghĩa hay không có ý nghĩa.
Kết quả tính toán trong ANOVA một yếu tố được trình bày tóm tắt như trong bảng 5.2.
Bảng 5.2. Bảng ANOVA một yếu tố Nguồn Bậc tự
do (f)
Tổng bình phương (Sum of square)
Phương sai (S2, Mean of
square)
Fstat Fcrit p–value
A fA=a – 1 SSA = SS2 – SS3 SA2=SSA fA
SA2 Sr2
F(α, fA,fr) P(F,fA,fr) Sai số fr=N–a SSr = SS1–SS2 Sr2=SSr
fr
Tổng N–1 SSt = SS1 – SS3
Trong đó:
– SSt là tổng các bình phương đặc trưng cho độ sai khác của toàn bộ ma trận so với giá trị trung bình:
SSt=∑ai=1∑nj=1(xij− x̅)2= SS1 – SS3 (5.1) – SSA là tổng các bình phương của yếu tố A, đặc trưng cho sự thay đổi các mức (giữa các cột/between group):
SSA = ∑ai=1ni(x̅i− x̅)2 = SS2 – SS3 (5.2) ni là số lần lặp lại tại mức thứ i của yếu tố A
– SSr là tổng bình phương sai số hay tổng bình phương dư đặc trưng cho thay đổi ngẫu nhiên của thực nghiệm:
SSr = ∑ai=1∑nj=1(xij− x̅i)2= SSt – SSA= SS1–SS2 (5.3) – SS1 là tổng bình phương tất cả các giá trị trong ma trận thực nghiệm:
SS1 = ∑ai=1∑nj=1yij2 (5.4)
– SS2 là tổng các trung bình bình phương tất cả các giá trị của mỗi cột (mỗi mức thực nghiệm):
SS2 = ∑ Ai2
ni
ai=1 (5.5)
Trong đó Ai là tổng của cột i, n là số lần thí nghiệm lặp trong cột thứ i, số lần thí nghiệm lặp trong các cột có thể khác nhau.
– SS3 là bình phương của tổng các giá trị trong ma trận thực nghiệm:
SS3 = 1
N(∑ai=1∑nj=1yij)2 (5.6) – SA2 là phương sai đặc trưng cho sự ảnh hưởng yếu tố A lên kết quả thực nghiệm:
SA2 = SSA
a−1 (5.7)
– Sr2 là phương sai dư hay phương sai lặp lại của thí nghiệm, đặc trưng cho sai số ngẫu nhiên trong quá trình thực nghiệm:
Sr2 =SSr
fr (5.8)
Sử dụng chuẩn Fisher để so sánh phương sai:
Fstat = SA
2
Sr2 (5.9)
Fcrit = F(α,fa,fr) (5.10)
p–value = P(Fstat,fa,fr) (5.11)
Giả thuyết thống kê:
H0: SA2 đồng nhất với Sr2, yếu tố A có ảnh hưởng lên kết quả đo Ha: SA2 khác biệt với Sr2, yếu tố A không ảnh hưởng lên kết quả đo – Nếu Fstat < Fcrit hoặc p–value > α (thường là 0.05), chấp nhận giả thuyết H0. Sai khác do thay đổi các mức thực nghiệm của yếu tố A gây ra không khác sai số thí nghiệm. Do vậy, yếu tố A không có ảnh hưởng đến kết quả đo.
– Nếu Fstat > Fcrit hoặc p–value < α (thường là 0.05), chấp nhận giả thuyết Ha. Sai khác do thay đổi các mức thực nghiệm của yếu tố A khác biệt với sai số thí nghiệm. Do vậy yếu tố A có ảnh hưởng lên kết quả đo ở một độ tin cậy nhất định (thông thường là 95%). Trong trường hợp cần chỉ ra sự khác biệt ở mức nào của yếu tố so với các mức còn lại cần thực hiện phân tích sâu Post–hoc theo phép kiểm định Ducan hoặc Tukey.
Ví dụ 5.1: Phân tích hàm lượng muối (%) trong 04 mẫu khoai tây chiên thu được kết quả như bảng dưới đây, hãy kiểm tra xem hàm lượng muối trong các mẫu khoai tây chiên có đồng nhất không?
Mẫu 1 Mẫu 2 Mẫu 3 Mẫu 4
0.340 0.452 0.398 0.463
0.311 0.467 0.447 0.420
0.352 0.448 0.377 0.439
0.324 0.455 – 0.424
0.327 – – –
Giải:
Cách 1: Thực hiện các công thức tính từ 5.1 đến 5.10 kết quả thu được như bảng sau:
SS1 = ∑ai=1∑nj=1yij2 = 2.64186 SS2 = ∑Ai2
ni =1.6452
5 +1.8222
4 +1.2222
3 +1.7462
4 = 2.637 SS3 = 1
N(∑ai=1∑nj=1yij)2 = 6.4442
16 = 2.595
Nguồn f SS S2 Fstat Fcrit p–value
A 3 SSA = 0.04163 SA2 = 0.01388 33.95 3.49 3.8 10–6 Sai số 12 SSr = 0.00491 Sr2= 0.00041
Tổng 15 SST= 0.04654
Fstat = 33.95 >> Fcrit = 3.49 (p–value = 3.8 10–6 << 0,05) kết luận Ha. Hàm lượng muối trong các mẫu khoai tây chiên là khác nhau rõ rệt.
Cách 2: Sử dụng công cụ phân tích ANOVA trong Excel
Nhập bảng dữ liệu Excel, trong data chọn Data analysis và chọn ANOVA: single factor sau đó nhập dữ liệu theo hình sau:
Sau khi chọn ok, kết quả thu được dưới bảng ANOVA tương tự như bảng 5.2:
Cách 3: Sử dụng phần mềm Statgraphics
Phần mềm Statgraphics là một phần mềm xử lý thống kê được sử dụng rộng rãi từ năm 1980 bởi Tiến sỹ Neil W. Polhemus. Đến nay, sau hơn 40
năm phát triển, phần mềm đã được nâng cấp lên tới phiên bản 19 với năm ngôn ngữ Anh, Đức, Pháp, Tây Ban Nha và Ý. Phần mềm có thể thực hiện được hầu hết các phép xử lý thống kê và đồ thị. Stagraphics cung cấp nhiều công cụ trong xử lý thống kê trong đó có kiểm định thống kê, phân tích phương sai, thiết kế và phân tích thực nghiệm với hầu hết các mô hình thực nghiệm phổ biến hiện nay.
Trong phân tích phương sai, Statgraphics cho phép xử lý các bài toán ANOVA đa dạng hơn so với Excel ở số lượng yếu tố của mô hình thực nghiệm. Để tiến hành bài toán ANOVA một yếu tố, tiến hành cài đặt phần mềm Statgraphics và nhập số liệu vào sheet data theo quy cách như hình sau:
Trong công cụ Compare chọn Analysis of Variance và chọn One–
Way ANOVA:
Chọn biến phụ thuộc là % salt, yếu tố là sample sau đó chọn ok. Khi bảng tables and graph xuất hiện, chọn các bảng cần xuất dữ liệu trong đó chọn ANOVA table, kết quả thu được như sau:
Kết quả thu được tương tự như giải bằng hai cách trên.