Chương 4: Xử lý thống kê trong thẩm định phương pháp phân tích
5.2. Phân tích phương sai hai yếu tố không lặp
Khi cần xem xét đại lượng đo có phụ thuộc vào hai yếu tố khác nhau, chúng ta có ma trận thực nghiệm cho phân tích phương sai hai yếu tố, yếu tố A: a mức đo; yếu tố B: b mức đo.
Ma trận thực nghiệm của bài toán ANOVA hai yếu tố không lặp như bảng 5.3.
Bảng 5.3. Ma trận thực nghiệm của bài toàn ANOVA hai yếu tố không có lặp
Yếu tố B Yếu tố A
Tổng hàng
A1 A2 Ai Aa
B1 y11 y21 ... yn1 ∑ai=1yi1
B2 y12 y22 ... yn2 ∑ai=1yi2
Bj ... ... ... ... ...
Bb y1b y2b ... yab ∑a yib
i=1 Tổng cột ∑b y1j
j=1 ∑b y2j
j=1 ... ∑b yaj
j=1 ∑ ∑b yij j=1 a
i=1
Để tính toán bài toán này một cách thuận lợi ta lập bảng tính như bảng 5.4
Bảng 5.4. Bảng kết quả bài toán ANOVA hai yếu tố không có lặp
Nguồn f SS S2 Fstat Fcrit p–value
A fA = a –1 SSA = SS2 – SS4 SA2=SSA fA
SA2 Sr2
F(α, fA, fr) P(F,fA,fr)
B fB = b –1 SSB = SS3 – SS4 SB2=SSB fB
SB2
Sr2
F(α,fB, fr) P(F,fB,fr)
Sai số fr = ab – a – b+1
SSr = SS1–SS2– SS3+SS4
Sr2=SSr fr
Tổng N = ab–1 SSt = SS1 – SS4
Trong đó:
– SSt là tổng các bình phương đặc trưng cho độ sai khác của toàn bộ ma trận so với giá trị trung bình:
SST = ∑ai=1∑bj=1(xij− x̅)2= SS1 – SS4 (5.12) – SSA là tổng các bình phương của yếu tố A, đặc trưng cho sự thay đổi của A:
SSA =b ∑ai=1(x̅i− x̅)2 = SS2 – SS4 (5.13) – SSB là tổng các bình phương của yếu tố B, đặc trưng cho sự thay đổi của B:
SSB = a ∑bj=1(x̅j− x̅)2= SS3 – SS4 (5.14)
– SSr là tổng bình phương sai số hay tổng bình phương dư đặc trưng cho thay đổi ngẫu nhiên của thực nghiệm:
SSr =∑ai=1∑bj=1(xij− x̅i− x̅j+ x̅)2= SST –SSA – SSB = SS1 – SS2 –
SS3 + SS4 (5.15)
– SS1 là tổng bình phương tất cả các giá trị trong ma trận thực nghiệm tương tự công thức 5.1
SS1 = ∑ ∑ ∑ yijk2 (5.16)
– SS2 là trung bình tổng các bình phương mỗi cột:
SS2 = 1
b∑ A2i (5.17)
Trong đó Ai là tổng của cột thứ i, b là số mức thực nghiệm của yếu tố B.
– SS3 là trung bình tổng các bình phương của mỗi hàng:
SS3 = 1
a∑ Bj2 (5.18)
Trong đó Bj là tổng của hàng thứ j, a là số mức thực nghiệm của yếu tố A.
– SS4 là trung bình của bình phương tổng các giá trị trong ma trận thực nghiệm tương tự công thức 5.3:
SS4 = 1
ab(∑ ∑ yij)2 (5.19) – SA2 là phương sai đặc trưng cho sự ảnh hưởng yếu tố A lên kết quả thực nghiệm:
SA2 =SSA
fA = SSA
a−1 (5.20)
– SB2 là phương sai đặc trưng cho sự ảnh hưởng yếu tố B lên kết quả thực nghiệm:
SB2 = SSB
fB = SSB
b−1 (5.21)
– Sr2 là phương sai dư hay phương sai lặp lại của thí nghiệm, đặc trưng cho sai số ngẫu nhiên trong quá trình thực nghiệm:
Sr2 =SSr
fr = SSr
ab−a−b+1 (5.22)
Sử dụng chuẩn Fisher để so sánh lần lượt các phương sai SA2, SB2 so với Sr2. Giả thuyết thống kê và kết luận thống kê tương tự như bài toán ANOVA một yếu tố.
Ví dụ 5.2: Kết quả phân tích protein trong mẫu dăm bông đóng hộp trên cùng một mẫu ở 3 mức nhiệt độ 415, 435 và 460 oC ở các thời gian 30, 60 và 90 phút thu được như bảng sau đây:
Thời gian t oC
415 435 460
30 phút 27.13 27.20 27.03
60 phút 27.29 27.07 27.10
90 phút 27.03 27.20 27.03
Đánh giá nhiệt độ và thời gian có ảnh hưởng đến kết quả phân tích protein trong mẫu dăm bông đóng hộp hay không?
Giải:
Cách 1: Áp dụng công thức
Tính các giá trị Ai, Bj (tổng cột và tổng hàng) trong ma trận thực nghiệm
Thời gian t oC
Σhàng
415 435 460
30 phút 27.13 27.20 27.03 81.36
60 phút 27.29 27.07 27.10 81.46
90 phút 27.03 27.20 27.03 81.26
Σcột 81.45 81.47 81.16 244.08
Tính tổng các bình phương giá trị trong ma trận thực nghiệm
Thời gian t oC
Σhàng
415 435 460
30 phút 736.04 739.84 730.62 2206.50 60 phút 744.74 732.78 734.41 2211.94
90 phút 730.62 739.84 730.62 2201.08 Σcột 2211.40 2212.46 2195.65 6619.52
Ta có các giá trị như sau:
– Tổng tất cả các kết quả:
∑ ∑ yij= ∑ Ai= ∑ Bj = 244.08
– Tổng bình phương của tất cả các kết quả:
SS1 =∑ ∑ yij2 = 6619.5186 SS2 = 1
m∑ A2i =1
3(81.452 + 81.472+ 81.162) = 6619.4697 SS3 = 1
n∑ Bj2 =1
3(81.362+ 81.462+ 81.262) = 6619.4563 SS4 =(∑ ∑ yij)
2
N = 244.082
9 = 6619.4496
SSA = SS2– SS4 = 6619.47 – 6619.45 = 0.0201 SSB = SS3– SS4 = 6619.46 – 6619.45 = 0.0067 SSt = SS1 – SS4 = 6619.52 – 6619.45 = 0.0690
SSr = SST –SSA – SSB= 0.0690 – 0.0201– 0.0067= 0.0423 – Tìm phương sai tương ứng:
SA2 = SSA
a−1=0.0201
3−1 = 0.01003333 SB2 = SSB
b−1= 0.0067
3−1 = 0.00333333 Sr2 = SSr
a.b−a−b+1=0.0423
4 = =0.01056667
Kết quả được trình bày trong bảng ANOVA thành bảng ta có:
Nguồn f SS S2 Fstat Fcrit p–value
Nhiệt độ 2 0.0201 0.01003333 0.9495268 6.94 0.4598 Thời gian 2 0.0067 0.00333333 0.3154574 6.94 0.7461
Sai số 4 0.0423 0.01056667
Tổng 8 0.0690
Kết luận:
– Yếu tố nhiệt độ:
Vì Fstat ≈ 0.95 << Fcrit = 6.94 (p–value = 0.4598 >> 0.05) nên nhiệt độ không ảnh hưởng đến kết quả phân tích.
– Yếu tố thời gian:
Vì Fstat≈ 0.32 << Fcrit = 6.94 (p–value = 0.7461 >> 0.05) nên thời gian không ảnh hưởng đến kết quả phân tích.
– Kết luận chung: nhiệt độ và thời gian không ảnh hưởng lên kết quả phân tích protein trong mẫu dăm bông đóng hộp.
Cách 2: Sử dụng Microsoft Excel
Nhập dữ liệu theo ma trận thực nghiệm và sử dụng công cụ ANOVA:
Two–Factor without Replication trong Data analysis theo bảng sau đây:
Chọn ok kết quả thu được như bảng ANOVA:
Các giá trị thu được hoàn toàn giống cách 1.
Kết luận: Nhiệt độ và thời gian không ảnh hưởng đến kết quả phân tích.
Cách 3: Sử dụng phần mềm Statgraphics Nhập số liệu vào sheet data như hình dưới đây:
Trong menu Compare chọn Analysis of Variance và chọn Multifactor ANOVA khai báo dữ liệu theo hướng dẫn dưới đây :
Sau khi chọn ok kết quả thu được là bảng ANOVA giống như trong cách 2.
Kết luận thống kê hoàn toàn giống như hai cách đã trình bày trên.