• Đề bài: Một nông trường nuôi 3 giống bò sữa A, B, C Lượng sữa của các con bò này được thể hiện trong bảng theo dõi sau:
Lượng sữa Ít Trung bình Nhiều
Với mức ý nghĩa α = 5%, hãy nhận định xem có phải 3 giống bò này thuần như nhau về phương diện sản lượng sữa hay không?
xk nk1 nk2 nkh nk mj m1 m2 mh ∑ n i = n
Trong đó: x i (i = 1, k̅̅̅̅̅) – các dấu hiệu mà X nhận y i (j = 1, h̅̅̅̅̅) – các dấu hiệu mà Y nhận
6 n i (i = 1, k̅̅̅̅̅) – số lần X nhận x i m j (i = 1, h̅̅̅̅̅) – số lần Y nhận y j n i,j (i = 1, k̅̅̅̅̅, j = 1, h̅̅̅̅̅) – số lần đồng thời X nhận x i và Y nhận y j
- Tìm 𝐗 α 2 = 𝐗 α 2 [(k − 1)(h − 1)] từ bảng phân vị 𝐗 2
• Bài giải: o Dạng bài: Kiểm định về phân bố (kiểm định tính độc lập)
- Giả thiết H0: Mức độ sản lượng sữa giữa 3 giống bò thuần như nhau
- Giả thiết H1: Có ít nhất 2 loại bò có sản lượng sữa khác nhau
Với mức ý nghĩa α = 5% = 0,05 Sử dụng hàm Chiinv (0.05,4) ta có được: χ 0,05 2 [(3 − 1) (3 − 1)] = 9,49
Theo đề bài, ta có: n = 368
Tổng cột 1,2,3 có giá trị lần lượt là m 1 = 220, m 2 = 71 , m 3 = 77
Tổng hàng 1,2,3 có giá trị lần lượt là n 1 = 175 , n 2 87 , n 3 = 106
Vì χ 2 > χ 0,05 2 => bác bỏ H0, chấp nhận H1 o Kết luận: 3 giống bò này khác nhau về phương diện sản lượng sữa
• Sử dụng R: o Kết quả: o Code:
Pearson's Chi-squared test data: data2 X-squared = 11.39, df = 4, p-value = 0.02252 Ít Trung bình Nhiều
Kết luận: 3 giống bò này khác nhau về phương diện sản lượng sữa.
Đề bài yêu cầu phân tích tình hình kinh doanh của một số ngành nghề tại 4 quận nội thành dựa trên số liệu doanh thu của các cửa hàng Với mức ý nghĩa 5%, việc đánh giá này sẽ giúp xác định xu hướng và hiệu quả hoạt động của từng ngành nghề, từ đó đưa ra những nhận định chính xác về sự phát triển kinh tế trong khu vực Các số liệu doanh thu sẽ được sử dụng để so sánh và phân tích, nhằm làm rõ những yếu tố ảnh hưởng đến tình hình kinh doanh của các cửa hàng trong các quận này.
1 2 3 4 Điện lạnh 2.5, 2.7, 2.0, 3.0 13.1, 3.5, 2.7 2.0, 2.4 5.0, 5.4 Vật liệu xây dựng 0.6, 10.4 15.0 9.5, 9.3, 9.1 19.5, 17.5 Dịch vụ tin học 1.2, 1.0, 9.8, 1.8 2.0, 2.2, 1.8 1.2, 1.3, 1.2 5.0, 4.8, 5.2
Giả sử chúng ta quan tâm tới nhân tố A và B Nhân tố A được xem xét ở các mức A1,
A2, Ar, và nhân tố B được xem xét ở các nước B1, B2, Bc
Gọi Xjk là ĐLNN đo lường hiệu quả việc tác động của mức Aj và Bk lên cá thể
Giả sử x1jk, x2jk, , xnjk là mẫu kích thước njk rút ra từ tập hợp chính các giá trị của
> colnames(data2)=c("Ít","Trung bình","Nhiều")
> data2=as.data.frame(data2)
Xjk Ta gọi đó là mẫu (j, k) Ta đưa ra một số ký hiệu sau: x jk: trung bình của mẫu (j, k) c jo jk k 1 n n
= jo ok j k n =n =n jk jk i jk k i k jo jo jo n x x x =n = n trung bình của mức Aj jk jk i jk j i j ok ok ok n x x x = n = n trung bình của mức Bk x = trung bình chung = x jk n
Ta có bảng sau đây ghi các kết quả tính toán trên:
Trung bình cột Bk x o1 x o2 x oc x
Tổng bình phương chung, ký hiệu là SST, được tính theo công thức sau:
Tổng bình phương cho nhân tố A, ký hiệu là SSFA được tính theo công thức sau:
Tổng bình phương do sai số, ký hiệu là SSE, được tính theo công thức
Tổng bình phương do tương tác (Sum of Squares for Interaction) ký hiệu là SSI, được tính theo công thức
Trung bình bình phương của nhân tố A, ký hiệu là MSFA’ được tính bởi công thức:
(r – 1 gọi là bậc tự do của A bằng số mức của A trừ 1)
Trung bình bình phương của nhân tố B, ký hiệu là MSFB’ được tính bởi công thức
(c – 1 gọi là bậc tự do của B bằng số mức của B trừ 1) Trung bình bình phương của sai số, ký hiệu là MSE, được tính bởi
= − n – cr gọi là bậc tự do của sai số
Trung bình bình phương của tương tác, ký hiệu là MSI, được tính bởi
(c – 1) (r – 1) gọi là bậc tự do của tương tác
(r – 1) + (c – 1) + (c – 1) (r – 1) + n – rc = n – 1 = bậc tự do tổng cộng
+ Tỷ số F cho nhân tố A, ký hiệu bởi FA được tính như sau
Tương tự tỷ số F cho nhân tố B, FB được tính bởi
= M SE và tỷ số F cho tương tác giữa A và B, ký hiệu là FAB được tính bởi:
Với mức ý nghĩa đã cho ta ký hiệu f (u, v) là phân vị mức của phân bố Fisher với bậc tự do (u, v)
Ta có quy tắc quyết định như sau:
+ Nếu FA > f (r – 1, n – cr) thì ta bác bỏ giả thiết
H o “Các mức A1, Ar có hiệu quả trung bình như nhau” + Nếu FB > f (c – 1, n – cr) thì ta bác bỏ giả thiết:
H o “Các mức B1, B2, Bc có hiệu quả trung bình như nhau” Nếu FAB > f ((r – 1)(c – 1), n – rc)
Ta bác bỏ giả thiết:
H o “Có sự tương tác giữa A và B”
Trên thực hành tính toán chúng ta thực hiện như sau:
Giả sử Tjk là tổng các giá trị trong mẫu (j, k) Ký hiệu
, c r jo jk ok jk k 1 j 1 c r jo jk ok jk k 1 j 1
jo ok i jk jo ok
Ta có các đẳng thức sau:
SSI = SST SSF − − SSF − SSE Đặc biệt nếu tất cả các mẫu bằng nhau njk = m với mọi j, k thì: jo , ok n = cm n = r m do đó r 2 jo 2 j 1 A
• Bài giải: o Dạng bài: Kiểm định giá trị trung bình o Phương pháp: Phân tích phương sai 2 yếu tố có lặp o Giả thiết H0:
- Giả thiết HA: Doanh thu không phụ thuộc vào ngành nghề
- Giả thiết HB: Doanh thu không phụ thuộc vào quận
- Giả thiết HAB: Doanh thu giữa các ngành nghề và các quận không có liên quan tới nhau
Sử dụng Excel để giải:
Nhập dữ liệu vào bảng:
Sử dụng ANOVA: Two-Factor with Replication ta được:
Yếu tố hàng (mẫu): F = 2.8929 < F–crit = 5.2479 → chấp nhận giả thiết HA
Doanh thu của các cửa hàng không phụ thuộc vào ngành nghề
Yếu tốc cột: F = 0.8189 < F–crit = 4.3771 → chấp nhận giả thiết HB
Doanh thu của các cửa hàng không phụ thuộc vào khu vực kinh doanh
Kết quả phân tích cho thấy F = 0.6498, nhỏ hơn F–crit = 3.3507, do đó chấp nhận giả thiết HAB Điều này cho thấy tình hình kinh doanh giữa các ngành nghề và các quận là tương đương, không có sự tương tác hay ảnh hưởng giữa khu vực kinh doanh và ngành nghề.
Df Sum Sq Mean Sq F value Pr(>F)
Call: lm(formula = score ~ Industries + Districts)
Estimate Std Error t value Pr(>|t|)
Residual standard error: 3.448 on 26 degrees of freedom
F-statistic: 9.428 on 5 and 26 DF, p-value: 3.213e-05
=> Chấp nhận HA, HB, HAB
Kết luận: Tình hình kinh doanh giữa các ngành nghề và quận là tương đồng, không có sự tương tác hay ảnh hưởng giữa khu vực kinh doanh và ngành nghề.
Một nghiên cứu đã phân tích 105 nhà doanh nghiệp Mỹ dựa trên thu nhập hàng năm và tuổi thọ của họ, cho thấy mối liên hệ giữa hai yếu tố này Kết quả cho thấy rằng thu nhập cao thường đi kèm với tuổi thọ dài hơn trong sự nghiệp, điều này nhấn mạnh tầm quan trọng của sự bền bỉ trong kinh doanh Hình ảnh minh họa kết quả nghiên cứu cung cấp cái nhìn sâu sắc về sự phát triển và thành công của các doanh nhân trong môi trường cạnh tranh.
Thu nhập Dưới 100.000 $ Từ 100.000 $ Trên 400.000 $
1.2,1.0,9.8,1.8, 2.0,2.2,1.8, 1.2,1.3,1.2, 5.0,4.8,5.2) data