1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Giáo trình thiết kế thí nghiệm

232 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Giáo Trình Thiết Kế Thí Nghiệm
Tác giả Đỗ Đức Lực, Nguyễn Đình Hiền
Trường học Vietnam National University of Agriculture
Thể loại book
Năm xuất bản 2017
Định dạng
Số trang 232
Dung lượng 8,2 MB

Cấu trúc

  • Chương 1 MỘT SỐ KHÁI NIỆM TRONG XÁC SUẤT THỐNG KÊ MÔ TẢ (12)
    • 1.1. TÓM TẮT VỀ XÁC SUẤT VÀ BIẾN NGẪU NHIÊN (12)
      • 1.1.1. Xác suất cơ bản (12)
      • 1.1.2. Hệ sự kiện đầy đủ (12)
      • 1.1.3. Biến ngẫu nhiên, bảng phân phối, hàm phân phối (13)
      • 1.1.4. Một số phân phối thường gặp (13)
    • 1.2. BIẾN SINH HỌC (15)
      • 1.2.1. Khái niệm về biến sinh học (15)
      • 1.2.2. Tổng thể và mẫu (16)
      • 1.2.3. Sơ lược về cách chọn mẫu (16)
      • 1.2.4. Các tham số thống kê của mẫu (17)
      • 1.2.5. Biểu diễn số liệu bằng đồ thị (22)
    • 1.3. BÀI TẬP (24)
  • Chương 2 ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THIẾT (26)
    • 2.1. GIẢ THIẾT VÀ ĐỐI THIẾT (26)
    • 2.2. ƯỚC LƯỢNG GIÁ TRỊ TRUNG BèNH à CỦA BIẾN PHÂN PHỐI CHUẨN N(  ,  2 ) (27)
      • 2.2.1. Ước lượng  khi biết phương sai  2 (27)
      • 2.2.2. Ước lượng  khi không biết phương sai  2 (28)
    • 2.3. KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH  CỦA BIẾN PHÂN PHỐI CHUẨN N(  ,  2 ) (28)
      • 2.3.1. Kiểm định giả thiết H 0 :  =  0 khi biết  2 (28)
      • 2.3.2. Kiểm định giả thiết H 0 :  =  0 khi không biết  2 (29)
    • 2.4. KIỂM ĐỊNH HAI GIÁ TRỊ TRUNG BÌNH CỦA HAI BIẾN PHÂN PHỐI CHUẨN (30)
      • 2.4.1. Chọn mẫu theo cặp (31)
      • 2.4.2. Chọn mẫu độc lập (32)
    • 2.5. ƯỚC LƯỢNG VÀ KIỂM ĐỊNH XÁC SUẤT (35)
      • 2.5.1. Ước lượng xác suất P (35)
      • 2.5.2. Kiểm định giả thiết H 0 : P = P 0 (36)
      • 2.5.3. Kiểm định giả thiết H 0 : P 2 = P 1 (36)
    • 2.6. PHÂN TÍCH PHƯƠNG SAI (37)
    • 2.7. BÀI TẬP (41)
  • Chương 3 MỘT SỐ KHÁI NIỆM VỀ THIẾT KẾ THÍ NGHIỆM (43)
    • 3.1. PHÂN LOẠI THÍ NGHIỆM (43)
      • 3.1.1. Thí nghiệm quan sát (43)
      • 3.1.2. Thí nghiệm thực nghiệm (43)
    • 3.2. MỘT SỐ KHÁI NIỆM TRONG THIẾT KẾ THÍ NGHIỆM (44)
      • 3.2.1. Yếu tố thí nghiệm (44)
      • 3.2.2. Mức (44)
      • 3.2.3. Công thức thí nghiệm (công thức thí nghiệm) (44)
      • 3.2.4. Đơn vị thí nghiệm (44)
      • 3.2.5. Dữ liệu (số liệu) (45)
      • 3.2.6. Khối (45)
      • 3.2.7. Lặp lại (45)
      • 3.2.8. Nhắc lại (45)
      • 3.2.9. Nhóm đối chứng (45)
    • 3.3. CÁC BƯỚC TIẾN HÀNH THÍ NGHIỆM (45)
    • 3.4. SAI SỐ THÍ NGHIỆM (46)
    • 3.5. BỐ TRÍ THÍ NGHIỆM VÀO CÁC CÔNG THỨC THÍ NGHIỆM (47)
      • 3.5.1. Sự cần thiết của phân chia ngẫu nhiên (47)
      • 3.5.2. Các phương pháp phân chia ngẫu nhiên (48)
    • 3.6. PHƯƠNG PHÁP LÀM MÙ (50)
    • 3.7. TĂNG ĐỘ CHÍNH XÁC CỦA ƯỚC TÍNH (50)
      • 3.7.1. Lặp lại (50)
      • 3.7.2. Kỹ thuật khối (50)
      • 3.7.3. Kỹ thuật cặp (50)
    • 3.8. DUNG LƯỢNG MẪU CẦN THIẾT (51)
      • 3.8.1. Số công thức thí nghiệm (52)
      • 3.8.2. Bậc tự do của sai số ngẫu nhiên (60)
      • 3.8.3. Phương pháp chọn mẫu (61)
    • 3.9. BÀI TẬP (66)
  • Chương 4 THIẾT KẾ THÍ NGHIỆM MỘT YẾU TỐ (67)
    • 4.1. THÍ NGHIỆM HOÀN TOÀN NGẪU NHIÊN (Completely randomized Design - CRD) (67)
      • 4.1.1. Đặc điểm (67)
      • 4.1.2. Chất lượng động vật (67)
      • 4.1.3. Dung lượng mẫu cần thiết (68)
      • 4.1.4. Ưu điểm và nhược điểm (70)
      • 4.1.5. Cách thiết kế thí nghiệm (70)
      • 4.1.6. Phân tích số liệu (71)
    • 4.2. THÍ NGHIỆM KHỐI NGẪU NHIÊN ĐẦY ĐỦ (Randomized complete block design - RCBD) (74)
      • 4.2.1. Số khối cần thiết (75)
      • 4.2.2. Ưu điểm và nhược điểm (76)
      • 4.2.3. Cách thiết kế thí nghiệm (76)
      • 4.2.4. Phân tích số liệu (77)
    • 4.3. THÍ NGHIỆM KHỐI NGẪU NHIÊN VỚI NHIỀU ĐƠN VỊ THÍ NGHIỆM TRONG MỘT CÔNG THỨC THÍ NGHIỆM VÀ KHỐI (80)
      • 4.3.1. Cách thiết kế thí nghiệm (80)
      • 4.3.2. Mô hình phân tích (81)
      • 4.3.3. Cách phân tích (81)
    • 4.4. THÍ NGHIỆM Ô VUÔNG LA TINH (83)
      • 4.4.1. Ưu điểm và nhược điểm của mô hình (84)
      • 4.4.2. Cách thiết kế thí nghiệm (84)
      • 4.4.3. Mô hình phân tích (85)
      • 4.4.4. Cách phân tích (85)
    • 4.5. BÀI TẬP (88)
  • Chương 5 THIẾT KẾ THÍ NGHIỆM HAI YẾU TỐ (90)
    • 5.1. THÍ NGHIỆM HAI YẾU TỐ CHÉO NHAU (Cross hay Orthogonal) (90)
      • 5.1.1. Ưu điểm và nhược điểm (90)
      • 5.1.2. Số đơn vị thí nghiệm cần thiết (91)
      • 5.1.3. Cách thiết kế thí nghiệm (91)
      • 5.1.4. Mô hình phân tích (92)
      • 5.1.5. Cách phân tích (92)
    • 5.2. THÍ NGHIỆM HAI YẾU TỐ PHÂN CẤP (Hierachical hay Nested) (95)
      • 5.2.1. Ưu và nhược điểm của mô hình (96)
      • 5.2.2. Cách thiết kế thí nghiệm (96)
      • 5.2.3. Mô hình (96)
      • 5.2.4. Cách phân tích (96)
    • 5.3. THÍ NGHIỆM HAI YẾU TỐ CHIA Ô (98)
      • 5.3.1. Ưu và nhược điểm của mô hình (99)
      • 5.3.2. Cách thiết kế thí nghiệm (99)
      • 5.3.3. Mô hình (99)
      • 5.3.4. Cách phân tích (100)
    • 5.4. THÍ NGHIỆM HAI YẾU TỐ CHIA Ô HOÀN TOÀN NGẪU NHIÊN (103)
    • 5.5. BÀI TẬP (104)
  • Chương 6 TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH (106)
    • 6.1. SẮP XẾP SỐ LIỆU (106)
    • 6.2. HỆ SỐ TƯƠNG QUAN (107)
      • 6.2.1. Tính hệ số tương quan (107)
      • 6.2.2. Tính chất của hệ số tương quan mẫu (107)
    • 6.3. HỒI QUY TUYẾN TÍNH (109)
      • 6.3.1. Đường trung bình của biến ngẫu nhiên Y theo X trong phân phối chuẩn 2 chiều (110)
      • 6.3.2. Đường thẳng gần đúng của Y theo X (111)
    • 6.4. KIỂM ĐỊNH ĐỐI VỚI HỆ SỐ TƯƠNG QUAN VÀ CÁC HỆ SỐ HỒI QUY (114)
    • 6.5. DỰ BÁO THEO HỒI QUY TUYẾN TÍNH (116)
    • 6.6. PHÂN TÍCH PHƯƠNG SAI VÀ HỒI QUY (117)
  • Chương 7 KIỂM ĐỊNH MỘT PHÂN PHỐI VÀ BẢNG TƯƠNG LIÊN (119)
    • 7.1. KIỂM ĐỊNH MỘT PHÂN PHỐI (119)
    • 7.2. BẢNG TƯƠNG LIÊN L x K (121)
    • 7.3. KIỂM ĐỊNH CHÍNH XÁC CỦA FISHER ĐỐI VỚI BẢNG TƯƠNG LIÊN 2 x2 (126)
    • 7.4. THÍ NGHIỆM NGHIÊN CỨU DỊCH TỄ HỌC THÚ Y (128)
      • 7.4.1. Thiết kế thí nghiệm nghiên cứu cắt ngang (cross sectional studies) (128)
      • 7.4.2. Thiết kế thí nghiệm nghiên cứu bệnh chứng (case – control study) (131)
      • 7.4.3. Thiết kế thí nghiệm nghiên cứu thuần tập (cohort study) (133)
    • 7.5. BÀI TẬP (135)
  • Bài 1. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU (137)
    • 1.1. GIỚI THIỆU PHẦN MỀM MINITAB (137)
    • 1.2. TÓM TẮT VÀ TRÌNH BÀY ĐỐI VỚI BIẾN ĐỊNH LƯỢNG (138)
    • 1.3. TÓM TẮT VÀ TRÌNH BÀY ĐỐI VỚI BIẾN ĐỊNH TÍNH (142)
  • Bài 2. ƯỚC LƯỢNG, KIỂM ĐỊNH MỘT GIÁ TRỊ TRUNG BÌNH VÀ SO SÁNH HAI GIÁ TRỊ TRUNG BÌNH (147)
    • 2.1. ƯỚC LƯỢNG VÀ KIỂM ĐỊNH MỘT GIÁ TRỊ TRUNG BÌNH (147)
      • 2.1.1. Kiểm định phân phối chuẩn (147)
      • 2.1.2. Kiểm định Z (148)
      • 2.1.3. Kiểm định T (149)
    • 2.2. SO SÁNH HAI GIÁ TRỊ TRUNG BÌNH (150)
      • 2.2.1. Kiểm định sự đồng nhất của phương sai (150)
      • 2.2.2. Kiểm định T (152)
      • 2.2.3. Kiểm định T cặp (154)
  • Bài 3. SO SÁNH NHIỀU GIÁ TRỊ TRUNG BÌNH (157)
    • 3.1. THÍ NGHIỆM MỘT YẾU TỐ HOÀN TOÀN NGẪU NHIÊN (157)
    • 3.2. THÍ NGHIỆM MỘT YẾU TỐ KHỐI NGẪU NHIÊN ĐẦY ĐỦ (164)
    • 3.3. THÍ NGHIỆM Ô VUÔNG LA TINH (168)
    • 3.4. THÍ NGHIỆM HAI YẾU TỐ CHÉO NHAU (TRỰC GIAO) (172)
    • 3.5. THÍ NGHIỆM HAI YẾU TỐ PHÂN CẤP (CHIA Ổ) (174)
    • 3.6. THÍ NGHIỆM HAI YẾU TỐ CHIA Ô (Split-Plot) (177)
    • 3.7. PHÂN TÍCH HIỆP PHƯƠNG SAI (180)
  • Bài 4. TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH (183)
    • 4.1. HỆ SỐ TƯƠNG QUAN (183)
    • 4.2. PHƯƠNG TRÌNH HỒI QUY TUYẾN TÍNH (184)
  • Bài 5. BẢNG TƯƠNG LIÊN (188)
  • Bài 6. ƯỚNG TÍNH DUNG LƯỢNG MẪU (192)
    • 6.1. ƯỚC LƯỢNG, KIỂM ĐỊNH MỘT GIÁ TRỊ TRUNG BÌNH (192)
    • 6.2. ƯỚC LƯỢNG, KIỂM ĐỊNH MỘT TỶ LỆ (194)
    • 6.3. SO SÁNH HAI GIÁ TRỊ TRUNG BÌNH (195)
    • 6.4. SO SÁNH HAI TỶ LỆ (196)
    • 6.5. SO SÁNH NHIỀU GIÁ TRỊ TRUNG BÌNH (197)
  • BÀI 7. BÀI TẬP (198)
    • 7.1. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU (198)
    • 7.2. ƯỚC LƯỢNG, KIỂM ĐỊNH MỘT GIÁ TRỊ TRUNG BÌNH (200)
    • 7.3. ƯỚC LƯỢNG, KIỂM ĐỊNH XÁC SUẤT P (200)
    • 7.4. SO SÁNH HAI GIÁ TRỊ TRUNG BÌNH (0)
    • 7.5. SO SÁNH HAI XÁC SUẤT (0)
    • 7.6. PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ (0)
    • 7.7. PHÂN TÍCH PHƯƠNG SAI HAI YẾU TỐ (0)
    • 7.8. TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH (0)
    • 7.9. KIỂM ĐỊNH MỘT PHÂN PHỐI VÀ BẢNG TƯƠNG LIÊN (0)
  • TÀI LIỆU THAM KHẢO (0)

Nội dung

MỘT SỐ KHÁI NIỆM TRONG XÁC SUẤT THỐNG KÊ MÔ TẢ

TÓM TẮT VỀ XÁC SUẤT VÀ BIẾN NGẪU NHIÊN

Số chỉnh hợp chập k trong n vật:  !

Số tổ hợp chập k của n vật:

Số hoán vị của k vật: A k k k!

Số chỉnh hợp lặp chập k của n vật: A~ n k n k

Quy tắc cộng tổng quát: p(A  B) = p(A) + p(B) - p(AB)

Quy tắc cộng đơn giản: p(A  B) = p(A) + p(B) nếu A B = 

Quy tắc nhân tổng quát: p(A B) = p(A) p(B/A)= p(B).p(A/B)

Quy tắc nhân đơn giản: p(A B) = p(A) p(B) nếu A, B độc lập

1.1.2 Hệ sự kiện đầy đủ

Hệ sự kiện đầy đủ hay hệ sự kiện toàn phần nếu:

Công thức xác suất toàn phần: 

1.1.3 Biến ngẫu nhiên, bảng phân phối, hàm phân phối

Kỳ vọng toán học: MX   n x i p i

Bảng phân phối của biến ngẫu nhiên rời rạc:

1.1.4 Một số phân phối thường gặp

Kỳ vọng MX = à = p Phương sai DX = pq p i p q

X 0 1 K n MX = np DX=npq p i q n C 1 n pq n-1 C k n p k q n-k p n ModX là số nguyên np-q  ModX np+p

Nếu trong N bi có M bi trắng, rút n bi, X là số bi trắng

X = 1,  với pk = p(X = k) = pq k-1 (p là xác suất thành công, q = 1- p)

Hàm mật độ xác suất: 2

Với (z)là hàm phân phối của biến chuẩn tắc

Tính gần đúng phân phối nhị thức bằng phân phối chuẩn khi n lớn: p(k  X  l)  ( ) ( ) npq np k npq np l  

Dung lượng mẫu cần thiết để trung bình cộng khác  không quá  (độ chính xác) khi có phân phối chuẩn N(, 2 ) và mức tin cậy P = 1 - 

  z là giá trị sao cho (z) = 1-/2

Dung lượng mẫu cần thiết để tần suất khác xác suất không quá  trong phân phối nhị thức và mức tin cậy P = 1 - 

  z là giá trị sao cho (z) = 1-/2.

BIẾN SINH HỌC

Trong quá trình thí nghiệm, việc thu thập dữ liệu là rất quan trọng để xử lý và đưa ra kết luận Dữ liệu này có thể là giá trị số hoặc chữ, đặc trưng cho cá thể hoặc nhóm và có sự biến đổi giữa các cá thể Những dữ liệu này được gọi là biến, hay biến ngẫu nhiên, vì chúng được thu thập từ việc chọn ngẫu nhiên cá thể hoặc nhóm trong tổng thể (trong thí nghiệm thực nghiệm) hoặc từ việc quan sát các đặc trưng của cá thể (trong thí nghiệm quan sát).

1.2.1 Khái niệm về biến sinh học Đối tượng nghiên cứu trong chăn nuôi là các vật sống, vì vậy các biến như đã nêu trên gọi chung là các biến sinh học Có thể phân loại các biến sinh học như sau:

Biến định tính bao gồm các biến có hai trạng thái (binary) như giới tính (cái hay đực), tình trạng sống chết của vật nuôi, và tình trạng nhiễm bệnh Ngoài ra, còn có các biến nhiều trạng thái, ví dụ như màu lông của giống lợn và các kiểu gen Những biến này được gọi là biến định danh (nominal) hay biến thuộc tính Trong số các biến có nhiều trạng thái, một số có thể sắp xếp theo thứ tự, chẳng hạn như mức độ mắc bệnh của vật nuôi, thường được xếp hạng từ thấp đến cao Những biến này được gọi là biến thứ hạng (ranked) hay biến có thang đo thứ bậc.

Biến định lượng là biến phải dùng một gốc đo, một đơn vị đo để xác định giá trị

Biến định lượng bao gồm biến rời rạc và biến liên tục Biến rời rạc có thể là số trứng nở từ 12 quả, số lợn con trong một lứa đẻ, hay số tế bào hồng cầu trên kính hiển vi Biến liên tục có thể là khối lượng gà 45 ngày tuổi, sản lượng sữa bò, tăng khối lượng hàng ngày của động vật, hay nồng độ canxi trong máu Khi chọn đơn vị đo, giá trị cụ thể của biến sẽ nằm trong khoảng [a, b] Biến định lượng được phân thành hai loại: biến khoảng (interval) và biến tỷ số (ratio) Biến khoảng chỉ chú ý đến mức chênh lệch giữa hai giá trị mà không có giá trị 0 thực sự, ví dụ như nhiệt độ Ngược lại, biến tỷ số có giá trị 0 và tỷ số giữa các giá trị có ý nghĩa, như trong trường hợp khối lượng lợn từ 25 kg lên 90 kg, cho thấy khối lượng kết thúc nặng gấp 3,6 lần.

Một tổng thể được hình thành từ một đám đông cá thể có chung nguồn gốc, nơi sinh sống hoặc nguồn lợi Khi đo một biến sinh học X từ từng cá thể trong tổng thể, chúng ta nhận được một biến ngẫu nhiên, có thể là định tính hoặc định lượng.

Để hiểu biết toàn diện về biến X, cần khảo sát tổng thể, nhưng nhiều lý do như thiếu tài chính, thời gian, hoặc cần bảo tồn cá thể khiến việc này trở nên khó khăn Đôi khi, sự cân nhắc giữa độ chính xác và chi phí khảo sát dẫn đến quyết định không khảo sát toàn bộ.

Nhiều lý do dẫn đến việc chỉ khảo sát một mẫu (sample) để xử lý dữ liệu và đưa ra kết luận chung cho tổng thể, được gọi là “kết luận thống kê” Để đảm bảo tính chính xác của các kết luận này, mẫu phải phản ánh đúng tổng thể, tức là phải đại diện và điển hình cho tổng thể mà không thiên lệch về phía tốt hay xấu.

1.2.3 Sơ lược về cách chọn mẫu

Tùy thuộc vào đặc thù của từng ngành nghề, có nhiều phương pháp chọn mẫu khác nhau, chẳng hạn như chọn ruộng để đánh giá năng suất, lựa chọn sản phẩm từ máy để kiểm tra chất lượng, hay chọn hộ gia đình để thực hiện điều tra dân số và xã hội học Việc chọn mẫu cần phải hợp lý về mặt chuyên môn, dễ dàng cho người thực hiện, và đảm bảo yêu cầu về xác suất thống kê, tức là phải ngẫu nhiên và không thiên lệch.

Thuần tuý về thống kê cũng có nhiều cách chọn mẫu:

Để chọn mẫu ngẫu nhiên, có thể sử dụng phương pháp rút thăm hoặc bảng số ngẫu nhiên Trước tiên, cần chia tổng thể thành các lớp đồng đều hơn dựa trên các tiêu chuẩn như vùng miền (vùng cao, trung du, đồng bằng), tầng lớp xã hội, thu nhập, ngành nghề, hoặc phân loại sản phẩm theo nguồn vật liệu và ngày sản xuất Sau khi xác định các lớp, dựa vào mức độ đồng đều trong từng lớp, tiến hành chọn số lượng cá thể đại diện cho lớp đó, đảm bảo dung lượng mẫu phù hợp.

Tổng thể có thể được phân chia thành các lớp, từ đó lựa chọn một số lớp làm mẫu cấp một Mỗi lớp trong mẫu cấp một lại được chia thành các lớp nhỏ hơn, đều hơn, và từ đó chọn ra một số lớp làm mẫu cấp hai Việc khảo sát có thể thực hiện trên toàn bộ cá thể trong mẫu cấp hai hoặc chỉ khảo sát một phần nhất định.

Việc chọn mẫu trong nghiên cứu cần phải được thực hiện một cách ngẫu nhiên và khách quan Điều này có nghĩa là không nên để yếu tố chủ quan của người chọn ảnh hưởng đến quá trình lựa chọn mẫu.

1.2.4 Các tham số thống kê của mẫu

Kích thước mẫu được gọi là n, trong đó x1, x2, , xn là các số liệu đo được từ các cá thể trong mẫu Nếu có nhiều số liệu trùng lặp, chúng có thể được ghi lại theo dạng tần số, tức là số lần xuất hiện của từng giá trị.

Các tham số của mẫu, hay còn gọi là các thống kê, được phân loại thành hai nhóm chính: tham số về vị trí và tham số về độ phân tán của dữ liệu.

Các tham số thống kê về vị trí bao gồm trung bình, trung vị và mode, trong khi các tham số về độ phân tán gồm phương sai, độ lệch chuẩn, sai số chuẩn, khoảng biến động và hệ số biến động.

Trung bình cộng ký hiệu là x n x x n i i

1 khi có tần số hoặc tần suất (m i )

Ví dụ 1.1: Khối lượng (g) của 16 chuột cái tại thời điểm cai sữa như sau:

Để tính khối lượng trung bình của 4547 lợn Piétrain lai (Yorkshire và Landrace) nuôi vỗ béo đến 210 ngày tuổi, cần phân loại lợn thành các nhóm theo khối lượng từ thấp đến cao Sau đó, xác định khối lượng trung bình của từng nhóm và tần suất xuất hiện của mỗi nhóm.

Khối lượng trung bình nhóm (kg) Tần số Tần suất Tần suất tích luỹ

BÀI TẬP

Xác suất mắc bệnh ở một động vật là P = 0,35, được xác định từ một nghiên cứu với mẫu lớn Để tính xác suất mắc bệnh của 2 trong số 10 động vật, ta có thể áp dụng công thức xác suất nhị thức Kết quả sẽ cho thấy khả năng mắc bệnh trong nhóm động vật này.

Xác suất mắc một bệnh là 0,25 Hãy tính xác suất không phát hiện được ca nhiễm bệnh trong số 30 động vật kiểm tra

Bệnh dại xuất hiện với tần suất 0,005 Cần tiến hành kiểm tra bao nhiêu chó trong vùng để phát hiện bệnh dại với độ chính xác 95%

Khối lượng (kg) của lợn Pietrain ở 210 ngày tuổi với các kiểu gen Halothane khác nhau được thể hiện trong bảng số liệu Cần vẽ đồ thị và tính toán các tham số thống kê mô tả cho bộ số liệu này.

ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THIẾT

GIẢ THIẾT VÀ ĐỐI THIẾT

Khi khảo sát một tổng thể và xem xét các biến ngẫu nhiên, có thể đưa ra giả thuyết liên quan đến phân phối của chúng Nếu đã biết phân phối, ta có thể đưa ra giả thuyết về tham số của tổng thể Để kết luận thống kê cho giả thuyết, cần chọn mẫu ngẫu nhiên, tính toán tham số mẫu, và xác định mức ý nghĩa α trước khi đưa ra kết luận.

Bài toán kiểm định tham số  của phân phối được đặt ra với giả thuyết H0:  = o, trong đó o là một số đã cho Kết luận thống kê có thể là "chấp nhận H0" hoặc "bác bỏ H0" Tuy nhiên, việc bác bỏ H0 dẫn đến việc chấp nhận một trong nhiều giá trị khác  khác với o, gây khó khăn trong việc giải quyết Do đó, bài toán thường được cụ thể hóa hơn với giả thiết H0 và đối thiết H1 Khi kết luận, ta hoặc chấp nhận H0 hoặc bác bỏ H0, và trong trường hợp bác bỏ H0, có thể coi như chấp nhận đối thiết H1, mặc dù chúng không hoàn toàn tương đương.

Khi chấp nhận giả thuyết H0 trong khi giả thuyết đúng là H1, ta sẽ mắc sai lầm loại II, được gọi là rủi ro loại hai (β) Ngược lại, nếu bác bỏ giả thuyết H0 khi nó thực sự đúng, ta sẽ mắc sai lầm loại I, với xác suất mắc sai lầm này được gọi là rủi ro loại một (α).

Giả thiết Bác bỏ H 0 Chấp nhận H 0

H 0 đúng Sai lầm loại I () Quyết định đúng

H 0 sai Quyết định đúng Sai lầm loại II ()

Trong kiểm định giả thiết, luôn tồn tại hai loại rủi ro: loại I và loại II, với mức độ quan trọng khác nhau tùy theo vấn đề nghiên cứu Thông thường, người ta thường chú trọng vào sai lầm loại I và cần kiểm soát để đảm bảo rằng rủi ro này không vượt quá mức ý nghĩa được xác định là α.

Trước hết xem xét cụ thể bài toán kiểm định giả thiết H0:  = o, đối thiết H1: 

Bài toán kiểm định giả thiết đơn so sánh hai giá trị 1 và o, trong đó 1 khác o Quy tắc kiểm định dựa vào hai giá trị cụ thể này cùng với mức ý nghĩa  và sai lầm loại hai Việc thực hiện kiểm định này trong lý thuyết thống kê là tương đối đơn giản.

Sau đó mở rộng quy tắc sang cho bài toán kiểm định giả thiết kép H1: o;  >

Việc mở rộng khoảng tham số từ o đến  < o gặp nhiều khó khăn, nhưng các nhà nghiên cứu lý thuyết xác suất thống kê đã tìm ra giải pháp Do đó, khi kiểm định giả thiết H0:  = o, có thể lựa chọn một trong ba đối thiết H1 sau.

H1:   o gọi là đối thiết hai phía

H1:  > o gọi là đối thiết phải

H1:  < o gọi là đối thiết trái

Trong nghiên cứu, hai đối thiết được gọi là đối thiết một phía Việc lựa chọn đối thiết phụ thuộc vào vấn đề khảo sát cụ thể Nếu mục tiêu chỉ là thu thập dữ liệu hoặc thực hiện thí nghiệm để so sánh hai giống hoặc hai phương pháp mà không ưu tiên giống hay phương pháp nào, thì nên chọn H0: à1 = à2 và H1: à1 ≠ à2.

Khi so sánh giống mới (phương pháp mới: à2) với giống cũ (phương pháp cũ: à1) để xác định liệu giống mới có ưu việt hơn hay không, cần thiết lập giả thuyết H1: à1 < à2, không cần quan tâm đến trường hợp à2 ≤ à1 vì mục tiêu là tìm kiếm giống (phương pháp) tốt hơn Ngược lại, nếu chú trọng đến chi phí sản xuất giống hoặc khi sử dụng phương pháp, giả thuyết H1 sẽ là à1 > à2, vì lúc này chỉ cần chọn phương pháp có giá rẻ hơn.

Trong y học, khi bệnh nhân bị huyết áp cao, mục tiêu điều trị bằng thuốc là giảm huyết áp Nếu huyết áp của bệnh nhân dao động quanh mức H0: à = 150, thì thuốc cần được sử dụng để đạt mục tiêu H1: à < 150 Ngược lại, nếu huyết áp của bệnh nhân thấp với H0: à = 90, thì thuốc sẽ được dùng để tăng huyết áp, với mục tiêu H1: à > 90.

Kiểm định giả thiết là quá trình mà người dùng đặt ra các giả thuyết trước khi thu thập mẫu và xử lý dữ liệu Thông thường, người ta chọn kiểm định hai phía, trong đó giả thuyết H0 (H0: μ1 = μ2) thể hiện rằng hai trung bình không khác nhau rõ rệt, trong khi giả thuyết H1 (H1: μ1 ≠ μ2) cho thấy hai trung bình khác nhau rõ rệt Bài giảng này chủ yếu tập trung vào kiểm định hai phía, còn được gọi là kiểm định hai đuôi.

ƯỚC LƯỢNG GIÁ TRỊ TRUNG BèNH à CỦA BIẾN PHÂN PHỐI CHUẨN N(  ,  2 )

2.2.1 Ước lượng  khi biết phương sai  2

Dựa vào lý thuyết xác suất có thể đưa ra ước lượng giá trị trung bình quần thể () theo các bước sau đây:

+ Chọn mẫu dung lượng n, tính trung bình cộngx

+ Ở mức tin cậy P đã cho lấy  = 1- P, sau đó tìm giá trị tới hạn z(/2) trong Phụ lục 3 (hàm (z) tìm z sao cho (z) = 1 - /2)

+ Khoảng tin cậy đối xứng ở mức tin cậy P: z n n x z x ( /2)     ( /2) 

Trong ví dụ 2.1, khối lượng bao thức ăn gia súc được phân phối chuẩn với các tham số N (μ, σ²) và độ lệch chuẩn σ = 1,5 kg Sau khi cân thử 25 bao, khối lượng trung bình thu được là x = 49 kg Để ước lượng kỳ vọng μ với mức tin cậy P = 0,95, ta sử dụng giá trị z (0,025) = 1,96.

2.2.2 Ước lượng  khi không biết phương sai  2

Dựa vào phân phối Student có thể đưa ra ước lượng  theo các bước sau đây: + Chọn mẫu dung lượng n, tính trung bình cộng x và độ lệch chuẩn s

+ Ở mức tin cậy P lấy  = 1- P, tìm giá trị tới hạn t(/2, n-1) trong bảng 2, cột

+ Khoảng tin cậy đối xứng ở mức tin cậy P: n n s t n x n s t x (/2, 1)    (/2, 1)

Ví dụ 2.2: Từ một quần thể đồng nhất, chọn và cân ngẫu nhiên 30 con gà được khối lượng trung bình x = 3,03 kg; s = 0,0279 kg Hãy ước lượng  với mức tin cậy P

KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH  CỦA BIẾN PHÂN PHỐI CHUẨN N(  ,  2 )

2.3.1 Kiểm định giả thiết H 0 :  =  0 khi biết  2

Tiến hành kiểm định theo các các bước sau:

+ Chọn mẫu dung lượng n, tính trung bình cộng x

+ Tìm giá trị tới hạn z (/2) nếu kiểm định 2 phía hoặc z() nếu kiểm định một phía

+ Tính giá trị thực nghiệm: ZTN 

So sánh ZTN và z tới hạn để rút ra kết luận theo nguyên tắc sau:

H1:    0 (Kiểm định hai phía) Nếu giá trị tuyệt đối của ZTN nhỏ hơn hoặc bằng z(/2), thì chấp nhận giả thuyết H0; ngược lại, nếu lớn hơn, thì bác bỏ H0 và chấp nhận H1.

Với H1:  >  0 (Kiểm định một phía) Nếu ZTN nhỏ hơn hay bằng giá trị tới hạn z() thì chấp nhận H0, ngược lại thì chấp nhận H1

Với H1:  <  0 (Kiểm định một phía) Nếu ZTN lớn hơn hay bằng giá trị tới hạn - z() thì chấp nhận H0, ngược lại thì chấp nhận H1

Trong thí nghiệm nuôi 100 con cừu theo chế độ riêng, mục tiêu là kiểm tra xem chế độ này có làm tăng khối lượng của cừu một năm tuổi hay không Từ một quần thể có khối lượng trung bình 30 kg và phương sai 25 kg², giả thiết khối lượng phân phối chuẩn N(μ, 25) được đưa ra Kiểm định giả thiết H0: μ = 30 và H1: μ > 30 với mức ý nghĩa α = 0,05 Kết quả cho thấy khối lượng trung bình của 100 con cừu thí nghiệm là 32 kg.

Kết luận cho thấy rằng do ZTN lớn hơn ZLT, giả thiết H0 đã bị bác bỏ, điều này có nghĩa là khối lượng trung bình không đạt 30 kg Chế độ nuôi mới đã góp phần làm tăng khối lượng của những con cừu một năm tuổi.

Trong một nghiên cứu, một mẫu gồm 100 bò sữa đã được phân tích, với sản lượng sữa trung bình trong một chu kỳ tiết sữa đạt 3850 kg Những con bò này được chọn từ quần thể có giá trị trung bình cao.

4000 kg và độ lệch chuẩn là 1000 hay không? Giả sử sản lượng sữa của quần thể tuân theo phân phối chuẩn N (,1000²) Hãy kiểm định giả thiết H0:  = 4000 đối thiết H1: 

Kết luận: Chấp nhận H0, số bò sữa nêu trên xuất phát từ một quần thể ban đầu có sản lượng sữa chu kỳ là 4000 kg

2.3.2 Kiểm định giả thiết H 0 :  =  0 khi không biết  2 Đây là trường hợp phổ biến khi kiểm định giá trị trung bình của phân phối chuẩn Tiến hành các bước sau:

+ Lấy mẫu dung lượng n, tính x và s 2

+ Tính giá trị T thực nghiệm TTN s n x )

(  0 + Tìm giá trị tới hạn t (/2, n-1) với kiểm định 2 phía hoặc tìm t (, n-1) nếu kiểm định 1 phía trong bảng 2

Để thực hiện kiểm định hai phía với giả thuyết H0:    0, ta so sánh giá trị tuyệt đối của thống kê kiểm định |TTN| với giá trị tới hạn t(/2, n-1) Nếu |TTN| nhỏ hơn hoặc bằng t(/2, n-1), ta chấp nhận H0; ngược lại, nếu lớn hơn, ta bác bỏ H0 và chấp nhận H1.

Với H1:  >  0 (Kiểm định một phía) Nếu TTN  t (, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1

Với H1:  <  0 (Kiểm định một phía) Nếu TTN  - t (, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1

Ví dụ 2.5: Thời gian mang thai của bò phân phối chuẩn N (285,  2 ) Theo dõi thời gian mang thai (ngày) của 6 bò được các số liệu

Kiểm định giả thiết H0:  = 285 ngày đối thiết H1:   285 ngày

Kết luận: Vì TTN = 3,007 > t(0,025;5) nên bác bỏ H0 như vậy thời gian mang thai không phải 285 ngày

Trong điều kiện chăn nuôi bình thường, bò sản xuất trung bình 19 kg sữa mỗi ngày Tuy nhiên, trong một đợt hạn hán, 25 con bò chỉ cho lượng sữa trung bình là 17,5 kg/ngày với độ lệch chuẩn 2,5 kg Để kiểm định giả thuyết H0: μ = 19 với đối thiết μ < 19 ở mức ý nghĩa α = 0,05, cần phân tích sự khác biệt giữa lượng sữa thực tế và lượng sữa trung bình trong điều kiện bình thường.

Kết luận: TTN < 1,711 nên giả thiết H0 bị bác bỏ, như vậy sản lượng sữa trung bình không còn là 19 kg/ngày nữa mà thấp hơn.

KIỂM ĐỊNH HAI GIÁ TRỊ TRUNG BÌNH CỦA HAI BIẾN PHÂN PHỐI CHUẨN

Giả sử có hai tổng thể khác nhau và chúng ta theo dõi biến định lượng X, chẳng hạn như khối lượng gà sau 6 tháng nuôi, năng suất của hai giống lúa, hoặc sản lượng của một giống ngô khi áp dụng hai công thức phân bón khác nhau Bên cạnh đó, cũng có thể xem xét sản lượng trái cây khi trồng theo hai khoảng cách hàng khác nhau.

Để so sánh hai trung bình của hai tổng thể với biến X1 (phân phối chuẩn N(μ1, σ1²)) và X2 (phân phối chuẩn N(μ2, σ2²)), chúng ta cần thực hiện việc chọn mẫu Có hai phương pháp chọn mẫu chính là chọn mẫu theo cặp và chọn mẫu độc lập.

Từ tổng thể đầu tiên, chúng ta chọn một mẫu gồm n cá thể với các giá trị x1, x2, , xn Tương tự, từ tổng thể thứ hai, chúng ta cũng chọn một mẫu n cá thể với các giá trị y1, y2, , yn.

Giữa hai mẫu có mối quan hệ cặp, với n cặp (xi, yi) (i = 1, n) Các cặp này được hình thành thông qua các quan hệ như quan hệ gia đình (ví dụ: vợ chồng, anh em) hoặc quan hệ trước sau (như đo chỉ số trước và sau khi dùng thuốc) Ngoài ra, các cặp số liệu cũng có thể được tạo ra từ các thí nghiệm được bố trí theo cặp, chẳng hạn như so sánh giữa ô ruộng thử nghiệm và ô ruộng đối chứng.

Viết lại số liệu dưới dạng hai cột hay hai hàng rồi tính hiệu số di = yi - xi

Tiếp theo tính giá trị trung bình d _ và độ lệch chuẩn sd

Giả thiết H0: 2 = 1 đối thiết H1: 2  1 được chuyển thành H0: d = 0 đối thiết

H1: d  0 (tương tự H1: 2 > 1 chuyển thành H1: d > 0 và H1: 2 < 1 chuyển thành H1: d < 0) Ở mức ý nghĩa  việc kiểm định gồm các bước sau:

+ Tính giá trị thực nghiệm TTN s d n d

+ Tìm giá trị tới hạn t (/2, n-1) nếu kiểm định 2 phía hoặc t(, n-1) nếu kiểm định một phía bảng 2

+ Kiểm định hai phía H1:  2   1 Nếu TTN  t (/2, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1

+ Kiểm định một phía H1 :  2 >  1 Nếu TTN  t (, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1

+ Kiểm định một phía H1:  2 <  1 Nếu TTN  - t (, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1

Trong nghiên cứu này, chúng tôi tiến hành so sánh khối lượng tăng thêm (kg) của 10 cặp bê sinh đôi giống hệt nhau dưới hai chế độ chăm sóc khác nhau, A và B Mỗi bê trong cặp được phân bổ ngẫu nhiên vào một trong hai phương pháp chăm sóc Giả thiết rằng sự tăng trưởng khối lượng tuân theo phân phối chuẩn Mục tiêu là kiểm định giả thiết H0 rằng khối lượng tăng trung bình ở hai phương pháp chăm sóc là như nhau.

H1: Tăng khối lượng trung bình khác nhau ở hai cách chăm sóc với mức ý nghĩa  0,05 Số liệu thu được như sau:

Tăng khối lượng ở cách A 19,50 17,69 17,69 19,05 20,87 19,50 17,24 19,96 23,13 19,50 Tăng khối lượng ở cách B 16,78 15,88 15,42 18,60 17,69 16,78 15,88 18,14 21,77 16,32 Chênh lệch (d) 2,72 1,81 2,27 0,45 3,18 2,72 1,36 1,82 1,36 3,18 n = 10; d = 2,09; sd = 0,89; TTN 89 , 0

Kết luận: Bác bỏ giả thiết H0, chấp nhận H1: “Tăng khối lượng trung bình ở hai cách chăm sóc là khác nhau”

Ví dụ 2.8: Có 15 trại phối hợp tham gia thử nghiệm khẩu phần ăn bình thường

Trong nghiên cứu này, hai khẩu phần ăn cho lợn được so sánh: khẩu phần A không bổ sung đồng và khẩu phần B có bổ sung đồng Mỗi trại chọn hai khu nuôi lợn tương tự và ngẫu nhiên phân chia một khu ăn khẩu phần A, một khu ăn khẩu phần B Kết quả tăng khối lượng trung bình (kg/ngày) của lợn được trình bày trong bảng dưới đây Kiểm định giả thuyết H0 cho thấy hai khẩu phần A và B có kết quả tăng khối lượng trung bình giống nhau, trong khi đối thiết H1 cho rằng khẩu phần có bổ sung đồng sẽ dẫn đến tăng khối lượng trung bình cao hơn.

Khẩu phần Khẩu phần Khẩu phần

Giá trị trung bình d = 0,0407; độ lệch chuẩn sd = 0,0489

Kết luận: Vì TTN > t nên bác bỏ H0, chấp nhận H1 Như vậy khẩu phần bổ sung đồng cho tăng khối lượng trung bình cao hơn khẩu phần ăn thường

Từ hai tổng thể, chọn ra hai mẫu độc lập với dung lượng có thể bằng nhau hoặc khác nhau Tính các tham số thống kê x₁ và s₁² cho mẫu thứ nhất, cùng với x₂ và s₂² cho mẫu thứ hai Để kiểm định giả thiết H₀: μ₂ = μ₁ với các đối thiết H₁ ở mức ý nghĩa α, cần chia ra thành ba trường hợp, trong đó trường hợp đầu tiên là biết phương sai σ₁² và σ₂².

+ Tìm giá trị tới hạn z (/2) nếu kiểm định 2 phía hoặc z () nếu kiểm định một phía trong bảng 1

+ Kiểm định hai phía H1 :  2   1 Nếu ZTN   z (/2) thì chấp nhận H0, ngược lại thì chấp nhận H1

+ Kiểm định một phía H1:  2 >  1 Nếu ZTN  z () thì chấp nhận H0, ngược lại thì chấp nhận H1

+ Kiểm định một phía H1:  2 <  1 Nếu ZTN  - z () thì chấp nhận H0, ngược lại thì chấp nhận H1

Chiều dài cá trong hai ao được phân phối chuẩn với độ lệch chuẩn lần lượt là 2 cm và 2,2 cm Từ ao thứ nhất, mẫu 100 con cho giá trị trung bình x1 = 8 cm, trong khi mẫu 120 con từ ao thứ hai có giá trị trung bình x2 = 8,5 cm Để kiểm định giả thuyết H0: μ1 = μ2 và đối thiết H1: μ1 ≠ μ2, chúng ta thực hiện kiểm định với mức ý nghĩa α = 0,05.

Vì ZTN = 1,764 < 1,96 nên chấp nhận H0: “Chiều dài cá trung bình trong 2 ao như nhau” b Kh ông biết phương sai  1 2 và  2 2 mẫu lớn ( n 1  30, n 2  30)

+ Tính giá trị thực nghiệm ZTN

+ Tìm giá trị tới hạn z (/2) nếu kiểm định 2 phía hoặc z () nếu kiểm định một phía trong bảng 1

+ Kiểm định hai phía H1: 2  1 Nếu ZTN   z (/2) thì chấp nhận H0, ngược lại thì chấp nhận H1

+ Kiểm định một phía H1: 2 > 1 Nếu ZTN  z () thì chấp nhận H0, ngược lại thì chấp nhận H1

+ Kiểm định một phía H1: 2 < 1 Nếu ZTN  - z () thì chấp nhận H0, ngược lại thì chấp nhận H1

Ví dụ 2.10: Để đánh giá tăng khối lượng của lợn ở hai chế độ ăn khác nhau

Sau 4 tháng nuôi, khối lượng trung bình của hai chế độ nuôi được ghi nhận như sau: chế độ thứ nhất với 64 con có khối lượng trung bình là 73,2 kg (σ1 = 10,9 kg), trong khi chế độ thứ hai với 68 con có khối lượng trung bình là 76,6 kg (σ2 = 11,4 kg) Giả thiết khối lượng phân phối theo chuẩn N(μ1, σ1²) và N(μ2, σ2²) được đặt ra Kiểm định giả thiết H0: μ2 = μ1 và đối thiết H1: μ2 > μ1.

Theo kiểm định ZTN > z (0,05), chúng ta có thể chấp nhận giả thuyết H1 rằng "chế độ ăn thứ hai mang lại kết quả trung bình cao hơn chế độ ăn thứ nhất" Trong trường hợp không biết phương sai 1² và 2², nếu kích thước mẫu nhỏ (ít nhất một trong hai số n1, n2 < 30), bài toán này sẽ gặp nhiều khó khăn về lý thuyết Do đó, chúng ta chỉ trình bày trường hợp có thêm giả thiết phụ rằng 1² = 2².

+ Tìm giá trị tới hạn t (/2, n1 + n2 - 2) với kiểm định 2 phía hoặc t (, n1 + n2 -

2) nếu kiểm định một phía

+ Kiểm định hai phía H1:  2   1 Nếu TTN t (/2, n1+n2 -2) thì chấp nhận

H0, ngược lại thì chấp nhận H1

+ Kiểm định một phía H1:  2 >  1 Nếu TTN  t (, n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1

+ Kiểm định một phía H1:  2 <  1 Nếu TTN  - t (, n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1

Để so sánh khối lượng của hai giống bò, một nghiên cứu đã chọn ngẫu nhiên 12 con bò từ giống thứ nhất và 15 con bò từ giống thứ hai Kết quả thu được cho thấy khối lượng trung bình của giống thứ nhất là 196,2 kg với độ lệch chuẩn 10,62 kg, trong khi giống thứ hai có khối lượng trung bình là 153,70 kg và độ lệch chuẩn 12,30 kg Nghiên cứu kiểm định giả thuyết H0 rằng hai giống bò có khối lượng trung bình như nhau, với đối thiết H1 cho rằng giống bò thứ nhất có khối lượng trung bình lớn hơn giống bò thứ hai Giả định rằng khối lượng của hai giống bò có phân phối chuẩn và hai phương sai bằng nhau, mức ý nghĩa được đặt là α = 0,05.

Kết luận: Ở mức ý nghĩa α = 0,05 vì TTN > t nên bác bỏ H0 Như vậy giống thứ nhất có khối lượng trung bình cao hơn giống thứ hai

Hai giống gà được nghiên cứu có khối lượng phân phối chuẩn, với mẫu gồm 10 con gà của giống thứ nhất và 16 con gà của giống thứ hai Các tham số về khối lượng của hai mẫu gà ở độ tuổi 45 ngày được trình bày như sau.

Trong nghiên cứu này, mẫu thứ nhất có kích thước n1 = 10, khối lượng trung bình x1 = 2,8 kg và phương sai s1² = 0,1111 kg² Mẫu thứ hai có kích thước n2 = 16, khối lượng trung bình x2 = 2,35 kg và phương sai s2² = 0,0667 kg² Chúng ta kiểm định giả thiết H0 rằng hai giống gà có khối lượng trung bình giống nhau, trong khi giả thiết đối H1 cho rằng hai giống gà có khối lượng trung bình khác nhau, với mức ý nghĩa α = 0,05.

Kết luận: Bác bỏ H0, như vậy hai giống gà có khối lượng trung bình khác nhau.

ƯỚC LƯỢNG VÀ KIỂM ĐỊNH XÁC SUẤT

Trong một tổng thể, có hai loại cá thể A và A’, với loại A chiếm tỷ lệ p và loại A’ chiếm tỷ lệ q = 1-p Sau khi thực hiện việc chọn mẫu, có thể áp dụng phân phối chuẩn để ước lượng gần đúng phân phối nhị thức, từ đó suy ra công thức ước lượng tỷ lệ p.

Khi dung lượng mẫu lớn (n  100) và p không bé quá, cũng không lớn quá ( np >

5, nq > 5) Từ mẫu có dung lượng n, tính số cá thể loại A được tần số m và tần suất f m/ n với mức tin cậy α có khoảng tin cậy đối xứng sau: n f z f f n P f z f f (1 )

Để xác định tỷ lệ trứng nở p của một loại trứng, ta cho vào máy ấp 100 quả và nhận được kết quả là 80 quả nở Từ đó, tỷ lệ nở được tính là f = 80/100 = 0,8 Với mức tin cậy  = 0,05 và z(0,025) = 1,96, chúng ta có thể tính toán khoảng tin cậy cho tỷ lệ trứng nở này.

Khi mẫu có dung lượng lớn (n ≥ 100) và p nằm trong khoảng hợp lý (np > 5, nq > 5), ta có thể tính số cá thể loại A từ tần số m và tần suất f = m/n Ở mức ý nghĩa α, cần tính giá trị z(α/2) cho kiểm định hai phía hoặc z(α) cho kiểm định một phía Cuối cùng, tính giá trị ZTN n để hoàn thiện quá trình kiểm định.

Với đối thiết hai phía H1: P  P0 Nếu ZTN  z (/2) thì chấp nhận H0, ngược lại thì chấp nhận H1

Với đối thiết một phía H1: P > P0 Nếu ZTN  z () thì chấp nhận H0, ngược lại thì chấp nhận H1

Với đối thiết một phía H1 : P < P0 Nếu ZTN  - z () thì chấp nhận H0, ngược lại thì chấp nhận H1

Ví dụ 2.14: Ấp 100 quả trứng có 82 quả nở Kiểm định giả thiết H0: tỷ lệ nở P 0,80, đối thiết H1: P  0,8 với  = 0,05 n = 100; m = 82; f = 82/100 = 0,82;

Kết luận: Chấp nhận H0: “Tỷ lệ ấp nở là 0,80”

Khi dung lượng cả 2 mẫu đều lớn (n1 > 100, n2 > 100) và các pi không bé quá (hoặc lớn quá) có thể kiểm định như sau (ở mức ý nghĩa )

Tìm giá trị tới hạn z (/2) nếu kiểm định 2 phía hoặc z() nếu kiểm định một phía

Tính giá trị thực nghiệm: ZTN

Với đối thiết hai phía H1: P2  P1 Nếu ZTN  z (/2) thì chấp nhận H0, ngược lại thì chấp nhận H1

Với đối thiết một phía H1: P2 > P1 Nếu ZTN  z () thì chấp nhận H0, ngược lại thì chấp nhận H1

Với đối thiết một phía H1: P2 < P1 Nếu ZTN  - z () thì chấp nhận H0, ngược lại thì thì chấp nhận H1

Ví dụ 2.15: Dùng thuốc A điều trị cho 200 bệnh nhân thấy 150 người khỏi bệnh

Để kiểm định giả thuyết H0: Tỷ lệ khỏi bệnh của hai thuốc giống nhau và đối thiết H1: Tỷ lệ khỏi bệnh của hai thuốc khác nhau với mức ý nghĩa α = 0,05, ta có dữ liệu từ 200 bệnh nhân sử dụng thuốc A, trong đó 150 người khỏi bệnh, tỷ lệ khỏi bệnh là f1 = 0,75 Đối với thuốc B, có 100 bệnh nhân, 72 người khỏi bệnh, tỷ lệ khỏi bệnh là f2 = 0,72 So sánh hai tỷ lệ này giúp xác định sự khác biệt trong hiệu quả điều trị giữa hai loại thuốc.

Kết luận: Chấp nhận H0; tức là tỷ lệ khỏi bệnh ở 2 loại thuốc là như nhau.

PHÂN TÍCH PHƯƠNG SAI

Bài toán phân tích phương sai một yếu tố mở rộng từ việc so sánh hai trung bình của các tổng thể, khi có hơn hai trung bình Ví dụ, với a tổng thể, chúng ta khảo sát các biến X1, X2, , Xa bằng cách lấy một mẫu quan sát độc lập từ mỗi tổng thể.

Tất cả có n = ri quan sát Viết lại các quan sát xi j dưới dạng xi j = i + ei j ei j gọi là sai số hay phần dư (2.1)

Giả thiết rằng các biến Xi là độc lập và phân phối theo chuẩn N(μi, σ²), đồng thời các quan sát trong mẫu cũng độc lập Dựa trên giả thiết này, ta có thể đưa ra ba giả thiết cụ thể liên quan đến các sai số ei j.

 Các biến ei j độc lập với nhau

 Các biến ei j phân phối chuẩn với kỳ vọng bằng 0

 Các biến ei j có phương sai bằng nhau ( 2 )

Bài toán phân tích phương sai một yếu tố chính là bài toán kiểm định giả thiết H0:

Trong nghiên cứu thống kê, giả thuyết H0 cho rằng "các trung bình i bằng nhau", trong khi giả thuyết H1 cho rằng "có ít nhất một cặp trung bình khác nhau" Nếu ký hiệu  là trung bình của các trung bình i, ta có thể diễn đạt lại công thức như sau: xi j =  + ai + ei j, với ai được tính là i -  và tổng các ai bằng 0.

Giả thiết H0 được đặt ra là “Các ai đều bằng 0”, trong khi H1 là “Không phải tất cả các ai đều bằng 0” Để tiến hành phân tích phương sai, chúng ta sử dụng các trung bình cộng của các mẫu quan sát ký hiệu là x i Nếu giả thiết H0 đúng, các giá trị Xi sẽ có cùng phân phối N(μ, σ²) và có thể coi các mẫu quan sát này được lấy ra từ cùng một tổng thể.

Gọi x là trung bình chung của tất cả các mẫu

Tính tổng bình phương tất cả các sai số (gọi là tổng bình phương toàn bộ SSTO)

  Đem tổng bình phương này chia cho (n - 1) được một ước lượng của  2

Tổng bình phương sai số (SSTO) theo phân phối ² với bậc tự do dfTO = (n - 1) Đối với mỗi mẫu quan sát, ta tính tổng bình phương sai số trong mẫu và chia cho bậc tự do tương ứng (ni - 1) để có ước lượng cho ² Sau đó, gộp lại thành tổng bình phương do sai số (SSE), tương tự như phương pháp tìm phương sai chung s²c trong trường hợp mẫu nhỏ và hai phương sai bằng nhau.

( Đem SSE chia cho n - a được một ước lượng của  2

SSE / 2 phân phối  2 với dfE = (n - a) bậc tự do

Có thể chứng minh hệ thức sau:

Tổng thứ ba gọi là tổng bình phương do yếu tố SSA

Nếu xi j phân phối chuẩn N(i,  2 ) thì các trung bình cộng

_ x i phân phối chuẩn N(i,  2 /ni) Từ đó suy ra nếu đem SSA chia cho (a - 1) thì được ước lượng của  2

Tổng SSA/ 2 phân phối  2 với dfA = (a-1) bậc tự do

Như vậy đã tách tổng bình phương toàn bộ ra hai tổng:

SSTO = SSA + SSE Đồng thời bậc tự do toàn bộ cũng tách thành 2 bậc tự do: dfTO = dfA + dfE

Mỗi tổng bình phương chia cho bậc tự do tương ứng cung cấp ước lượng cho phương sai σ², và khi mỗi tổng này được chia cho σ², chúng sẽ tuân theo phân phối χ² với số bậc tự do tương ứng Tỷ số MSA/MSE được xác định với MSA = SSA/dfA và MSE = SSE/dfE.

Dựa trên lý thuyết về phân phối Khi bình phương (χ²) và phân phối F, chúng ta có thể rút ra kết luận rằng tỷ lệ MSA/MSE tuân theo phân phối Fisher-Snedecor (F) Từ đó, có thể thực hiện kiểm định cho giả thuyết H0 và H1.

+ Tính giá trị thực nghiệm FTN = MSA / MSE

+ Tìm giá trị tới hạn F(,dfA,dfE)

+ Nếu FTN  F(,dfA,dfE) thì chấp nhận H0, ngược lại thì chấp nhận H1

Toàn bộ quy trình phân tích phương sai được tóm tắt trong bảng phân tích phương sai sau:

Nguồn biến động Bậc tự do Tổng bình phương Trung bình bình phương F TN F tới hạn

Yếu tố df A = a-1 SS A MS A = SS A /df A MS A /MS E F (,dfA,dfE)

Sai số ngẫu nhiên df E = n-a SS E MS E = SS E /df E

Tổng biến động df TO = n-1 SS TO Để thuận tiện thường kẻ bảng chứa dữ liệu và tính theo thứ tự sau:

+ Tính dung lượng ni, tổng hàng THi, trung bình x i , TH 2 i /ni

+ Tổng các dung lượng n = ni , tổng tất cả các xi j ST = xi j

+ SSTO =  x 2 i j – G bậc tự do dfTO = n – 1

+ SSA = TH 2 i / ni - G bậc tự do dfA = a – 1

+ SSE = SSTO - SSA bậc tự do dfE = dfTO - dfA = n – a

+ Tính các trung bình MSA = SSA / dfA và MSE = SSE/ dfE

+ Tìm giá trị F(,dfA,dfE)

+ So sánh FTN với F(,dfA,dfE)

Khối lượng (kg) của 20 lợn lai Duroc x (Landrace x Yorkshire) được nuôi ở 5 trại (A, B, C, D và E) từ 21 đến 90 ngày tuổi được phân tích Dữ liệu cho thấy khối lượng tuân theo phân phối chuẩn Kiểm định giả thiết H0 cho rằng khối lượng trung bình của lợn 90 ngày tuổi ở 5 trại là bằng nhau, trong khi đối thiết phản bác giả thiết này.

H1: Khối lượng trung bình của lợn 90 ngày tuổi ở 5 traih không bằng nhau Mức ý nghĩa α = 0,05

Trại Khối lượng (kg) n i TH i TH i 2 /n i

SSTO = 18727,69 - 18222,68 = 505,0055; bậc tự do dfTO = 20 -1 = 19

SSA = 18521,0492 - 18222,6845 = 298,3647; bậc tự do dfA = 5 - 1 = 4

SSE = 505,0055 - 298,3647 = 206,6408; bậc tự do dfE = 19 - 4 = 15

Có thể tổng hợp các kết quả thu được theo bảng phân tích phương sai (ANOVA) sau:

Nguồn biến động Bậc tự do Tổng bình phương Trung bình bình phương F TN F tới hạn

Kết luận: Bác bỏ H0, như vậy là bác bỏ giả thiết “Khối lượng trung bình của lợn

90 ngày tuổi ở 5 trại bằng nhau”

Sau khi có kết luận, cần so sánh trung bình của 5 trại để xác định các trung bình nào giống nhau và khác nhau Vấn đề này sẽ được phân tích chi tiết trong phần tiếp theo.

Để kiểm định giả thuyết H0: “Các trung bình bằng nhau” và đối thiết H1: “Có ít nhất một cặp trung bình khác nhau”, chúng ta cần tách tổng bình phương toàn bộ SSTO thành các tổng bình phương giữa các nhóm SSA và tổng bình phương trong nhóm SSE.

Biến động số liệu có hai nguồn chính: một là do sự khác biệt giữa các mẫu, và hai là do sự khác biệt giữa các số liệu trong cùng một mẫu Để phân tích, cần tách bậc tự do toàn bộ dfTO thành các bậc tự do dfA và dfE, tương ứng với tổng SSA và SSE, từ đó thực hiện phân tích phương sai.

Sau khi có nhiều nguồn biến động, cần tách SSTO thành nhiều tổng tương ứng với từng nguồn biến động và phân chia bậc tự do dfTO thành nhiều bậc tự do Tiếp theo, tiến hành kiểm định các giả thiết liên quan đến các nguồn biến động bằng cách sử dụng phân phối Fisher-Snedecor.

BÀI TẬP

Tăng khối lượng trung bình (g/ngày) của 36 lợn nuôi vỗ béo giống Landrace được rút ngẫu nhiên từ một trại chăn nuôi Số liệu thu được như sau:

Cán bộ kỹ thuật trại cho rằng khối lượng trung bình của toàn đàn lợn trong trại tăng 607 g/ngày Anh chị có đồng ý với kết luận này không? Hãy nêu lý do giải thích cho quan điểm của mình.

Anh chị hãy kiểm tra kết luận với bài tập tương tự như 2.7.1, biết rằng độ lệch chuẩn của tính trạng này ở Landrace là 24 g/ngày

Tỷ lệ thụ thai bằng thụ tinh nhân tạo từ tinh trùng của hai bò đực giống đã được xác định trên nhóm bò cái gồm 50 con, trong đó 18 nhóm bò cái sử dụng tinh trùng của bò đực A.

16 đối với bò đực B Tỷ lệ thụ thai (%) thu được như sau:

Hãy cho biết tỷ lệ thụ thai của 2 bò đực nêu trên

Nồng độ fructoza (mg%) trong tinh dịch bò trước và sau khi ủ được xác định trên

12 mẫu tinh bò đực; các giá trị thu được như sau:

Kết luận về nồng độ fructoza trong tinh dịch bò trước và sau khi ủ

Một thí nghiệm đã được thực hiện để nghiên cứu ảnh hưởng của progesterone lên chu kỳ động dục của cừu Merino, sử dụng 4 liều khác nhau (0, 10, 25 và 40 mg/ngày) tiêm dưới da liên tục trong 4 ngày từ ngày động dục Kết quả thu được cho thấy chu kỳ động dục (ngày) của 8 cừu trong mỗi nhóm đã được ghi nhận và phân tích.

Cho biết ảnh hưởng của progesterone lên chu kỳ động dục ở cừu Merino.

MỘT SỐ KHÁI NIỆM VỀ THIẾT KẾ THÍ NGHIỆM

PHÂN LOẠI THÍ NGHIỆM

Theo bản chất, thí nghiệm được chia thành hai loại chính: thí nghiệm quan sát và thí nghiệm thực nghiệm Trong thiết kế thí nghiệm của giáo trình này, chúng tôi sẽ chú trọng vào thí nghiệm thực nghiệm.

Trong lĩnh vực chăn nuôi và thú y, các nghiên cứu thường được chia thành hai mảng chính: thứ nhất, nghiên cứu về dinh dưỡng, năng suất và di truyền của vật nuôi; thứ hai, nghiên cứu về tình hình dịch bệnh cùng các biện pháp phòng ngừa và điều trị bệnh.

Trong thí nghiệm quan sát, các nhà nghiên cứu chỉ đơn giản quan sát và ghi lại dữ liệu về các tính trạng của động vật mà không can thiệp vào sự tồn tại của chúng Đặc biệt, trong loại thí nghiệm này, động vật không được bố trí ngẫu nhiên theo các công thức thí nghiệm Điều tra được coi là một trường hợp đặc biệt của thí nghiệm quan sát, trong đó cần kiểm tra toàn bộ hoặc một nhóm động vật để xác định các giá trị của các tham số khác nhau trong quần thể.

 Điều tra quần thể - tiến hành kiểm tra tất cả các động vật trong quần thể

Điều tra mẫu là quá trình kiểm tra các nhóm động vật đại diện, từ đó rút ra kết luận cho toàn bộ quần thể dựa trên kết quả điều tra.

Trong thí nghiệm thực nghiệm, các nhà khoa học can thiệp vào nghiên cứu bằng cách áp dụng các công thức thí nghiệm khác nhau lên các nhóm động vật Sau đó, họ quan sát ảnh hưởng của các công thức này lên đối tượng nghiên cứu Đối với loại thí nghiệm này, động vật được bố trí ngẫu nhiên theo các công thức thí nghiệm trong quá trình thiết kế.

MỘT SỐ KHÁI NIỆM TRONG THIẾT KẾ THÍ NGHIỆM

Yếu tố thí nghiệm là biến độc lập bao gồm nhiều phần tử có cùng bản chất, cho phép so sánh trong quá trình thí nghiệm Ví dụ về yếu tố này có thể là giống vật nuôi, kiểu gen Halothane ở lợn, hàm lượng protein trong khẩu phần, cũng như các loại thuốc kháng sinh và vắc xin dùng trong phòng và điều trị bệnh.

Một thí nghiệm có thể bao gồm một hoặc nhiều yếu tố, được phân loại thành yếu tố cố định hoặc yếu tố ngẫu nhiên.

Các phần tử riêng biệt trong cùng một yếu tố thí nghiệm được gọi là mức Chẳng hạn, với yếu tố thí nghiệm là kiểu gen Halothane ở lợn, có ba phần tử tương ứng với ba kiểu gen (NN, Nn, nn) hay còn gọi là ba mức Tương tự, khi nghiên cứu ảnh hưởng của protein đến sản lượng sữa bò, có thể tiến hành khảo sát ở ba mức protein khác nhau Trong lĩnh vực thú y, các nhà nghiên cứu cũng đánh giá hiệu quả điều trị bệnh của các loại thuốc khác nhau, mỗi loại thuốc được xem như một mức.

3.2.3 Công thức thí nghiệm (công thức thí nghiệm)

Một công thức thí nghiệm là sự kết hợp của các mức khác nhau của các yếu tố nghiên cứu Chẳng hạn, khi nghiên cứu ảnh hưởng của protein ở ba mức khác nhau đến sản lượng sữa bò, sẽ có ba công thức thí nghiệm Nếu thêm yếu tố thứ hai là thức ăn tinh với hai mức, tổng số công thức thí nghiệm sẽ tăng lên thành sáu.

3.2.4 Đơn vị thí nghiệm Đơn vị thực hiện nhỏ nhất ứng với một công thức được gọi là đơn vị thí nghiệm Đơn vị thí nghiệm trong chăn nuôi, thú y thường là từng động vật nhưng đôi khi là một nhóm động vật Ví dụ: khi nghiên cứu về khả năng sản xuất của vật nuôi, mỗi động vật được đánh số tai (hoặc đeo số cánh), tiến hành cân đo từng cá thể tại từng thời điểm nghiên cứu, mỗi cá thể cho một quan sát do đó đơn vị thí nghiệm là từng động vật Tuy nhiên, khi nghiên cứu tiêu tốn thức ăn đối với một kg tăng khối lượng, trong thực tế ta không thể theo dõi được lượng thức ăn thu nhận của từng vật nuôi (ngoại trừ từng động vật được gắn chíp điện tử và có hệ thống theo dõi thức ăn thu nhận tự động) mà ta chỉ biết được số thức ăn thu nhận được của một nhóm gồm nhiều cá thể khác nhau Tức là từ một nhóm cá thể như vậy ta chỉ có một quan sát duy nhất, đây cũng chính là điều mà các nhà nghiên cứu cần phải chú ý

Khi đơn vị thí nghiệm là một cá thể, việc cân và đo sẽ cho ra một dữ liệu hoặc quan sát cụ thể Nếu đơn vị thí nghiệm là một nhóm gồm nhiều cá thể, có thể tiến hành cân, đo chung cho toàn bộ nhóm hoặc chọn một số cá thể để thu thập dữ liệu, từ đó suy ra kết quả chung cho đơn vị thí nghiệm Số liệu của các nhóm này có thể được lưu trữ nhằm đánh giá sai số trong quá trình thí nghiệm.

Tập hợp các đơn vị thí nghiệm có chung một hay nhiều đặc tính được gọi là khối

Mỗi công thức, trừ những trường hợp đặc biệt, đều được lặp lại một số lần nhất định, thường là bằng nhau Việc lặp lại này giúp tạo ra các công thức tính toán đơn giản và thuận tiện cho nhiều mô hình Ngược lại, nếu số lần lặp không đồng nhất, việc áp dụng mô hình hồi quy nhiều biến sẽ trở nên phức tạp hơn, kèm theo những khó khăn trong việc kiểm định giả thuyết và tính toán các kỳ vọng của các trung bình bình phương.

Trong quá trình thí nghiệm, việc thu thập dữ liệu thường gặp khó khăn do một số động vật có thể chết hoặc không đáp ứng yêu cầu, dẫn đến số lần lặp không đồng nhất Số lượng động vật sống sót cho đến khi kết thúc thí nghiệm phụ thuộc vào loại thí nghiệm và loài vật nuôi Nếu dữ liệu bị mất không nhiều, có thể áp dụng công thức cụ thể để thay thế dữ liệu bằng tổ hợp của các dữ liệu còn lại, đồng thời điều chỉnh các bậc tự do tương ứng Ngược lại, nếu mất nhiều dữ liệu, cần coi như số lần lặp khác nhau và sử dụng mô hình hồi quy tổng quát.

Nhắc lại là làm lại thí nghiệm trong điều kiện tương tự có thể để kết luận đạt mức độ tin cậy

Là nhóm động vật thí nghiệm được tạo ra trong quá trình bố trí thí nghiệm nhưng được nuôi dưỡng, chăm sóc trong điều kiện bình thường hiện có.

CÁC BƯỚC TIẾN HÀNH THÍ NGHIỆM

Một thí nghiệm thường được thực hiện qua các bước sau: đầu tiên, đặt vấn đề cần nghiên cứu; tiếp theo, phát biểu giả thuyết; sau đó, mô tả thiết kế thí nghiệm; tiếp tục là thực hiện thí nghiệm và thu thập số liệu; tiếp theo là phân tích số liệu đã thu thập; cuối cùng, giải thích kết quả để kiểm tra tính đúng đắn của giả thuyết.

Lập kế hoạch cho một thí nghiệm bắt đầu bằng việc xác định các vấn đề cấp thiết và thu thập tài liệu liên quan, bao gồm các nghiên cứu trước đó Sau đó, cần nêu ra hướng giải quyết cho những vấn đề đã nêu Mục đích nghiên cứu cần được xác định rõ ràng, vì các bước tiếp theo trong thiết kế thí nghiệm sẽ phụ thuộc vào mục đích này.

Bước tiếp theo trong nghiên cứu là xác định nguyên liệu và phương pháp nghiên cứu, trong đó thiết kế thí nghiệm cần mô tả cách thu thập số liệu Số liệu có thể được thu thập từ các nghiên cứu quan sát các quá trình tự nhiên hoặc từ các thí nghiệm trong môi trường kiểm soát Việc hiểu rõ thông tin cần thu thập và phương pháp thu thập sẽ giúp rút ra kết luận một cách hiệu quả Điều này áp dụng cho cả thí nghiệm quan sát và thực nghiệm, đồng thời giúp phát hiện thông tin bất ngờ dẫn đến những kết luận mới Đối với các nhà thống kê, thiết kế thí nghiệm đặt ra tiêu chuẩn cho việc chọn mẫu, bao gồm xác định công thức thí nghiệm, đơn vị thí nghiệm, số lần lặp lại, cách bố trí các đơn vị vào công thức thí nghiệm và các sai số có thể xảy ra.

Giả thiết thống kê là bước tiếp theo sau giả thiết nghiên cứu, giúp xác định câu trả lời cho mục đích nghiên cứu bằng cách chấp nhận hoặc bác bỏ Trong quá trình kiểm định giả thiết, các nhà thống kê áp dụng mô hình thống kê, được xây dựng dựa trên mô hình thí nghiệm và thường được thể hiện qua các công thức toán học.

Việc thu thập số liệu được thực hiện theo mô hình thiết kế thí nghiệm, và phân tích thống kê được tiến hành sau khi hoàn tất việc thu thập Quá trình phân tích bao gồm việc mô tả và giải thích kết quả, với mô hình phân tích được xây dựng dựa trên mục đích và thiết kế thí nghiệm Thông thường, phương pháp phân tích số liệu được xác định trước khi thu thập, nhưng cũng có thể được điều chỉnh sau khi có dữ liệu nếu nhà nghiên cứu phát hiện ra cách tiếp cận tốt hơn hoặc khám phá khía cạnh mới liên quan đến vấn đề nghiên cứu.

Người nghiên cứu cần rút ra kết luận rõ ràng và chính xác để hoàn thiện mục tiêu nghiên cứu Họ cũng phải thảo luận về các ứng dụng thực tiễn của nghiên cứu và chỉ ra những khả năng phát triển trong tương lai liên quan đến vấn đề tương tự.

SAI SỐ THÍ NGHIỆM

Bản chất của vật liệu sinh học liên quan đến sự biến động, có thể phân chia thành hai loại: biến động có thể giải thích và biến động không giải thích Mỗi đơn vị thí nghiệm (yij) được biểu diễn theo công thức: yij = i + eij.

Trong nghiên cứu, giá trị ước tính  thể hiện ảnh hưởng giải thích được của nhóm thứ i, trong khi eij là ảnh hưởng không giải thích được Các quan sát (yij) khác nhau là do sự ảnh hưởng giải thích được từ các nhóm khác nhau và các yếu tố không giải thích được Ước tính i phản ánh ảnh hưởng của nhóm i, nhưng sự khác biệt giữa các đơn vị thí nghiệm trong cùng một nhóm thường không thể giải thích và được gọi là sai số thí nghiệm.

Sai số thí nghiệm được chia thành hai loại chính: sai số ngẫu nhiên và sai số hệ thống Sai số hệ thống là những yếu tố nhất định làm lệch các giá trị đo được trong nghiên cứu, thường xuất phát từ sự thiếu đồng nhất trong quá trình thực hiện thí nghiệm, dụng cụ không được hiệu chỉnh, nhiệt độ không ổn định, hoặc thiên lệch trong sử dụng thiết bị Nếu phát hiện được sự thiên lệch này, hiệu chỉnh sẽ là biện pháp hiệu quả nhất Tuy nhiên, nếu không phát hiện, sai số hệ thống sẽ rất khó giải quyết vì chúng ảnh hưởng đến các giá trị một cách có hệ thống nhưng không theo một xu hướng rõ ràng.

Sai số ngẫu nhiên là kết quả của các tác động không thể dự đoán, dẫn đến những biến động khó lý giải, với kỳ vọng bằng 0 Khi phân tích một loạt quan sát, các tính toán dựa trên trung bình sẽ không bị thiên lệch Trong sinh học, sai số ngẫu nhiên thường xuất hiện, chẳng hạn như trong chăn nuôi, nơi các phép đo và phân tích chỉ tiêu ở động vật có thể cho ra kết quả khác nhau, mặc dù sự khác biệt không lớn Để giảm thiểu sai số hệ thống và sự thiên lệch, cần xem xét hai giải pháp hiệu quả.

1 Bố trí động vật vào các công thức thí nghiệm

BỐ TRÍ THÍ NGHIỆM VÀO CÁC CÔNG THỨC THÍ NGHIỆM

3.5.1 Sự cần thiết của phân chia ngẫu nhiên

Sự thiên lệch trong quá trình phân chia động vật vào các công thức thí nghiệm có thể xảy ra do yếu tố chủ quan, chẳng hạn như việc phân chia theo sở thích cá nhân Khi động vật được bố trí vào các công thức thí nghiệm dựa trên sự ưu ái hoặc không thích, điều này có thể dẫn đến sự khác biệt hệ thống giữa nhóm đối chứng và nhóm thí nghiệm Kết quả là, chúng ta không thể xác định chính xác liệu sự sai khác quan sát được sau thí nghiệm là do ảnh hưởng của công thức thí nghiệm hay do sự khác biệt có hệ thống giữa các nhóm.

Một phương pháp hiệu quả để giảm thiểu sự thiên lệch trong nghiên cứu là sử dụng bố trí ngẫu nhiên, hay còn gọi là ngẫu nhiên hóa, khi phân chia các động vật thí nghiệm vào các công thức thí nghiệm Trong quá trình này, động vật được phân bổ theo các yêu cầu cụ thể nhằm đảm bảo tính chính xác và khách quan cho kết quả nghiên cứu.

 Tất cả các động vật thí nghiệm đều có cơ hội nhận được một công thức thí nghiệm bất kỳ;

 Việc bố trí động vật vào công thức thí nghiệm này không ảnh hưởng đến việc bố trí động vật vào công thức thí nghiệm khác;

 Chúng ta không biết trước công thức thí nghiệm mà từng động vật được phân vào

 Ngẫu nhiên hoá có một số ưu điểm sau:

 Loại bỏ được sự thiên lệch trong quá trình bố trí động vật thí nghiệm;

 Tạo được sự giống nhau giữa các nhóm

3.5.2 Các phương pháp phân chia ngẫu nhiên

Tránh sử dụng các phương pháp cơ học như tung đồng xu hoặc ném xúc xắc để phân bố động vật trong các thí nghiệm, vì chúng cồng kềnh và không kiểm tra được Thay vào đó, bảng số ngẫu nhiên hoặc máy tính có thể được sử dụng để tạo ra số ngẫu nhiên Khi thiết kế thí nghiệm, số đơn vị thí nghiệm thường phải bằng nhau giữa các công thức Phân chia ngẫu nhiên đơn giản là phương pháp cơ bản không có sự phân biệt, ví dụ như phân chia 12 động vật được đánh số từ 1 đến 12 vào hai công thức thí nghiệm (đối chứng - C và thí nghiệm - T) bằng cách chọn số ngẫu nhiên từ bảng số ngẫu nhiên Nếu số ngẫu nhiên là số chẵn, động vật sẽ được phân vào nhóm C, còn số lẻ sẽ vào nhóm T.

Có thể áp dụng các bước tương tự cho thí nghiệm với hơn 2 công thức, chẳng hạn như A, B và C, bằng cách chọn các số 1-3, 4-6 và 7-9 tương ứng, trong khi bỏ qua số 0 Ví dụ, với dãy số ngẫu nhiên 8137664077652, kết quả thu được là CAACBBBCCBBA Tuy nhiên, sự ngẫu nhiên không được đảm bảo do có 3A, 5B và 4C Để khắc phục vấn đề này, cần áp dụng cách phân chia ngẫu nhiên hạn chế theo khối.

Phân chia ngẫu nhiên đơn giản đảm bảo rằng tất cả các động vật có cơ hội như nhau khi tham gia thí nghiệm Tuy nhiên, khi mẫu lớn, việc này cần điều chỉnh Bằng cách lựa chọn theo tiêu chí cụ thể như lứa tuổi, khối lượng hay hành vi, chúng ta có thể phân chia động vật thành các nhóm đồng đều hơn Sau đó, các động vật trong từng nhóm sẽ được chia ngẫu nhiên vào các công thức thí nghiệm, tạo ra phương pháp phân chia ngẫu nhiên theo khối hiệu quả hơn.

Nghiên cứu bệnh viêm khớp ở chó được thực hiện bằng cách tạo ra ba nhóm chó với khối lượng cơ thể lớn, trung bình và nhỏ Mục tiêu là xác định ảnh hưởng của khối lượng cơ thể đến mức độ mắc bệnh trong từng công thức thí nghiệm Qua đó, sẽ so sánh các công thức thí nghiệm liên quan đến khối lượng cơ thể Phương pháp phân chia ngẫu nhiên sẽ được áp dụng để hạn chế sai số trong nghiên cứu.

Để đảm bảo số lượng đơn vị thí nghiệm đồng đều trong các công thức thí nghiệm, kỹ thuật ngẫu nhiên đơn giản thường được áp dụng, đặc biệt khi dung lượng mẫu đủ lớn Tuy nhiên, khi dung lượng mẫu nhỏ, sự thiếu cân bằng có thể xảy ra, như minh họa trong ví dụ về phân chia ngẫu nhiên đơn giản với tỷ lệ 3A, 5B và 4C Để khắc phục những vấn đề này, kiểu phân chia ngẫu nhiên hạn chế có thể được sử dụng.

Ví dụ có 16 đơn vị thí nghiệm, cần chia về 4 công thức thí nghiệm A, B, C và D

Chúng ta sẽ chọn các cặp số 1-2, 3-4, 5-6, 7-8 tương ứng với các công thức thí nghiệm A, B và C, bỏ qua số 9 và 0 Với dãy số ngẫu nhiên 81376640776529997742, kết quả thu được là DABDCCBDD Đến số ngẫu nhiên thứ 9, đã có đủ 4 động vật cho công thức thí nghiệm D Các số ngẫu nhiên 7-8 cũng được bỏ qua vì đã đạt số lượng yêu cầu: 1 động vật cho A, 2 cho B và 2 cho C Tiếp theo, với CC, đến số ngẫu nhiên thứ 11, đã đủ 4 đơn vị cho công thức C Như vậy, số đơn vị thí nghiệm ở các công thức là bằng nhau.

Phân chia ngẫu nhiên theo khối thường được dùng kết hợp với phân chia ngẫu nhiên giới hạn d Phân chia ngẫu nhiên theo nhóm (Cluster)

Trong nghiên cứu chăn nuôi và thú y, một nhóm động vật thường được xem như một đơn vị thí nghiệm, bên cạnh việc xem xét từng động vật riêng lẻ Điều này là do thức ăn, thuốc và vắc xin thường được áp dụng cho toàn bộ nhóm động vật trong cùng một lứa hoặc môi trường nuôi Kỹ thuật ngẫu nhiên hoá theo nhóm được sử dụng để đảm bảo rằng tất cả động vật trong nhóm nhận cùng một công thức thí nghiệm Kết quả từ các nhóm này sẽ được tổng hợp để đánh giá ảnh hưởng của các công thức thí nghiệm, với lưu ý rằng mỗi nhóm động vật chỉ được coi như một đơn vị thí nghiệm duy nhất.

Nghiên cứu về tiêu tốn thức ăn cho lợn nuôi vỗ béo cho thấy rằng, mặc dù lý thuyết cho phép theo dõi lượng thức ăn mà từng con lợn tiêu thụ hàng ngày, nhưng thực tế lại gặp nhiều khó khăn Thay vào đó, việc quan sát tổng lượng thức ăn tiêu thụ trong một ô chuồng nuôi khoảng 30 – 50 con lợn sẽ giúp tính toán được mức tiêu tốn thức ăn cho mỗi kg tăng khối lượng.

Trong nghiên cứu về tiêu tốn thức ăn để tăng khối lượng trên 1kg, việc sử dụng 50 con vật như một đơn vị thí nghiệm là cần thiết Để thu thập dữ liệu chính xác, cần tiến hành thí nghiệm trên nhiều ô chuồng và thực hiện việc chọn ngẫu nhiên ô chuồng áp dụng các công thức thí nghiệm khác nhau.

PHƯƠNG PHÁP LÀM MÙ

Trong nghiên cứu, việc sử dụng kỹ thuật ngẫu nhiên hóa để bố trí động vật vào các công thức thí nghiệm giúp loại bỏ sai số hệ thống Tuy nhiên, thiên lệch có thể phát sinh từ những định kiến của người thực hiện và người đánh giá Để đảm bảo tính khách quan trong thí nghiệm, kỹ thuật làm mù được áp dụng Có hai phương pháp chính để thực hiện kỹ thuật làm mù.

1) Kỹ thuật làm mù đơn và 2) Kỹ thuật làm mù kép

Kỹ thuật làm mù kép là phương pháp nghiên cứu trong đó cả người thực hiện và người đánh giá không biết thông tin về thí nghiệm, giúp đảm bảo tính khách quan Ngược lại, kỹ thuật làm mù đơn chỉ có một trong hai bên không biết thông tin Để người thực hiện không phân biệt được giữa nhóm đối chứng và nhóm thí nghiệm, có thể sử dụng vật giả (placebo) - những vật giống hệt về bề ngoài nhưng khác biệt về bản chất Placebo thường được áp dụng trong các nghiên cứu liên quan đến thuốc để kiểm tra hiệu quả điều trị.

TĂNG ĐỘ CHÍNH XÁC CỦA ƯỚC TÍNH

Số lượng đơn vị thí nghiệm lớn hơn sẽ nâng cao độ chính xác của ước tính và tăng khả năng phát hiện ảnh hưởng của công thức thí nghiệm, nếu có Thông tin chi tiết về cách xác định dung lượng mẫu tối ưu được trình bày trong chương 4 và chương 5.

Lặp lại là quá trình thu thập dữ liệu giống nhau nhiều lần từ cùng một động vật hoặc đơn vị thí nghiệm Phương pháp này giúp phân biệt biến động do yếu tố sinh học hoặc ảnh hưởng từ công thức thí nghiệm.

Kỹ thuật nhóm đơn vị thí nghiệm là công cụ hữu ích giúp giảm biến động trong so sánh, bằng cách tạo ra các nhóm động vật đồng đều, từ đó giảm thiểu biến động ngẫu nhiên giữa các khối Việc tiến hành ngẫu nhiên hóa trong từng khối cho phép phân tách biến động do công thức thí nghiệm và biến động do khối Nhờ vậy, ước tính thu được sẽ chính xác hơn Kỹ thuật khối có hai mô hình thiết kế thí nghiệm: khối ngẫu nhiên đầy đủ, nơi bố trí tất cả các công thức thí nghiệm trong mỗi khối, và khối ngẫu nhiên không đầy đủ, khi không có đầy đủ các công thức thí nghiệm trong mỗi khối.

Kỹ thuật cặp được đề cập khi ta xem xét trường hợp chỉ có 2 công thức thí nghiệm

Hai nhóm có mối liên hệ chặt chẽ, trong đó các quan sát có thể tạo thành cặp hoặc một cá thể tham gia ở cả hai nhóm, yêu cầu các quan sát giữa hai nhóm phải tương đương Kỹ thuật cặp cho phép so sánh các công thức thí nghiệm trong từng cặp, giúp giảm thiểu sự biến động và nâng cao độ chính xác của ước tính Các kiểu cặp có thể được phân loại theo nhiều cách khác nhau.

1 Cặp tự tạo - mỗi động vật tham gia cả 2 công thức thí nghiệm

2 Cặp tự nhiên - động vật sinh đôi hoặc nhân bản

Cặp nhân tạo là phương pháp tạo ra các cặp với các tiêu chí lựa chọn tương đối đồng nhất, chẳng hạn như tuổi, khối lượng, và các chỉ tiêu sinh lý, sinh hóa Việc lựa chọn những yếu tố này giúp đảm bảo tính đồng nhất và hiệu quả trong nghiên cứu cũng như ứng dụng thực tiễn.

DUNG LƯỢNG MẪU CẦN THIẾT

Số lượng động vật thí nghiệm, kích thước khối và số lượng ô lớn, ô nhỏ cần thiết là một câu hỏi phức tạp Để xác định chính xác, chúng ta cần xem xét nhiều yếu tố khác nhau và áp dụng các phương pháp tiếp cận phù hợp.

Số lượng động vật thí nghiệm cần được xác định sao cho không ảnh hưởng đến kết quả, với số lượng quá ít làm giảm độ tin cậy và quá nhiều gây lãng phí Để đạt độ chính xác cao, không nhất thiết phải sử dụng số lượng lớn động vật, vì điều này có thể dẫn đến khó khăn trong việc theo dõi và tạo điều kiện đồng nhất cho từng cá thể, như việc cho ăn, từ đó giảm độ chính xác kỹ thuật của thí nghiệm.

Dung lượng mẫu cần thiết trong thí nghiệm phụ thuộc vào chất lượng và độ đồng đều của động vật tham gia Nếu động vật có độ đồng đều cao, số lượng mẫu có thể giảm, ngược lại, nếu độ đồng đều thấp, số lượng cần tăng lên Độ tuổi của vật nuôi cũng rất quan trọng; động vật non thường yêu cầu dung lượng mẫu lớn hơn do sự biến động lớn về sinh lý và ngoại hình Hơn nữa, mỗi loại vật nuôi có đặc điểm riêng, vì vậy thiết kế thí nghiệm cần chú ý đến yếu tố này Cuối cùng, kết quả mong đợi của thí nghiệm, đặc biệt là sự chênh lệch giữa các công thức thí nghiệm, cũng ảnh hưởng đáng kể đến dung lượng mẫu.

Có thể phác sơ qua các yếu tố ảnh hưởng đến dung lượng mẫu như sau:

Yếu tố ảnh hưởng Dung lượngmẫu bé trung bình lớn

Biến động trong đàn nhỏ lớn Đối tượng nghiên cứu đại gia súc gia cầm

Giai đoạn nghiên cứu đầu cuối

Loại đề tài thức ăn giống phòng bệnh

Phương tiện bằng tay có máy móc

Nhân lực và vật lực hạn chế nhiều

Để quyết định chọn dung lượng mẫu, cần xem xét các tiêu chí quan trọng Bên cạnh đó, việc xác định số lượng động vật thí nghiệm cần thiết cũng dựa vào các tiêu chí này.

3.8.1 Số công thức thí nghiệm

Cách tiếp cận thứ nhất để xác định được dung lượng mẫu cần thiết đó là dựa vào:

1 Số công thức thí nghiệm (a)

2 Mức độ đồng đều của tính trạng cần nghiên cứu (σ²)

Thông thường một công trình nghiên cứu chấp nhận sai sót loại I khoảng 1% hay 5% (tức α = 0,01 hay 0,05) và xác suất sai sót loại II khoảng β 0,1 đến 0,2 (tức power = 0,8 – 0,9)

Trong nghiên cứu thống kê, việc phát hiện sự khác biệt giữa hai giá trị trung bình là rất quan trọng Có năm sai khác mong đợi (∆) mà chúng ta cần chú ý để xác định sự chênh lệch nhỏ nhất Điều này giúp chúng ta ước tính chính xác giá trị trung bình và nhận diện những khác biệt tiềm ẩn trong dữ liệu.

Để ước tính giá trị trung bình cộng khác với  không quá ∆ trong phân phối chuẩn N(, 2 ) với mức tin cậy P = 1 - , cần xác định dung lượng mẫu cần thiết theo công thức cụ thể.

Trong đó: C là hằng số liên quan giữa α và β; C = (Z1-α/2 + Z1-β) 2 ; bảng 3.1

Bảng 3.1 Bảng tham chiếu hằng số C liên quan giữa α và β α β = 0,2 (power = 0,8) β = 0,1 (power = 0,9) β = 0,05 (power = 0,95)

Để ước tính năng suất sữa trong chu kỳ tiết sữa 305 ngày với độ tin cậy 95%, cần quan sát một số lượng bò sữa nhất định sao cho sai số không vượt quá ± 75 kg so với giá trị thực của quần thể Với sản lượng sữa có phân bố chuẩn và độ lệch chuẩn σ = 500 kg, việc xác định số lượng bò cần quan sát là rất quan trọng để đảm bảo độ chính xác trong ước tính.

Như vậy cần ít nhất 349 bò sữa để thoả mãn điều kiện bài toán Đối với trường hợp ước tính một tỷ lệ

Dung lượng mẫu cần thiết để tỷ lệ ước tính pˆ khác không quá d so với tỷ lệ thực

 Nếu biết tỷ lệ hiện hành p (prevalance) và kiểm định ở mức tin cậy P = 1 -  dựa vào công thức sau:

Tỷ lệ hiện hành p có thể được xác định từ các tài liệu, nghiên cứu trước đó hoặc từ kinh nghiệm của người nghiên cứu Nếu không có thông tin cụ thể về tỷ lệ lưu hành trong quá trình thí nghiệm, ta sẽ sử dụng p = 0,5.

Để xác định tỷ lệ hiện nhiễm vi khuẩn trên thân thịt lợn tại một lò mổ với sai số không quá 5%, cần tính toán dung lượng mẫu cần thiết Với tỷ lệ hiện hành p = 0,2 và mức tin cậy 95%, việc xác định kích thước mẫu là rất quan trọng để đảm bảo độ chính xác của kết quả nghiên cứu.

Như vậy cần khảo sát ít nhất 246 thân thịt Đối với trường hợp so sánh 2 giá trị trung bình

Để phát hiện sự sai khác giữa hai giá trị trung bình ∆ trong mỗi công thức thí nghiệm, cần xác định dung lượng mẫu cần thiết, với sai lầm loại I và loại II lần lượt là α và β Giả sử số liệu tuân theo phân bố chuẩn, phương sai của tính trạng nghiên cứu được ký hiệu là σ².

Trong đó: C là hằng số liên quan giữa α và β; C = (Z1-α/2 + Z1-β) 2 ; bảng 3.1

Ví dụ 3.5: Muốn thiết kế một thí nghiệm để so sánh sản lượng sữa của dê Bách

Thảo ở 2 công thức thí nghiệm với yêu cầu α = 0,05; β = 0,2; chênh lệch mong đợi 30 kg sữa biết σ = 50 kg

Như vậy cần ít nhất 44 dê cho mỗi công thức thí nghiệm Đối với trường hợp so sánh hai tỷ lệ

Với các nghiên cứu tiến cứu (Cohort studies), dung lượng mẫu cần thiết để so sánh 2 tỷ lệ là:

Trong nghiên cứu, n1 đại diện cho dung lượng mẫu tối thiểu cần thiết cho nhóm không phơi nhiễm, trong khi n2 là dung lượng mẫu tối thiểu cho nhóm có phơi nhiễm Tỷ lệ giữa hai nhóm này được ký hiệu là r = n1 / n2 Ngoài ra, p1 là tỷ lệ mắc bệnh hiện hành trong quần thể thứ nhất, còn p2 là tỷ lệ mắc bệnh dự đoán trong quần thể thứ hai.

Z(1-α/2) = Giá trị z ở mức tương ứng 1-α/2 (α – xác suất mắc sai lầm loại I)

Z(1-β) = Giá trị z ở mức tương ứng 1- β (β– xác suất mắcsai lầm loại II)

Một nghiên cứu được thực hiện nhằm so sánh tỷ lệ tổn thương núm vú ở bò sữa giữa hai hệ thống vắt sữa: tự động (A) và bằng tay (B) Nghiên cứu kéo dài 12 tháng với tỷ lệ tổn thương dự kiến ở hệ thống B là 34,5% (p1 = 0,345) và tỷ lệ tổn thương ở hệ thống A là 15% (p2 = 0,15) Để đảm bảo độ tin cậy của kết quả, cần tính toán dung lượng mẫu cần thiết cho mỗi nhóm với các thông số α = 0,05 và β = 0,20.

Như vậy cần ít nhất 85 bò sữa cho một nhóm

Dung lượng mẫu cần thiết để so sánh 2 tỷ lệ (trong các nghiên cứu dịch tễ học thú y) có thể được tính bằng công thức sau:

  n = dung lượng mẫu tối thiểu cần thiết cho một nhóm p1 = tỷ lệ mắc bệnh hiện hành ở quần thể thứ 1 p2 = tỷ lệ mắc bệnh dự đoán ở quần thể thứ 2

Z(1-α/2) = Giá trị z ở mức tương ứng 1-α/2 (α – xác suất mắc sai lầm loại I)

Z(1-β) = Giá trị z ở mức tương ứng 1- β (β– xác suất mắcsai lầm loại II)

∆: Sai khác mong đợi (sự khác biệt muốn phát hiện); ∆ = p1 – p2.

Một thí nghiệm được thiết kế nhằm đánh giá hiệu quả điều trị của cao mật động vật trên bệnh lợn con phân trắng đã được thực hiện Trong thí nghiệm này, nhóm 1 được điều trị bằng cao mật động vật, trong khi nhóm 2 là nhóm đối chứng không được điều trị Các nhà nghiên cứu giả định tỷ lệ bệnh lợn con phân trắng ở nhóm đối chứng là khoảng 10% và dự kiến cao mật động vật sẽ giảm tỷ lệ này xuống còn khoảng 6% Để kiểm tra giả thuyết với mức sai sót I (α = 0,01) và độ mạnh (power) là 0,9, cần xác định số lượng lợn con tham gia nghiên cứu.

Như vậy cần ít nhất 1366 lợn con cho một nhóm

Trường hợp so sánh nhiều giá trị trung bình

Trong các trường hợp ước tính cỡ mẫu, phương pháp ước tính trực tiếp được áp dụng Đối với việc so sánh nhiều giá trị trung bình, phương pháp ước tính gián tiếp được sử dụng để xác định dung lượng mẫu cần thiết Cách xác định này giúp tối ưu hóa quá trình nghiên cứu.

+ Gọi số trung bỡnh của g nhúm là à1, à2, …, àg

+ Tính giá trị Lamda: SS 2

    + Tìm giá trị F* = F(α, u, v), trong đó: u = g – 1 và v = g(n – 1)

Thay các giá trị g, λ, F* và dung lượng mẫu (n) để sao cho Zβ đáp ứng được yêu cầu độ mạnh của phép thử (Power) đạt tối thiểu 0,8 hoặc 0,9

Để thiết kế một thí nghiệm so sánh sự tăng khối lượng (g) của gà với 4 khẩu phần thức ăn (A, B, C, D), chúng ta chọn các giá trị trung bình lần lượt là: A = 79, B = Việc này nhằm đánh giá hiệu quả dinh dưỡng của từng khẩu phần thức ăn đối với sự phát triển của gà.

= 71, àC = 80, àD= 102, với α = 0,05 và 1- β = 0,8; biết σ 2 = 35 2 Cần bao nhiờu gà tham gia thí nghiệm này?

+ Tìm giá trị F* = F(0,05, u, v), trong đó: u = 4 – 1 = 3 và v = 4(n – 1)

+ Thay lần lượt từng giá trị dung lượng mẫu để thoả mãn điều kiện Zβ đáp ứng được yêu cầu độ mạnh của phép thử (Power) đạt tối thiểu 0,8 hoặc 0,9

+ n = 1 => F* = F(0,05, 3, 0) => không xác định được giá trị F* => n = 1 không thoả mãn yêu cầu

  z    1,34159 => Power = 0,0898 (8,98%) < 0,8 (80%) => n = 2 không thoả mãn yêu cầu

  z    0,37255=> Power = 0,3547 (35,47%) < 0,8 (80%) => n = 10 không thoả mãn yêu cầu

  z   0, 4510=> Power = 0,6740 (67,40%) < 0,8 (80%) => n = 20 không thoả mãn yêu cầu

  z   0,78326=> Power = 0,78326 (78,32%) < 0,8 (80%) => n = 25 không thoả mãn yêu cầu

  z   0,84564=> Power = 0,80112 (80,11%) > 0,8 (80%) => n = 26 thoả mãn yêu cầu

BÀI TẬP

Để ước tính tăng khối lượng trung bình hàng ngày của lợn nuôi vỗ béo từ 60 đến 180 ngày tuổi, với độ lệch chuẩn là 200 g/ngày và khoảng tin cậy 95%, cần tính toán dung lượng mẫu cần thiết sao cho giá trị ước tính nằm trong khoảng ± 50 g/ngày so với giá trị thực của quần thể.

Một thí nghiệm được thực hiện để nghiên cứu tác động của việc bổ sung đồng đến tăng trưởng khối lượng lợn, với 20 con lợn Yorkshire 80 ngày tuổi được chia thành hai nhóm: nhóm đối chứng và nhóm thí nghiệm Kết quả khối lượng của lợn ở 210 ngày tuổi cho thấy nhóm đối chứng có khối lượng từ 115 đến 135 kg, trong khi nhóm thí nghiệm có khối lượng từ 119 đến 140 kg Đây là thí nghiệm ngẫu nhiên hoàn toàn với hai công thức thí nghiệm Nếu tôi là người thiết kế thí nghiệm này, số động vật cần thiết sẽ là 20 con.

Bệnh East Coast Fever (ECF) có tỷ lệ tử vong ở vật nuôi lên tới 50% Để bảo vệ 95% vật nuôi khỏi bệnh này, việc sử dụng một loại vắc xin là cần thiết Với độ tin cậy 95% và độ mạnh của phép thử 90%, cần xác định dung lượng mẫu phù hợp để đảm bảo hiệu quả của vắc xin.

Để xác định số lượng cá thí nghiệm cần thiết cho mỗi bể nhằm phát hiện hiệu quả của vắc xin, giả sử tỷ lệ cá nhiễm bệnh là 10% khi sử dụng vắc xin và 30% khi không sử dụng Với mức độ tin cậy 0,95 và độ mạnh của phép thử đạt 0,80, cần tính toán cẩn thận để đảm bảo kết quả chính xác.

THIẾT KẾ THÍ NGHIỆM MỘT YẾU TỐ

THIẾT KẾ THÍ NGHIỆM HAI YẾU TỐ

TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

KIỂM ĐỊNH MỘT PHÂN PHỐI VÀ BẢNG TƯƠNG LIÊN

ƯỚC LƯỢNG, KIỂM ĐỊNH MỘT GIÁ TRỊ TRUNG BÌNH VÀ SO SÁNH HAI GIÁ TRỊ TRUNG BÌNH

SO SÁNH NHIỀU GIÁ TRỊ TRUNG BÌNH

TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

ƯỚNG TÍNH DUNG LƯỢNG MẪU

BÀI TẬP

Ngày đăng: 11/10/2022, 16:01

HÌNH ẢNH LIÊN QUAN

Bảng phân phối của biến ngẫu nhiên rời rạc: - Giáo trình thiết kế thí nghiệm
Bảng ph ân phối của biến ngẫu nhiên rời rạc: (Trang 13)
Đồ thị là tóm tắt số liệu ở các dạng hình ảnh khác nhau và cho phép dễ dàng phát  hiện những điểm đặc biệt hơn so với tóm tắt bằng số - Giáo trình thiết kế thí nghiệm
th ị là tóm tắt số liệu ở các dạng hình ảnh khác nhau và cho phép dễ dàng phát hiện những điểm đặc biệt hơn so với tóm tắt bằng số (Trang 22)
Đồ thị phân tán được sử dụng một cách rất hữu hiệu khi ta quan tâm đến mối liên - Giáo trình thiết kế thí nghiệm
th ị phân tán được sử dụng một cách rất hữu hiệu khi ta quan tâm đến mối liên (Trang 23)
Đồ thị hộp: Phân bố tần suất sản lượng sữa dê Bách Thảo trong chu kỳ tiết sữa - Giáo trình thiết kế thí nghiệm
th ị hộp: Phân bố tần suất sản lượng sữa dê Bách Thảo trong chu kỳ tiết sữa (Trang 23)
Đồ thị phân tán thể hiện mối quan hệ giữa thời gian cai sữa (ngày) - Giáo trình thiết kế thí nghiệm
th ị phân tán thể hiện mối quan hệ giữa thời gian cai sữa (ngày) (Trang 24)
Bảng 3.1. Bảng tham chiếu hằng số C liên quan giữa α và β - Giáo trình thiết kế thí nghiệm
Bảng 3.1. Bảng tham chiếu hằng số C liên quan giữa α và β (Trang 52)
Bảng 3.2. Bảng tham chiếu dung lượng mẫu tương ứng với độ mạnh của phép thử - Giáo trình thiết kế thí nghiệm
Bảng 3.2. Bảng tham chiếu dung lượng mẫu tương ứng với độ mạnh của phép thử (Trang 57)
Sơ đồ chọn mẫu ngẫu nhiên theo hệ thống - Giáo trình thiết kế thí nghiệm
Sơ đồ ch ọn mẫu ngẫu nhiên theo hệ thống (Trang 62)
Sơ đồ chọn mẫu ngẫu nhiên đơn - Giáo trình thiết kế thí nghiệm
Sơ đồ ch ọn mẫu ngẫu nhiên đơn (Trang 62)
Sơ đồ chọn mẫu phân tầng không tỷ lệ - Giáo trình thiết kế thí nghiệm
Sơ đồ ch ọn mẫu phân tầng không tỷ lệ (Trang 64)
Sơ đồ chọn mẫu chùm 1 giai đoạn - Giáo trình thiết kế thí nghiệm
Sơ đồ ch ọn mẫu chùm 1 giai đoạn (Trang 65)
Bảng phân tích phương sai - Giáo trình thiết kế thí nghiệm
Bảng ph ân tích phương sai (Trang 72)
Bảng phân tích phương sai - Giáo trình thiết kế thí nghiệm
Bảng ph ân tích phương sai (Trang 79)
Bảng phân tích phương sai (ANOVA). - Giáo trình thiết kế thí nghiệm
Bảng ph ân tích phương sai (ANOVA) (Trang 83)
Bảng  bên.  Hãy  tiến  hành  phân  tích  để - Giáo trình thiết kế thí nghiệm
ng bên. Hãy tiến hành phân tích để (Trang 89)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN