Nếu dùng phương pháp ngẫu nhiên đơn để chọn một số cụm, rồi chọn một số nhất định các hộ gia đình ở mỗi cụm vào mẫu thì những hộ ở các cụm có kích thước (dân số) nhỏ hơn sẽ có cơ hội n[r]
(1)PHƯƠNG PHÁP NGHIÊN CỨU TRÊN MẪU Mục tiêu học tập
1 Diễn giải qui trình thiết kế loại mẫu thường dùng Dịch tễ học;
2 Nêu công thức ước lượng tham số quần thể từ số đo mẫu, công thức tính cỡ mẫu nhỏ hợp lý;
3 Trình bày giai đoạn thiết kế mẫu
Không thiết phải điều tra toàn quần thể mà cần tiến hành điều tra mẫu; từ kết mẫu ước lượng tham số quần thể Làm tiết kiệm tiền, thời gian, tập trung vào chất lượng số lượng Nhưng, kết mẫu khơng giống hịan tịan với kết có thật quần thể Chúng ta phải chấp nhận sai số
Nếu trình thiết kế mẫu tiến hành cách cẩn thận, phương pháp sai số loại trừ giảm
I THIẾT KẾ MẪU
Là quy trình chọn đơn vị mẫu từ quần thể đích (Target Poputatio: TP.: quần thể mà ta quan tâm, ta nghiên cứu)
Có số quy trình mẫu sau:
1 Mẫu ngẫu nhiên đơn (Simple Random Sampling : SRS)
Tất cá thể có quần thể đích (TP) có xác suất hay có hội xuất mẫu Việc lựa chọn cá thể vào mẫu nhờ vào bảng số ngẫu nhiên, hoặc bốc thăm Mẫu SRS mẫu đại diện tốt cho quần thể, đòi hỏi phải có khung mẫu (Sampling Frame) - danh sách tồn cá thể quần thể đích Mẫu áp dụng tốt cho quần thể nhỏ, khu trú; khó áp dụng cho quần thể lớn, phân tán
Bảng số ngẫu nhiên:
Là bảng tạo 10 ký tự (0, 1, 2, 3, , 9) mà xuất ký tự bảng có tỷ lệ khơng theo trật tự nào, hồn tồn ngẫu nhiên Cho nên, chọn số từ điểm ngẫu nhiên bảng ký tự có hội xuất
Chẳng hạn: Muốn chọn ngẫu nhiên mẫu 200 trẻ trường học có trẻ để điều tra vấn đề sức khỏe trẻ đánh số thứ tự từ đến 625 (khung mẫu) Như vậy, ta dùng ký tự bảng
625
625
Vào bảng: cách ngẫu nhiên (ví dụ: dùng đầu bút chì, khơng nhìn vào bảng, chấm vào điểm bảng) điểm số có ký tự, ví dụ điểm nằm vào hàng thứ cột thứ bảng ta đọc theo chiều từ xuống từ trái qua phải, số 330, 369, 743, 273, 943, , Chọn số có ký tự (khơng lấy ký tự , ký tự lớn 625, lấy lần, không lấy ký tự lập lại); Như ta có mẫu 200 trẻ
5
,
002 871, 918 702, 318, 200
3 000
Một quần thể có kích thước N, mẫu chọn có kích thước n, tổng số T mẫu có kích thước n :
(N n)! n!
N! T
(2)(3)Ví dụ: N = 5, n = 2, Tổng số mẫu có cỡ n = lấy từ quần thể N = là:
( ) 10
! 2!
5!
T =
− =
Trong mẫu ngẫu nhiên đơn, xác xuất để đơn vị (phần tử) quần thể chọn vào mẫu n/N
2 Mẫu hệ thống (Systematic Sampling)
Đạt mẫu cách dễ dàng có khung mẫu Ví dụ: Quần thể đích có N = 5000 cá thể, cần chọn mẫu n = 500 thì: đánh số thứ tự từ đến vào khung mẫu, chọn số ngẫu nhiên (dựa vào bảng số ngẫu nhiên) từ đến 10
1 5000
) 10 500 5000
(N n= =
Giả sử chọn số 5, tất cá thể có số thứ tự chọn vào mẫu
,
5 15, 25, 4995
T1 : Vùng Thủ phủ
T2 : Vùng Thành phố
T3 : Vùng Thị trấn
T4 : Vùng Nông thôn 34
,
0 0,13 0,15 0,38
Mẫu không tầng Mẫu tầng
Các cá thể chọn ngẫu nhiên từ danh sách tồn quần thể đích: Không thực tiễn quần thể
lớn, phân tán
Mẫu tỷ lệ: Số cá thể chọn vào mẫu tỷ lệ với kích thước tầng;
Mẫu tốt
Mẫu không tỷ lệ: Số cá thể tầng chọn vào mẫu nhau: Các tầng có
kích thước nhỏ q đại diện mẫu
Ví dụ: phải chọn mẫu n = 2000
680 2000 34
,
1 = × =
T
260 2000 13
,
2 = × =
T
760 2000 38
,
300 2000 15
= ×
=
= ×
= T T
Tổng : 2000
500 500 500 500
4
= = = =
T T T T
Tổng: 2000 Ước lượng tốt cho vùng
nhỏ, không tốt cho vùng lớn (tỉnh, nước) Sơ đồ 6.1: Các loại mẫu tầng
3 Mẫu chùm (Cluster Sampling)
Quần thể đích tạo nên chùm (cụm) tự nhiên (như thành phố, bệnh viện, làng, xã, ) Một mẫu ngẫu nhiên đơn chọn từ cụm (đơn vị mẫu khung mẫu cụm quần thể đích), tất cá thể nằm cụm chọn đó, tạo nên mẫu cần thiết Mẫu dễ thực hiện, rẻ, tính đại diện cho quần thể đích khơng tốt
(4)Quần thể đích phân chia cách tự nhiên thành phận nhỏ hơn, gọi tầng Trong tầng, chọn mẫu ngẫu nhiên đơn: Tập hợp mẫu ngẫu nhiên đơn tạo nên mẫu cần thiết
Có loại mẫu tầng: Mẫu tầng tỷ lệ mẫu tầng không tỷ lệ: (Xem sơ đồ 6.1) 5 Mẫu nhiều giai đoạn (Multi Stage Sampling)
Quần thể đích, ví dụ: Một nước có nhiều tỉnh, tỉnh có nhiều huyện, huyện có nhiều xã
- Giai đọan 1: Chọn ngẫu nhiên số tỉnh;
- Giai đọan 2: Chọn ngẫu nhiên số huyện từ tỉnh chọn giai đoạn 1; - Giai đọan 3: Chọn ngẫu nhiên số xã từ huyện chọn giai đoạn 2, Quá trình chọn ngẫu nhiên giai đọan nói dùng phương pháp ngẫu nhiên đơn phương pháp PPS
6 Mẫu xác suất tỷ lệ với kích thước (Probability Proportional to Size: PPS)
Quần thể đích có nhiều cụm, (ví dụ: huyện có nhiều xã), cụm có kích thước khơng Nếu dùng phương pháp ngẫu nhiên đơn để chọn số cụm, chọn số định hộ gia đình cụm vào mẫu hộ cụm có kích thước (dân số) nhỏ có hội nhiều chọn vào mẫu so với hộ cụm có kích lớn Một phương pháp tốt chọn cụm theo phương pháp: xác suất chọn tỷ lệ với kích thước cụm
Quy trình mẫu sau: - Đánh số thứ tự vào cụm ;
- Lập bảng tần số dồn, có tổng số dân toàn quần thể: m;
- Ân định số cụm cần chọn vào mẫu: Nên chọn nhiều cụm để cụm có hộ vào mẫu chọn cụm mà cụm có nhiều hộ Giả sử ta chọn N cụm ;
Tìm khoảng cách mẫu k: N m k = ;
- Chọn số ngẫu nhiên R từ đến k (dùng bảng số ngẫu nhiên);
- Tìm cụm vào mẫu: dựa vào tần số dồn: theo tần số dồn, cụm có chứa số R+ik (i từ đến N-1) cụm chọn vào mẫu
Ví dụ: Một quần thể (một huyện chẳng hạn) có 17 cụm (xã), biết dân số cụm (xã) tổng dân số toàn quần thể (huyện) m = 90000 Cần chọn vào mẫu n = 100 hộ (xem bảng 6.1)
Giả sử chọn N = 10 cụm (xã), 9000 10
90000 = =
k
Chọn số ngẫu nhiên R từ đến 9000, ví dụ: chọn số 5500, cụm (xã) chọn vào mẫu cụm (xã) tương ứng với tần số dồn có chứa số:
,
, 5500 ),
9000
(
5500 + × 5500 +(2×9000), 5500 +(9×9000), - cụm (xã) có đánh dấu⊗
Chọn 10 cụm (xã), cụm (xã) chọn 10 10 100 = =
N n
(5)Bảng 6.1 : Chọn cụm theo phương pháp PPS (Dữ kiện giả định) cụm thứ
( )a
Dân số ( )b
Tần số dồn ( )c
Cụm thứ ( )a
Dân số ( )b
Tần số dồn ( )c
8
7275 6426 8835 7684 5541 6569 4348 3762
50440 43165 36739 27904 20220 14679 8110 3762
⊗ ⊗ ⊗ ⊗ ⊗
17 16 15 14 13 12 11 10
2120 3532 2123 7694 1987 5416 4578 9143 2967
90000 87880 84348 82225 74531 72544 67128 62550 53407
⊗ ⊗ ⊗ ⊗ ⊗
Có thể dùng phương pháp ngẫu nhiên đơn, dùng phương pháp khác (phương pháp EPI chẳng hạn) để chọn hộ gia đình vào mẫu
II ƯỚC LƯỢNG
Từ “Ước lượng” sử dụng với ý nghĩa thơng thường: ước lượng tỷ lệ mắc, tỷ lệ mắc bệnh định quần thể, ước lượng giá thành trung bình ngày chương trình y tế, ước lượng thiệt hại tai nạn giao thông.v.v
Cùng tham số, tồn nhiều ước lượng Gọi ước lượng khơng có sai số lặp lại nhiều lần giá trị ước lượng khác nhau, có phân phối tập trung chung quanh tham số
θ θ
θ1 θ2
Hình 6.1: Ước lượng có khơng có sai số
θ
θ
θ
3
θ4
(6)Hình 6.1 phân bố ước lượng θ1 θ2 tham số θ Ước lượng θ2là
khơng có sai số, ước lượng θ1 cao so với θ Dĩ nhiên, người ta muốn tìm
ước lượng khơng có sai số
Thường có nhiều ước lượng khơng có sai số tham số (khi người ta chọn ước lượng có phân phối tập trung chung quanh θ
Hình 6.2 phân phối ước lượng θ3 θ4 tham số θ Cả ước
lượng θ3 θ4 khơng có sai số, θ4chính xác (Các giá trị θ4 có nhiều khả
năng gần với tham số θ hơn)
Có nhiều cách đo lường xác ước lượng khơng có sai số Phương pháp đơn giản dùng phương sai, trung bình độ lệch bình phương giá trị ước lượng tham số ước lượng (thông số ước đoán) Độ lệch chuẩn ước lượng bậc phương sai
Khi trình bày ước lượng, cần nói rõ độ xác nó, cách trình bày thơng thường là: “(Ước lượng) ± (Độ lệch chuẩn)”;
Hoặc cách khác, độ xác ước lượng là: “Khoảng tin cậy” = [(Ước lượng) - γ (Độ lệch chuẩn), (Ướclượng) + γ (Độ lệch chuẩn)];
Ở đây, γ số tùy thuộc vào phân bố ước lượng độ xác mong muốn ước lượng (hệ số tin cậy); hệ số tin cậy ấn định , có nghĩa khoảng tin cậy muốn đạt có khả chứa đựng tham số chưa biết Giá trị γ tương ứng với hệ số tin cậy mong muốn tra bảng sách tốn thơng kê thơng dụng (luật chuẩn, bảng )
% 90 %
90
1 Ước lượng thực tiễn
Ít dùng “Ước lượng điểm” thực tiễn Việc trình bày “Khoảng tin cậy” ước lượng có ý nghĩa quan trọng, hay sử dụng:
Ví dụ:
(1) Một điều tra tỷ lệ mắc bệnh, để áp dụng chương trình can thiệp, phải quan tâm tới khả xấu nhất, nghĩa tỷ lệ mắc cao xảy quần thể Như phải dùng tới giới hạn khoảng tin cậy
(2) Một điều tra tỷ lệ có miễn dịch bệnh, để sau áp dụng tiếp chương trình gây miễn dịch vaccin, lúc phải quan tâm tới tình trạng xấu nhất, nghiã tỷ lệ có miễn dịch thấp quần thể Lúc phải sử dụng tới giới hạn khỏang tin cậy
2 Ước lượng tỷ lệ 2.1 Trường hợp nhị thức
Giả sử người ta lập lại n lần thử nghiệm, lần xác suất gặp biến cố định p, lần tiến hành thử nghiệm độc lập nhau, ta có tình nhị thức
Ví dụ: Nếu lần thử nghiệm việc sinh cặp vợ chồng khác nhau, biến cố nghiên cứu sinh gái, tình nhị thức có p gần 1/2
Trong tình nhị thức, n biết, ta phải ước lượng p Nếu lập lại n lần, gặp X lần biến cố nghiên cứu dùng
n X
pˆ = để ước lượng p Ví dụ: Trong 1000 lần sinh, gặp trẻ gái, ta có:
532 0,532
1000 532
ˆ = =
(7)Và có kết sau: -
n X
pˆ = ước lượng điểm p; - phương sai ước lượng là:
n p p(1− )
, ước lượng bằng: n
p pˆ(1− ˆ)
- độ lệch chuẩn ước lượng
n p p(1− )
, ước lượng bằng:
n p pˆ(1− ˆ)
, - khoảng tin cậy ước lượng (p,p)được xác định bằng:
⎥ ⎥ ⎦ ⎤ ⎢
⎢ ⎣ ⎡
+ − −
+ +
= 2 22
4 ) ˆ ( ˆ
ˆ
n n
p p
n p n
n
p γ γ γ
γ ,
⎥ ⎥ ⎦ ⎤ ⎢
⎢ ⎣ ⎡
+ − +
+ +
= 2 22
4 ) ˆ ( ˆ
ˆ
n n
p p
n p n
n
p γ γ γ
γ
Ở đây: γ = 1,96 (1,65) hệ số tin cậy mong muốn 95% (90%)
Nếu n tương đối lớn (n ≥ 30) thì khoảng tin cậy gần p tính:
n p p p
p = ˆ −γ ˆ(1− ˆ) ,
n p p p
p = ˆ +γ ˆ(1− ˆ)
Ví dụ: 1000 lần sinh, gặp 532 trẻ gái, thì:
- pˆ =532/1000=0,532;
- phương sai pˆlà: pˆ(1− pˆ)/n = (0,532×0,468)/1000 = 0,0002489 ; - độ lệch chuẩn pˆ là: 0.0002489 = 0,0185 ;
- khoảng tin cậy 95% xác định:
p = 0,532 −1,96 × 0,0158 = 0,501, p = 0,532 +1,96 × 0,0158 = 0,563;
Hay: (p , p)= (0,501, 0,563)
Để có khoảng tin cậy 90%, thay 1,96 1,65, ta có: (p,p)= (0,506, 0,558 ; Khoảng ngắn khoảng có xác suất nhỏ việc chứa tham số chưa
biết p
2.2 Trường hợp siêu bội
Một quần thể có kích thước N chứa N1 người bị bệnh, N - N1 người không bị bệnh
Một mẫu có kích thước n, có n1 người bị bệnh, n−n1 người không bị bệnh Người ta muốn ước lượng tỷ lệ
N N1
chưa biết quần thể
Việc ước lượng tỷ lệ mắc, tỷ lệ mắc bệnh định quần thể tình này, dùng
n n1
người bị bệnh mẫu để ước lượng cho N N1
(8)(1) n n1
ước lượng điểm N N1
, (2) phương sai
n n1 n N N N N N n N 1 1 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − − ,
và ước lượng bằng:
n N N n n N n N 1 1 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − − Khi N lớn nhiều so với n ⎟
⎠ ⎞ ⎜
⎝
⎛ ≤ 10
,
N n
phương sai n n1 gần bằng: n n n n n 1 1 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −
(3) độ lệch chuẩn ước lượng
n n n n n N n N 1 1 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − − ,
và gần
n n n n n 1 1 ⎟ ⎠ ⎞ ⎜ ⎝
⎛ − N lớn nhiều so với n (4) khoảng tin cậy
N N1
xác định :
n n n n n N n N n n
p 1
1 1 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − − − = γ n n n n n N n N n n
p 1
1 1 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − − − + = γ
Ở đây, γ = 1,96 (1,65) hệ số tin cậy 95% (90%); N lớn so với n đại lượng
1 − − N n N
gần
Ví dụ : Người ta muốn ước lượng tỷ lệ mắc bệnh quần thể, mẫu có kích thước n = 6000 người, có 528 người bị bệnh Tỷ lệ mắc mẫu 0,088
6000528 = , N
N1
là chưa biết, giả sử rằng, kích thước quần thể lớn so với 6000, 088 , = n n
ước lượng điểm N N1
, ước lượng khoảng tính:
- Phương sai: 0,0000133
6000 912 , 088 , ) ( 1
2 = − = × × =
n n n n n s
(9)Một quần thể có kích thước N, mẫu chọn có kích thước n; quần thể đó, tính chất cần nghiên cứu có giá trị trung bình chưa biết μ, phương sai chưa biết δ2
, mục đích nghiên cứu mẫu ước lượng giá trị trung bình μ
Ví dụ: Người ta muốn ước lượng số ngày nằm viện trung bình bệnh nhân bệnh viện vùng đó; mẫu bệnh nhân ghi nhận: X1, X2, Xn là số
ngày nằm viện bệnh nhân; số trung bình mẫu là: )
(
1
2
1 X Xn
X n
X = + + +
Người ta dùng X để ước lượng μ ; có kết sau: (1) X ước lượng điểm μ ,
(2) phương sai củaμ
n N
n
N
1
δ
− −
gần n
2
δ
N lớn so với n,
(3) độ lệch chuẩn củaμ
n N
n
N
1
δ
− −
gần n
δ
N lớn so với n, (4) thay δ2
s2 để tính phương sai độ lệch chuẩn từ công thức nêu trên, mà:
(5) khoảng tin cậy củaμ xác định:
) X n X X X ( n
1
s n2
2 2
2 + + + −
− =
n s
X γ
μ = − ,
n s
X γ
μ = + Trong γ = 1,96 (1,65) hệ số tin cậy 95% (90%) Ví dụ:
Một mẫu n = 45 bệnh nhân có số ngày nằm viện người là:
19, 4, 9, 3, 12, 7, 43, 25, 8, 6, 2, 5, 17, 21, 3, 8, 27, 5, 3, 6, 12, 10, 18, 4, 31, 8, 14, 6, 5, 5, 31, 3, 8, 12, 7, 11, 10, 20, 8, 6, 2, 14, 7, 5, 11
Tính X =11,13 Giả sử kích thước quần thể lớn so với n= 45, phương sai ước lượng : 1,778
2 = n s
độ lệch chuẩn 11,778 =1,333 Khoảng tin cậy 95% μ tính:
μ = 11,13 − 1,96 × 1,333 = 8,52 μ = 11,13 + 1,96 ×1,333 = 13 ,74
Hay (μ, μ)=(8,52, 13,74)
III XÁC ĐỊNH CỠ MẪU
(10)Dựa vào độ xác mong muốn để tính cỡ mẫu trường hợp sau đây: (1) Độ lệch chuẩn ước lượng phải nhỏ giá trị định trước;
(2) Khoảng tin cậy ước lượng phải ngắn giá trị định trước;
(3) Sự khác biệt số đo mẫu tham số quần thể phải nhỏ giá trị định trước
Ta xét trường hợp cho loại phân phối 1 Ước lượng tỷ lệ (trường hợp nhị thức)
1.1 Dựa vào độ lệch chuẩn
Để độ lệch chuẩn không vượt giá trị định d, phải giải phương trình: pˆ
d
n p) p(1
= −
2
d p) p(1
n= −
Độ lớn n phụ thuộc vào tham số chưa biết p Nếu ta có ước đốn giá trị p (dựa vào nghiên cứu tương tự thực nơi khác, mẫu thăm dị) ta đưa vào cơng thức để tính; khơng coi:
4 p)
p(1− = cho trường hợp,
lúc 2
4d
n=
Ví dụ : Muốn ước lượng tỷ lệ p với d = 0,01 cỡ mẫu cần thiết là: 2500
(0,01)
1 n
2 =
× =
Khi có ước đốn trước p, chẳng hạn, ước chừng p = 0,90 (theo kinh nghiệm theo nghiên cứu nơi khác) thì: 0,90
) 01 , (
10 , 90 ,
2 =
× =
n
Rõ ràng, ước đoán trước p quan trọng cần thiết để n nhỏ hợp lý Một ví dụ khác, muốn nghiên cứu ước lượng tỷ lệ đó, gần với 0, độ lệch chuẩn lúc phải thật nhỏ, n có nguy lớn Ví dụ, ước đốn p chừng khoảng 0,02 mong muốn p=0,001 : 19600
001 ,
98 , 02 ,
= ×
=
n
1.2 Dựa vào độ dài khoảng tin cậy
Để độ dài khoảng tin cậy ước lượng không vượt giá trị định l: độ dài khoảng tin cậy
=
l (p , p) đó:
n ) pˆ (1 pˆ γ pˆ
p = − − ,
n ) pˆ (1 pˆ γ pˆ
p = + −
Phải giải phương trình :
n ) pˆ (1 pˆ γ p
(11)
2 l
) pˆ (1 pˆ γ
n = − Nếu ta chưa có ước đoán p (hoặc p ), dùng công thức ˆ
2 l
2 γ n =
Ví dụ, mong muốn khoảng tin cậy 95% ước lượng không vượt l = 0,01 ta có: 385
) 01 , (
) 96 , (
2
= =
n ;
Nếu thay 0,01 0,05 thì: 1537 )
05 , (
) 96 , (
2
= =
n
1 Dựa vào khác biệt số đo mẫu tham số quần thể
Để p ˆ−p không vượt giá trị định c (thường lấy giá trị 0,01; ; với xác suấtt , phải giải phương trình:
02 , )
05 ,
0 95%
1,96,
p) p(1
n c
=
−
c
p) p(1 (1,96)
n = −
Nếu chưa có ý niệm p coi p = 0,05 hay
4 p)
p(1− = , thì:
2
4 ) 96 , (
c
n = ;
Nếu thay 95% 90% 1,96 thay 1,65
Ví dụ, mong muốn trước p−pˆ ≤0,02 , với xác suất 90% : 1701
2 4(0,02)
2 (1,65) n = =
2 Ước lượng tỷ lệ (trường hợp siêu bội)
2.1 Dựa vào độ lệch chuẩn
Để độ lệch chuẩn n n1
không vượt giá trị định d phải giải phương trình:
d n n
1 n N
1 N N
n N
= −
− −
⎟⎟ ⎠ ⎞ ⎜⎜
⎝ ⎛
⎥ ⎦ ⎤ ⎢
⎣ ⎡
⎟⎟ ⎠ ⎞ ⎜⎜
⎝ ⎛
⎟⎟ ⎠ ⎞ ⎜⎜
⎝ ⎛
− −
+
− =
1 d
1 N
1 N N
1 N N
1
2 d
1 N
1 N N
1 N
n (1)
Ví dụ: Nếu cỡ quần thể N = 1200, tỷ lệ ước lượng chừng khoảng , mong muốn , ta có:
40 , 01
(12)0,01, n
1 0) (0,40)(0,6 11999
n 1200
= −
⎟ ⎠ ⎞ ⎜ ⎝ ⎛
hay n = 2000
Lưu ý rằng, 0,17
12000 2000
= =
N n
nên ta bỏ qua đại lượng
1 − − N
n N
tính tốn Tuy nhiên, ≤ 0,01
N n
công thức (1) nêu đơn giản hóa,
lấy giá trị gần đúng: 2 1
1 d
N N N
N n
⎟ ⎠ ⎞ ⎜
⎝ ⎛ −
= , chưa có ý niệm
N N1
ta dùng cơng thức : 2
4 d
n = 2.2 Dựa vào độ dài khoảng tin cậy
Để độ dài khoảng tin cậy không vượt giá trị định l, ta phải giải phương trình:
l
n n n n n N
n N γ p
p − =
− − =
− ⎟
⎠ ⎞ ⎜
⎝ ⎛
;
Hay :
⎥ ⎦ ⎤ ⎢
⎣ ⎡
⎟⎟ ⎠ ⎞ ⎜⎜
⎝ ⎛
− −
+
− =
1 l
) pˆ (1 pˆ γ N
1
)/l pˆ (1 pˆ γ n
2
2
Nếu N lớn, ta dùng công thức: 2
) ˆ ( ˆ
l p p
n = γ −
Trong ví dụ trước, mong muốn khoảng tin cậy 90% N N1
không vượt l = 0,10, ta có: (0,40)(0,60)1 0,10
1 12000 12000 )
65 , (
2 =
− −
n n
hoặc n =256 Nếu ≤ 0,10
N n
và chưa có ý niệm N N1
(hoặc n n1
)thì dùng cơng thức:
2
l
n = γ , tương tự trường hợp nhị thức
2.3 Dựa khác biệt số đo mẫu tham số quần thể
Để p ˆ−p không vượt giá trị định e (0,01, 0,02 )và với xác suất , phi giải phương trình:
% 95
1,96
1
1
= −
− ⎟
⎠ ⎞ ⎜
⎝
⎛ − N n
N
N N N
N n c
(13)Hay
⎥ ⎦ ⎤ ⎢
⎣ ⎡
− ⎟ ⎠ ⎞ ⎜
⎝ ⎛ − +
⎟ ⎠ ⎞ ⎜
⎝ ⎛ − =
1
) 96 , ( 1
1 )
96 , (
1
2
1
2
N N N
N c
N
N N N
N c
n
Nếu N đủ lớn thì: ⎟
⎠ ⎞ ⎜
⎝ ⎛ − =
N N N
N c
n 1
2
1 )
96 , (
Nếu khơng có ý niệm p dùng cơng thức: 2
2
4 ) 96 , (
c n =
Nếu 95% thay 90% 1,96 thay 1,65
Ví dụ: Từ kiện mục 2.2 (của phần ước lượng), phải tính cỡ mẫu với pˆ− p ≤0,01
và với xác suất 95%, ta có :
3083
) 01 , (
) 912 , )( 088 , ( ) 96 , (
2
= =
n
3 Ước lượng số trung bình 3.1 Dựa vào độ lệch chuẩn
Để cho độ lệch chuẩn X không vượt giá trị định d, phải giải phương trình sau: d
n =
δ
, hay 2
2
d n =δ
Công thức phụ thuộc δ chưa biết Phải làm mẫu thăm dị (một mẫu có kích thước nhỏ, cho ước đoán trước δ2
), ví dụ: Lấy kiện mục (của phần ước lượng) làm mẫu thăm dò, mong muốn độ lệch chuẩn X số ngày nằm viện trung bình khơng vượt q ngày thì:
9
027 , 80 2
= =
= d
s
n
Ta thấy n = 45 (ví dụ mục phần ước lượng ) độ lệch chuẩn 1,333 nhỏ Nếu muốn độ lệch chuẩn khơng vượt q ngày thì:
81
027 , 80 2
= =
= d
s
n
3.2 Dựa vào độ dài khoảng tin cậy
Để độ dài khoảng tin cậy không vượt giá trị định l, ta phải giải phương trình:
l n s = =
−μ γ
μ , hay 2
2
l s
(14)50; ) ( 027 , 80 ) 96 , ( 2 = × × = n
Nếu khoảng tin cậy mong muốn 90% thì: 35 ) ( 027 , 80 ) 65 , ( 2 = × × = n
3.3 Dựa vào khác biệt số đo mẫu tham số ca quần thể
Để X−μ khơng vượt giá trị định c, với xác suất 95% ta phải giải phương trình:
=1,96,
δ n c
hay 2
2 ) 96 , ( c
n = δ
Ở cần có ý niệm δ2
( từ mẫu thăm dò từ nguồn khác) Hơn nữa, giá trị c phải tùy thuộc vào độ lớn μ
Ví dụ: Từ kiện mục (phần ước lượng), mong muốn X−μ ≤1ngày, với xác suất
90% thì: 218
1 ) 027 , 80 ( ) 65 ,
( =
=
n
Bảng sau tóm tắt cơng thức tính cỡ mẫu vừa nêu trên: (Xem bảng 6.2) Bảng 6.2: Bảng tóm tắt cơng thức tính cỡ mẫu:
Tham số
Dựa vào độ lệch chuẩn Dựa vào khoảng tin cậy Dựa vào khác biệt p (nhị thức) ) ( d p p
n= −
hoặc: 2
4 d n= 2 ) ˆ ( ˆ l p p n= γ −
hoặc: 2
l n= γ
2 ) ( c p p n= γ −
hoặc: c n γ = p (siêu bội) ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − + ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = 1 1 1 1 1 d N N N N N d N N N N n
Hoặc: 1 12
d N N N N n ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − =
Hoặc: 2
4 d n= ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − − + − = ) ˆ ( ˆ 1 ) ˆ ( ˆ 2 2 l p p N l p p n γ γ ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − + ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = 1 1 1 2 1 2 N N N N c N N N N N c n γ γ
Hoặc:
2 ) ˆ ( ˆ l p p n= γ −
Hoặc: 2
2
l n= γ
Hoặc: ⎟⎠
⎞ ⎜ ⎝ ⎛ − = N N N N c
n 1
2 γ Hoặc: c n γ = μ (trung bình) 2 d
n =δ 2
2
l s
n= γ 2
2
c n =γ δ
(15)Các công thức áp dụng cho quần thể vô hạn định, quần thể có kích thước đủ lớn so với cỡ mẫu, ta thấy cỡ mẫu khơng phụ thuộc vào kích thước quần thể Với quần thể hữu hạn, có kích thước khơng đủ lớn so với cỡ mẫu (thường cỡ mẫu lấy vượt 5% đến 10% kích thước quần thể)
Ví dụ: Muốn điều tra tỷ lệ tiêm chủng vaccin Sởi làng A B, làng A có trẻ làng
601
B có 300 trẻ độ tuổi điều tra Ta muốn độ xác với mức tin cậy 95% dùng công thức :
04 ,
2
) ( ) 96 , (
c p p
n= − , với p = 0,50 thì: 600
) 04 , (
) 50 , )( 50 , ( ) 96 , (
2
= =
n
Bằng trực giác, ta thấy rằng, làng A phải điều tra 600/601 trẻ, điều tra tồn bộ, làng B khơng rút 600 trẻ 300 trẻ
Trong trường hợp (quần thể hữu hạn), cỡ mẫu hiệu chỉnh theo công thức sau:
f i
f i f
N n
N n n
+ × =
Trong đó:
- nf : ước lượng cỡ mẫu cho quần thể hữu hạn;
- Nf : kích thước quần thể hữu hạn;
- Ni : cỡ mẫu cho quần thể vơ hạn định tính theo cơng thức trước Trong ví dụ trên, ta tính: ni= 600
ở làng A có Nf = 601 trẻ, thì: 300,25 301
601 600
601 600
≈ =
+ × = A nf
và làng B có Nf = 300 trẻ thì: 200
300 600
300
600 =
+ × = B
nf
Như vậy: - Ở làng A lấy 301/600 ≈ 50% dân số quần thể vào mẫu; - Ở làng B lấy 200/300 = 67% dân số quần thể vào mẫu;
Ta thấy rằng, kích thước quần thể hữu hạn giảm cỡ mẫu giảm, với tỷ lệ lấy vào mẫu lại tăng lên măc dù giữ nguyên độ xác mức tin cậy mong muốn
IV SỰ CHÍNH XÁC CỦA MỘT NGHIÊN CỨU
Trong phần trước, ta đề cập tới kích thước mẫu, cho phép đạt độ xác mong muốn theo tiêu chuẩn khác Ngược lại, ta phải biết độ xác ước lượng có kích thước mẫu định Trên thực tế, đơi người ta phải ước lượng tình trạng sức khỏe (tỷ lệ mắc bệnh chẳng hạn) dựa mẫu cố định có sẵn, ta phải trả lời xác ước lượng
Ví dụ 1: Từ ví dụ trước: n =1000; pˆ = 0,532 , ta tính được: - độ lệch chuẩn pˆ 0,0158;
(16)Từ cơng thức tính cỡ mẫu: 2
) ˆ ( ˆ ) 96 , (
c p p
n= −
, ta tính được: 1000 0,0010
) 468 , )( 532 , ( ) 96 ,
(
2 = =
c , c = 0,0309
Từ kích thước mẫu n = 1000 ví dụ này, ta nói: (1) độ lệch chuẩn ước lượng không vượt d =0,0158
(2) độ dài khoảng tin cậy ước lượng không vượt l = 0,0620
(3) khác tuyệt đối p ˆ−p không lớn c = 0,0309 với xác suất 0,95; Ví dụ 2: Từ ví dụ: X=11,13 n = 45 ta có:
- phương sai X là: s2 = 80,027; - độ lệch chuẩn X là: 1,333
- khoảng tin cậy 95% μ là: (8,52,13,74); Ta sử dụng công thức:
2 2 ) 96 , (
c
n = δ
để tính: 45 6,8303
) 027 , 80 ( ) 96 ,
(
2 = =
c c = 2,6138
Từ kích thước mẫu n = 45 ví dụ này, ta nói: (1) Độ lệch chuẩn ước lượng khơng vượt d = 1,333; (2) Độ dài khỏang tin cậy ước lượng không vượt l = 5,22;
(3) Sự khác tuyệt đối X−μ không vượt c = 2,6138 với xác suất 0,95 V CÁC GIAI ĐỌAN CHÍNH CỦA THIẾT KẾ MẪU
Quy trình thiết kế mẫu phải tiến hành theo giai đoạn sau đây:
(1) Từ mục tiêu nghiên cứu, điều tra, phải xác định rõ xác tính chất, biến số cần điều tra
(2) Xác định xác quần thể đích (TP) quần thể mà từ ta chọn mẫu Mẫu chọn để điều tra đại diện cho quần thể
(3) Xác định độ xác mong muốn (sai số chọn) để tính cỡ mẫu
(4) Tính kích thước mẫu (nhỏ hợp lý) để đạt xác nói