Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
314,69 KB
Nội dung
Thống kê xã hội học Khoa CTXH & PTCð Chương ƯỚC LƯỢNG TRUNG BÌNH VÀ TỶ LỆ Ước lượng trung bình tỷ lệ Bài tốn ước lượng Ước lượng điểm ước lượng khoảng UL khoảng trung bình tổng thể: Mẫu lớn UL khoảng trung bình tổng thể: Mẫu nhỏ UL khoảng tỷ lệ tổng thể: Mẫu lớn Xác ñịnh ñộ lớn mẫu ñối với UL trung bình Xác ñịnh ñộ lớn mẫu ñối với UL tỷ lệ 1 Bài tốn ước lượng • Phân biệt tham số tổng thể thống kê mẫu Các đo lường tóm lược tính tốn tập liệu tổng thể gọi tham số tổng thể Ví dụ trung bình tổng thể tham số tổng thể Các đo lường tóm lược tính tốn tập liệu mẫu ñược gọi thống kê mẫu Ví dụ trung bình mẫu thống kê mẫu • Việc gán giá trị cho tham số tổng thể dựa giá trị thống kê mẫu tương ứng ñược gọi ước lượng (estimation) • Ví dụ ðể điều tra thu nhập trung bình gia đình thành phố, người ta tiến hành điều tra tồn thể gia đình sống thành phố Sau tính thu nhập trung bình tổng thể µ Khi ta khơng cần đến ước lượng Tuy nhiên cách làm nhiều thời gian tốn nhiều chi phí cơng sức Người ta làm cách khác Bằng cách chọn ngẫu nhiên từ gia đình thành phố mẫu gồm n gia đình mang tính đại diện, sau tính thu nhập trung bình x mẫu Dựa giá trị x người ta gán giá trị cho thu nhập trung bình µ tổng thể Như ta có ước lượng giá trị cho tham số tổng thể dựa giá trị thống kê mẫu • Giá trị gán cho tham số tổng thể dựa giá trị thống kê mẫu gọi ước lượng (estimate) • Ví dụ Một nhà quản lý lấy mẫu gồm 40 cơng nhân vào làm tính thời gian học việc trung bình x 5,5 Nếu cô ta gán giá trị cho trung bình tổng thể 5,5 gọi mt c lng ca ã Cỏch thc c lượng bao gồm bước sau: Chọn mẫu Thu thập thơng tin từ phần tử mẫu Tính tốn giá trị thống kê mẫu Gán giá trị cho tham số tổng thể tương ứng dựa giá trị thống kê mẫu Ước lượng trung bình tỷ lệ Bài toán ước lượng Ước lượng ñiểm ước lượng khoảng UL khoảng trung bình tổng thể: Mẫu lớn UL khoảng trung bình tổng thể: Mẫu nhỏ UL khoảng tỷ lệ tổng thể: Mẫu lớn Xác ñịnh ñộ lớn mẫu ñối với UL trung bình Xác định độ lớn mẫu UL tỷ lệ Ước lượng ñiểm ước lượng khoảng • Ước lượng ước lượng ñiểm hay ước lượng khoảng • Giá trị thống kê mẫu ñược dùng ñể ước lượng tham số tổng thể ñược gọi ước lượng ñiểm (point estimate) • Ví dụ Một trung tâm nghiên cứu xã hội lấy mẫu gồm 10000 gia đình tính thu nhập tháng trung bình x mẫu 375000 đồng Sau dùng x ước lượng điểm µ, trung tâm nghiên cứu phát biểu thu nhập tháng trung bình tất gia đình khoảng 375000 đồng Cách làm gọi ước lượng điểm • Khi dùng ước lượng ñiểm, người ta thường tính giới hạn sai số kết hợp với UL điểm Chẳng hạn, ước lượng trung bình tổng thể giới hạn sai số (margin of error) tính Margin of error = ±1,96σ x or ± 1,96 s x (Trong σ x ñộ lệch chuẩn phân phối mẫu x , s x ước lượng ñiểm σ x ) • Trong việc ước lượng ñiểm, mẫu ñược chọn từ tổng thể cho giá trị thống kê mẫu khác Như vậy, giá trị gán cho tham số tổng thể việc ước lượng ñiểm phụ thuộc vào mẫu ñược chọn Ta thấy giá trị khác với giá trị ñúng (giá trị chân thực) tham số tổng thể • ðối với việc ước lượng khoảng (interval estimation), khoảng ñược xây dựng quanh ước lượng ñiểm, khoảng ñược xem khoảng có khả chứa tham số tổng thể tương ứng 10 • Ví dụ Trở lại ví dụ tính thu nhập tháng trung bình gia đình thành phố việc chọn mẫu Thay cho thu nhập tháng trung bình gia đình thành phố 375000 ñồng (tức ta cho µ = 375000 đồng), ta đưa khoảng chứa µ, chẳng hạn khoảng (275000 đồng, 475000 đồng) Khi ta nói thu nhập tháng trung bình gia đình thành phố nằm khoảng (275000 ñồng, 475000 ñồng) Cách làm ñược gọi ước lượng khoảng Giá trị 275000 ñồng gọi giới hạn khoảng 475000 ñồng giới hạn khoảng 11 µx = µ 275000 x = 375000 x 475000 12 • Vấn ñề ñặt ñối với ước lượng khoảng: - Tính khoảng chứa µ cách nào? - Khoảng chứa µ tin tưởng tới mức nào? • ðể nói lên mức ñộ tin tưởng ñối với phát biểu “khoảng chứa µ” người ta đưa mức tin cậy (confidence level) • Khoảng xây dựng với mức tin cậy kèm theo gọi khoảng tin cậy (confidence interval) • Mức tin cậy ký hiệu (1-α) 100% Các mức tin cậy thông dụng 90%, 95% 99% 13 Ước lượng trung bình tỷ lệ Bài tốn ước lượng Ước lượng điểm ước lượng khoảng UL khoảng trung bình tổng thể: Mẫu lớn UL khoảng trung bình tổng thể: Mẫu nhỏ UL khoảng tỷ lệ tổng thể: Mẫu lớn Xác ñịnh ñộ lớn mẫu ñối với UL trung bình Xác định độ lớn mẫu UL tỷ lệ 14 UL khoảng trung bình tổng thể: Mẫu lớn • ðối với mẫu có kích thước lớn (n ≥ 30), làm để tính khoảng tin cậy chứa trung bình tổng thể µ? • Trường hợp 1: Biết σ Khoảng tin cậy (1-α)100% µ x ± zσ x σx =σ / n 15 • Trường hợp 2: Khơng biết σ Khoảng tin cậy (1-α)100% µ x ± zs x sx = s / n Giá trị z dùng công thức ñược tra từ bảng phân phối chuẩn tiêu chuẩn ứng với mức tin cậy sử dụng Giá trị s x ñược xem ước lượng ñiểm σ x • ðại lượng E = zσ x (hoặc E = zs x ) công thức khoảng tin cậy ñược gọi sai số cực ñại ước lượng, ký hiệu E 16 • Ví dụ Một nhà xuất xuất sách Trước họ ñịnh giá bán sách, họ muốn biết giá bán trung bình tất sách tương tự có thị trường Bộ phận nghiên cứu NXB ñã chọn mẫu gồm 36 sách tương tự thu thập giá bán chúng Từ biết giá bán trung bình mẫu $70,50 Giả sử ñộ lệch chuẩn giá bán tất sách tương tự $4,50 17 - Tính ước lượng điểm giá bán trung bình tất sách tương tự? Giới hạn sai số ước lượng điểm bao nhiêu? - Tính khoảng tin cậy 90% giá bán trung bình tất sách tương tự? Ta có n = 36, x = $70,50 σ = $4,50 ðộ lệch chuẩn x σx = σ n = 4,50 = 0,75 36 Ước lượng ñiểm giá bán trung bình tất sách tương tự $70,50 Tức Ước lượng điểm µ = x = $70,50 18 Giới hạn sai số kết hợp với ước lượng ñiểm Giới hạn sai số = ± 1,96σ x = ±1,96(0,75) = ±$1,47 Ý nghĩa giới hạn sai số giá bán trung bình tất sách tương tự $70,50 chênh lệch tăng giảm $1,47 Bây ta tính ước lượng khoảng Mức tin cậy 90% hay 0,90 Trước hết ta tìm z ứng với mức tin cậy 90% 0,90 / = 0,4500 Tra bảng phân phối chuẩn tiêu chuẩn khơng có 0,4500 ta chọn số gần 0,4505 ứng với z = 1,65 Thay số vào công thức (ứng với trường hợp 1) 19 x ± zσ x = 70,50 ± 1,65(0,75) = 70,50 ± 1,24 = (70,50 - 1,24) to (70,50 + 1,24) = $69,26 to $71,74 Như ta có 90% tin tưởng để nói lên giá bán trung bình tất sách tương tự nằm khoảng từ $69,26 ñến $71,74 Ý nghĩa thực mức tin cậy 90% gì? Nó có nghĩa ta chọn tất mẫu có (mỗi mẫu kích thước n = 36), ứng với mẫu ta tính khoảng, ta có nhiều khoảng 90% số khoảng chứa µ 20 10 x µ x1 x3 x1 − 1,65σ x x2 − 1,65σ x x3 − 1,65σ x x3 x2 x1 x x1 + 1,65σ x x2 + 1,65σ x x3 + 1,65σ x 21 Ước lượng trung bình tỷ lệ Bài toán ước lượng Ước lượng điểm ước lượng khoảng UL khoảng trung bình tổng thể: Mẫu lớn UL khoảng trung bình tổng thể: Mẫu nhỏ UL khoảng tỷ lệ tổng thể: Mẫu lớn Xác định độ lớn mẫu UL trung bình Xác ñịnh ñộ lớn mẫu ñối với UL tỷ lệ 22 11 UL khoảng trung bình tổng thể: Mẫu nhỏ • ðối với mẫu có kích thước lớn (n ≥ 30), phân phối chuẩn ñược dùng ñể ước lượng khoảng trung bình tổng thể µ (Về mặt Tốn học, cơng thức tính khoảng tin cậy xây dựng dựa việc phân phối mẫu x phân phối xấp xỉ chuẩn, kết ñịnh lý giới hạn trung tâm) • ðối với mẫu có kích thước nhỏ (n < 30), phân phối t, gọi phân phối Student, dùng để ước lượng khoảng trung bình tổng th 23 ã Phõn phi t - Hỡnh dỏng cân ñối phân phối chuẩn - Chiều cao thấp hơn, ñộ bẹt nhiều - Tiếp cận pp chuẩn tiêu chuẩn n tăng lên - Có tham số gọi bậc tự do, ký hiệu df • Trung bình độ lệch chuẩn phân phối t - Trung bình µ = - ðộ lệch chuẩn σ = df (df − 2) • Trong phạm vi chương bậc tự phân phối t tính cơng thức df = n – 24 12 ðộ lệch chuẩn phân phối t /(9 − 2) = 1,134 ðộ lệch chuẩn phân phối chuẩn tiêu chuẩn µ=0 Phân phối t với bậc tự df = phân phối chuẩn tiêu chuẩn 25 • Tra bảng phân phối t Tìm giá trị t với bậc tự 16 vùng diện tích phía phải ñường cong phân phối t 0,05 0,05 df = 16 1,746 ðây giá trị cần tìm t 26 13 Tra bảng phân phối t Area in the Right Tail Under the t Distribution Curve df 10 05 025 … 001 3.078 6.314 12.706 … 318.309 1.886 2.920 4.303 … 22.327 1.638 2.353 3.182 … 10.215 … … … … … 16 1.337 1.746 2.120 … 3.686 … … … … … 27 • Phân phối t dùng để tính khoảng tin cậy trung bình tổng thể µ ñiều kiện sau ñây: - Tổng thể có phân phối (xấp xỉ) chuẩn - Kích thước mẫu nhỏ (n < 30) - Khơng biết độ lệch tiêu chuẩn tổng thể σ Khoảng tin cậy (1-α)100% µ x ± ts x sx = s / n Tra bảng phân phối t với bậc tự n – ứng với mức tin cậy ñã cho giá trị t 28 14 • Ví dụ Một bác sĩ muốn ước lượng mức cholesterol trung bình tất người nam trưởng thành ñang sống thành phố A Ông ta lấy mẫu gồm 25 người nam trưởng thành thành phố A tính mức cholesterol trung bình mẫu 186 với ñộ lệch chuẩn 12 Giả sử mức cholesterol tất người nam trưởng thành sống thành phố A có phân phối (xấp xỉ) chuẩn Tính khoảng tin cậy 95% trung bình tổng thể µ 29 Ta có mức tin cậy 95% 0,95 n = 25, x = 186, s = 12 sx = s 12 = = 2,40 n 25 Bậc tự df = n – = 25 – = 24 ðể tìm giá trị t bảng phân phối t ta cần tính diện tích vùng phía phải 0,5 – (0,95/2) = 0,025 Tra bảng phân phối t với 0,025 bậc tự 24 ta ñược t = 2,064 x ± ts x = 186 ± 2,064(2,40) = 186 ± 4,95 = 181,05 to 190,95 30 15 Như ta phát biểu với mức tin cậy 95% mức cholesterol trung bình tất người nam trưởng thành sống thành phố A nằm 181,05 190,95 Phân phối t df = 24 0,025 0,025 0,4750 -2,064 0,4750 2,064 t 31 Ước lượng trung bình tỷ lệ Bài toán ước lượng Ước lượng ñiểm ước lượng khoảng UL khoảng trung bình tổng thể: Mẫu lớn UL khoảng trung bình tổng thể: Mẫu nhỏ UL khoảng tỷ lệ tổng thể: Mẫu lớn Xác ñịnh ñộ lớn mẫu ñối với UL trung bình Xác ñịnh ñộ lớn mẫu ñối với UL tỷ lệ 32 16 UL khoảng tỷ lệ tổng thể: Mẫu lớn • Nhắc lại tỷ lệ tổng thể ñược ký hiệu p, tỷ lệ mẫu ñược ký hiệu pˆ • ðồng thời ta biết rằng: - Phân phối mẫu pˆ pp (xấp xỉ) chuẩn - Trung bình µ pˆ = p - ðộ lệch chuẩn σ pˆ = pq n (q = p – 1) 33 • Chú ý kết có điều kiện kích thước mẫu lớn theo nghĩa np nq ñều lớn Nếu khơng biết p q npˆ nqˆ ñều cần phải lớn Ước lượng ñiểm p • Tỷ lệ mẫu pˆ ước lượng ñiểm tỷ lệ tổng thể p tương ứng Giới hạn sai số kết hợp với ước lượng ñiểm pˆ qˆ Margin of error = ± 1,96 s pˆ với s pˆ = n ( qˆ = pˆ − ) 34 17 Ước lượng khoảng p Khoảng tin cậy (1-α)100% ñối với p pˆ ± zs pˆ s pˆ = pˆ qˆ n Giá trị z dùng cơng thức tra từ bảng phân phối chuẩn tiêu chuẩn ứng với mức tin cậy sử dụng Chú ý cơng thức tính khoảng tin cậy áp dụng điều kiện kích thước mẫu lớn tức npˆ > nqˆ > 35 • Ví dụ Theo điều tra khảo sát năm 2002 1000 người Mỹ trưởng thành cho biết có đến 20% số họ cần đến tư vấn pháp luật vấn ñề liên quan đến tranh chấp gia đình nhà cửa - Tính ước lượng ñiểm tổng thể? Giới hạn sai số ước lượng bao nhiêu? - Với mức tin cậy 99% tính xem có phần trăm người trưởng thành Mỹ cần ñến tư vấn pháp luật ñể giải vấn ñề tranh chấp gia ñình nhà cửa (trong năm 2002)? 36 18 Ta có n = 1000, pˆ = 0,20 qˆ = – 0,20 = 0,80 pˆ qˆ (0,20)(0,80) = = 0,01264911 n 1000 Ước lượng ñiểm tỷ lệ tổng thể p pˆ = 0,20 s pˆ = Chú ý npˆ > nqˆ > Giới hạn sai số kết hợp với ước lượng ñiểm ± 1,96s pˆ = ±1,96(0,01264911) = ±0,25 = ±2,5% Giới hạn sai số phát biểu tỷ lệ tất người Mỹ trưởng thành cần ñến tư vấn pháp luật năm 2002 20% tăng giảm khoảng 2,5% 37 Với mức tin cậy 99% hay 0,99 để tìm giá trị z ta chia 0,99 / = 0,4950 Dùng 0,4950 tra bảng phân phối chuẩn tiêu chuẩn ta ñược z xấp xỉ 2,58 pˆ ± zs pˆ = 0,20 ± 2,58(0,01264911) = 0,20 ± 0,033 = 0,167 to 0,233 or 16,7% to 23,3% Ta phát biểu với mức tin cậy 99% có khoảng từ 16,7% đến 23,3% người Mỹ trưởng thành cần ñến tư vấn pháp luật năm 2002 ñể giải vấn ñề tranh chấp gia ñình nhà cửa 38 19 Ước lượng trung bình tỷ lệ Bài tốn ước lượng Ước lượng điểm ước lượng khoảng UL khoảng trung bình tổng thể: Mẫu lớn UL khoảng trung bình tổng thể: Mẫu nhỏ UL khoảng tỷ lệ tổng thể: Mẫu lớn Xác ñịnh ñộ lớn mẫu ñối với UL trung bình Xác ñịnh ñộ lớn mẫu ñối với UL tỷ lệ 39 Xác ñịnh ñộ lớn mẫu UL tr.bình • Ta biết sai số cực ñại ước lượng khoảng ñối với µ E = zσ x = z σ n • Từ cơng thức ta suy z 2σ n= E 40 20 • Như với mức tin cậy cho trước biết ñược độ lệch chuẩn tổng thể kích thước mẫu sinh sai số cực ñại E ước lượng khoảng µ là: z 2σ n= E (Nếu ta khơng biết σ ta chọn tạm mẫu sơ có kích thước tính s sau dùng s thay cho σ) • Ví dụ Sinh viên Mỹ thường phải vay tiền phủ để học ñại học sau tốt nghiệp xem nợ tiền phủ 41 Một hội cựu sinh viên muốn ước lượng khoảng tiền nợ trung bình sinh viên tốt nghiệp năm phủ Biết độ lệch chuẩn tổng thể tiền nợ sinh viên tốt nghiệp năm $11800 Hỏi nên chọn mẫu có độ lớn để giá trị ước lượng với mức tin cậy 99% nằm khoảng $800 so với trung bình tổng thể? Nói cách khác, hội cựu sinh viên muốn có khoảng tin cậy 99% với ước lượng khoảng x ± 800 tiền nợ trung bình sinh viên tốt nghiệp năm Ta có sai số cực ñại ước lượng E = $800, σ = $11800 z = 2,58 (ứng với 99%) 42 21 ðộ lớn mẫu tính bởi: z 2σ (2,58) (11.800) n= = E (800) = 1448,18 ≈ 1449 Như hội cựu sinh viên chọn mẫu ngẫu nhiên gồm 1449 sinh viên tốt nghiệp năm nay, tính tiền nợ trung bình mẫu này, lấy khoảng tin cậy 99% xung quanh tiền nợ trung bình mẫu sai số cực đại ước lượng xấp xỉ $800 43 Ước lượng trung bình tỷ lệ Bài tốn ước lượng Ước lượng điểm ước lượng khoảng UL khoảng trung bình tổng thể: Mẫu lớn UL khoảng trung bình tổng thể: Mẫu nhỏ UL khoảng tỷ lệ tổng thể: Mẫu lớn Xác ñịnh ñộ lớn mẫu ñối với UL trung bình Xác ñịnh ñộ lớn mẫu ñối với UL tỷ lệ 44 22 Xác ñịnh ñộ lớn mẫu ñối với UL tỷ lệ • Lập luận tương tự trường hợp ước lượng trung bình, sai số cực đại ước lượng khoảng ñối với tỷ lệ tổng thể p E = zσ pˆ = z • Từ cơng thức ta suy pq n z pq n= E2 45 • Trong trường hợp ta khơng biết giá trị p q, ta áp dụng cơng thức theo hai cách sau đây: - Cho p = 0,5 q = 0,5 Khi với giá trị E cho trước giá trị p q ñược gán cho ta ñộ lớn mẫu lớn - Chọn mẫu sơ có kích thước Tính giá trị pˆ qˆ ñối với mẫu Sau dùng giá trị để tính độ lớn mẫu 46 23 • Ví dụ Một cơng ty vừa lắp ñặt máy sản xuất phận dùng đồng hồ Cơng ty muốn ước lượng tỷ lệ hư hỏng số phận máy tạo Các nhà quản lý công ty muốn ước lượng nằm khoảng 0,02 so với tỷ lệ mẫu với mức tin cậy 95% Hỏi nên lấy mẫu có độ lớn bao nhiêu? Các nhà quản lý cơng ty muốn khoảng ước lượng 95% tỷ lệ hư hỏng số phận ñược chế tạo từ máy lặp ñặt là: pˆ ± 0,02 47 Ta giá trị p q Ta cho p = 0,5 q = 0,5 Còn E = 0,02 Với mức tin cậy 95% dị z = 1,96 Áp dụng cơng thức ta tính độ lớn mẫu là: z pq (1,96) (0,50)(0,50) n= = = 2401 E (0,02) Như công ty lấy mẫu 2401 phận có đến 95% hội ước lượng p nằm khoảng 0,02 so với tỷ lệ mẫu 48 24 Tóm lại, tìm hiểu … Bài tốn ước lượng Ước lượng điểm ước lượng khoảng UL khoảng trung bình tổng thể: Mẫu lớn UL khoảng trung bình tổng thể: Mẫu nhỏ UL khoảng tỷ lệ tổng thể: Mẫu lớn Xác ñịnh ñộ lớn mẫu ñối với UL trung bình Xác ñịnh ñộ lớn mẫu ñối với UL tỷ lệ 49 T h a n k s 50 25 ... khác với giá trị ñúng (giá trị chân thực) tham số tổng thể • ðối với việc ước lượng khoảng (interval estimation), khoảng ñược xây dựng quanh ước lượng ñiểm, khoảng ñược xem khoảng có khả chứa tham... (confidence level) • Khoảng xây dựng với mức tin cậy kèm theo gọi khoảng tin cậy (confidence interval) • Mức tin cậy ký hiệu (1-α) 100% Các mức tin cậy thông dụng 90%, 95% 99% 13 Ước lượng trung... ta chọn tạm mẫu sơ có kích thước tính s sau dùng s thay cho σ) • Ví dụ Sinh viên Mỹ thường phải vay tiền phủ để học ñại học sau tốt nghiệp xem nợ tiền phủ 41 Một hội cựu sinh viên muốn ước lượng