Phần 1 của tài liệu Xác suất và thống kê toán: Hướng dẫn giải bài tập có nội dung gồm 5 chương, trình bày về: biến cố, xác suất của biến cố; đại lượng ngẫu nhiên và quy luật phân phối xác suất; một số quy luật phân phối xác suất; lý thuyết mẫu; ước lượng các tham số của đại lượng ngẫu nhiên;... Mời các bạn cùng tham khảo!
Phép thử và biến cố
Khi tiến hành một tập hợp các điều kiện xác định mà kết quả không thể dự đoán trước, chúng ta gọi đó là việc thực hiện một "phép thử".
Khi một phép thử được thực hiện thì có nhiều kết cục khác nhau có thể xảy ra, ta gọi mỗi kết cục đó là một biến cố.
Ví dụ 1.1 Gieo một đồng tiền là thực hiện một phép thử Các kết cục: "Xuất hiện mặt sấp", "Xuất hiện mặt ngửa" là các biến cố.
Việc lấy ba sản phẩm từ một lô hàng để kiểm tra là một phép thử quan trọng Kết quả cho thấy cả ba sản phẩm đều đạt tiêu chuẩn chất lượng.
Trong ba sản phẩm được lấy ra, có hai sản phẩm đạt tiêu chuẩn, và trong số ba sản phẩm này, ít nhất một sản phẩm cũng đạt tiêu chuẩn Những thông tin này thể hiện các biến cố quan trọng liên quan đến chất lượng sản phẩm.
Biến cố nhất định xảy ra khi phép thử được thực hiện được gọi là biến cố chắc chắn, kí hiệu là u.
Biến cố nhất định không xảy ra khi phép thử được thực hiện được gọi là biến cố không thể có, kí hiệu là V hoặc 0.
Biến cố có thể xảy ra hoặc không xảy ra khi thực hiện phép thử được gọi là biến cố ngẫu nhiên, kí hiệu là A, B, c
Tổng của hai biến cố A và B là một biến cố xảy ra khi và chỉ khi ít nhất một trong hai biến cố này xảy ra, kí hiệu A + B hoặc A u B.
Tích của hai biến cố A và B là một biến cố xảy ra khi và chỉ khi cả hai biến cố này đồng thời xảy ra, kí hiệu A.B hoặc An B.
Hai biến cố A và B được gọi là xung khắc nếu chúng không thể cùng xảy ra trong một phép thử Như vậy nếu A và B xung khắc thì A.B = V.
Hai biến cố A và B được gọi là đối lập nếu thỏa mãn hai điều kiện:
• A và B là hai biến cố xung khắc: A.B = V
• Khi thực hiện phép thử thì nhất thiết một trong chúng phải xảy ra:
Chú ý 1.1 Biến cố đối lập với biến cố A kí hiệu là A.
Các biến cố A1, A2, A3, An được gọi là lập thành một hệ đầy đủ các biến cố nếu thỏa mãn hai điều kiện:
• Chúng xung khắc từng đôi: AịAj = V với Ví j.
• Khi thực hiện phép thử thì nhất thiết một trong chúng phải xảy ra : i = l
Các định nghĩa về xác suất
Định nghĩa cổ điển
Giả sử trong một phép thử có n kết cục đồng khả năng, trong đó có m kết cục thuận lợi cho biến cố A xảy ra.
Định nghĩa thống kê
Lặp lại n lần một phép thử, gọi m(A) là số lần xuất hiện biến cố A trong n phép thử đó Khi đó /(A) = — - được gọi là tần suất xuất hiện biến cốm(A) n
Khi số phép thử n lớn, tần suất xuất hiện của biến cố A sẽ dao động nhẹ quanh một giá trị không đổi p Giá trị p này được xác định là xác suất của biến cố A.
Trong thực tế khi n khá lớn, ta lấy: P(A) ~ /(A)
Tính chất của xác suất
Trong một lô hàng gồm 15 sản phẩm, có 12 sản phẩm tốt và 3 sản phẩm xấu Khi lấy ngẫu nhiên 2 sản phẩm, xác suất để có một sản phẩm tốt và một sản phẩm xấu là 0.48 Ngược lại, xác suất để cả hai sản phẩm đều xấu là 0.04.
Lời giải. a Gọi A là biến cố trong hai sản phẩm lấy ra có 1 sản phẩm tốt và 1 sản phẩm xấu Theo định nghĩa cổ điển, ta có:
P(A) Trong đó n là số kết cục đồng khả năng của phép thử n = cĩ5 = = 105
Số cách lấy 2 sản phẩm từ lô là 15, trong đó m là số kết cục thuận lợi cho biến cố A, tức là số cách chọn ra hai sản phẩm với 1 sản phẩm tốt và 1 sản phẩm xấu.
343 b Gọi B là biến cố có hai sản phẩm tốt Tương tự như trên ta có:
Ví dụ 1.4 Trong một thùng hàng gồm 6 sản phẩm loại I và 4 sản phẩm loại
II Chia ngẫu nhiên thành hai phần bằng nhau về số lượng Tìm xác suất để mỗi phần đều có số sản phẩm loại I và loại II như nhau.
Lời giải Gọi A là biến cố mỗi phần đều có số sản phẩm loại I và loại II như nhau.
Số kết cục đồng khả năng đại diện cho số cách phân chia thùng hàng thành hai phần, mỗi phần chứa 5 sản phẩm Điều này tương đương với việc chọn 5 sản phẩm từ tổng số 10 sản phẩm có trong thùng, được tính bằng công thức n = C(10, 5).
Số kết cục thuận lợi cho biến cố A là cách lấy 5 sản phẩm từ thùng để trong đó có 3 sản phẩm loại I và 2 sản phẩm loại II: m = CgC?.
Theo định nghĩa cổ điển, ta có: P(A) = CềCl
Các định lí về xác suất
Công thức cộng xác suất
Với hai biến cố A và B bất kì, ta luôn có:
P(A + B) = P(A) + P(P) - P(ÂB) Chú ý 1.2 Nếu A và B là hai biến cố xung khắc (A.B = V) thì:
+ (-l)"- 1 P(AA2 An ) Chú ý 1.4 Nếu các biến cố A1, t42, .An xung khắc từng đôi, khi đó ta có:
Xác suất có điều kiện
Xác suất của biến cố A, khi biến cố B đã xảy ra, được gọi là xác suất có điều kiện và được ký hiệu là P(A/B).
Trong trường hợp P(B) > 0, ta có:
Hai biến cố A và B được coi là độc lập nếu sự xảy ra hoặc không xảy ra của biến cố này không ảnh hưởng đến xác suất xảy ra của biến cố kia.
Chú ý 1.5 Nếu thêm điều kiện P(A) > 0 và P(A) > 0 thì từ (1) ta có thể suy ra (2) Như vậy, nếu các điều kiện P(A) > 0, P(A) > 0, P(B) > 0 và P(B) > 0 được thỏa mãn thì (1) và (2) tương đương.
Nếu các biến cố A và B là độc lập, thì chúng cũng độc lập với nhau, bao gồm cả A và B, cũng như A hoặc B Các biến cố A1, A2, A3, , An được gọi là độc lập toàn phần nếu mỗi biến cố trong tập hợp này độc lập với tích của tất cả các biến cố còn lại.
Công thức nhân xác suất
Cho hai biến cố A và B, ta có:
Nếu cho n biến cố A ị ,A2, Â3, An thì:
Chú ý 1.7 Nếu Ä1, ư42, A3 j4n độc lập thì:
Trong ví dụ này, có hai cửa hàng kinh doanh độc lập cùng một loại hàng hóa, với xác suất phá sản lần lượt là 0,01 và 0,02 Để tính xác suất xảy ra các biến cố, ta có thể xác định xác suất có một cửa hàng nào đó bị phá sản (biến cố A), ít nhất một cửa hàng bị phá sản (biến cố B), và có nhiều nhất một cửa hàng bị phá sản (biến cố C).
Lời giải Gọi Ai là biến cố cửa hàng thứ i bị phá sản (ỉ = 1,2) a Ta có: A — j4j.j42 + j4j.j42
Ví dụ 1.6 Có hai hộp sản phẩm:
Hộp I đựng 10 sản phẩm tốt và 2 phế phẩm.
Hộp II đựng 8 sản phẩm tốt và 4 phế phẩm.
Để tính xác suất cho việc lấy ra hai sản phẩm từ mỗi hộp, chúng ta cần xác định xác suất của hai biến cố quan trọng Đầu tiên, xác suất để trong hai sản phẩm lấy ra có một phế phẩm (biến cố i4) có thể được tính toán dựa trên số lượng phế phẩm và sản phẩm đạt tiêu chuẩn trong mỗi hộp Thứ hai, xác suất để cả hai sản phẩm cùng loại (biến cố BỴ) cũng cần được xem xét, điều này phụ thuộc vào tỷ lệ sản phẩm của từng loại trong hộp Việc phân tích các xác suất này sẽ giúp hiểu rõ hơn về chất lượng sản phẩm và khả năng xảy ra các tình huống khác nhau trong quá trình lựa chọn.
Lời giải Gọi Ai là biến cố sản phẩm lấy ra từ hộp i là tốt (¿ = 1,2) a Ta có: A = j4j.j42 + ĩ4i.242
Suy ra: P(A) = P(A,).P(Ã2) + P(Ã,).P(A2) = i! A + A JL = AL ử 0,39 b Ta có: B — A1.A2 “1“ A1.A2
Ví dụ 1.7 Một tổ có 9 sinh viên trong đó có 3 nữ được chia ngẫu nhiên thành
3 nhóm, mỗi nhóm 3 người Tìm xác suất để nhóm nào cũng có một sinh viên nữ.
Lời giải Gọi A là biến cố nhóm nào cũng có 1 nữ.
Gọi Aị là biến cố nhóm thứ i có 1 nữ (ĩ = 1,3).
Trong ví dụ 1.8, một thủ kho có chùm chìa khóa gồm 9 chìa, trong đó có 2 chìa mở được kho Người thủ kho thử từng chìa một để mở cửa, và không thử lại chìa đã thử Xác suất để mở được cửa kho trong lần thử thứ 4 là một vấn đề cần phân tích, cũng như xác suất để mở cửa kho trong không quá 3 lần thử.
Lời giải Gọi 4j là biến cố thử lần thứ i mở được kho (i = 1,4). a Gọi A là biến cố đến lần thứ 4 thì mở được cửa kho.
72 b Gọi B là biến cố thử không quá 3 lần thì mở được kho.
Công thức xác suất đầy đủ và công thức Bayes
Công thức xác suất đầy đủ
Giả sử H1, H2, Hn là một hệ thống đầy đủ các biến cố Khi biến cố A xảy ra đồng thời với một trong các biến cố này, xác suất của A được tính bằng công thức: p(A) = Σ p(Hi) (i=1 đến n).
Đại lượng ngẫu nhiên và quy luật phân phối xác suất 21
Khái niệm
2.1.1 Định nghĩa Đại lượng ngẫu nhiên (ĐLNN) là đại lượng mà khi phép thử được thực hiện nó chỉ nhận một giá trị nào đó trong các giá trị có thể có của nó với một xác suất tương ứng xác định. ĐLNN được gọi là rời rạc nếu tập giá trị của nó là hữu hạn hay vô hạn đếm được. ĐLNN được gọi là liên tục trên một khoảng nếu tập giá trị của nó lấp đầy khoảng đó.
2.1.2 Quy luật phân phối xác suất của ĐLNN
Quy luật phân phối xác suất của ĐLNN xác định mối quan hệ giữa các giá trị khả dĩ của ĐLNN và xác suất tương ứng của chúng.
Quy luật phân phối xác suất của ĐLNN rời rạc thường được cho dưới dạng bảng và gọi là bảng phân phối xác suất.
Trong đó ta kí hiệu ĐLNN là X còn Xi là các giá trị có thể có của nó,
Vì (X = Tl), (X = x2), , (X = xn) tạo thành một hệ đầy đủ các biến cố, nên tổng xác suất của chúng là 1 Đối với phân phối xác suất liên tục, bảng phân phối không thể sử dụng để biểu diễn quy luật phân phối Để giải quyết vấn đề này, các khái niệm mới như hàm phân phối xác suất và hàm mật độ xác suất đã được giới thiệu.
Hàm phân phối và hàm mật độ xác suất
2.2.1 Hàm phân phối xác suất
Hàm phân phối xác suất của ĐLNN X kí hiệu F(x) và được định nghĩa:
F(x) = P(x < x), ĩễR Hàm phân phối xác suất có các tính chất sau:
2) F(x) là hàm khụng giảm, tức là nếu Xi < X2 thỡ F(ổi) < F(x2)
Hệ quả 2.2 Nếu F(x) là liên tục thì P(X = a) = 0 Vậy nếu F(x) là liên tục thì:
2.2.2 Hàm mật độ xác suất
Giả sử biến ngẫu nhiên liên tục X có hàm phân phối F(x) và tồn tại đạo hàm F'(x) trên R (trừ một số hữu hạn điểm) Khi đó, F'(x) được gọi là hàm mật độ xác suất của biến ngẫu nhiên X và được ký hiệu là f(x).
Hàm mật độ xác suất có các tính chất sau:
Một số quy luật phân phối xác suất 34
Phân phối nhị thức
Một dãy n phép thử độc lập, trong đó xác suất xảy ra biến cố A là p, được gọi là dãy phép thử Bernoulli hay lược đồ Bernoulli.
Nếu gọi X là số lần xuất hiện biến cố A trong lược đồ Bernoulli thì X là ĐLNN rời rạc có thể nhận các giá trị 0,1,2,3, , n và : p(x = k) = Pn(k) = ckpkqn~k, q = 1 - p, k = 0,1,2 n
3.1.2 Định nghĩa ĐLNN rời rạc X đừợc gọi là phân phối theo quy luật nhị thức, kí hiệu
X ~ B(n,p) nếu nó có thể nhận một trong các giá trị 0,1, , n với xác suất tương ứng:
Chú ý 3.1 Trong trường hợp X ~ B(n,p) với n = 1 ta nói X phân phối theo quy luật không — một, kí hiệu X ~ A( jj ) Khi đó bảng phân phối xác suất của
Nếu X ~ B(n,p) thì E(X) = np,Var(X) = npq Còn Mod(X) là số nguyên thỏa mãn điều kiện : np — q < ModựC) < np + p
Trong ví dụ 3.1, khi ném một quả bóng vào rổ 10 lần độc lập với xác suất trúng rổ là 0,7, chúng ta cần xác định một số xác suất quan trọng Đầu tiên, xác suất có hai lần trúng rổ được tính toán Tiếp theo, chúng ta cần tìm xác suất có ít nhất hai lần trúng rổ Thêm vào đó, số lần trúng rổ trung bình cũng cần được xác định Cuối cùng, chúng ta sẽ tìm số lần ném trúng rổ có khả năng xảy ra nhất trong 10 lần ném này.
Lời giải Gọi X là số lần ném trúng rổ, khi đó X là ĐLNN rời rạc có thể nhận các giá trị: 0,1,2, , 10
Do các lần ném là độc lập và xác suất ném trúng trong môi lần đều bằng 0,7 suy ra : X ~ B(10; 0,7)
0,999856 c E(X) = np = 10.0,7 = 7 Vậy trung bình có 7 lần trúng rổ. d Ta có 7 — 0,3 < ModỌC) < 7 + 0,7 Suy ra ModỌC) = 7 Vậy số lần ném trúng rổ có khả năng nhất là 7 lần.
Phân phối Poisson
3.2.1 Định nghĩa ĐLNN rời rạc X được gọi là phân phối theo quy luật Poisson nếu nó có the nhận một trong các giá trị 0,1,2, , n, với các xác suất tương ứng: p-x Xk P(X = k) = -^~, k = 0,1,2 trong đó A > 0 là tham số.
Nếu X có phân phối Poisson với tham số A ta kí hiệu X PW-
Nếu X ~ P(A) thì F(X) = A,Var(X) = A Còn Mod(X) là số nguyên thỏa mãn điều kiện : A — 1 < Mod(X) < A
3.2.3 Mối liên hệ giữa phân phối nhị thức và phân phối
Giả sử X ~ B(n,p) Khi n lớn, p khá bé thì X có phân phối xấp xỉ phân phối Poisson với tham số A = np Khi đó:
Trong một trạm điện thoại tự động trung bình, có 240 lần gọi trong một giờ, tương đương với 4 lần gọi mỗi phút Để tính xác suất không có lần nào gọi trong 1 phút, ta sử dụng phân phối Poisson với λ = 4 Ngoài ra, để tìm xác suất có từ 2 đến 3 lần gọi trong cùng khoảng thời gian, cũng áp dụng phân phối Poisson với các giá trị tương ứng.
Lời giải Gọi X là số lằn gọi điện thoại trong 1 phút.
Lý thuyết mẫu 54
Các đặc trưng mẫu quan trọng
3) Nếu 11 là giá trị quan sát nhỏ nhất và Xk là giá trị quan sát lớn nhất của X trẽn mẫu thì F*(x) — 0 với X < X1 và F*(x) — 1 với X > Xk Ngoài ra còn có những phương pháp mô tả mẫu khác (xem [1], trang 133).
4.2 Các đặc triíUg mẫu quan trọng
Để nghiên cứu một dấu hiệu X trong một đám đông, ta ký hiệu E(X) = n và Var(X) = σ² Từ đám đông, ta sẽ lấy một mẫu ngẫu nhiên có kích thước n, được biểu diễn dưới dạng w = (X1, X2, , Xn).
4.2.1 Trung bình mẫu Định nghĩa 4.3 Trung bình mẫu, kí hiệu là X được định nghĩa bằng công thức:
Trung bình mẫu là giá trị trung bình cộng của n dữ liệu ngẫu nhiên, do đó nó cũng được coi là một dữ liệu ngẫu nhiên Khi thực hiện lấy mẫu ngẫu nhiên, chúng ta nhận được một giá trị cụ thể w = (x1, x2, , xn).
1 n thì trung bình mẫu cũng nhận một giá trị cụ thể: X = 3 52 n i=i
_ 1 k hoặc X — £■ 52 nixi nếu có bảng 4.1.
Trung bình mẫu có các tính chất: ì
Suy ra: ơ-ỵ — yJvar(X') — -^=, nếu mẫu được lấy theo cặch có hoàn lại
_ , v r N — n ơ2 Đối với mẫu ỉấy theo cách không hoàr lại ta có; Var(X} - ——7.— Khi
' N — Tỉ - s n rất nhỏ so với N thì ~ 1, nên khi đó mặc dù mẫu lấy không hoàn lại nhưng ta vẫn có thể dùng công thức (4.2).
4.2.2 Phương sai mẫu và phương sai mẫu điều chỉnh Định nghĩa 4.4 Phương sai mẫu, kí hiệu là s*2 được định nghĩa bằng công thức:
Phương sai mẫu có tính chất: EÍS2) = — -ơ2 Định nghĩa 4.5 Phương sai mẫu điều chỉnh, kí hiệu s12 và được định nghĩa:
Từ tính chất của phương sai mẫu, ta có : E(S/2} = ơ2.
Khi làm việc với phương sai mẫu, cần chú ý rằng s² và S'² là những đại lượng ngẫu nhiên Khi mẫu ngẫu nhiên nhận giá trị cụ thể w = (x₁, x₂, , xₙ), phương sai mẫu s² và phương sai mẫu điều chỉnh S'² cũng sẽ có giá trị cụ thể, được tính theo công thức s² = (1/n) Σ(xᵢ - x̄)².
- - 1 53 nị(xi — x)2 nếu có bảng 4.1 n - 1 i=í
Chú ý 4.1 Ta có thể tính s'2 theo công thức: s'2 = ——- n — 1
Chú ý 4.2 Để tính giá trị của phương sai mẫu cũng như phương sai mẫu điều chỉnh người ta còn dùng công thức sau:
L i=ỉ Định nghĩa 4.6 Căn bậc hai của phương sai mẫu được gọi là độ lệch tiêu chuẩn mẫu và được kí hiệu là s.
Căn bậc hai của phương sai mẫu điều chỉnh được gọi là độ lệch tiêu chuẩn mẫu điều chỉnh và được kí hiệu là S'.
Độ lệch tiêu chuẩn mẫu và độ lệch tiêu chuẩn mẫu điều chỉnh là những đại lượng thống kê quan trọng Trong một mẫu cụ thể, giá trị của chúng được ký hiệu là s và s' Công thức tính độ lệch tiêu chuẩn mẫu là s = √(Σ(xi - x̄)²), trong khi độ lệch tiêu chuẩn mẫu điều chỉnh được tính bằng công thức s' = √(Σ(xi - x̄)² / (n - 1)).
Trong trường hợp các giá trị của X được phân chia thành từng lớp, cần lấy giá trị trung tâm của mỗi lớp để đại diện cho lớp đó Điều này giúp tính toán các đặc trưng mẫu và tìm hàm phân phối thực nghiệm một cách chính xác.
Ví dụ 4.1 Theo dõi doanh thu của 25 cửa hàng bán lẻ cùng một mặt hàng được kết quả :
Doanh thu (triệu đồng/ngày) Số cửa hàng
Hãy tính trung bình mẫu và độ lệch tiêu chuẩn mẫu điều chỉnh.
Lời giải Lập bảng tính toán:
Từ đó, ta tính được X = 3 X) TiiXi - = 15,32
Ước lượng các tham số của ĐLNN 66
Ước lượng điểm
Để ước lượng tham số ớ, ta cần lấy mẫu từ đám đông, ký hiệu là w = (X1, X2, , Xn) Từ mẫu này, chúng ta sẽ xây dựng một thống kê ớ* = f(X1, X2, , Xn) phù hợp Để có được ước lượng điểm, chỉ cần điều tra một mẫu cụ thể w = (xi, X2, , xn) với kích thước n đủ lớn, sau đó tính toán ớ* = f(xi, X2, , xn).
Có nhiều phương pháp để chọn thống kê ước lượng Thông thường, người ta sử dụng hàm ước lượng để xác định các đặc trưng mẫu tương ứng Ví dụ, trung bình mẫu X được dùng để ước lượng trung bình của đám đông, ký hiệu là E(X) Tương tự, phương sai mẫu điều chỉnh s'2 được áp dụng để ước lượng phương sai của đám đông, ký hiệu là Var(X) Cuối cùng, tần suất mẫu f được sử dụng để ước lượng tỷ lệ của đám đông, ký hiệu là p Các tiêu chuẩn này phản ánh bản chất tốt của ước lượng.
Thống kê ớ* được gọi là ước lượng không chệch của ớ nếu E(0*) = ỡ Nếu
E(0*) Ỷ s thì ớ* được gọi là ước lượng chệch của ớ.
Thống kê ớ* được gọi là ước lượng vững của 0 nếu với mọi e > 0, nhỏ tùy ý ta luôn có: lim p(|ớ* -ỡ| < e) = 1 n—>oo 1 1
Thống kê ớ* được gọi là ước lượng hiệu quả của tham số ỡ của ĐLNN gốc
X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trẽn cùng mẫu đó.
Ví dụ 5.1 x,s'2,f là những ước lượng không chệch, ước lượng vững, ước lượng hiệu quả tương ứng của ịi, ơ và p.
Nếu 9’ và Ớ2 là hai ước lượng không chệch của 9 nhưng Var(ớ]') < Var(oỵ) thì 9ý sẽ là ước lượng không chệch tốt hơn.
Khái niệm về ước lượng bằng khoảng tin cậy
cậy Để ước lượng tham số ỡ của ĐLNN X trước hết từ đám đông ta lấy ra mẫu ngẫu nhiên w = (Xj, x2, ■ , xn).
Tiếp theo, chúng ta xây dựng thống kê G = /(X1, x2, • • •, Xn, ớ) với quy luật phân phối xác suất của G được xác định hoàn toàn, không phụ thuộc vào tham số ớ Để đạt được xác suất 7 = 1 — a, chúng ta xác định cặp giá trị 0 và 30), ta có thể thay ơ bằng ước lượng không chệch tốt nhất của nó là s'.
Chú ý 5.2 Trong trường hợp biết /z, cần ước lượng X, biến đổi tương đương (5.2), ta có:
Vậy khoảng tin cậy của X là: (fj, — e; p + e)
Trọng lượng của gói hàng do máy tự động đóng được xác định là một đại lượng ngẫu nhiên phân phối chuẩn với độ lệch tiêu chuẩn là 20 gam Qua việc cân ngẫu nhiên 16 gói hàng do máy đóng, kết quả tính được là X = 997 gam.
1) Với độ tin cậy 99% hãy ước lượng trọng lượng trung bình của gói hàng do máy đóng.
2) Nếu yêu cầu ước lượng trọng lượng trung bình của gói hàng đạt độ tin cậy 95% và sai số không vượt quá 5 gam thì cần cân thử bao nhiêu gói?
1) Gọi X là trọng lượng của gói hàng do máy đóng.
Gọi X là trọng lượng trung bình của gói hàng trên mẫu.
Gọi ụ là trọng lượng trung bình của gói hàng trên đám đông
Vì X có phân phối chuẩn nên X n
Ta tìm được phân vị chuẩn Ui, sao cho:
P(|Ỉ7| < ưa) — 1 - a — 7 Thay biểu thức của u vào công thức trên, ta có:
Vì 1 — a — 0,99 => Uị = u0,005 = 2,58 Theo giả thiết, ta có: ơ = 20, n =
Khoảng tin cậy 0,99 của ụ, đối với mẫu cụ thể là (997 — 12,9; 997 + 12,9) hay (984,1;1009,9)
Kết luận: Với độ tin cậy 99% ta có thể nói rằng trọng lượng trung bình của các gói hàng nằm trong khoảng (984, lgam; 1009,9gam). ơ Ơ2ÚỈ
Để đảm bảo ước lượng đạt độ tin cậy 95% với sai số không vượt quá 5 gam, cần điều tra ít nhất 62 gói hàng Khoảng tin cậy được tính bằng công thức Oi - 0,02 - Ot, nhằm ước lượng giá trị tối thiểu của /ì.
Ta vẫn dùng thống kê (5.1) Với độ tin cậy 7 = 1 — 0 cho trước ta tìm được phân vị chuẩn ua sao cho:
Thay biểu thức của u từ (5.1) vào công thức trên, ta có:
Như vậy, khoảng tin cậy phải với độ tin cậy 7 = 1 — a của fj, là: c Khoảng tin cậy trái (lấy Oi =0,02 = 0, dùng để ước lượng giá trị tối đa của Ặí)
Ta cũng dùng thống kê (5.1) Với độ tin cậy 7 = 1 — 0 cho trước ta tìm được ua sao cho:
Thay biểu thức của u từ (5.1) vào công thức trên, ta có: p(-ua < = 1-0 = 7 y/ủ
Như vậy, khoảng tin cậy trái với độ tin cậy 7 = 1 — 0 của ịi là:
Trong một nghiên cứu về doanh thu của cửa hàng, dữ liệu trong 16 ngày cho thấy doanh thu trung bình hàng ngày đạt 18 triệu đồng Với độ tin cậy 99%, cần ước lượng doanh thu trung bình tối thiểu của cửa hàng, biết rằng doanh thu có phân phối chuẩn với độ lệch tiêu chuẩn là 2 triệu đồng.
Lời giải Gọi X là doanh thu của cửa hàng.
Gọi X là doanh thu trung bình của cửa hàng trên mẫu.
Gọi ụ là doanh thu trung bình của cửa hàng trên đám đông Vì X có phân
2 phối chuẩn nên X ~ N(fi, —), khi đó: n y/n
Ta tìm được phân vị chuẩn ua, sao cho: p(ư < Ua) — 1 — a = 7 o P(X y=ua < = 1 — a = "Ỵ
Vì 1 — a = 0,99 => ua — Uo.oi = 2,33 Ta có khoảng tin cậy phải 99% của ỊJ, là: (18 — ^.2,33; +oo) hay (16, 835; +oo).2
Vậy với độ tin cậy 99% ta có thể nói rằng doanh thu trung bình tối thiểu của cửa hàng là 16,835 triệu đồng.
5.3.2 ĐLNN X phân phối theo quy luật chuẩn với ơ 2 chưa biết
Vì X có phân phối chuẩn nên:
(5.4) a Khoảng tin cậy đối xứng (lấy Oi = a2 — —)
Với độ tin cậy 7 = 1 — a cho trước ta tìm được phân vị sao cho:
Thay biểu thức của T vào công thức trên, ta có:
6 = sl là sai số của ước lượng , yời 2
Khoảng tin cậy ngẫu nhiên của fỉ được xác định bởi (X — e < fi < X + e) Trong phần này, chúng ta cần giải quyết ba bài toán tương tự như ở mục 5.3.1 Đặc biệt, bài toán 3 về xác định kích thước mẫu sẽ được xử lý bằng phương pháp mẫu kép.
Bước 1- Điều tra một mẫu sơ bộ kích thước k không lớn lắm:
Từ mẫu này ta tính được X = — 52 Xi và s'2 = -—- 52C^i — X)2. k i=i k — 1 j=i Bước 2: Giả sử mầu cần tìm có kích thước là n: w2 = (X1, x2ì , Xn), ta có: 1 "
Vì vậy có thể tìm được phân vị tí-1) sao cho:
Thay biểu thức của T vào công thức trên và biến đổi, ta được:
Sai số của ước lượng sẽ là: e = —7=ta-1), suy ra TI = —ta-1 • Đó chính y/n 2 L e 2 J là giá trị tối thiểu của kích thước mẫu cần tìm.
Trong thực hành, khi đã có mẫu sơ bộ kích thước k, chỉ cần tiến hành điều tra thêm mẫu kích thước n - k là đủ Đồng thời, khoảng tin cậy cần được xác định bằng cách sử dụng Oi - 0 và a2 - a để ước lượng giá trị tối thiểu của jiz.
Vẫn dùng thống kê (5.4) với độ tin cậy 7 = 1 — a cho trước, tìm ta"-1) sao cho:
Thay biểu thức T từ (5.4) vào công thức trên, ta có: p(^_Íỉ 30, tuy vẫn có thể dùng thống kê (5.4) song người ta thường dựng thống kờ (5.1) và lấy ơ ô s' (s' là ước lượng khụng chệch tốt nhất của ơ).
Chiều cao của nam thanh niên tại một địa phương được xác định là một đại lượng ngẫu nhiên phân phối chuẩn Qua khảo sát 25 nam thanh niên, chiều cao trung bình được tính là 169 cm, với độ lệch tiêu chuẩn mẫu điều chỉnh là 10 cm.
1) Với độ tin cậy là 95% hãy ước lượng chiều cao trung bình tối đa của nam thanh niên ở địa phương trên.
2) Để đảm bảo khi ước lượng chiều cao trung bình của nam thanh niên ở địa phương trên đạt độ tin cậy 99% và sai số không vượt quá 3 cm thì cần điều tra bao nhiêu người?
1) Gọi X là chiều cao của thanh niên ở địa phương.
Gọi X là chiều cao trung bình của thanh niên trên mẫu.
Gọi ụ, là chiều cao trung bình của thanh niên trên đám đông
Vì X có phân phối chuẩn nên:
Ta tìm được t^a sao cho:
Thay biểu thức của T vào công thức trên, ta có:
Kết luận: Với độ tin cậy 95% có thể nói rằng chiều cao trung bình tối đa của thanh niên địa- phương đó là 172,442 cm.
2) Ta coi mẫu ở đầu bài đã cho là mẫu sơ bộ kích thước k — 25 :
Từ mẫu sơ bộ này ta tính được: x = ị ¿Xi và s'2 - -Ị- Ề(Xx - X)2
Giả sử mẫu cần tìm có kích thước n :W2 — (X1, x2, , Xn)
Vì X có phân phối chuẩn nên T ~ Vì vậy, ta có thể tìm được í í-1) sao cho:
Kết luận: Để đảm bảo khi ước lượng đạt độ tin cậy 99% và sai số là 3 cm thì cần điều tra ít nhất 87 thanh niên.
5.3.3 Chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu TI > 30
Theo mục 2 § chương 4, khi TI > 30 thì X ~ 7V(/Z, —) Do đó ta sử dụng n thống kê:
Các phần còn lại giải quyết tương tự như trong mục 5.3.1.
Chú ý 5.4 - Riêng đối với bài toán ước lượng kích thước mẫu, vì chưa biết quy luật phân phối xác suất của X nên phải giả thiết X có phân phối chuẩn.
- Nếu chưa biết ơ, vỡ n lớn nờn, ta cú thể lấy ơ ô s'
Một nghiên cứu phỏng vấn 40 khách du lịch nước ngoài đến Huế cho thấy thời gian lưu trú trung bình của mỗi người là 1,9 ngày, với phương sai mẫu điều chỉnh là 1,5 (ngày)².
1) Với độ tin cậy 99% hãy ước lượng thời gian lưu lại Huế trung bình tối thiểu của một khách du lịch nước ngoài.
2) Để đảm bảo khi ước lượng đạt độ tin cậy 99% và sai số không vượt quá 0,3 ngày thì cần phải phỏng vấn bao nhiêu khách du lịch.
1) Gọi X là thời gian lưu lại Huế của khách du lịch nước ngoài.
Gọi X là thời gian lưu lại Huế trung bình của một khách trên mẫu. Gọi /J, là thời gian lưu lại Huế trung bình của một khách trên đám đông
Vì n = 40 > 30 nên X có phân phối xấp xỉ chuẩn:
Vậy ta có thể tìm được ua sao cho:
Thay biểu thức của ư vào công thức trên và biến đối tương đương, ta có:
Vỡ ơ chưa biết, kớch thước mẫu lớn nờn ta lấy ơ ô s' = y/1,5 ô 1,225 và ta có ua = 1/0,01 = 2,33.
1 225 Vậy khoảng tin cậy phải của ịi là (1,9—^=-.2,33; +oo) hay (1,45; +oo) y40
Kết luận: Với dộ tin cậy 99% ta có thể nói rằng thời gian lưu lại Huế trung bình tối thiểu của một khách du lịch nước ngoài là 1,45 ngày.
2) Giả thiết X có phân phối chuẩn: X
Ta tìm được 1/a sao cho:
Vỡ ơ chưa biết, ta lấy ơ ô s' — 1,225(cú trong mẫu của cõu 1) Mặt khỏc ĩ/a = 1/0,005 — 2, 58 Do đó: n = (ỉ^.2,58)2 = 110,98
Kết luận: Để đảm bảo khi ước lượng đạt độ tin cậy 99% và sai số không vượt quá 0,3 ngày thì cần điều tra ít nhất 111 khách hàng.
Ước lượng tỉ lệ (ước lượng tham số p trong phân phối A(pỴ) 79
Xét một đám đông kích thước N, trong đó có M phần tử mang dấu hiệu
A Kí hiệu tỉ lệ phần tử mang dấu hiệu A trên đám dõng là p = Để ước lượng p từ đám đông ta lấy ra mẫu kích thước n Kí hiệu Ù a là số phần tử mang dấu hiệu A có trong n phần tử lấy ra Khi đó f — —— là tỉ lệ phần tử n mang dấu hiệu A trên mẫu Ta sẽ dùng f để ước lượng p Khi n đủ lớn, theo mục 4.3.4, chương 4 thì f ~ N(p, —), ở đây ta kí hiệu q = 1 — p Vì vậy, ta pq 9 n có: u = ~ 1V(O,1) (5.5) pq n
7->(|i7| < Ua) ô 1 — a = 7 Thay biểu thức của u vào công thức trên, ta có:
(5.7) là sai số của ước lượng Nếu p chưa biết, n khỏ lớn để tớnh e ta lấy p ô /và q ô 1 — /, khi đú:
Khoảng tin cậy đối xứng của p được xác định là (/ — e; / + e), với độ tin cậy của ước lượng là 7 = 1 — a Bài viết đề cập đến ba bài toán cần giải quyết tương tự như trong ước lượng kỳ vọng toán của ĐLNN Đặc biệt, trong bài toán thứ ba về việc tìm kích thước mẫu, để áp dụng các công thức (5.5), (5.6), và (5.7), chúng ta cần giả định rằng / có phân phối chuẩn Từ công thức (5.7), chúng ta có thể tìm ra các thông tin cần thiết.
PơUa n = (5.8) Đến đây có ba khả năng sau có thể xảy ra:
1) Biết p, ta tìm n theo công thức (5.8).
2) Chưa biết p, nhưng biết f, để tìm n trong công thức (5.8) ta thay p ô f, q ô 1 - f.
Từ đó ta có khoảng tin cậy 1 — a của f là (p — e; p + e).
Chú ý 5.6 a) Từ f — e < p < f + e, thay p=~ và biến đổi ta có:
Từ đó ta có khoảng tin.cậy của M khi biết N là: (Nự — e); N(f + e)) b) Tương tự, từ p — e < f < p + e, thay / = — và biến đổi ta được: n n(p - e) < nA < n(p + e)
Từ đó ta có khoảng tin cậy của nA khi biết p là: (n(p — e); n(p + e)) Tương tự, ta có khoảng tin cậy của N khi biết M là , M M
Ví dụ 5.6 Điều tra ngẫu nhiên 50 sinh viên năm thứ hai của trường ĐHTM thấy có 12 sinh viên đạt điểm khá giỏi môn LTXS và TKT.
1) Với độ tin cậy 95% hãy ước lượng tỉ lệ sinh viên đạt điểm khá giỏi môn LTXS và TKT trong toàn trường.
2) Với độ tin cậy 95% hãy ước lượng số sinh viên năm thứ hai của trưòng đạt điểm khá giỏi môn LTXS và TKT Biết số sinh viên năm thứ hai của trường là 2000 sinh viên.
3) Để đảm bảo khi ước lượng đạt độ tin cậy 99% và sai số không vượt quá 0,1 thì cần điều tra bao nhiêu sinh viên?
Lời giải Gọi f là tỉ lệ sinh viên đạt điểm khá giỏi trên mẫu.
Gọi p là tỉ lệ sinh viên đạt điểm khá giỏi trẽn đám đông.
Khi đó ta tìm được Us sao cho: 2
P(|Ỉ7| < Uọ) ~ 1 — a = 7 Thay biểu thức của u vào công thức trên, ta có: p(\f
Trong đó: 6 7 = 1 — a - 0, 95, nên lia = u0,025 — 1, 96 Suy ra:
Vậy khoảng tin cậy củap là: (0,24—0,118; 0, 24+0,118) hay (0,122; 0,358)
Kết luận: Với độ tin cậy 95% có thể nói rằng tỉ lệ sinh viên đạt điểm khá giỏi môn LTXS và TKT nằm trong khoảng từ 12,2% đến 35, 8%.
Thay p= 77 và Ar = 2000 ta được: 244 < M < 716.
Kết luận: Với độ tin cậy 95%, số sinh viên năm thứ hai đạt điểm khá giỏi môn LTXS và TKT được ước lượng nằm trong khoảng từ 244 đến một giá trị cụ thể.
3) Giả thiết f có phân phối chuẩn, ta có: f N(p^Ỵ Khi đó: n u = t —-~7V(0,l)
Tứơng tự trong câu 1), ta có: 6 = — Suy ra: n = —T-2- y n 2
Vỡ p chưa biết, ta lấy p ~ f = 0,24; q ô 0,76 cú trong mẫu của cõu 1).
Kết luận: Để đạt được độ tin cậy 99% và sai số không vượt quá 0,1, cần điều tra ít nhất 122 sinh viên Khoảng tin cậy phải được tính toán với Oi = 0 và Ơ2 = Oí để ước lượng giá trị tối thiểu của p.
Ta vẫn dùng thống kê (5.5) Với độ tin cậy 7 = 1 — 0 cho trước ta tìm được ua sao cho:
VI p chưa biết, n lớn ta lấy p ô / Ta cú khoảng tin cậy phải của p là:
/(!-/) n ■Ua\ +oo) c Khoảng tin cậy trái (lấy Ck! = a, a2 = 0 dùng để ước lượng giá trị tối đa của p).
Ta vẫn dùng thống kê (5.5) Với độ tin cậy 7 = 1 — a cho trước ta tìm được ua sao cho:
Vỡ p chưa biết, n lớn ta lấy p ô f Ta cú khoảng tin cậy trỏi của p là:
Trong một cuộc khảo sát tại một huyện ngoại thành, 100 trẻ em dưới một tuổi được khám và phát hiện có 18 em bị suy dinh dưỡng Với độ tin cậy 99%, tỉ lệ tối thiểu trẻ em dưới một tuổi suy dinh dưỡng ở huyện này được ước lượng là 18%.
Lời giải Gọi f là tỉ lệ trẻ em suy dinh dưỡng trên mẫu.
Gọi p là tỉ lệ trẻ em suy dinh dưỡng trẽn đám đông.
Vì TI = 200 khá lớn nên f có phân phối xấp xỉ chuẩn: f-p
Ta tìm được ua sao cho:
Thay biểu thức của u vào công thức trên, ta có:
Vỡ p chưa biết, n khỏ lớn ta lấy p ô f = 0,18; q ô 0,82; ua = uOfii = 2,33 Vậy khoảng tin cậy phải của p là:
Kết luận- Với độ tin cậy 99% ta có thể nói rằng tỉ lệ tối thiểu trẻ em suy dinh dưỡng ở huyện trên là 9%.
Ước lượng phương sai của ĐLNN phân phối chuẩn
Giả sử ta cần nghiên cứu một dấu hiệu X có phân phối chuẩn vdi Var(X) = cr2 chưa biết Để ước lượng ớ2, từ đám đông ta lấy ra mẫu w — (X1,X2) ,Xn)
Từ mẫu này ta tìm được s'2 Theo (4.4), ta có:
X2 = (" ~ x2(“-‘> (5.9) a Khoảng tin cậy của ơ2 (lấy ƠI = a2 = —
Vì X2 ~ x2^-1), với độ tin cậy 7 — 1 — a cho trước, ta có thể tìm được phân vị Xi_s và xã sao cho:
Thay biểu thức của X2 vào công thức trên và biển đổi, ta có: ơ đây 7 = 1 — a là độ tin cậy.
Khoảng tin cậy của