BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT
Các khái niệm
Hiện tượng ngẫu nhiên xảy ra khi các kết quả quan sát được trong cùng một điều kiện có thể khác nhau và không thể dự đoán trước Đây là chủ đề chính trong nghiên cứu của lý thuyết xác suất.
Phép thử ngẫu nhiên là một thí nghiệm hoặc quan sát liên quan đến một hiện tượng ngẫu nhiên, trong đó kết quả thu được có thể khác nhau mỗi lần thực hiện.
Gieo một con xúc xắc thì mặt xuất hiện của nó có thể là mặt nhất, mặt nhị, …
Quan sát thời gian đợi thanh toán của khách hàng ở siêu thị thì có khách sẽ được thanh toán ngay, có khách phải xếp hàng đợi 1 phút, 2 phút …
Không gian mẫu là tập hợp tất cả các kết quả có thể xảy ra khi thực hiện một phép thử, được ký hiệu là Tập hợp này thường được biểu diễn dưới dạng
(mỗi kết quả của phép thử ký hiệu là , còn gọi là biến cố sơ cấp)
Phép thử gieo xúc xắc có không gian mẫu là
Phép thử tung đồng xu cho đến khi xuất hiện mặt sấp thì dừng có không gian mẫu là
Phép thử chọn ngẫu nhiên một điểm trong hình tròn bán kính R có không gian mẫu là
Khi thực hiện phép thử, ta thường quan tâm một nhóm các kết quả của phép thử có xảy ra hay không, chẳng hạn:
Gieo một con xúc xắc thì nó có xuất hiện mặt chẳn hay không
Quan sát thời gian đợi thanh toán ở siêu thị thì có khách phải đợi trên 10 phút hay không …
Nhóm các kết quả như vậy gọi là biến cố của phép thử
Mỗi biến cố trong xác suất là một tập con của không gian mẫu, thường được ký hiệu là hay Biến cố có thể xảy ra hoặc không xảy ra khi thực hiện phép thử; nếu kết quả của phép thử xảy ra, ta nói rằng biến cố đã xảy ra, ngược lại, nếu không xảy ra, biến cố được coi là không xảy ra Biến cố không thể xảy ra được gọi là biến cố không thể, trong khi biến cố chắc chắn xảy ra được gọi là biến cố chắc chắn.
Gieo một con xúc xắc, xét biến cố là “con xúc xắc xuất hiện mặt chẳn” thì biểu diễn
Quan sát thời gian chờ thanh toán của khách hàng tại siêu thị, ta xét biến cố "khách đợi trên 10 phút", ký hiệu cho thời gian chờ của khách.
1.1.5 Quan hệ giữa các biến cố Mỗi biến cố là một tập hợp, do đó mỗi quan hệ trong lý thuyết tập hợp cho tương ứng một quan hệ giữa các biến cố như sau: Giả sử là hai biến cố của một phép thử thì
Biến cố kéo theo biến cố , ký hiệu , nếu xảy ra thì xảy ra
Biến cố hợp , ký hiệu , là biến cố xảy ra khi hoặc hoặc xảy ra
Biến cố giao , ký hiệu hay , là biến cố xảy ra khi và đều xảy ra Nếu thì gọi là xung khắc nhau
Biến cố hiệu , ký hiệu , là biến cố xảy ra khi xảy ra và không xảy ra Biến cố gọi là biến cố đối của
Chú ý Dùng các tính chất giao hoán, kết hợp và phân phối để mở rộng các quan hệ trên cho nhiều biến cố
Trong ví dụ 1.1.3, chúng ta quan sát hoạt động của một hệ thống gồm ba bộ phận máy trong khoảng thời gian t Biến cố được định nghĩa là "máy thứ bị hỏng trong khoảng thời gian t".
là biến cố “có ít nhất một máy bị hỏng”
là biến cố “máy 1 còn hoạt động, máy 2, 3 bị hỏng”
Hai biến cố và xung khắc nhau
Xác suất là thước đo khả năng xảy ra của một biến cố, được ký hiệu bằng một giá trị từ 0 đến 1 Giá trị xác suất càng cao cho thấy khả năng xảy ra của biến cố đó càng lớn và ngược lại Điều này đặc biệt quan trọng trong nhiều lĩnh vực như thống kê, khoa học và tài chính.
Khả năng xuất hiện mỗi mặt khi gieo một đồng xu cân đối, đồng chất là bằng nhau với xác suất 0,5
Khả năng trúng giải đặc biệt khi mua một tờ vé số là rất nhỏ với xác suất
(giả sử vé số gồm 5 chữ số)
1 Xác định không gian mẫu và biến cố trong các phép thử sau: a) Gieo 2 con xúc xắc và xét biến cố “Tổng số chấm xuất hiện là 10” b) Chọn 2 học sinh từ lớp gồm 20 nam, 18 nữ và xét biến cố “Chọn được 1 nam và 1 nữ” c) Lấy ngẫu nhiên lần lượt (không hoàn lại) ra 3 bi từ hộp chứa 5 bi đen, 3 bi vàng và xét biến cố “Lấy được bi đen nhiều hơn” d) Cho phương trình Chọn ngẫu nhiên 2 số thuộc [0;1] và xét biến cố “Hai số chọn được làm phương trình có nghiệm thực”
2 Ba xạ thủ A, B, C mỗi người bắn một viên đạn vào mục tiêu Gọi lần lượt là biến cố A, B, C bắn trúng mục tiêu a) Hãy mô tả các biến cố: , , , b) Biểu diễn các biến cố sau theo :
: “có ít nhất 2 xạ thủ bắn trúng”
: “có nhiều nhất 1 xạ thủ bắn trúng”
: “chỉ có 1 xạ thủ bắn trúng”
: “có ít nhất 1 xạ thủ không bắn trúng”
3 Chứng minh các hệ thức của các biến cố qua việc mô tả a) ; b) ; ; c)
Trong phần tiếp theo, chúng ta sẽ khám phá cách xây dựng mô hình xác suất trên không gian mẫu của phép thử Mô hình xác suất được hình thành dựa trên lực lượng và cấu trúc của không gian mẫu Từ đó, bài viết sẽ trình bày các định nghĩa và phương pháp tính xác suất cho bất kỳ biến cố nào liên quan đến phép thử này.
Mô hình xác suất rời rạc
1.2.1 Tần suất của biến cố Thực hiện lặp lại một phép thử lần độc lập trong các điều kiện như nhau và quan sát biến cố trong mỗi phép thử Gọi là số lần xảy ra trong dãy phép thử trên thì tỷ số được gọi là tần suất xảy ra của biến cố trong n phép thử
J Bernoulli chứng minh được rằng khi tăng lên vô hạn thì hội tụ đến một giới hạn xác định là - xác suất của (Luật số lớn Bernoulli) Như vậy, xác suất của một biến cố có thể được xấp xỉ qua tần suất xảy ra của biến cố đó, tức là khi đủ lớn Đây là nội dung của định nghĩa xác suất theo thống kê
Ví dụ 1.2.1 Thí nghiệm về gieo một đồng xu cân đối, đồng chất như sau:
Người thực hiện Số lần gieo Số mặt sấp xuất hiện
Tần suất xuất hiện mặt sấp
Như vậy xác suất xuất hiện mặt sấp khi gieo đồng xu có thể xấp xỉ bằng 0,5
Định nghĩa xác suất trong thống kê dựa trên các thí nghiệm quan sát thực tế, nhưng chỉ áp dụng cho những phép thử có thể lặp lại trong điều kiện giống nhau Để xác định giá trị xác suất một cách chính xác, cần thực hiện một số lượng lớn các phép thử Tuy nhiên, với sự phát triển của công nghệ thông tin, hiện nay có thể mô phỏng các phép thử ngẫu nhiên mà không cần thực hiện thực tế, giúp việc tính xác suất theo phương pháp thống kê trở nên dễ dàng hơn.
1.2.2 Mô hình xác suất của phép thử có đếm được kết quả
Xét phép thử với không gian mẫu có đếm được các kết quả có thể xảy ra (hữu hạn hay vô hạn đếm được), được biểu diễn như sau:
Mỗi kết quả có xác suất xảy ra tương ứng là sao cho: i) (tính không âm) ii) (tính chuẩn hóa)
Khi đó với biến cố bất kỳ thì
Bộ là mô hình xác suất hay không gian xác suất của phép thử, trong đó giả sử các phép thử thỏa mãn hai điều kiện: không gian mẫu có hữu hạn kết quả và các kết quả có khả năng xảy ra đồng đều, thường áp dụng cho các phép thử có tính đối xứng và ngẫu nhiên.
Trong mô hình xác suất của phép thử, xác suất của một biến cố được xác định theo định nghĩa cổ điển Để tính xác suất này, người ta thường áp dụng các quy tắc và phương pháp đếm trong giải tích tổ hợp, bao gồm tổ hợp, chỉnh hợp, quy tắc cộng và quy tắc nhân.
Trong một hộp có 5 cầu trắng, 3 cầu xanh và 4 cầu đen, tổng cộng có 12 cầu Khi chọn ngẫu nhiên 3 cầu từ hộp, ta cần tính xác suất để có đúng 2 cầu cùng màu Để giải bài toán này, ta sẽ xác định các trường hợp có thể xảy ra và áp dụng công thức xác suất phù hợp.
Giải Chọn ngẫu nhiên 3 cầu từ hộp thì số đồng khả năng là
Biến cố A được định nghĩa là "3 cầu chọn ra có đúng 2 cầu cùng màu", bao gồm ba trường hợp: có đúng 2 cầu trắng, 2 cầu xanh hoặc 2 cầu đen Do đó, xác suất của biến cố A có thể được tính toán dựa trên các trường hợp này.
Gieo một đồng xu cân đối và đồng chất cho đến khi xuất hiện mặt sấp, sau đó dừng lại Mô hình xác suất của phép thử này có thể được xác định, và xác suất để số lần gieo không vượt quá 3 lần cần được tính toán.
Giải Không gian mẫu của phép thử là với
Khi đó, xác suất để số lần gieo không quá 3 lần là
1 Gieo 3 con xúc xắc Tính xác suất a) Xuất hiện 2 mặt “nhất” và 1 mặt “lục” b) Có tổng số chấm xuất hiện chia hết cho 5
2 Một hộp gồm 10 bi xanh, 6 bi đỏ và 4 bi vàng Lấy ngẫu nhiên ra 4 bi Tính xác suất a) Lấy được ít nhất mỗi màu 1 bi b) Lấy được bi xanh nhiều hơn
3 Rút ngẫu nhiên 13 con bài từ bộ bài tây 52 con Tính xác suất a) Có 4 con “hai” b) Có sảnh từ “ba” đến “Át” c) Có 12 con bài cùng màu
4 Một hộp có 30 thẻ đánh số từ 1 đến 30, trong đó có 15 thẻ có chữ “SU”, 9 thẻ có chữ “ZU”, 5 thẻ có chữ “KI” và 1 thẻ có chữ “SUZUKI” Chọn ngẫu nhiên 4 thẻ từ hộp Tính xác suất để 4 thẻ chọn ra có thể sắp được chữ SUZUKI
5 Trong một thùng có 6 quả bóng vàng, 5 quả bóng trắng và 4 quả bóng xanh cùng kích thước Rút ngẫu nhiên lần lượt từng quả (không hoàn lại) cho đến khi được bóng vàng thì dừng Tính xác suất trong số quả bóng lấy ra: a) Có 2 bóng trắng, 1 bóng xanh b) Không có quả bóng trắng nào
6 a) Có 10 đội bóng được bốc thăm chia làm 5 cặp đấu, trong đó có hai đội hạt giống
A, B Tính xác suất để hai đội A, B không phải gặp nhau b) Có 16 đội bóng được bốc thăm chia làm 4 bảng (mỗi bảng 4 đội), trong đó có hai đội hạt giống A, B Tính xác suất để hai đội A, B không nằm cùng bảng
7 Gieo một con xúc xắc cho đến khi xuất hiện 2 lần mặt “lục” thì dừng a) Tìm mô hình xác suất cho phép thử trên b) Tính xác suất để số lần gieo không vượt quá 5 lần.
Mô hình tổng quát - Hệ tiên đề của xác suất
Khi không gian mẫu là tập không đếm được, việc xây dựng mô hình xác suất như trong mô hình rời rạc trở nên không khả thi Để giải quyết vấn đề này, A N Kolmogorov đã phát triển hệ tiên đề của lý thuyết xác suất vào năm 1933, nhằm xây dựng một mô hình xác suất tổng quát Cụ thể, ông đã tạo ra mô hình xác suất dựa trên lớp đại số các biến cố trong không gian mẫu.
Lớp các tập con của không gian gọi là một -đại số các biến cố nếu: i) , ii) Từ suy ra , iii) Từ họ suy ra
Bộ gọi là không gian đo được
Giả sử không gian mẫu có một số lượng hữu hạn các kết quả, thì lớp các tập con của không gian mẫu đó tạo thành một -đại số Số lượng biến cố trong lớp này là
2) Giả sử phép thử có không gian mẫu Lớp thường dùng là -đại số
Borel trên đoạn [0;1] Các biến cố thuộc lớp này có dạng hợp, giao các khoảng với
1.3.2 Hệ tiên đề của lý thuyết xác suất
Trong một không gian đo được, giả sử rằng hàm tập thỏa mãn các điều kiện sau: i) Với mọi biến cố, hàm tập này đều không âm; ii) Nếu có một dãy biến cố mà chúng xung khắc đôi một, thì tổng của hàm tập tương ứng với các biến cố đó sẽ bằng tổng của các hàm tập riêng lẻ.
Khi đó gọi là (độ đo) xác suất của biến cố và bộ gọi là mô hình xác suất tổng quát hay không gian xác suất của phép thử
Giả sử không gian mẫu có kết quả đồng khả năng, thì lớp tất cả các tập con và hàm tập với biến cố bất kỳ sẽ tạo thành một không gian xác suất.
2) Giả sử phép thử có không gian mẫu , các kết quả đồng khả năng, lớp là -đại số Borel trên đoạn [0;1] và hàm tập thì bộ tạo thành một không gian xác suất
Trong không gian Euclide hữu hạn chiều với độ đo hữu hạn và lớp -đại số Borel, xác suất của biến cố được định nghĩa dựa trên độ đo Ví dụ, độ đo chiều dài thường được sử dụng cho đường, độ đo diện tích cho mặt phẳng, và độ đo thể tích cho không gian ba chiều Định nghĩa xác suất theo hình học này mở rộng từ định nghĩa cổ điển, trong đó các kết quả xảy ra có khả năng xảy ra đồng đều.
Ví dụ 1.3.3 Cho phương trình Chọn ngẫu nhiên số thuộc [0;1] Tính xác suất để phương trình có nghiệm thực
Giải Mỗi số chọn là một điểm thuộc đoạn
Gọi là biến cố “phương trình có nghiệm thực” thì
Trong bài toán gặp nhau, hai người hẹn gặp tại một địa điểm cụ thể trong khoảng thời gian từ 8 đến 9 giờ Người đến trước sẽ chờ tối đa 10 phút cho người kia Nếu sau thời gian này không gặp nhau, họ sẽ rời khỏi điểm hẹn Mục tiêu là xác định xác suất để hai người gặp nhau, với giả định rằng thời gian đến của mỗi người là ngẫu nhiên và độc lập.
Giả sử thời điểm đến của người thứ nhất và thứ hai tại điểm hẹn được biểu diễn bằng phút Mỗi cặp thời gian đến của hai người này sẽ tương ứng với một điểm trong hình vuông.
Gọi là biến cố hai người gặp nhau thì
1.3.3 Tính chất của xác suất
Xác suất, dựa trên lý thuyết độ đo, có những tính chất cơ bản quan trọng Đầu tiên, với bất kỳ biến cố nào, xác suất đều phải nằm trong khoảng từ 0 đến 1 Thứ hai, nếu hai biến cố không thể xảy ra đồng thời, xác suất của hợp hai biến cố này là tổng của xác suất từng biến cố Thứ ba, xác suất của biến cố chắc chắn luôn bằng 1 Thứ tư, xác suất của biến cố không xảy ra là 1 trừ đi xác suất của biến cố xảy ra Cuối cùng, nếu hai biến cố xung khắc, xác suất của chúng cũng sẽ bằng 0.
Chú ý - Tính chất (iv) được xem là quy tắc cộng xác suất
- Tính chất (iv) và (v) được tổng quát như sau: iv’) Với dãy biến cố bất kỳ thì
Trong một khu vực dân cư, tỷ lệ người mắc bệnh tim chiếm 9%, trong khi tỷ lệ người mắc bệnh huyết áp là 12% và tỷ lệ người mắc cả hai bệnh này là 7% Để tính xác suất một người được chọn ngẫu nhiên không mắc cả bệnh tim lẫn bệnh huyết áp, ta cần sử dụng công thức xác suất kết hợp.
Giải Gọi là “người đó mắc bệnh tim”, là “người đó mắc bệnh huyết áp” Theo giả thiết ta có
Gọi là “người đó không mắc cả bệnh tim và bệnh huyết áp” Suy ra là
“người đó mắc bệnh tim hoặc bệnh huyết áp” Do đó ta có
Ví dụ 1.3.6 Xếp ngẫu nhiên 10 cuốn sách lên một giá sách, trong đó có 3 cuốn sách
Toán Tính xác suất có ít nhất 2 cuốn sách Toán đứng cạnh nhau
Trong bài toán này, chúng ta ký hiệu ba cuốn sách Toán là T1, T2 và T3 Các biến cố được định nghĩa như sau: biến cố A là “Hai cuốn sách T1 và T2 đứng cạnh nhau”, biến cố B là “Hai cuốn sách T1 và T3 đứng cạnh nhau”, và biến cố C là “Hai cuốn sách T2 và T3 đứng cạnh nhau”.
Vậy xác suất có ít nhất 2 cuốn sách Toán đứng cạnh nhau là
1.3.4 Nguyên lý xác suất nhỏ, xác suất lớn Qua thực nghiệm và quan sát thực tế, người ta thấy rằng các biến cố có xác suất nhỏ sẽ không xảy ra khi ta chỉ thực hiện một phép thử hay một vài phép thử Từ đó, ta thừa nhận nguyên lý sau đây, gọi là “Nguyên lý xác suất nhỏ”: Nếu một biến cố có xác suất rất nhỏ thì thực tế có thể cho rằng khi thực hiện một phép thử, biến cố đó sẽ không xảy ra
Mỗi chiếc máy bay đều có xác suất rất nhỏ xảy ra tai nạn, nhưng nhiều người vẫn tin tưởng sử dụng phương tiện này vì họ cho rằng trong một chuyến bay, khả năng gặp sự cố là rất thấp Mức xác suất được coi là "nhỏ" phụ thuộc vào từng trường hợp cụ thể Nguyên lý xác suất lớn cho rằng nếu một biến cố có xác suất gần bằng 1, thì có thể tin tưởng rằng biến cố đó sẽ xảy ra trong thực tế Hai nguyên lý này là nền tảng cho phương pháp luận của thống kê, sẽ được thảo luận trong các chương sau.
Ví dụ 1.3.7 (Bài toán ngày sinh) Chọn ngẫu nhiên một nhóm người Tính xác suất để có ít nhất hai người có cùng ngày tháng sinh
Giải Ngày tháng sinh của một người có thể là một trong 365 ngày của năm Do đó
Gọi là “có ít nhất hai người có cùng ngày tháng sinh” thì
Khi số lượng người trong một nhóm tăng lên, xác suất có ít nhất hai người có cùng ngày tháng sinh cũng tăng theo Đặc biệt, với nhóm từ 50 đến 60 người, xác suất này gần như đạt giá trị 1, cho thấy rằng trong thực tế, chắc chắn sẽ có ít nhất hai người có cùng ngày tháng sinh.
1 Giả sử cho Tính các xác suất
2 Giả sử , Chứng minh rằng Cho ví dụ để dấu “=” xảy ra
3 Có 4 hộp quà đánh số từ 1 đến 4 và được ẩn số Một người đặt ngẫu nhiên 4 chiếc thẻ cũng đánh số từ 1 đến 4 lên các hộp Tính xác suất có ít nhất một thẻ đặt đúng số với hộp
4 Trên đoạn thẳng có độ dài , chọn ngẫu nhiên 2 điểm Tính xác suất để a) b)
Xác suất có điều kiện
1.4.1 Xác suất có điều kiện
Trong không gian xác suất, khi có hai biến cố bất kỳ, xác suất của biến cố thứ nhất xảy ra dưới điều kiện biến cố thứ hai đã xảy ra được gọi là xác suất có điều kiện Xác suất này thường được ký hiệu là P(A|B).
Ví dụ 1.4.1 Một hộp gồm cầu trắng, cầu đỏ Chọn ngẫu nhiên lần lượt ra một cầu từ hộp Gọi là “chọn lần được cầu trắng”, Khi đó
- Xác suất chọn lần đầu tiên được cầu trắng là
- Xác suất chọn lần hai được cầu trắng, biết rằng lần đầu chọn được cầu trắng là
- Xác suất chọn lần hai được cầu trắng, biết rằng lần đầu chọn được cầu đỏ là
Xác suất có điều kiện là một khái niệm quan trọng trong lý thuyết xác suất, giúp hiểu rõ hơn về mối quan hệ giữa các biến cố Nó liên quan đến tính độc lập của các biến cố và các quy tắc tính xác suất, bao gồm quy tắc xác suất đầy đủ.
Nếu thì Xác suất có điều kiện có thể tính trực tiếp mà không cần áp dụng công thức trên
Xác suất thông thường có thể biểu diễn là
Xác suất có điều kiện có thể được hiểu như một xác suất trong không gian với các biến cố được chọn phù hợp Điều này cho thấy rằng các tính chất của xác suất vẫn áp dụng đúng cho xác suất có điều kiện.
1.4.2 Tính độc lập của các biến cố Nhiều bài toán xác suất thường sử dụng giả thiết về tính độc lập của các biến cố, đó là sự không phụ thuộc lẫn nhau đến xác suất xảy ra giữa các biến cố Cụ thể hơn, ta có một số dạng độc lập cơ bản như sau:
Hai biến cố được gọi là độc lập nếu
Dãy biến cố được gọi là độc lập từng đôi nếu với mọi
Dãy biến cố được gọi là độc lập toàn thể nếu với mọi tập con thì
Hai biến cố được coi là độc lập khi sự xảy ra hoặc không xảy ra của một biến cố không ảnh hưởng đến khả năng xảy ra của biến cố còn lại Nói cách khác, việc một biến cố xảy ra hoàn toàn không tác động đến biến cố kia và ngược lại.
Dãy biến cố độc lập toàn thể thì độc lập từng đôi Điều ngược lại chưa chắc đúng
Phân biệt tính độc lập và tính xung khắc của các biến cố Nói chung, hai biến cố xung khắc thì không độc lập
Ví dụ 1.4.3 Gieo 2 đồng xu Gọi biến cố là “đồng xu 1 xuất hiện mặt sấp”, là
“đồng xu 2 xuất hiện mặt sấp” và là “Hai đồng xu cùng xuất hiện một mặt” Xét tính độc lập của
Giải Không gian mẫu của phép thử và các biến cố
Theo định nghĩa tính độc lập, suy ra độc lập từng đôi nhưng không độc lập toàn thể
1.4.3 Quy tắc nhân xác suất
Khái niệm xác suất có điều kiện giúp chúng ta áp dụng quy tắc nhân xác suất giữa các biến cố Đối với hai biến cố bất kỳ, ta có thể xác định xác suất của chúng Đặc biệt, nếu hai biến cố là độc lập, xác suất của chúng sẽ được tính bằng tích xác suất của từng biến cố Tổng quát hơn, với một dãy biến cố bất kỳ, quy tắc tương tự cũng được áp dụng Nếu dãy biến cố này là độc lập, xác suất tổng quát sẽ là tích của xác suất từng biến cố trong dãy.
Ví dụ 1.4.4 Giả sử hai biến cố độc lập Chứng minh rằng các cặp biến cố sau:
Cũng độc lập với nhau
Giải Do độc lập nên , suy ra
Vậy độc lập Chứng minh tương tự cho các cặp còn lại
Trong một hệ thống gồm ba bộ phận hoạt động độc lập, xác suất hỏng của từng bộ phận trong khoảng thời gian t lần lượt là 0,2, 0,25 và 0,1 Để tính xác suất còn lại hai bộ phận hoạt động sau khoảng thời gian t, ta cần xác định xác suất hỏng của từng bộ phận và áp dụng các quy tắc xác suất phù hợp.
Giải Gọi là “bộ phận bị hỏng trong khoảng thời gian t”, Theo giả thiết thì độc lập và
Gọi là “còn hai bộ phận hoạt động được sau khoảng thời gian t” thì Suy ra
1 Một chùm chìa khóa 9 chìa, trong đó có 2 chìa mở được khóa Một người mở khóa bằng cách thử từng chìa (chìa nào không mở được thì loại ra) Tính xác suất mở được khóa sau 4 lần thử
2 Để nhập kho, sản phẩm của nhà máy phải trải qua 3 phòng kiểm tra chất lượng Xác suất phát hiện ra phế phẩm ở các phòng theo thứ tự là 0,8; 0,9 và 0,95 Tính xác suất phế phẩm được nhập kho
3 Một hộp gồm 3 bi đỏ, 5 bi đen Rút ngẫu nhiên 1 bi, ghi nhớ màu của nó rồi bỏ lại bi đó vào hộp cùng với 1 bi cùng màu khác Tính xác suất trong 4 lần lấy như trên thì lấy được 2 bi đỏ
4 Gieo hai con xúc xắc cân đối, đồng chất Gọi là biến cố “Tổng số chấm xuất hiện là lẻ”, là biến cố “Có ít nhất 1 mặt một chấm” Tính ,
5 Giả sử 3 biến cố độc lập Chứng minh rằng các cặp biến cố và ; và cũng độc lập
6 Người ta dùng một thiết bị để kiểm tra một loại sản phẩm nhằm xác định sản phẩm có đạt yêu cầu không Biết rằng sản phẩm có tỉ lệ phế phẩm là 2% Thiết bị có khả năng phát hiện đúng sản phẩm là phế phẩm với xác suất 0,95 và phát hiện đúng sản phẩm đạt yêu cầu với xác suất 0,97 Tính xác suất khi dùng thiết bị trên kiểm tra ngẫu nhiên 1 sản phẩm thì a) Được kết luận là phế phẩm b) Được kết luận đúng với thực chất của nó
7 Một tín hiệu truyền từ trạm đến trạm theo sơ đồ sau: trong đó, chẳng hạn xác suất tín hiệu truyền thành công từ đến là 0,8; từ đến là 0,9; Tính xác suất tín hiệu truyền thành công từ đến
Dãy phép thử Bernoulli
Trong một phép thử, ta quan sát một biến cố với xác suất xảy ra nhất định Khi lặp lại phép thử một cách độc lập, kết quả của mỗi lần thử không ảnh hưởng đến nhau Mỗi lần lặp lại, ta chỉ ghi nhận xem biến cố có xảy ra hay không, với xác suất xảy ra của biến cố luôn giữ nguyên.
Dãy phép thử lặp như trên gọi là dãy phép thử Bernoulli
Các thành phần của dãy phép thử Bernoulli gồm:
Biến cố quan sát với xác suất
1) Gieo 10 con xúc xắc và quan sát số lần xuất hiện mặt “6 chấm” Đó là dãy phép thử Bernoulli với biến cố quan sát là “xúc xắc xuất hiện mặt 6 chấm” và
2) Một người bắn 5 viên đạn vào mục tiêu với xác suất bắn trúng mỗi viên là 0,8
Quan sát số viên bắn trúng Đó là dãy phép thử Bernoulli với biến cố quan sát là “bắn trúng mục tiêu” và
Trong dãy phép thử Bernoulli với biến cố quan sát và , bài toán đặt ra là: Tính xác suất xuất hiện đúng lần trong phép thử Bernoulli, ký hiệu
Gọi là “ xuất hiện ở phép thử thứ ”, thì dãy biến cố là độc lập và
Gọi là “ xuất hiện đúng lần trong phép thử” Dễ thấy rằng có trường hợp mà trong đó xảy ra, chẳng hạn
Trong mỗi trường hợp có đúng lần xuất hiện và lần xuất hiện, do đó xác suất của mỗi trường hợp là Vì vậy,
(gọi là công thức Bernoulli)
Chú ý Các biến cố là xung khắc đôi một và Do đó
Khi đó, xác suất có ít nhất một lần xuất hiện trong phép thử là
Trong một thí nghiệm sinh hóa có xác suất thành công là 0,6, một nhóm 6 sinh viên thực hiện thí nghiệm độc lập Để tìm xác suất có từ 3 đến 5 thí nghiệm thành công, chúng ta áp dụng công thức xác suất nhị phân Ngoài ra, để xác định xác suất có ít nhất một thí nghiệm thành công, ta có thể tính bằng cách lấy 1 trừ đi xác suất không có thí nghiệm nào thành công.
Giải Ta có dãy phép thử Bernoulli:
Phép thử lặp: tiến hành một thí nghiệm sinh hóa và
Biến cố là “thí nghiệm thành công” với a) Xác suất có từ 3 đến 5 thí nghiệm thành công
b) Xác suất có ít nhất một thí nghiệm thành công
Để đảm bảo xác suất báo động khi có đám cháy vượt quá 99,9%, một khu vực cần lắp đặt một hệ thống chuông báo động hỏa hoạn với ít nhất một số lượng chuông nhất định Mỗi chuông hoạt động độc lập và có xác suất báo động là 0,7 khi xảy ra hỏa hoạn Việc tính toán số lượng chuông cần thiết là rất quan trọng để đảm bảo an toàn cho khu vực đó.
Hệ thống chuông báo động hoạt động như một dãy phép thử Bernoulli, trong đó biến cố xảy ra là "chuông báo động khi có đám cháy" Xác suất hệ thống này báo động khi có đám cháy được xác định dựa trên các yếu tố liên quan đến hiệu suất và độ tin cậy của thiết bị.
Theo giả thiết, ta phải có
Vậy cần lắp hệ thống với ít nhất 6 chuông
1.5.3 Số có khả năng nhất
Khi thực hiện dãy phép thử Bernoulli, số lần xuất hiện của các biến cố có xác suất xác định Số lần xuất hiện với xác suất cao nhất được gọi là số có khả năng nhất trong dãy phép thử, ký hiệu là
Khi thực hiện dãy phép thử Bernoulli, để dự đoán số lần biến cố xuất hiện thì thông thường dựa vào số có khả năng nhất
Quy tắc tìm số có khả năng nhất
Quy tắc đưa ra trên dựa vào việc khảo sát sự đơn điệu của dãy theo
Thật vậy, xét tỷ số
Suy ra rằng, khi và khi Do vậy,
Từ đó suy ra điều phải chứng minh
Ví dụ 1.5.4 Trong ví dụ 1.5.2, hãy tìm số thí nghiệm thành công có khả năng xảy ra cao nhất
Giải Ta có nên , suy ra Vậy số thí nghiệm thành công có khả năng nhất của nhóm sinh viên là 4 thí nghiệm
1 Xác suất một thiết bị máy có thời gian sử dụng trên 5 năm là 0,3 Tính xác suất trong 12 thiết bị trên a) Có 7 thiết bị có thời gian sử dụng trên 5 năm b) Có ít nhất một thiết bị có thời gian sử dụng trên 5 năm c) Có từ 2 đến 4 thiết bị có thời gian sử dụng dưới 5 năm
2 Một đề thi trắc nghiệm có 20 câu hỏi với 4 phương án trả lời, trong đó có 1 phương án đúng Một thí sinh kém làm bài bằng cách chọn ngẫu nhiên đáp án từng câu a) Tính xác suất thí sinh đó chọn đúng ít nhất 2 câu b) Giả sử mỗi câu chọn đúng được 0,5 điểm Tính xác suất thí sinh đó được 4 điểm Hỏi điểm đó có phải là mức điểm có khả năng nhất hay không?
3 a) Cần phải gieo một con xúc xắc ít nhất bao nhiêu lần để với xác suất lớn hơn 0,7 thì có ít nhất một lần xuất hiện mặt 6 chấm b) Xác suất để bắn một viên đạn trúng đích là 0,8 Hỏi phải bắn bao nhiêu viên đạn để với xác suất nhỏ hơn 0,4 thì không có viên nào trật
4 Một sân bay có 10 chuyến bay mỗi ngày Giả sử xác suất mỗi chuyến bay khởi hành trễ là và mỗi chuyến bay khởi hành là độc lập nhau Để đảm bảo xác suất các chuyến bay đều khởi hành đúng giờ mỗi ngày là trên 90% thì cần điều chỉnh xác suất như thế nào?
5 Trên một kênh liên lạc, người ta truyền đi hai tín hiệu 0 và 1 Vì tiếng ồn gây nhiễu nên máy thu có thể nhận nhầm dạng tín hiệu với xác suất 0,2 Để tăng độ tin cậy, thay vì truyền chữ số 0, ta truyền một cụm 5 chữ số 0 (00000) và truyền chữ số 1 bằng một cụm 5 chữ số 1 (11111) Nếu khi nhận được một cụm 5 tín hiệu có đa số là 0 thì ta xem như nhận được tín hiệu 0, và nếu có đa số là 1 thì xem như nhận được tín hiệu 1 Tính xác suất nhận dạng nhầm tín hiệu bằng phương pháp trên.
Công thức xác suất đầy đủ - Công thức Bayes
1.6.1 Hệ đầy đủ Các biến cố được gọi là một hệ đầy đủ của không gian xác suất nếu:
Chúng đôi một xung khắc nhau, tức là
Hệ đầy đủ là một phân hoạch của không gian xác suất, cho phép tồn tại nhiều hệ đầy đủ trên cùng một không gian Việc sử dụng hệ đầy đủ giúp đơn giản hóa tính toán trong các bài toán, và việc lựa chọn hệ đầy đủ phù hợp phụ thuộc vào từng bài toán cụ thể.
Trong ví dụ 1.6.1, có ba hộp chứa bi Khi chọn ngẫu nhiên một hộp và lấy một bi từ hộp đó, hành động này được gọi là "chọn được hộp" Như vậy, nhóm các kết quả này tạo thành một hệ đầy đủ cho phép thử.
1.6.2 Công thức xác suất đầy đủ, công thức Bayes Giả sử là một hệ đầy đủ của không gian và biến cố bất kỳ Định lý (Công thức xác suất đầy đủ)
Các biến cố xung khắc từng đôi, suy ra
Định lý (Công thức Bayes)
Giả sử thì với mỗi
Chứng minh Suy ra từ công thức xác suất điều kiện và công thức xác suất đầy đủ
Các xác suất tiên nghiệm được xác định trước khi thực hiện phép thử Công thức xác suất đầy đủ được sử dụng để tính toán xác suất của một biến cố dựa trên các xác suất này.
Các xác suất được xác định sau khi tiến hành phép thử và biến cố đã xảy ra, được gọi là các xác suất hậu nghiệm Công thức
Bayes có rất nhiều ứng dụng, đặc biệt trong các nghiên cứu về y học, xã hội học …
Trong một nhóm 18 xạ thủ được chia thành ba tổ: tổ I gồm 5 người với xác suất bắn trúng mục tiêu là 0,9, tổ II có 7 người với xác suất 0,7, và tổ III có 6 người với xác suất 0,8 Để tính xác suất bắn trúng mục tiêu của một xạ thủ được chọn ngẫu nhiên, ta áp dụng công thức xác suất tổng hợp Ngoài ra, nếu xạ thủ bắn một viên đạn và trúng mục tiêu, ta cần tính xác suất xạ thủ đó thuộc tổ I bằng cách sử dụng định lý Bayes.
Xạ thủ được phân loại thành ba nhóm: “xạ thủ chọn thuộc tổ I”, “xạ thủ chọn thuộc tổ II” và “xạ thủ chọn thuộc tổ III” Điều này cho thấy sự đa dạng và đầy đủ của hệ thống phân loại xạ thủ.
Gọi là “xạ thủ chọn bắn trúng mục tiêu”, theo giả thiết ta có
a) Áp dụng công thức xác suất đầy đủ, xác suất xạ thủ bắn trúng mục tiêu là
b) Áp dụng công thức Bayes, xác suất xạ thủ thuộc tổ I là
Trong một bệnh viện, 50% bệnh nhân điều trị bệnh A, 30% điều trị bệnh B và 20% điều trị bệnh C, với xác suất chữa khỏi tương ứng là 0,8, 0,9 và 0,7 Để tính tỷ lệ bệnh nhân được chữa khỏi trong bệnh viện, ta cần xem xét tỷ lệ chữa khỏi cho từng loại bệnh Tỷ lệ bệnh nhân được chữa khỏi bệnh A, B, C trong tổng số bệnh nhân được chữa khỏi cũng cần được tính toán để có cái nhìn tổng quan về hiệu quả điều trị tại bệnh viện này.
Chọn ngẫu nhiên một bệnh nhân từ hệ thống điều trị, bao gồm các nhóm bệnh nhân được điều trị bệnh A, bệnh B và bệnh C.
Theo giả thiết ta có
Gọi là “bệnh nhân được chữa khỏi bệnh” thì
a) Áp dụng công thức xác suất đầy đủ, tỷ lệ bệnh nhân được chữa khỏi là
b) Áp dụng công thức Bayes, tỷ lệ bệnh nhân được chữa khỏi bệnh A, B, C trong tổng số bệnh nhân được chữa khỏi bệnh là
Ví dụ 1.6.4 Hai cậu bé lần lượt gieo một đồng xu Ai gieo được mặt sấp trước thì thắng cuộc Tính xác suất thắng cuộc của mỗi cậu bé
Giải Gọi là “đồng xu xuất hiện mặt sấp ở lần gieo ”, Xét hệ đầy đủ với
Giả sử cậu bé 1 gieo đầu tiên, gọi là “cậu bé thắng cuộc”, Áp dụng công thức đầy đủ, ta có
Suy ra , do đó Như vậy người gieo trước sẽ có cơ hội thắng cuộc cao gấp đôi
1 Ba phân xưởng cùng sản xuất một loại sản phẩm Tỷ lệ phế phẩm của phân xưởng I sản xuất là 3%, phân xưởng II là 2% và phân xưởng III là 4% Một kho chứa các sản phẩm của 3 phân xưởng I, II, III sản xuất với tỷ lệ 2:4:3 Kiểm tra ngẫu nhiên 1 sản phẩm của kho a) Tính xác suất sản phẩm đó là phế phẩm b) Giả sử sản phẩm kiểm tra là phế phẩm Hỏi khả năng sản phẩm đó do phân xưởng nào sản xuất nhất?
2 Một trạm chỉ phát hai tín hiệu A hoặc B với xác suất tương ứng là 0,7 và 0,3 Do có nhiễu trên đường truyền nên 1/7 tín hiệu A bị méo và thu được như tín hiệu B, còn 1/8 tín hiệu B bị méo và thu được như tín hiệu A a) Tính xác suất thu được tín hiệu A trong một lần phát tín hiệu b) Giả sử trong một lần phát tín hiệu thì thu được tín hiệu A Tìm xác suất thu được đúng tín hiệu lúc phát
3 Trong kỳ thi môn triết, đề cương có 10 câu hỏi Các sinh viên trong một lớp chuẩn bị bài theo tỷ lệ sau: 50% học cả 10 câu; 30% học 7 câu và số còn lại chỉ học 5 câu Đề thi ra 2 câu trong đề cương Tính xác suất để một sinh viên của lớp làm được cả 2 câu hỏi
4 Bắn 3 viên đạn một cách độc lập vào một mục tiêu Xác suất trúng mục tiêu của từng viên tương ứng là 0,6; 0,4; 0,5 Nếu chỉ 1 viên đạn trúng mục tiêu thì mục tiêu bị phá hủy với xác suất 0,4 Nếu có 2 viên đạn trúng thì mục tiêu bị phá hủy với xác suất
0,9 Nếu có 3 viên đạn trúng thì mục tiêu chắc chắn bị phá hủy Tính xác suất mục tiêu bị phá hủy khi bắn 3 viên đạn như trên
5 Có 3 hộp bi: hộp I gồm 3 bi đỏ, 6 bi trắng; hộp II gồm 5 bi đỏ; 2 bi trắng; hộp III gồm 4 bi đỏ Xét các bài toán sau: a) Chọn ngẫu nhiên một hộp, từ hộp đó lấy ra 2 bi Tính xác suất lấy được 2 bi đỏ b) Từ hộp I lấy 2 bi bỏ vào hộp II, rồi từ hộp II lấy ra 3 bi Tính xác suất lấy sau cùng được 1 bi đỏ, 2 bi trắng c) Từ hộp I lấy 2 bi bỏ vào hộp II, sau đó từ hộp II lấy 1 bi bỏ vào hộp III Sau đó từ hộp III lấy ra 2 bi, tính xác suất lấy sau cùng được 2 bi khác màu
6 (Trò chơi “chú tiểu” trong gameshow Hãy chọn giá đúng) Có 5 tấm thẻ trong đó có
Người chơi sẽ có cơ hội đoán giá của 4 sản phẩm, trong đó có 1 thẻ hình “chú tiểu” Nếu đoán đúng giá của bất kỳ sản phẩm nào, người chơi sẽ được chọn 1 tấm thẻ Cuối cùng, kết quả sẽ phụ thuộc vào hình ảnh trên các thẻ mà người chơi đã chọn.
Nếu một người chơi có khả năng đoán đúng giá một sản phẩm là 0,6, xác suất để người đó chiến thắng trong trò chơi sẽ được tính toán dựa trên khả năng đoán đúng này Cụ thể, xác suất chiến thắng sẽ là 0,6, tương ứng với khả năng chính xác của người chơi trong việc đưa ra dự đoán.
BIẾN NGẪU NHIÊN VÀ PHÂN PHỐI XÁC SUẤT
Biến ngẫu nhiên
Giả sử là không gian xác suất của một phép thử cho trước
2.1.1 Khái niệm biến ngẫu nhiên
Biến ngẫu nhiên, hay còn gọi là đại lượng ngẫu nhiên, là đại lượng có giá trị ngẫu nhiên và phụ thuộc vào kết quả của phép thử Trong toán học, biến ngẫu nhiên được biểu diễn dưới dạng hàm, đảm bảo rằng với mọi điều kiện, giá trị của nó có thể thay đổi.
Biến ngẫu nhiên thường ký hiệu là hay Tập giá trị của biến ngẫu nhiên ký hiệu là
Chú ý Biểu diễn là một biến cố Tổng quát hơn, nếu thì là một biến cố
1) Gieo hai con xúc xắc Gọi là tổng số chấm xuất hiện thì là biến ngẫu nhiên có và
Khi đó, biến cố “tổng số chấm nhỏ hơn 5” được biểu diễn
2) Một người bắn vào mục tiêu cho đến khi nào trúng thì dừng Gọi là số lần bắn thì là biến ngẫu nhiên có và
3) Trên đoạn AB độ dài , lấy ngẫu nhiên điểm M Gọi là độ dài đoạn AM thì là biến ngẫu nhiên có và
2.1.2 Phân loại biến ngẫu nhiên Dựa vào tập giá trị, ta phân biến ngẫu nhiên làm hai loại:
Biến ngẫu nhiên rời rạc nếu các giá trị nhận của nó là tập hữu hạn hoặc vô hạn đếm được
Biến ngẫu nhiên liên tục nếu các giá trị nhận của nó lấp đầy một hay một số khoảng hữu hạn hay vô hạn trên trục số
Ví dụ 2.1.2 Trong các biến ngẫu nhiên xét trong ví dụ 2.1.1 thì là biến ngẫu nhiên rời rạc, là biến ngẫu nhiên liên tục
Ngoài ra, trong thực tế, các biến ngẫu nhiên sau:
Các biến ngẫu nhiên rời rạc bao gồm số khách hàng đến một điểm phục vụ trong một khoảng thời gian nhất định, số sinh viên nhập học tại một trường Đại học trong một năm, và số tiền thưởng nhận được từ các trò chơi may rủi.
Thời gian hỏng hóc của thiết bị hoạt động, sai số trong đo lường đại lượng vật lý và tốc độ tăng trưởng thu nhập đều là những biến ngẫu nhiên liên tục.
2.1.3 Phân phối xác suất Điều quan tâm đối với một biến ngẫu nhiên là nó nhận một giá trị nào đó hoặc nhận giá trị trong một khoảng nào đó với xác suất bao nhiêu Đó chính là sự phân phối các xác suất trên tập giá trị nhận của biến ngẫu nhiên, gọi là quy luật phân phối xác suất Phân phối xác suất của biến ngẫu nhiên cho ta thông tin đầy đủ về biến ngẫu nhiên đó, từ đó có thể đưa ra các đặc trưng hay giải quyết các bài toán liên quan đến biến ngẫu nhiên sẽ đề cập ở các phần sau
Ví dụ 2.1.3 Phân phối xác suất của các biến ngẫu nhiên xét trong ví dụ 2.1.1 là
1) là tổng số chấm xuất hiện khi gieo 2 con xúc xắc thì
2) là số lần bắn cho đến khi trúng thì dừng Giả sử xác suất bắn trúng mỗi lần là thì
3) là độ dài đoạn AM khi chọn ngẫu nhiên M trên đoạn AB độ dài thì với
2.1.4 Sự độc lập các biến ngẫu nhiên
Hai biến ngẫu nhiên được coi là độc lập khi giá trị của một biến không ảnh hưởng đến giá trị của biến còn lại Cụ thể, hai biến ngẫu nhiên A và B là độc lập nếu xác suất xảy ra của A và B cùng một lúc bằng tích của xác suất xảy ra riêng biệt của chúng Điều này có nghĩa là việc xảy ra của biến ngẫu nhiên này không tác động đến việc xảy ra của biến ngẫu nhiên kia và ngược lại.
Trong một nghiên cứu về thỏ, có hai chuồng: chuồng I chứa 5 thỏ trắng và 7 thỏ nâu, trong khi chuồng II có 4 thỏ trắng và 3 thỏ nâu Khi tiến hành bắt ngẫu nhiên 2 thỏ từ mỗi chuồng, số lượng thỏ trắng được bắt ra từ chuồng I và chuồng II được coi là hai biến ngẫu nhiên độc lập.
Hàm phân phối xác suất
Định nghĩa Giả sử biến ngẫu nhiên xác định trên không gian xác suất
Khi đó, hàm xác định bởi
, gọi là hàm phân phối (xác suất) của
Dùng ký hiệu cho hàm phân phối của khi cần phân biệt
Một biến ngẫu nhiên xác định duy nhất một hàm phân phối Nó đặc trưng cho phân phối xác suất của biến ngẫu nhiên
Tính chất Hàm phân phối có các tính chất cơ bản sau: i) với mọi ii) là hàm không giảm, liên tục trái iii) iv) Với thì
Các tính chất của độ đo xác suất dẫn đến sự tương ứng hai chiều giữa biến ngẫu nhiên và hàm phân phối Cụ thể, mỗi biến ngẫu nhiên xác định duy nhất một hàm phân phối, và ngược lại, một hàm thỏa mãn các tính chất của hàm phân phối sẽ tồn tại biến ngẫu nhiên tương ứng Định lý này phát biểu rằng, nếu một hàm thỏa mãn các tính chất (i), (ii), (iii), thì sẽ tồn tại không gian xác suất và biến ngẫu nhiên phù hợp.
Ví dụ 2.2.1 Gọi là số chấm xuất hiện khi gieo 1 con xúc xắc thì ,
Khi đó, hàm phân phối của là hay
Ví dụ 2.2.2 Gọi là độ dài đoạn AM khi chọn ngẫu nhiên M trên đoạn AB độ dài thì hàm phân phối của là
Phân phối xác suất trong ví dụ 2.2.1 và 2.2.2 gọi là phân phối đều rời rạc và phân phối đều liên tục
1 Một biến ngẫu nhiên có hàm phân phối a) Tìm các hằng số và tính xác suất b) Tìm hàm phân phối của biến ngẫu nhiên
2 Cho là biến ngẫu nhiên có hàm phân phối
Tìm và tính xác suất để
3 Trên đường tròn tâm O bán kính , cho điểm cố định A Lấy ngẫu nhiên điểm M trên đường tròn và đặt Tìm hàm phân phối xác suất của và tính xác suất để
Biến ngẫu nhiên rời rạc
2.3.1 Bảng phân phối xác suất rời rạc
Biến ngẫu nhiên rời rạc được mô tả thông qua phân phối xác suất, thể hiện bằng dãy xác suất mà biến này có thể nhận tại mỗi giá trị trong tập giá trị của nó.
Đặt thì dãy gọi là phân phối xác suất (rời rạc) của và được mô tả bằng bảng phân phối xác suất như sau:
Hàm phân phối của biến ngẫu nhiên rời rạc được xác định qua đồ thị hàm bậc thang, với các bước nhảy xuất hiện tại các giá trị thuộc tập hợp của biến ngẫu nhiên.
Trong một lô sản phẩm gồm 7 sản phẩm tốt và 3 phế phẩm, khi chọn ngẫu nhiên 4 sản phẩm, ta cần xác định số sản phẩm tốt được lấy ra Để tìm phân phối xác suất của số sản phẩm tốt, ta sẽ xây dựng hàm phân phối tương ứng Đồng thời, cũng cần tính xác suất để lấy được phế phẩm trong quá trình chọn ngẫu nhiên này.
Giải Ta có và phân phối xác suất của là
hay bảng phân phối xác suất của là
1/30 9/30 15/30 5/30 Hàm phân phối của là
Xác suất lấy được phế phẩm là
Một sinh viên có thể thực hiện tối đa 5 lần thí nghiệm, và sẽ dừng lại nếu có 2 lần thành công Mỗi thí nghiệm diễn ra độc lập với xác suất thành công là 0,8 Cần xác định phân phối xác suất cho số lần thí nghiệm mà sinh viên đã thực hiện.
Giải Gọi là “thí nghiệm thứ thành công” Theo giả thiết thì các biến cố độc lập nhau và
Gọi là số thí nghiệm sinh viên đã làm thì và phân phối xác suất là
2.3.2 Hàm của biến ngẫu nhiên Giả sử là một biến ngẫu nhiên và là một hàm số thì là một biến ngẫu nhiên Từ phân phối xác suất của , ta có thể xác định được phân phối xác suất của Trong trường hợp biến ngẫu nhiên là rời rạc thì bài toán này khá đơn giản
Ví dụ 2.3.3 Giả sử là hai biến ngẫu nhiên độc lập với phân phối xác suất là
Tìm phân phối xác suất của các biến ngẫu nhiên
Giải Biến ngẫu nhiên có và phân phối xác suất là
Biến ngẫu nhiên có và từ giả thiết độc lập, suy ra phân phối xác suất là
2.3.3 Một số phân phối rời rạc thường gặp
Phân phối nhị thức là một loại phân phối xác suất, trong đó biến ngẫu nhiên nhận các giá trị theo quy luật xác suất nhất định Biến ngẫu nhiên này tuân theo phân phối nhị thức với các tham số xác định, được ký hiệu là
Trường hợp thì gọi là phân phối Bernoulli hay phân phối 0-1
Phân phối nhị thức được xác định từ mô hình dãy phép thử Bernoulli, trong đó xét một dãy phép thử với các biến cố quan sát Số lần xuất hiện của một biến cố trong các phép thử Bernoulli được ký hiệu là và có thể tính toán theo công thức Bernoulli.
, thì các biến ngẫu nhiên là độc lập, cùng phân phối Bernoulli và
Định lý Giả sử là hai biến ngẫu nhiên độc lập và , thì
Trong một đề thi trắc nghiệm gồm 30 câu với 4 phương án trả lời cho mỗi câu, trong đó chỉ có 1 phương án đúng, một thí sinh chọn ngẫu nhiên đáp án cho từng câu Để tính xác suất thí sinh chọn đúng 5 câu, ta sử dụng công thức xác suất phù hợp Tiếp theo, để xác định xác suất thí sinh chọn đúng ít nhất 5 câu, cần tính tổng xác suất cho các trường hợp từ 5 câu trở lên Cuối cùng, việc xác định khả năng thí sinh chọn đúng bao nhiêu câu và tính xác suất tương ứng sẽ giúp đánh giá khả năng làm bài của thí sinh trong bài thi này.
Giải Gọi là số câu chọn đúng đáp án của thí sinh trên thì Khi đó a) Xác suất chọn đúng đáp án 5 câu là
b) Xác suất chọn đúng đáp án ít nhất 5 câu là
c) Với thì Suy ra số câu chọn đúng có khả năng nhất là 7 câu và
Phân phối Poisson là một loại phân phối xác suất mà biến ngẫu nhiên nhận các giá trị nhất định, thường được ký hiệu bằng tham số λ Trong thực tế, khi có những giả thiết phù hợp, các biến ngẫu nhiên liên quan đến quá trình đếm trong một khoảng thời gian nhất định sẽ tuân theo phân phối Poisson với tham số là tốc độ dòng vào trung bình trong khoảng thời gian đó Ví dụ, số lượng cuộc gọi đến một tổng đài, số khách hàng chờ phục vụ, hay số tai nạn xảy ra tại một địa điểm cụ thể đều có thể được mô tả bằng phân phối này Định lý liên quan cho biết rằng nếu X và Y là hai biến ngẫu nhiên độc lập, thì tổng của chúng cũng sẽ tuân theo phân phối Poisson.
Giả sử số khách hàng vào một cửa hàng trong 1 giờ tuân theo phân phối Poisson, và số lượng khách hàng mỗi giờ là độc lập Cần tính xác suất có từ 3 đến 5 khách hàng vào cửa hàng trong 1 giờ, và từ 35 đến 40 khách hàng trong một ngày làm việc 8 giờ.
Giải a) Gọi là số khách hàng vào cửa hàng trong 1 giờ, theo giả thiết, thì Xác suất có từ 3 đến 5 khách vào cửa hàng là
Số khách hàng vào cửa hàng trong giờ làm việc được coi là các biến ngẫu nhiên độc lập và cùng phân phối Khi xem xét số khách hàng vào cửa hàng trong một ngày làm việc, xác suất có từ 35 đến 40 khách vào cửa hàng sẽ được tính toán dựa trên các biến này.
1 Cho biến ngẫu nhiên có phân phối xác suất a) Tìm hằng số và tính xác suất b) Tìm phân phối xác suất của các biến ngẫu nhiên ,
2 Một thiết bị gồm 4 bộ phận hoạt động độc lập với nhau Xác suất trong thời gian t các bộ phận bị hỏng tương ứng là 0,1; 0,05; 0,12 và 0,15 Gọi là số bộ phận bị hỏng của thiết bị trong thời gian t a) Lập bảng phân phối xác suất của b) Tính xác suất trong thời gian t có nhiều nhất 3 bộ phận bị hỏng, biết rằng có ít nhất 1 bộ phận bị hỏng trong thời gian t
3 Cho hai lô sản phẩm: Lô I gồm 8 chính phẩm và 2 phế phẩm; Lô II gồm 7 chính phẩm và 3 phế phẩm a) Từ mỗi lô lấy ra hai sản phẩm Gọi tương ứng là số chính phẩm lấy ra từ lô I, II Lập bảng phân phối xác suất của và tính b) Từ lô I lấy một sản phẩm bỏ vào lô II, sau đó từ lô II lấy ra hai sản phẩm Gọi là số chính phẩm lấy ra từ lô II Lập bảng phân phối xác suất của
4 Một hộp gồm 5 bi đỏ, 3 bi đen Lấy ngẫu nhiên một bi, ghi nhớ màu của nó rồi bỏ lại bi đó vào hộp cùng với một bi cùng màu khác Thực hiện 3 lần lấy như trên Lập bảng phân phối xác suất của số bi đỏ lấy ra
5 Một kho hàng chuyên cung cấp hàng cho 12 cửa hàng Xác suất để mỗi cửa hàng đặt hàng cho kho đó trong ngày là 0,3 Gọi là số đơn đặt hàng cho kho trong một ngày a) Hỏi có phân phối xác suất gì? b) Tính xác suất trong một ngày có từ 5 đến 7 đơn đặt hàng của các cửa hàng cho kho trên c) Tìm số đơn đặt hàng có khả năng nhiều nhất cho một ngày và tính xác suất tương ứng với nó
6 Một nhóm 3 xạ thủ với xác suất bắn trúng mục tiêu tương ứng là 0,8; 0,85; 0,7
Chọn ngẫu nhiên một xạ thủ và cho người đó bắn ba viên đạn Tìm phân phối xác suất của số viên đạn bắn trúng mục tiêu
Biến ngẫu nhiên liên tục
2.4.1 Hàm mật độ xác suất Định nghĩa Giả sử biến ngẫu nhiên liên tục có hàm phân phối được biểu diễn dạng
, thì được gọi là hàm mật độ (xác suất) của
Tính chất Hàm mật độ có các tính chất sau: i) với mọi ii) iii) tại các điểm liên tục của iv)
Giả sử là một hàm số thỏa mãn hai tính chất (i) và (ii) của hàm mật độ Đặt
Để một hàm được coi là hàm phân phối, nó cần thỏa mãn các tính chất nhất định Điều này cho thấy rằng tồn tại một biến ngẫu nhiên với hàm phân phối tương ứng, cùng với hàm mật độ liên quan Như vậy, có những điều kiện cụ thể để xác định một hàm bất kỳ có thể là hàm mật độ của một biến ngẫu nhiên.
Chú ý là biến ngẫu nhiên liên tục thì nên
Từ tính chất của hàm mật độ và tích phân thì với khá bé, ta có
Xác suất để biến ngẫu nhiên liên tục nhận giá trị trong một khoảng lân cận là rất nhỏ, gần như tỷ lệ với hàm mật độ Điều này cho thấy ý nghĩa quan trọng của hàm mật độ trong xác suất.
Ví dụ 2.4.1 Cho là biến ngẫu nhiên có hàm phân phối
Tìm và hàm mật độ
Khi đó hàm mật độ của là
Ví dụ 2.4.2 Cho biến ngẫu nhiên có hàm mật độ dạng
Xác định hằng số và hàm phân phối Tính xác suất
Từ , dễ dàng suy ra
Xác suất cần tìm là
2.4.2 Hàm của biến ngẫu nhiên
Giả sử X là một biến ngẫu nhiên liên tục và f là một hàm số, thì Y sẽ là một biến ngẫu nhiên, có thể là rời rạc hoặc liên tục Để xác định phân phối xác suất của Y, chúng ta dựa vào hàm phân phối của X Các ví dụ dưới đây sẽ minh họa phương pháp tìm phân phối xác suất này.
Ví dụ 2.4.3 Xét biến ngẫu nhiên có hàm phân phối
Tìm phân phối xác suất của các biến ngẫu nhiên
Giải Tập giá trị , suy ra Do đó là biến ngẫu nhiên liên tục, là biến ngẫu nhiên rời rạc
Hàm phân phối và hàm mật độ của :
Phân phối xác suất của :
2.4.3 Một số phân phối liên tục thường gặp
Phân phối mũ Biến ngẫu nhiên gọi là tuân theo phân phối mũ tham số , ký hiệu , nếu có hàm mật độ, hàm phân phối dạng: Đồ thị
Phân phối mũ được ứng dụng rộng rãi trong nhiều lĩnh vực thực tiễn, như trong việc tính toán thời gian sống của sinh vật, thời gian sử dụng thiết bị, và thời gian chờ trong hàng đợi Đặc biệt, định lý về tính không nhớ của phân phối mũ là một đặc trưng quan trọng, cho phép chúng ta hiểu rõ hơn về các hiện tượng liên quan đến thời gian trong các hệ thống này.
Giả sử tuổi thọ của một mạch điện tử trong máy tính được mô tả bởi phân phối mũ, với thời gian bảo hành là 2 năm Câu hỏi đặt ra là tỷ lệ phần trăm mạch điện tử cần phải thay thế trong thời gian bảo hành này là bao nhiêu.
Tuổi thọ của mạch điện tử được xác định theo giả thiết rằng nếu mạch điện tử bị thay thế trong thời gian bảo hành, thì tuổi thọ của nó phải dưới 2 năm.
Vậy có khoảng 12,5% số mạch điện tử bán ra phải thay thế trong thời gian bảo hành
Phân phối chuẩn Biến ngẫu nhiên gọi là tuân theo phân phối chuẩn tham số ( ), ký hiệu , nếu có hàm mật độ dạng:
Phân phối chuẩn, được phát hiện bởi Gauss vào năm 1809, đóng vai trò quan trọng trong lý thuyết xác suất và thống kê toán học Nhiều biến ngẫu nhiên trong thực tế, như trọng lượng, chiều cao của sinh vật, điểm thi của thí sinh, năng suất cây trồng và lãi suất của công ty, đều tuân theo phân phối này Trường hợp đặc biệt của nó được gọi là phân phối chuẩn tắc, với hàm mật độ và hàm phân phối có dạng cụ thể.
(gọi là tích phân Laplace)
Hàm phân phối không thể được biểu diễn qua các hàm sơ cấp đã biết, và giá trị của nó thường được tra cứu từ các bảng phụ lục Đặc biệt, cần lưu ý đến các tính chất của hàm này Một định lý quan trọng cho thấy mối liên hệ cơ bản giữa phân phối chuẩn và phân phối chuẩn tắc Cụ thể, giả sử có một biến số được đặt, thì mối quan hệ giữa chúng sẽ được xác định rõ ràng.
Theo định lý, các phép tính liên quan đến phân phối chuẩn có thể được thực hiện thông qua việc chuẩn hóa về phân phối chuẩn tắc Ví dụ, dựa trên giả thiết của định lý này, các kết quả tính toán sẽ chính xác hơn.
Định lý Giả sử , và độc lập thì tổ hợp tuyến tính bất kỳ của cũng có phân phối chuẩn, đặc biệt
Trong ví dụ 2.4.5, trọng lượng của sản phẩm M (đơn vị: gam) từ một máy sản xuất tự động được coi là biến ngẫu nhiên với phân phối chuẩn Sản phẩm được xem là đạt tiêu chuẩn kỹ thuật khi trọng lượng nằm trong khoảng từ 98g đến 102g Câu hỏi a) yêu cầu tìm tỷ lệ sản phẩm đạt tiêu chuẩn kỹ thuật do máy sản xuất Câu hỏi b) đề cập đến tỷ lệ sản phẩm có trọng lượng trên gam chiếm 15,9%, và yêu cầu xác định giá trị tương ứng.
Giải Gọi là trọng lượng của một sản phẩm M, theo giả thiết thì với
Khi đó a) Tỷ lệ sản phẩm đạt tiêu chuẩn kỹ thuật là b) Ta có
Quy tắc và Cho thì
Hai kết quả trên cho ta quy tắc như sau:
“Nếu có phân phối chuẩn thì có đến 95,44% giá trị của nằm trong khoảng và 99,73% (hầu như toàn bộ) giá trị của nằm trong khoảng ”
1 Cho biến ngẫu nhiên có hàm mật độ dạng a) Xác định và tính xác suất b) Tìm hàm phân phối c) Tìm hàm mật độ của
2 Cho là biến ngẫu nhiên có hàm mật độ Tìm biết rằng Tìm hàm phân phối tương ứng
3 Cho biến ngẫu nhiên có hàm mật độ và hàm phân phối liên hệ như sau: Hãy xác định phân phối xác suất của , biết rằng
4 Giả sử thời gian sử dụng (đv: năm) của một loại thiết bị là tuân theo phân phối mũ Thời gian bảo hành của thiết bị trên là 6 tháng a) Tính xác suất khi dùng một thiết bị trên không cần phải bảo hành (không bị hỏng dưới 6 tháng) b) Hỏi trong 20 thiết bị trên, xác suất để số thiết bị có thời gian sử dụng trên 6 năm nằm trong khoảng [16; 18] là bao nhiêu?
5 Giả sử thời gian phục vụ S (đv: phút) cho một khách hàng ở một cửa hàng là tuân theo có phân phối mũ Biết rằng xác suất một khách hàng được phục vụ dưới
5 phút là 0,51 a) Xác định b) Tính xác suất khi phục vụ cho 15 khách thì có từ 3 đến 5 khách có thời gian phục vụ nằm trong khoảng (5; 10) phút
6 Giả sử số tiền dùng mạng/tháng (đvị: nghìn đồng) của một hộ gia đình là biến ngẫu nhiên tuân theo phân phối chuẩn với Tính xác suất a) Hộ gia đình trên trả tiền mạng không dưới 100 nghìn đồng/tháng b) Trong một năm sử dụng, hộ trên có 2 tháng trả tiền mạng trên 100 nghìn đồng
7 Giả sử thời gian (đv: phút) đi từ nhà tới trường của sinh viên M tuân theo phân phối chuẩn Biết rằng có 64,8% số ngày M đến trường mất hơn 20 phút và 5,3% số ngày mất hơn 30 phút a) Xác định b) Giả sử M xuất phát từ nhà trước giờ vào học 25 phút Tính xác suất để M bị muộn học c) Sinh viên M cần xuất phát trước giờ vào học bao nhiêu phút để khả năng bị muộn học là nhỏ hơn 0,02.
Các đặc trưng của biến ngẫu nhiên
Phân phối xác suất là thông tin quan trọng nhất để mô tả biến ngẫu nhiên Tuy nhiên, trong nhiều trường hợp, chỉ cần một số thông tin cơ bản như giá trị trung bình và sự phân tán của các giá trị Bài viết này sẽ khám phá các đặc trưng về vị trí của phân phối, bao gồm kỳ vọng, mode và trung vị, cũng như sự phân tán của phân phối thông qua phương sai và độ lệch tiêu chuẩn.
2.5.1 Kỳ vọng Định nghĩa Kỳ vọng của biến ngẫu nhiên , ký hiệu , được xác định như sau:
Nếu là biến ngẫu nhiên rời rạc với phân phối xác suất thì
Nếu là biến ngẫu nhiên liên tục với hàm mật độ thì
Kỳ vọng chỉ tồn tại khi tổng chuỗi hoặc tích phân hội tụ Nó đại diện cho giá trị trung bình có trọng số xác suất mà biến ngẫu nhiên đạt được, như thu nhập trung bình, thời gian chờ trung bình, số lượng khách hàng trung bình, và lợi nhuận trung bình.
Giả sử có một biến ngẫu nhiên liên quan đến một phép thử cụ thể Khi thực hiện phép thử này, giá trị của biến ngẫu nhiên sẽ được ghi nhận Theo Luật số lớn, giá trị trung bình của biến ngẫu nhiên sẽ tiến gần đến giá trị kỳ vọng khi số lần thực hiện phép thử tăng lên.
Tính chất a) với mọi hằng số b) c) d) Nếu độc lập thì e) Cho hàm số thì
nếu là rời rạc với phân phối
nếu là liên tục với hàm mật độ
Ví dụ 2.5.1 Cho biến ngẫu nhiên có bảng phân phối xác suất như sau:
Ví dụ 2.5.2 Cho biến ngẫu nhiên có hàm mật độ
2.5.2 Trung vị (Median) Định nghĩa Trung vị (hay Median) của biến ngẫu nhiên , ký hiệu , được xác định như sau: hay và Ý nghĩa Trung vị là điểm chia phân phối xác suất của biến ngẫu nhiên thành 2 phần bằng nhau Chẳng hạn mức thu nhập mà gần 50% người có thu nhập dưới mức đó; mốc thời gian mà xác suất một thiết bị có tuổi thọ dưới mốc đó là gần 0,5 … Trong nhiều trường hợp, ta thường dùng trung vị thay thế kỳ vọng để đặc trưng cho vị trí của phân phối, đặc biệt là đối với các biến ngẫu nhiên có thể nhận giá trị bất thường
Dựa vào hàm phân phối của biến ngẫu nhiên để xác định trung vị Cụ thể:
Nếu là liên tục thì là nghiệm của phương trình
Nếu là rời rạc thì
Ví dụ 2.5.3 Xác định trung vị của các biến ngẫu nhiên trong ví dụ 2.5.1 và 2.5.2
Giải Ta có , suy ra
Hàm phân phối của là
2.5.3 Mốt (Mode) Định nghĩa Mốt (hay Mode) của biến ngẫu nhiên , ký hiệu , được xác định như sau:
Nếu là biến ngẫu nhiên rời rạc với phân phối xác suất thì
Nếu là biến ngẫu nhiên liên tục với hàm mật độ thì
Mốt là giá trị có xác suất xuất hiện cao nhất trong một biến ngẫu nhiên Nó thường được sử dụng để dự đoán giá trị mà biến ngẫu nhiên có thể nhận được khi tiến hành thử nghiệm.
Theo định nghĩa thì việc xác định mốt dựa vào các phương pháp tìm giá trị lớn nhất của một dãy số hay một hàm số
Ví dụ 2.5.4 Xác định mốt của các biến ngẫu nhiên trong ví dụ 2.5.1 và 2.5.2
Giải Ta có là lớn nhất, suy ra
Ta thấy hàm mật độ là hàm giảm trên đoạn , do đó
2.5.4 Phương sai, độ lệch tiêu chuẩn Định nghĩa Phương sai của biến ngẫu nhiên , ký hiệu hay , được xác định như sau:
Đại lượng được gọi là độ lệch tiêu chuẩn của
Phương sai là độ lệch bình phương trung bình của biến ngẫu nhiên so với giá trị kỳ vọng, giúp đo lường sự phân tán của các giá trị Khi phương sai và độ lệch tiêu chuẩn cao, điều này cho thấy sự phân tán lớn hơn của biến ngẫu nhiên, ngược lại, giá trị thấp cho thấy sự phân tán ít hơn.
Về mặt đơn vị, có cùng đơn vị đo với nên thông thường ta dùng độ lệch tiêu chuẩn để đánh giá sự phân tán của biến ngẫu nhiên
Tính chất Từ tính chất của kỳ vọng suy ra một số tính chất của phương sai như sau: a) b) với mọi hằng số c) d) Nếu độc lập thì
Ví dụ 2.5.5 Xác định phương sai, độ lệch tiêu chuẩn của các biến ngẫu nhiên trong ví dụ 2.5.1 và 2.5.2
2.5.5 Các đặc trưng của một số phân phối thường gặp Bảng dưới đây tóm tắt các kết quả về đặc trưng kỳ vọng, phương sai của một số phân phối xác suất được đề cập trong các phần trước
Phân phối xác suất Kỳ vọng Phương sai Nhị thức
Mũ Chuẩn Chứng minh các kết quả trên xem như bài tập cho độc giả
Ví dụ 2.5.6 Giả sử , và độc lập Tính a) Kỳ vọng và phương sai của biến ngẫu nhiên b) Kỳ vọng của biến ngẫu nhiên
Giải Từ giả thiết, suy ra và a) ;
1 Cho biến ngẫu nhiên có hàm mật độ a) Tính các đặc trưng b) Tính kỳ vọng và phương sai của biến ngẫu nhiên
2 Một hộp gồm 5 bi trắng, 3 bi đen Lấy ngẫu nhiên từ hộp ra 4 bi Gọi là số bi trắng lấy ra a) Lập bảng phân phối xác suất và tính các đặc trưng của b) Giả sử mỗi bi trắng lấy ra được 5 đồng, bi đen được 2 đồng Gọi là số tiền thu được từ 4 bi lấy ra Tính
3 Thu nhập của dân cư một vùng (đv: trđ/tháng) là biến ngẫu nhiên có hàm mật độ là a) Xác định thu nhập bình quân và sự phân tán thu nhập của dân cư trong vùng b) Hãy xác định mức thu nhập mà có 50% dân cư trong vùng có thu nhập dưới mức này
4 Số khách trên một xe buýt tại một tuyến giao thông có phân phối xác suất như sau:
Số khách đi mỗi chuyến 20 25 30 35 40
Để phân tích số khách đi mỗi chuyến xe, chúng ta có các xác suất tương ứng là 0,2, 0,3, 0,15, 0,1 và 0,25 Cần tính toán kỳ vọng, mốt và độ lệch chuẩn để hiểu rõ hơn về hành vi của khách hàng Kỳ vọng cho biết số lượng khách trung bình mỗi chuyến, mốt cho thấy số khách xuất hiện nhiều nhất, và độ lệch chuẩn phản ánh sự biến động trong số lượng khách Bên cạnh đó, nếu chi phí cho mỗi chuyến xe là 120 ngàn đồng và công ty mong muốn thu được lãi bình quân 20 ngàn đồng, giá vé cần được quy định là 140 ngàn đồng để đạt được mục tiêu lợi nhuận này.
5 Giả sử thời gian đợi (đv: phút) của một hành khách tại một trạm xe buýt tuân theo phân phối mũ a) Tính và nêu ý nghĩa các giá trị tính b) Hỏi trong 12 khách đợi ở trạm xe buýt trên thì trung bình có bao nhiêu khách phải đợi trên 5 phút
6 Một người cân nhắc giữa việc mua cổ phiếu của công ty A và công ty B hoạt động trong hai lĩnh vực độc lập nhau Biết lãi suất cổ phiếu của hai công ty là các biến ngẫu nhiên có phân phối chuẩn với các tham số như sau:
Kỳ vọng (%) Độ lệch chuẩn (%)
Nếu bạn muốn đạt được lãi suất tối thiểu là 10%, bạn nên xem xét mua cổ phiếu của công ty B Để hạn chế rủi ro, bạn có thể đầu tư vào cả hai công ty với tỷ lệ hợp lý, nhằm giảm thiểu mức độ rủi ro về lãi suất.
Trong trò chơi bầu cua, giả sử bạn đặt cược 1$ cho một cửa Số tiền thu được khi đặt 1 cửa sẽ khác với số tiền thu được khi đặt 2 cửa Để phân tích, cần tính kỳ vọng và phương sai của số tiền thu được từ các cược này Những kết quả này sẽ giúp hiểu rõ hơn về rủi ro và lợi nhuận trong trò chơi.