Một số kiến thức cơ bản về phân phối Poisson
Phân phối mũ
Phân phối mũ đóng vai trò quan trọng trong nhiều ứng dụng của xác suất Dưới đây trình bày vài tính chất cơ bản của phân phối mũ.
Ta nói rằng biến ngẫu nhiên X có phân phối mũ với tham số λ > 0 nếu mật độ xác suất của nó có dạng f(x) λe −λx , nếu x ≥ 0
Bằng các tính toán đơn giản ta thu được các kết quả sau
* X có phân phối mũ với tham số λ > 0 khi và chỉ khi các hàm phân phối xác suất của nó có dạng
*X có phân phối mũ với λ > 0 thì
E(X) = λ 1 , E(X 2 ) = λ 2 2, V ar(X) = λ 1 2.1.1.2 Các tính chất của phân phối mũ
* Ta nói rằng biến ngẫu nhiên X không nhớ nếu
Rõ ràng (1.1) tương đương với một trong hai điều kiện sau
Nhận xét X có phân phối mũ khi và chỉ khi X không nhớ.
Giả sử bóng đèn điện trong phòng có thời gian sống trung bình là 10 giờ và tuân theo phân phối mũ Khi Nam vào phòng và thấy bóng đèn đang sáng, chúng ta cần tính xác suất để Nam có thể làm việc liên tục trong 5 giờ với bóng đèn này.
Gọi X là thời gian sống của bóng đèn Khi đó ta có:
Vì X không nhớ( đã thắp sáng bao nhiêu lâu rồi ) nên xác suất phải tìm là:
P(X >5) = 1−P(X ≤ 5) = 1−F(5) = 1−(1−e −5λ ) =e −0,5 Chú ý rằng nếu X biết nhớ thì xác suất phải tìm là:
1−F(t) , trong đó t là thời gian bóng đèn đã được sử dụng trước khi Nam bước vào phòng.
Giả sử X1, X2, , Xn là các biến ngẫu nhiên độc lập và cùng phân phối mũ với tham số λ Khi đó, tổng X1 + X2 + + Xn sẽ có phân phối gamma với các tham số m và λ Hàm mật độ của phân phối này được biểu diễn dưới dạng f n (x) = (λx)^(n−1).
Thật vậy, hiển nhiên kết luận trên đúng với n= 1.
Giả sử kết luận đúng với n−1 Khi đó ta có: f n (x) ∞
= (λx) n−1 (n−1)!λe −λx Chú ý: Nếu X có phân phối gamma với các tham số n và λ thì trong đó f(x) là hàm mật độ của X 1
Hàm tốc độ hỏng r(t) của một thiết bị, với X là thời gian sống của thiết bị đó, được xác định bằng công thức r(t) = f(t), trong đó f(t) là hàm mật độ và F(t) là hàm phân phối tương ứng của biến ngẫu nhiên X.
Để hiểu ý nghĩa của r(t), ta giả định rằng thiết bị X đã hoạt động được thời gian t Mục tiêu là xác định xác suất để thiết bị X không hoạt động vượt quá thời gian t + ∆t, tức là thiết bị sẽ hỏng trước thời điểm t + ∆t, với ∆t > 0.
1−F(t) = r(t)∆t , tức là, r(t) biểu thị mật độ xác suất có điều kiện để thiết bị có tuổi t sẽ không làm việc được nữa.
Dễ thấy rằng, nếu X có phân phối mũ với tham số λ thì: r(t) = f(t)
Như vậy hàm tốc độ hỏng của phân phối mũ là một hằng số (bằng tham số của phân phối ấy).
Chú ý: Hàm tốc độ hỏng r(t) xác định duy nhất hàm phân phối F(t)
Do đó, phân phối mũ là phân phối duy nhất có hàm tốc độ hỏng là hằng số.
Phân phối Poisson
Biến ngẫu nhiên X được gọi là có phân phối Poisson với tham số λ >0 nếu
Cho biến ngẫu nhiên X có phân phối Poisson với tham số λ > 0 ta kí hiệu X ∼ P(λ). a Kì vọng và phương sai của phân phối Poisson
= λ 2 +λ. Vậy DX = λ. b Hàm đặc trưng của phân phối Poisson ϕ X (t) = Ee itx ∞
(λ.e k! it ) k = e −λ e λ.e it = e λ.e it −λ = e λ.(e it −1) Vậy ϕ X (t) =e λ.(e it −1)
1.2.2 Các tính chất của phân phối Poisson
1.2.2.1 Giả sử X, Y là hai biến ngẫu nhiên độc lập, với X ∼ P(λ 1 ) và Y ∼P(λ 2 ).
Ta có X, Y độc lập nên ϕ X+Y (t) = ϕ X (t).ϕ Y (t).
Mà ϕ X (t) =e λ 1 (e it −1) ϕ Y (t) =e λ 2 (e it −1) Suy ra ϕ X (t).ϕ Y (t) = e λ 1 (e it −1) e λ 2 (e it −1)
Giả sử N là biến ngẫu nhiên có phân phối Poisson với tham số λ > 0 ,
X là biến ngẫu nhiên sao cho
Khi đó X có phân phối Poisson với tham số λp, nghĩa là X ∼ P(λp). 1.2.2.3 Luật biến cố hiếm
Giả sử A là một biến cố có xác suất xảy ra là p Biến X được định nghĩa là số lần xuất hiện của A trong n lần quan sát Do đó, X tuân theo phân phối nhị thức.
Luật biến cố hiếm cho biết rằng khi p nhỏ và n lớn, phân phối nhị thức có thể được xấp xỉ bằng phân phối Poisson.
Quá trình đếm N (t)
Giả sử A là biến cố nào đó Ký hiệu N(t), t ≥ 0 là số lần biến cố A xuất hiện trong khoảng thời gian từ 0 tới t ( kể cả thời điểm t) Khi đó
N(t), t ≥ 0 được gọi là quá trình đếm.
Chẳng hạn ta có những ví dụ sau về quá trình đếm
• A là biến cố khách vào cửa hàng nào đó Khi ấy N(t) là số khách hàng vào cửa hàng tính tới thời điểm t.
• A là biến cố điện thoại gọi tới trạm bưu điện nào đó Khi ấy N(t) là số lần gọi tới trạm bưu điện tính tới thời điểm t.
• A là biến cố sinh con trai Khi ấy N(t) là số con trai sinh được tính tới thời điểm t.
Nếu N(t) là quá trình đếm, thì N(t) là biến ngẫu nhiên có các tính chất sau
2 N(t) là số nguyên không âm.
4 N(s, t] = N(t)−N(s), (0≤ s < t), là số lần biến cố A xẩy ra trong khoảng thời gian (s, t].
Ta gọi {N(s, t],0 ≤ s < t} là quá trình điểm tương ứng với quá trình đếm {N(t), t ≥0}.
Quá trình Poisson
1.4.1 Các giả thiết quan trọng
Quá trình Poisson là một quá trình đếm {N(t), t ≥ 0} với các đặc điểm chính sau: Thứ nhất, các gia số trong quá trình này là độc lập, nghĩa là với mọi m ≥ 2 và các thời điểm 0 = t0 < t1 < t2 < < tm, các biến ngẫu nhiên N(t0, t1], N(t1, t2], , N(tm−1, tm] là độc lập với nhau Thứ hai, quá trình này có số gia dừng, tức là với mọi s > 0 và 0 ≤ t1 < t2, các gia số N(t1 + S, t2 + S] cũng thỏa mãn điều kiện dừng.
N(t 1 , t 2 ] là các biến ngẫu nhiên trong cùng phân phối xác suất. c Tồn tại hằng số λ > 0 sao cho với h >0 khá bé thì
P[N(h) ≥ 2] = o(h). Ý nghĩa toán học của giả thiết trên Đặt P n (t) = P[N(t) = n], (n = 0,1,2, ).
1! ;P n (t) = (λt) n e −λt n! Tức là N(t) có phân phối Poisson với tham số λt.
Cho X = {X(t), t ≥ 0} là một quá trình ngẫu nhiên Ta nói rằng X là một quá trình Poisson với cường độ λ >0 nếu
(ii) X có gia số độc lập.
Biến ngẫu nhiên X t − X s (0 ≤ s < t) tuân theo phân phối Poisson với tham số λ(t−s), được biểu diễn bằng công thức P(X t − X s = k) = e −λ(t−s) [λ(t−s)] k! k, với k = 0, 1, 2 Hầu hết các quỹ đạo của biến ngẫu nhiên này là các hàm nguyên không âm và không giảm, với các bước nhảy bằng 1.
(E(X t −X s ) = D(X t −X s ) =a.(t−s)). 1.4.3 Điều kiện cần và đủ để {X(t), t ≥ 0} là quá trình Poisson
Từ định nghĩa ta thấy:
P n (h) = (λh) n n! e −λh Khai triển Taylor ta có
Vậy quá trình Poisson là quá trình thõa mãn các tiên đề trên, và ngược lại quá trình đếm thõa mãn các giả thiết trên là quá trình Poisson.
Mô hình Poisson
Quá trình Poisson có nhiều ứng dụng quan trọng trong các lĩnh vực như thông tin, liên lạc và kinh tế, đồng thời cũng đóng vai trò quan trọng trong lý thuyết phục vụ đám đông.
Xét X(t) là số lần gọi đến tổng đài trong khoảng thời gian t Chúng ta có thể chấp nhận các giả thiết rằng xác suất xảy ra n lần gọi trong khoảng thời gian t phụ thuộc vào n và t, nhưng không phụ thuộc vào vị trí của khoảng thời gian này trên trục thời gian.
Vậy X(t) là quá trình dừng. b Số lần gọi đến trong những khoảng thời gian không giao nhau là các biến ngẫu nhiên độc lập.
Quá trình X(t) được xác định là có gia số độc lập Xác suất xảy ra nhiều hơn một lần gọi đến trong khoảng thời gian t nhỏ (P[X(t) ≥ 2]) là rất nhỏ, với bậc cao hơn t.
Tức là: bất kỳ t, u thì từ a) và b) ta có P 0 (t+ u) =P 0 (t).P 0 (u).
Nghiệm duy nhất của phương trình này là: P 0 (t) =e −λt
Theo công thức Taylor: khi t khá bé thì
Mặt khác từ c) ta có: với n≥ 1 thì
Nên nghiệm duy nhất của phương trình trên là
Giả sử sự cố hỏng của một đường dây liên lạc xẩy ra theo quá trình Poisson với cường độ λ = 0.1 trên 1km ta cần tính.
• a Xác suất không có sự cố hỏng trong 2km đầu.
• b Xác suất không có sự cố hỏng ở km thứ 3, biết rằng không có sự cố hỏng ở 2 km đầu.
Giải λ = 0.1 a Xác suất không có sự cố hỏng trong 2 km đầu, vì X(2) có phân phối Poisson nên áp dụng công thức
P 0 (2) = P[X(2) = 0] = e −0.2 ≈ 0.8187. b Ta có X(3)−X(2) và X(2)−X(0) độc lập nên
Giả sử số khách đến một cửa hàng tuân theo quá trình Poisson với cường độ λ = 4 khách mỗi giờ Cửa hàng mở cửa lúc 9 giờ sáng Tính xác suất để đến 9 giờ 30 phút có đúng 1 khách đến cửa hàng và cho đến 11 giờ 30 phút có tổng cộng 5 khách đến.
Gọi thời điểm xuất phát là t 0 = 9 : 00 Xác suất cần tìm là
1.5.3 Quá trình không thuần nhất
Quá trình Poisson không thuần nhất xảy ra khi cường độ của quá trình phụ thuộc vào thời gian, cụ thể là khi λ = λ(t) Trong trường hợp này, sự chênh lệch X(t)−X(s) sẽ tuân theo phân phối Poisson với tham số là t.
1.5.4 Các giả thiết quan trọng về quá trình Poisson N(t), t ≥ 0
Quá trình Poisson là một quá trình đếm N(t) với các đặc điểm chính như sau: i) các số gia của N(t) là độc lập; ii) các số gia của N(t) là dừng; iii) tồn tại một λ > 0 sao cho với h rất nhỏ, quá trình vẫn giữ được tính chất của nó.
P(N(h) = 1) = λh+o(h)(= 1−e −λh ). iv) Với h >0 khá bé thì P(N(h) ≥ 2) = o(h).
Các quá trình Poisson lập thành martingale
Ví dụ 1 Giả sử (X t ) t≥0 là quá trình Poisson với tham số λ > 0,
Trong bài viết này, chúng ta xem xét quá trình Poisson (X(t)) t và chứng minh rằng (Y(t) = X(t) - λt) lập thành martingale Đầu tiên, do (X(t)) t có số gia độc lập, nên (Y(t)) t cũng sẽ có số gia độc lập Thứ hai, vì (X(t)) t là quá trình Poisson, ta có E(X(t) - X(s)) = λ(t - s).
Từ đó suy ra: EX t −λt = 0 Hay E(Y t ) = 0.
Vậy (Y t = X t −λt) lập thành martingale đối với F ≤ ≈
Giả sử (X t ) t≥0 là quá trình Poisson với tham số λ > 0, F ≤t = σ(ω :
X s , s ≤ t) Khi đó (Y t = (X t −λt) 2 −λt) lập thành martingale.
Chứng minh i) Do (X(t)) t là quá trình Poisson nên (X(t)) t ≥0 có số gia độc lập Do đó, (Y(t)) t có số gia độc lập. ii) Do (X(t)) t ≥0 là quá trình Poisson nên E(X t − X s ) = λ(t− s) và D(X t −X 0 ) =λ(t−s).
Vậy (Y t = (X t −λt) 2 −λt) lập thành martingale đối với F ≤
Về xấp xỉ quá trình Poisson trên không gian trừu tượng
Các định nghĩa và giả thiết
Giả sử X là tập trừu tượng bất kì, F là vành của các tập hợp con của
X và λ là hàm tập cộng tính trên F Cho không gian xác suất (Ω,A, P) và hàm X(E,Ω) là hàm lấy giá trị nguyên không âm, có tính chất cộng tính
Ta đưa vào các giả thiết sau đây
A 1 Với mọi ε > 0 và mọi E ∈ F tồn tại khai triển E n
B 1 Với mỗi E ∈ F thì X(E) có các tính chất sau
1 P(X(E) = 0) = e −λ(E) ( Chẳng hạn xác suất để không có ai gọi trong khoảng thời gian E).
2 P(X(E) ≥ 2)≤ λ(E).δ(λ(E)) (Chẳng hạn xác suất để có không quá
2 lần gọi) Trong đó lim x−→0δ(x) = 0. Đặt η = max
Số đo mức độ chênh lệch giữa 2 biến ngẫu nhiên lấy giá trị nguyên không âm X(E) và Y(E) được định nghĩa là d(X(E), Y(E)) = sup
|P[X(E) ∈ A]−P[Y(E) ∈ A]|. trong đó B là σ đại số cảm sinh bởi các số nguyên không âm {0, 1, 2, , n}.
Từ định nghĩa trên ta có d(X(E), Y(E)) = 1 2 n
Người ta còn đưa vào một độ đo khác về sự chênh lệch giữa X và Y được định nghĩa là d 0 (X(E), Y(E)) = sup k≥0
Từ A 1 và B 1 , trong [4] đã chỉ ra rằng với mỗi E ∈ F , X(E) n
X(E i ) có phân phối Poisson với tham số λ(E)
Mục đích của chương này là chỉ ra giới hạn của sai số khi xấp xỉ phân bố n
X(E i ) tuân theo phân bố Poisson, và từ đó chúng ta có thể thiết lập một giới hạn trên đơn giản liên quan đến các tham số ε, η và λ đối với d 0 (X(E), Z(E)) và d(X(E), Z(E)) Trong đó, Z(E) là một biến ngẫu nhiên được phân phối Poisson với tham số λ(E) Để tiếp tục, chúng ta cần các bổ đề sau.
Bổ đề 1.[4] Cho dãy các biến ngẫu nhiên độc lập BernoulliX 1 , X 2 , ,
X n với xác suất thành công tương ứng là : p 1 , p 2 , , p n và cho Z có phân phối Poisson với trung bình n
Bổ đề 2 [4] Giả sử Y là quá trình Poisson với tham số λ, và Z làPoisson với tham số λ 0 > λ Khi đó d(Y, Z) ≤ λ 0 −λ.
Xấp xỉ quá trình Poisson với các giả thiết A 1 , B 1
Đầu tiên ta sẽ chứng minh Định lý1
Trong các điều kiện A 1 , B 1 với mỗi E ∈ F, ta có: d(X(E), Z(E)) ≤C(ε).λ(E).(ε+ η), (3) trong đó C(ε) là hằng số dương phụ thuộc chỉ vào ε ( 0 < ε 1, i=1,2, ,n là các số tùy ý.
Từ định lý 1 và định lý 4 trong [4], ta thu được Định lý 3
Trong đó λ(E) là độ đo trên F, tuân theo điều kiện A 1 Nếu đối với tất cả:
P[X i (E) = 0] = a F((λ(E))) i , i=1,2 ,n, a i > 1 là các số tùy ý và F(x) là hàm nhận giá trị thực thì khi đó ta có ước lượng: d(X i (E), Z i (E)) ≤L i (ε, n)à i (E)ε, i = 1,2 , n
X i=1 λ(E i ) = λ(E) là đại lượng không lớn lắm và λ(E i ) khá bé thì n
P i=1 λ 2 (E i )có thể nhỏ ngay cả với số lớn[ max
Do đó sự ràng buộc về n
P i=1 λ 2 (E i )mang lại kết quả tốt hơn cho[ max
2.3 Xấp xỉ Poisson với các giả thiết A 2 và B 2
Bây giờ ta giả thiết rằng thay các điều kiện A 1 và B 1 bởi các điều kiện sau
A 2 Với mỗi E ∈ F, tồn tại phép phân hoạch E n
B 2 Với mỗi E ∈ F, thõa mãn (1), và P[X(E) ≥ 2] ≤ C E λ 2 (E), trong đó C E là hằng số dương liên tục, có thể phụ thuộc vào E.
Từ các giả thiết trên, ta có được các định lý sau Định lý 1’ Trong các điều kiện A 2 và B 2 với mỗi E ∈ F, ta có ước lượng: d(X(E), Z(E)) ≤ [C E + 5
P i=1 λ i (E) đo được trên F và thõa mãn điều kiện A 2
Với k 1 , k 2 , , k n là các số nguyên không âm, thỏa mãn
, trong đó λ(E) là độ đo trên F, tuân theo điều kiện A 2 , nếu đối với mọi E ∈ F, đều có:
P[X i (E) = 0 = a F i (λ(E)) , i= 1,2, , n, với a i là các số tùy ý lớn hơn 1 và F(x) là hàm tùy ý nhận giá trị thực thì khi đó: d(X i (E), Z i (E)) ≤ [5
P i=1 loga i ) 2 loga i ]ε i , i = 1,2, , n trong đú cỏc đại lượng λ E , Z i (E) và à i (E) giống như trong định lý 3, và ε i = inf{ n
Sử dụng các đánh giá tại (3) hoặc (3’), chúng ta có thể mở rộng kết quả để ước lượng mối quan hệ giữa kỳ vọng của biến ngẫu nhiên X và biến ngẫu nhiên Z.
Trong [4], đã chứng minh rằng đối với mỗi h hàm nhận giá trị thực trên các số nguyên không âm sao cho h