1. Trang chủ
  2. » Luận Văn - Báo Cáo

Giới thiệu về tập ngẫu nhiên

132 24 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Giới Thiệu Về Tập Ngẫu Nhiên
Tác giả Trần Thị Hải Lý
Người hướng dẫn TS. Nguyễn Thịnh
Trường học Đại Học Quốc Gia Hà Nội Trường Đại Học Khoa Học Tự Nhiên
Chuyên ngành Lý Thuyết Xác Suất Và Thống Kê Toán Học
Thể loại Luận Văn Thạc Sĩ Khoa Học
Năm xuất bản 2014
Thành phố Hà Nội
Định dạng
Số trang 132
Dung lượng 271,68 KB

Cấu trúc

  • đại học quốc gia hà nội trường đại học khoa học tự nhiên

  • Giới thiệu về tập ngẫu nhiên

  • Giới thiệu về tập ngẫu nhiên

  • luận văn thạc sĩ khoa học

    • Mục lục

  • Mở đầu

    • Chương 1.

      • 1.1. Kiến thức cơ bản về xác suất

      • 1.2. Một vài tập ngẫu nhiên trong thống kê

    • Chương 2.

      • 2.1. Tập ngẫu nhiên và phân bố của tập ngẫu nhiên

      • 2.2. Các quan sát có giá trị tập

      • 2.3. Xác suất không chính xác

      • 2.4. Phân bố entropy cực đại

      • 2.5. Tập đóng ngẫu nhiên và tôpô liên quan

    • Chương 3.

      • 3.1. Mối quan hệ 1-1 giữa hàm phân bố và hàm mật độ

      • 3.2. Tích phân Choquet

      • 3.3. Đạo hàm Radon - Nikodym

  • Kết luận

    • Tài liệu tham khảo

  • Tiếng Anh

Nội dung

Biến ngẫu nhiên và tập ngẫu nhiên 3 Kiến thức cơ bản về xác suÊt

Một vài tập ngẫu nhiên trong thống kê

Phần này chỉ ra sự tồn tại của các tập ngẫu nhiên, đặc biệt là trong lý thuyết thống kê toán học.

Xét một mô hình thống kê tham số hóa.

{f (x, θ) : x ∈ X ⊆ R m , θ ∈ Ⓢ ⊆ R d } , và một tham số mà ta quan t©m

Bản chất của sự ước lượng miền tin cậy là xác định một tập hợp ϕ(θ) từ các biến ngẫu nhiên X 1, X 2, , X n có hàm mật độ f(x, θ) Đối với một mẫu ngẫu nhiên C(X 1, X 2, , X n), mục tiêu là tìm ϕ(θ 0) với θ 0 là tham số thực, đảm bảo rằng xác suất chứa ϕ(θ 0) là lớn.

X n ) là một tập tin cậy cho ϕ(θ) với mức tin cậy 1 −α ∈ (0, 1) nếu ∀θ ∈ Ⓢ : P θ (ϕ(θ) ∈ C(X 1 , X 2 , ã ã ã , X n )) ≥ 1 − α

Trong những trường hợp đơn giản, việc xây dựng miền tin cậy tối ưu cho ϕ(θ) có thể thực hiện mà không cần áp dụng khái niệm hình thức về các tập ngẫu nhiên và phân bố của chúng.

Ví dụ: Cho biến ngẫu nhiên X có phân bố chuẩn N (à, σ 2 ) , ở đây θ = (à, σ 2 ) Xét ϕ(θ) = à Khi đó √ n(X n − à)/V có phân phối Student với n − 1 bậc tự

Mẫu và phương sai mẫu hiệu chỉnh được xác định dựa trên một mẫu ngẫu nhiên X1, X2, , Xn được rút ra từ X Từ đó, khoảng tin cậy (1 − α)% cho trung bình mẫu có thể được tính toán với điều kiện t1 < n(X̄n − μ) < t2, sao cho xác suất P(t1 < n(X̄n − μ) < t2) = 1 − α.

Hiển nhiên, có nhiều điểm (t 1 , t 2 ) sao cho: P (t 1 < V (X n − à) < t 2 )

Khoảng tin cậy tốt nhất tại mức 1 − α được định nghĩa là khoảng có độ dài nhỏ nhất, biểu thị độ chính xác của ước lượng cho ϕ(θ) Độ dài của khoảng này là một biến ngẫu nhiên, cụ thể là |S| = U − L = √V (t 2 − t 1 ) Chúng ta có thể chọn t 1 và t 2 sao cho độ dài kỳ vọng E|S| của tập ngẫu nhiên S = [L, U] là tối thiểu Trong không gian nhiều chiều, độ dài của tập ngẫu nhiên S được thay thế bằng khối Lebesgue ∧(S), vì vậy cần tính toán E∧(S) Để thực hiện điều này, cần định nghĩa khái niệm về một tập ngẫu nhiên trên R d.

∧(S) là một biến ngẫu nhiên (không âm). n do, trong đó X n −

Trớc khi nói về hệ phơng pháp Bayes mạnh, ta đa ra một ví dụ của trờng hợp "các xác suất không chính xác".

Cho X là biến ngẫu nhiên với các giá trị trong tập {a, b, c, d} ⊆ R, có mật độ f 0 không hoàn chỉnh được xác định bởi các điều kiện: f 0 (a) ≥ 0.4, f 0 (b) ≥ 0.2, f 0 (c) ≥ 0.2, và f 0 (d) ≥ 0.1 Đặt P f 0 là độ đo xác suất trên không gian mẫu Ⓢ = {a, b, c, d} được sinh ra từ mật độ f 0.

P f 0 (A) = Σ f 0 (θ),A ⊆ Ⓢ ta chỉ biết rằng P f 0 ∈ P , và do đó F ≤ P f 0 ≤ G với F = inf P , G = sup P

P Chó ý rằng F và G là liên hợp víi nhau theo nghĩa:

(A c ) = 1 P Đặt P θ∈A biểu thị lớp tất cả các độ đo xác suất P f trên Ⓢ mà f thỏa mãn (1.1) Khi

Vì vậy, chúng ta chỉ cần xét một trong hai hàm hoặc F hoặc G , hàm còn lại có thể đợc suy ra.

Hàm tập F trên 2 Ⓢ là không cộng tính

Vì F đợc định nghĩa trên tập đợc sắp thứ tự hữu hạn địa phơng (2 Ⓢ , ⊆) ( Ⓢ là hữu hạn), ta có một ánh xạ Mobius φ : 2 Ⓢ → R xác định bởi: φ(A) = B⊆A ( 1) #(A\B) F (B)

Ta có, F thỏa mãn các tính chất theo sau (xem chơng 2): i) F (∅) = 0, F (Ⓢ) = 1 ii) ∀n ≥ 2, và A 1 , ã ã ã , A n ⊆ Ⓢ , n

Từ các tính chất này của F suy ra rằng φ không âm và φ(A) = 1

Do đó, φ là một hàm khối xác suất thật sự của phần tử ngẫu nhiên S nào đó nhận các giá trị trong 2 Ⓢ , cụ thể là: φ(A) = P (S = A), A ⊆ Ⓢ

Phần tử ngẫu nhiên S là một tập ngẫu nhiên trên Ⓢ với phân bố φ (hoặc F ), bởi vì theo phép nghịch đảo Mobius, ta có:

Dựa trên phân tích trước đó, bài toán gốc về biến ngẫu nhiên X với mật độ không hoàn chỉnh có thể được chuyển đổi thành một bài toán liên quan đến tập ngẫu nhiên S, trong đó "mật độ" φ đã được xác định.

0.1, và φ(A) = 0 với tất cả các tập con A khác của Ⓢ

Khi đó, ta có kết luận.

Kết luận: Bài toán liên quan đến biến ngẫu nhiên với phân bố không chính xác có thể được chuyển đổi thành bài toán về tập ngẫu nhiên với phân bố chính xác.

Các tập ngẫu nhiên thường được xem là một mô hình lý tưởng cho các bài toán liên quan đến biến ngẫu nhiên với xác suất không chính xác, đặc biệt trong bối cảnh thống kê Bayes mạnh.

Quan điểm của kết luận Bayes mạnh: Xét một mô hình thống kê có dạng {F (x|θ), θ ∈

Trong bài viết này, chúng ta xem xét một véctơ ngẫu nhiên X, với hàm phân bố F(x|θ) phụ thuộc vào tham số θ trong một không gian tham Phương pháp Bayes khởi đầu bằng giả định rằng tồn tại một độ đo xác suất tiên nghiệm π trên không gian đo được.

(Ⓢ, σ(Ⓢ)) Tuy nhiên, trên thực tế thì cả mô hình và tiên nghiệm đều đợc cho xấp xỉ Do đó, kết luận

Bayes mạnh liên quan đến việc phân tích mà các tiên nghiệm được thay thế bằng một tập hợp các tiên nghiệm Điều này giúp giảm thiểu sự không chính xác trong việc xác định các tiên nghiệm, từ đó nâng cao độ tin cậy của kết quả phân tích.

Tập tiên nghiệm P cảm sinh các bao hình trên và dưới trên π 0 được xác định thông qua lớp độ đo xác suất P trên (Ⓢ, σ(Ⓢ)) Cụ thể, L(A) được tính là inf π(A) P và U(A) là sup π(A) P cho mọi A thuộc σ(Ⓢ).

Khi đó, kết luận sẽ dựa trên L Chú ý rằng L(ã) không phải là một độ đo xác suất trên (Ⓢ, σ(Ⓢ)) , bởi vì nó không cộng tính.

1.2.3 Phân tích dữ liệu thô

Dữ liệu thô thường xuất hiện khi các quan sát được ghi nhận dưới dạng tập hợp thay vì điểm riêng lẻ trong không gian mẫu Khi dữ liệu không chính xác hoặc bị ảnh hưởng bởi sai sót trong phương pháp thu thập (chẳng hạn như độ chính xác của dụng cụ đo), chúng ta có thể gặp phải dữ liệu chất lượng thấp, được gọi là dữ liệu thô Trong những trường hợp này, thay vì cố gắng gán giá trị duy nhất cho các quan sát, chúng ta nên xem xét các kết quả của phép thử ngẫu nhiên, cụ thể là các tập con chứa các giá trị quan sát "đúng" Schreiber đã đề xuất một hệ dàn tổng quát cho các quan sát có giá trị tập, sử dụng các tập ngẫu nhiên để cải thiện độ chính xác của dữ liệu.

Cụ thể, cho X là biến ngẫu nhiên có các kết quả không quan sát đợc X 1 , X 2 , ã ã ã ,

Với mỗi X j , tồn tại tập S j sao cho X j ∈ S j , j = 1, 2, ã ã ã , n Trong đó S j , j =

1, 2, ã ã ã , n là các kết quả có thể quan sát đợc của một tập ngẫu nhiên S

Khi đó ta nói X là một bộ chọn hầu chắc chắn của S

Bài toán suy luận thống kê về biến ngẫu nhiên X tập trung vào việc ước lượng các hàm mật độ xác suất của X dựa trên dữ liệu từ các tập ngẫu nhiên S_j, với j = 1, 2, , n Để thực hiện ước lượng này, cần có một lý thuyết vững chắc về các tập ngẫu nhiên và phân bố của chúng Khi phân tích dữ liệu thô, chúng ta thường không thể quan sát trực tiếp các giá trị của mẫu ngẫu nhiên X_1, , X_n trong các tập S_j, do đó việc định vị các giá trị này trở nên khó khăn.

Có nhiều phương pháp để thực hiện sự làm thô dữ liệu, mỗi phương pháp tạo ra một cách làm thô khác nhau Các tập ngẫu nhiên S_j được coi là mẫu ngẫu nhiên rút ra từ sự làm thô S của X, trong đó S là một tập ngẫu nhiên Theo đó, một tập ngẫu nhiên S được gọi là sự làm thô của X nếu S chứa X với xác suất cao, tức là X là một bộ chọn hầu chắc chắn của S.

Chú ý rằng X đã đợc cho trớc, và S là một mô hình tập ngẫu nhiên cho

Mô hình CAR, viết tắt của "coarsenning at random", là một phương pháp hữu ích cho sự làm thô Trong chương tiếp theo, chúng ta sẽ nghiên cứu chi tiết về mô hình này.

Ví dụ: Cho U ⊆ R là miền giá trị của X , và {A 1 , ã ã ã , A k } là một phân hoạch (đo đợc) của U Xét sơ đồ làm thô.

Giả sử rằng hàm mật độ xác suất cha biết của X có dạng tham số hóa, tức là f (x|θ), θ ∈ Ⓢ S j , j = 1, 2, ã ã ã , n là một mẫu độc lập và có cùng phân phèi víi

S Khi đó, hàm hợp lý dựa trên một mẫu của tập ngẫu nhiên S là:

Các tập ngẫu nhiên hữu hạn 14 1 Tập ngẫu nhiên và phân bố của tập ngÉu nhiên

Các quan sát có giá trị tập

Phần này và phần tiếp theo nghiên cứu các tập ngẫu nhiên dựa trên các dữ liệu không chính xác của một biến ngẫu nhiên.

Ta xét bài toán: Ước lợng luật xác suất cha biết π 0 của một biến ngẫu nhiên X với giá trị trong U Nhng không giống với trờng hợp cổ điển, dữ

Để ước lượng một mẫu độc lập và có cùng phân phối S1, S2, , Sn, cần rút ra từ một tập ngẫu nhiên S thay vì từ một mẫu độc lập và có cùng phân phối với X Mối quan hệ giữa X và S là X ∈ S hầu chắc chắn, tức là X là một bộ chọn đo được hầu chắc chắn từ S.

Theo luật mạnh số lớn, hàm phân bố F của S đợc ớc lợng vững bởi hàm phân bố thực nghiệm.

Từ đó, ta sẽ miêu tả mô hình thống kê theo F Đặt P biểu thị tập tất cả các

P chứa π 0, trớc khi có thông tin thêm vào để thu hẹp P thì P đơn giản là độ đo xác suất trên U (hữu hạn) Không gian tham là tập con

Trong tập P, ta nhận thấy rằng X là một bộ chọn của S, do đó F ≤ π 0, thể hiện rằng tập hợp các luật xác suất có thể của biến ngẫu nhiên X cần được làm rõ hơn.

Thật vậy, giả sử S và X đợc định nghĩa trên không gian xác suất (Ω, A,

Cho D ∈ A sao cho P (D c ) = 0 và X(ω) ∈ S(ω), ∀ω ∈ D Khi đó,

Do đó π 0 ∈ C(F ) = {π ∈ P : F ≤ π} Ta gọi C(F ) là lõi của F hoặc của

S Ta có thể chỉ ra rằng C(F ) ƒ= ∅ bằng cách đơn giản là xây dựng một hàm π ∈ P sao cho π ≥ F nh sau:

Giả sử f là hàm mật độ kết hợp với F , nghĩa là: f (A) = (−1) |A\B| F (B)

Cho một tập ∅ = A ⊆ U cố định, định nghĩa g A : U → R bởi:

Vì vậy g A (ã) là một mật độ xác suất trên U Đặt π A biểu thị độ đo xác suất trên U đợc sinh ra từ g A , khi đó với mỗi

) Hơn n÷a, tõ phÐ p x©y dùng π A ở trên ta cã π A (A ) =

F l à b a o d - í i c ủa lõi C(F ) Tiếp theo, ta sẽ đề cập đến việc sử dụng các tập ngẫu nhiên nh là các mô hình trong phân tích dữ liệu thô.

Cho (Ω, A, P ) là một không gian xác suất, và U là một tập hữu hạn Đặt

Theo định nghĩa về sự làm thô trong chương 1, làm thô của biến ngẫu nhiên X là một tập hợp ngẫu nhiên không rỗng S trên không gian mẫu U, với xác suất P(X ∈ S) = 1 Khi xem xét cặp (X, S), chúng ta nhận thấy rằng

Do đó, để kiểm tra sự làm thô, ta cần thông tin về phân bố chung của (X, S) Cụ thể, S là một làm thô của X nếu và chỉ nếu

Hơn nữa, nếu S là một làm thô của X , thì luật xác suất P X của X cần thiết phải thuộc vào lõi C(F ), trong đó F là hàm phân bố của

Cho biến ngẫu nhiên X, có nhiều sự làm thô khác nhau có thể xảy ra Trong số đó, một số sự làm thô đặc biệt giúp đưa ra kết luận thống kê về phân bố cha biết P X của X, ngay cả khi X không thể được quan sát trực tiếp Một trong những sự làm thô này được định nghĩa là làm thô ngẫu nhiên (CAR).

Điều kiện (2.2) được gọi là giả thiết CAR, trong đó P(S = A|X = x) là một hằng số cho bất kỳ tập A thuộc 2 U \{∅} và x thuộc A Hằng số này được ký hiệu là π(A) và được gọi là xác suất CAR Ý nghĩa thống kê của giả thiết CAR được thể hiện qua các định lý liên quan, trong đó Định lý 2.2.3 cho thấy điều kiện (2.2) tương đương với một số khía cạnh quan trọng khác trong thống kê.

Cho bất kỳ tập A ∈ 2 U \{∅} , và x ∈ A ,

Chứng minh Vì S là một làm thô của X , ta có (S = A) ⊂ (X ∈ A) nên

Do đó, nếu (2.1) đúng th× x∈A nghĩa là

= P (X ∈ A) = P (S = A|X ∈ A) π(A) = P (S = A|X = x) ⇒ (2.3) Ngợc lại, giả sử ta có (2.3) Khi đó, rõ ràng (2.2) đúng vì P (S = A|X ∈ A) chỉ phụ thuộc vào A Định lý 2.2.4 Điều kiện (2.3) tơng đơng với:

Cho bất kỳ tập A ∈ 2 U \{∅} , và x ∈ A ,

Chú ý: Điều kiện (2.4) là một độc lập có điều kiện của các biến cố (S = A) và (X ∈ A) với (X = x) đã cho Đặt a = (S = A), b =

(X ∈ A) và c = (X = x), khi đó a và b là độc lập có điều kiện với c đã cho nếu:

⇒ P (b|ac) = P (b|c) Định lý 2.2.5 Điều kiện (2.2) tơng đơng với Cho bất kỳ tập A ∈ 2 U \{∅} , và x ∈

Chứng minh Theo định lý 2.2.3 và định lý 2.2.4, ta có:

Giả thiết CAR (Conditional Independence) đề cập đến việc giá trị A trong tập ngẫu nhiên S có thể được quan sát để hiểu rõ hơn về biến ngẫu nhiên X không thể quan sát được, nhưng lại liên quan đến tập A Điều này cho thấy mối liên hệ giữa các biến trong thống kê và khả năng suy diễn từ các quan sát đã biết để hiểu các biến chưa quan sát.

Trong phân tích ở trên, ta thấy rằng, khi giả thiết CAR đúng, ta có: π(A) = P (S =

Giả sử P X đợc sinh ra bởi một mật độ trên U , kí hiệu là g , thì

Xét mật độ có điều kiện của S với điều kiện X = x đã cho Với bất kỳ x ∈ U , ta cã:

S là một làm thô của X ; P (S = A|X = x) = 0, ∀A mà không chứa x đã cho).

Khi S là một mô hình CAR cho X , thì P (S = A|X = x) = π(A) Do đó, điều kiện trên các họ của các xác suất CAR là: π(A) = 1 x U (2.7)

Điều kiện (2.6) được nêu trong Định lý 2.2.6 là điều kiện đủ để xác định sự tồn tại của mô hình CAR cho biến ngẫu nhiên X Cụ thể, nếu có một tập ngẫu nhiên S với mật độ f(A) = P(S = A), thì một họ các xác suất CAR π(A) với A thuộc 2U sẽ được xác định.

Để thỏa mãn điều kiện (2.7), cần có Q(A) = f(A)/π(A) như một độ đo xác suất trên tập hợp U, từ đó suy ra rằng Q(ã) là luật xác suất của biến ngẫu nhiên X, với S là mô hình CAR cho X.

Giả sử có (2.6) với P X = P g, và hai mật độ biên duyên f và g thỏa mãn (2.6) cùng với π theo điều kiện (2.7) Chúng ta có thể xây dựng một phân bố chung cho (S, X).

(i) S và X có f và g là các biên duyên tơng ứng,

(ii) S là một làm thô của X , và

(iii) S là một mô hình CAR cho X

Sự xây dựng sau làm đợc tất cả điều đó: Định nghĩa:

Chú ý rằng, theo (2.6), khi f (A) > 0, ta cũng có P g (A) > 0 nên mật độ có điều kiện của X với S = A đã cho đợc định nghĩa tốt Mật độ chung của

Do đó, mật độ biên duyên của X là: Σ

P (S = A, X = x) = Σ g(x)π(A) = g(x) (theo (2.7)) Tiếp theo, X là một bộ chọn hầu chắc chắn của S Thật vậy, ta có

Theo sự xây dựng, P (X = x, S = A) ƒ= 0 chỉ khi x ∈ A và f (A) >

A⊆U Asx nên P (X ∈ S) = 1 Cuối cùng, vì P (X = x, S = A) = g(x)π(A) và vì g(ã) là mật độ biên duyên của X , ta có

P (X = x) nghĩa là giả thiết CAR là đúng.

Khi mô hình thống kê cho biến X được cho là C(F), nhiệm vụ là xác định phần tử tối ưu của C(F) để diễn đạt các quan sát của X Việc này có thể thực hiện thông qua nguyên lý entropy cực đại Tuy nhiên, từ những phân tích trước đó, chúng ta có thể chuyển đổi bài toán thành một dạng mới.

Cho S là một sự làm thô của X , tìm một phần tử của C(F ) mà làm cho S là một mô hình CAR cho X

∈ [0, 1] Sự tồn tại của một mô hình CAR là sự tồn tại của một độ đo Q ∈ C(F ) sao cho: f

Ví dụ: Cho (Ω, A, P ) là một không gian xác suất và U = {x 1 , x 2 , x 3 , x 4 }

Giả sử X : Ω → U là một biến ngẫu nhiên với độ đo xác suất P X và

S : Ω → 2 U \{∅} là một tập ngẫu nhiên với mật độ f (A) = P (S =

, f ({x 1 , x 2 , x 3 }) = 1 , f (U ) = 1 , f (A) = 0, với A là các tập con khác của U

Giả sử rằng S là một mô hình CAR cho X Khi đó:

70 10 π({x 1 }) = π({x 2 }) = π({x 3 }) = 35 , π({x 4 }) = 5 π({x 1 , x 2 , x 3 }) = 10 , π(U ) = 1 , π(A) = 0 với A là các tập con khác của

Xác suất không chính xác

Cho biến ngẫu nhiên X , để biết đợc mọi thông tin về X ta cần biết đợc luật phân phối xác suất của X Trong trờng hợp biến ngẫu nhiên

X mà chúng ta quan tâm có thể có xác suất không chính xác Khi luật xác suất của X chỉ được xác định trong một lớp các độ đo xác suất đã biết, chúng ta cần áp dụng lý thuyết về tập ngẫu nhiên để rút ra kết luận từ những dữ liệu không chính xác này.

Trong một hộp có 30 quả cầu đỏ và 60 quả cầu trắng và đen, khi rút một quả cầu, giá phải trả cho quả cầu đỏ, trắng và đen lần lượt là 5, 10 và 20 Để tính giá phải trả trung bình, ta cần xác định xác suất rút từng loại quả cầu và nhân với giá tương ứng.

Chúng ta không thể trả lời câu hỏi này một cách chính xác do thiếu thông tin về phân bố xác suất của các quả cầu đỏ, đen và trắng Tuy nhiên, chúng ta có một tập hợp các mật độ xác suất mà mật độ xác suất đúng phải nằm trong đó, được trình bày qua bảng x đỏ, đen, trắng f k.

Hàm mật độ xác suất đúng là một trong 61 mật độ này.

Độ đo xác suất đúng P0 chỉ được xác định trong một lớp con nhất định Trong trường hợp tổng quát, P biểu thị tập hợp tất cả các độ đo xác suất, với P ⊆ P Từ kiến thức về P, chúng ta có thể rút ra các chặn cho P0.

F ≤ P 0 ≤ T , với F = inf P và T = sup P Vì T (A) = 1 − F (A c ) ( T và F là liên hợp với nhau) nên ta chỉ cần xét một trong hai chặn, ở đây ta xét F

, với F là hàm phân bố của tập ngẫu nhiên nào đó trên U

Do thông tin về độ đo xác suất trên các trạng thái tự nhiên không đầy đủ, cần xử lý thông tin qua các phần tử ngẫu nhiên được định giá đa trị, tức là các tập ngẫu nhiên.

Ví dụ dới đây minh họa trờng hợp khi P không đợc biết đầy đủ.

Ví dụ 2: Cho Ⓢ = {θ 1 , θ 2 , θ 3 } Độ đo xác suất "đúng" P 0 chỉ đợc biết P 0 ({θ 1 }) = 1/3, khi đó P 0 ({θ 2 , θ 3 }) = 2/3 Đặt P biểu thị lớp các độ đo xác suất P có tính chất này Khi đó P = {P : F ≤ P} , với

F đợc định nghĩa trên Ⓢ: F (A) = inf{P (A) : P ∈ P} Hơn nữa, F (A) = Σ m(B)

( F là hàm phân bố của tập ngẫu nhiên nào đó trên Ⓢ) với

1/3; m({θ 2 , θ 3 }) = 2/3; m(A) = 0 cho tất cả các tập con khác của Ⓢ Chú ý rằng hàm khối m là một mật độ trên 2 Ⓢ

Cho một mật độ f trên Ⓢ, P f là xác suất đợc sinh ra từ f Khi đó

P f (A) = f (θ) Lớp P bao gồm các độ đo xác suất này đợc sinh ra từ θ∈A các mật độ F m = {f : F ≤ P f }

Trong một hộp có 30 quả cầu đỏ và 60 quả cầu đen và trắng theo tỷ lệ đã biết, khi rút ra một quả cầu, giá trị phải trả cho từng loại quả cầu lần lượt là 5 cho quả cầu đỏ, 10 cho quả cầu đen, và 20 cho quả cầu trắng.

Giá phải trả trung bình cho các quả cầu đỏ, đen và trắng được biểu thị bằng tập hợp Ⓢ = {θ 1 , θ 2 , θ 3 } Mặc dù mật độ trên Ⓢ chưa được xác định rõ ràng, nhưng chúng ta biết rằng nó thuộc một trong những mật độ đã biết.

90 với k ∈ {0, 1, ã ã ã , 60} Mô hình này là thật sự nhỏ hơn F m ở trên vì khối m{θ 2 , θ 3 } chỉ có thể đợc phân bố tới θ 2 và θ 3 theo các tỉ lệ có dạng k và

60 − k , thay vì theo các tỉ lệ bất kì. Để giải quyết bài toán trên, trớc tiên ta xét giá trị kỳ vọng của một hàm phân bố.

Giả sử u là một biến ngẫu nhiên khả tích đợc định nghĩa trên không gian Σ

9 0 xác suất (U, A, P ), khi đó giá trị kì vọng của u đợc viết nh sau:

Thay P bằng một hàm phân bố của một tập ngẫu nhiên F , thì ta có:

Chú ý rằng E F không phải là một toán tử cộng tính −∞

Khi U hữu hạn thì việc tính toán E F (u) là đơn giản Giả sử U = {θ 1 , θ 2 , ã ã ã , θ n } Ta có thể sắp xếp lại các phần tử trong U để u(θ 1 ) ≤ u(θ 2 ) ≤ ã ã ã ≤ u(θ n ).

Đặt g(θ i ) = F ({θ i , ã ã ã , θ n }) − F ({θ i+1 , ã ã ã , θ n }), ta có g là một mật độ xác suất trên U Do đó, E F (u) trở thành một kì vọng xác suất thông thường, trong đó mật độ sử dụng cho kì vọng này chỉ phụ thuộc vào F và không bị ảnh hưởng bởi thứ tự của các phần tử trong U.

Giả sử g là một mật độ xác suất trên U , P g biểu thị độ đo xác suất đợc sinh ra từ g trên 2 U , F F là lớp các mật độ g trên U sao cho P g ≥ F

Định lý 2.3.7 nêu rằng, cho tập hữu hạn U và hàm số u: U → R, cùng với hàm phân bố F trên tập ngẫu nhiên S, thì sẽ tồn tại một mật độ g thuộc một không gian xác định.

Chứng minh Theo trên , đặt g(θ i ) = F ({θ i , ã ã ã , θ n }) − F ({θ i+1 , ã ã ã , θ n }).

Tiếp theo, ta chỉ cần chỉ ra rằng ∀t ∈ R và ∀f ∈ F F , ta có:

Thật vậy, cho (u > t) = {θ i , ã ã ã , θ n } Khi đó, theo phép xây dựng của g , ta cã: n n

P g (u > t) = Σ g(θ k ) = Σ Σ m(B) = Σ m(B) = F (u > t) với tổng lấy trên tất cả các tập con của {θ i , ã ã ã , θ n } Nếu f ∈ F F

Từ sự phân tích ở trên, trở lại ví dụ 1, ta có: g(θ 1 ) = F ({θ 1 , θ 2 , θ 3 }) − F ({θ 2 , θ 3 }) = 1 − m(θ 2 , θ 3 ) = 1 − 2 1 g(θ 2 ) = F ({θ 2 , θ 3 }) − F ({θ 3 }) = 2 g(θ 3 ) = F ({θ 3 }) = 0 g(θ 4 ) = F ({θ 4 }) = 0.1 Σ

Víi u(θ 1 ) = 5,u(θ 2 ) = 10, u(θ 3 ) = 20. Vậy giá phải trả trung bình thấp nhất là: Σ 4

Phân bố entropy cực đại

Phần này tập trung vào việc lựa chọn một phân bố xác suất chính tắc từ một tập hợp các phân bố thích hợp của biến ngẫu nhiên, dựa trên nguyên lý entropy cực đại Đối với một tập hữu hạn U, khi thực hiện phép thử, thông tin về sự xuất hiện của các phần tử trong U là rõ ràng Chúng ta gán cho các phần tử của U những khả năng xuất hiện khác nhau, tức là áp dụng phân bố đều cho U, điều này thể hiện nguyên lý không đủ lý của Laplace.

Nếu số lần xuất hiện của các phần tử trong U được xác định bởi một hàm mật độ xác suất f trên U, thì entropy của hàm mật độ xác suất này được định nghĩa như sau: Định nghĩa 2.4.14 Cho f là một hàm mật độ xác suất trên U, biểu thức:

H(f ) = − f (θ) log(f (θ)) θ đợc gọi là entropy của f

Vì phân bố đều có entropy cao nhất trong tất cả các mật độ trên

U nên nguyên lý không đủ lý Laplace tơng đơng với nguyên lý entropy cực đại Theo Laplace, mật độ đúng chính là mật độ làm cực đại H(f

Trên tập hợp tất cả các hàm mật độ xác suất f trên U, nguyên lý entropy cực đại cho phép tìm ra một hàm f ∈ F, trong đó F là tập hợp các hàm mật độ xác suất trên U, được xác định bởi các quy luật chi phối U, nhằm tối đa hóa giá trị entropy H(f).

Dựa vào lý thuyết về tập ngẫu nhiên, ta có hạn chế trên F đó là lấy F =

F m = {f : F ≤ P f } nh đã thảo luận ở phần trớc Nguyên lý không đủ lý Laplace là chọn f có entropy lớn nhất từ tập tất cả các mật độ trên

U sẽ chuyển thành chọn một hàm mật độ xác suất f có entropy lớn nhất trong F m Trong ví dụ 1 của phần trớc

Trong không gian F m với k ∈ {0, 1, ã ã ã , 60}, mật độ có entropy cực đại được thể hiện qua mật độ đều Điều này có nghĩa là xác suất xuất hiện của mỗi quả cầu màu đỏ, đen và trắng là như nhau, cụ thể là 1/3 cho mỗi màu.

Nếu m là một mật độ xác suất trên 2 U và các phần tử của m là rời nhau, thì mật độ trong F m với entropy cực đại được xác định bởi f (θ).

Asθ m(A) Nghĩa là, khối của A đợc phân bố nh nhau tới tất cả

Tiếp theo, ta sẽ nghiên cứu bài toán entropy cực đại trong trờng hợp tổng quát.

Trong trường hợp đầu tiên, chúng ta xem xét tập hợp U = {θ1, θ2, , θn} với m là một mật độ trên U, trong đó m(θi) = αi và m(U) = 1, với điều kiện αi = ε Bài toán đặt ra là phân chia ε giữa các αi nhằm tối đa hóa entropy của mật độ kết quả trên từng phần tử của U Điều này có nghĩa là ε = n, với i là chỉ số của các phần tử trong tập hợp.

0 , entropy của mật độ f đợc cho bởi f (θ i ) = α i + ε i là cực đại Ta có phát biểu chính xác cho bài toán nh sau:

1 Xác định các ε i sao cho:

Bản chất của vấn đề nằm trong bổ đề đơn giản theo sau Bổ đề 2.4.1 Cho x và c − x là dơng Khi đó:

L(x) = −[(c − x) log(c − x) + x log(x)] là tăng theo x nếu c − x > x

Chứng minh Đạo hàm L J (x) = 1 + log(c − x) − 1 − log(x)

Giả sử rằng ta có các α i và ε i thỏa mãn điều kiện của bài toán Ta quan tâm đến việc làm cực đại đại lợng:

H(ε 1 , ε 2 , ã ã ã , ε n ) = − (α i + ε i ) log(α i + ε i ) i với α i + ε i < α j + ε j , ε j > 0 (Ta cũng có thể lấy i < j ) Giả sử tồn tại δ sao cho δ > 0 , ε j − δ > 0 , và α i + ε i + δ < α j + ε j − δ Áp dụng bổ đề với c = α i + ε i + α j + ε j và x 1 = α i + ε i < α i + ε i + δ = x 2, ta có:

Kết luận: Nếu một sự phân chia ε 1 , ε 2 , ã ã ã , ε n của ε tới α 1 , α 2 , ã ã ã , α n làmcực đại H , thì bất cứ khi nào có α i + ε i < α j + ε j , ta phải có ε j = 0.

Giờ ta giả sử rằng các α i đợc chỉ số hóa để α 1 ≤ α 2 ≤ ã ã ã ≤ α n Khi đó, để làm cực đại H , ta phải có: α 1 + ε 1 = α 2 + ε 2 = ã ã ã = α k + ε k ≤ α k+1 ≤ ã ã ã ≤ α n (2.9)

Với ε k+i = 0 cho i > 0 Tất nhiên, k có thể bằng n Có nhiều nhất một sự phân chia các ε i nh vậy.

Để phân chia một tập hợp ε thành các phần γ 1, γ 2, , γ n sao cho ε i < γ i và α i + ε i < α i + γ i với γ i > 0, ta nhận thấy rằng có ít nhất một phân hoạch thỏa mãn điều kiện (2.9) Nếu tồn tại một ε j > γ j cho một chỉ số j nào đó, thì điều này dẫn đến α j + γ j < α j + ε j Để tìm các ε i thỏa mãn (2.9), ta định nghĩa δ i = α k − α i với k là chỉ số cực đại sao cho tổng Σ δ i ≤ ε Cuối cùng, ta đặt ε i = δ i + (ε − Σ δ i )/k cho i = 1, 2, , k.

Do đó, tồn tại duy nhất một tập các ε i thỏa mãn (2.9) Ta gọi sự phân chia này là sự phân chia chuẩn.

Tập các điểm (ε₁, ε₂, , εₙ) với εᵢ ≥ 0 và εᵢ = c, trong đó c là một hằng số bất kỳ, tạo thành một tập con đóng và bị chặn của Rⁿ Do đó, ảnh của tập này trong Rⁱ được xác định bởi một hàm liên tục.

H(ε 1 , ε 2 , ã ã ã , ε n ) = − (α i + ε i ) log(α i + ε i ) có một giá trị cực đại

Mặt khác, ta có mối quan hệ giữa các đại lượng α và ε, với điều kiện Σ α i + Σ ε i = 1 không phải là yếu tố quyết định trong các thảo luận trước đó, mà chỉ cần tổng này là một số dương nào đó.

Giả sử rằng γ 1 , γ 2 , , γ n là một phân chia của ε với điều kiện α 1 ≤ α 2 ≤ ≤ α n Gọi i là chỉ số nhỏ nhất sao cho ε i γ i Nếu ε i lớn hơn γ i, sẽ tồn tại các chỉ số i 1 , i 2 , , i m sao cho ε i j nhỏ hơn γ i j, thỏa mãn điều kiện Σ γ i j − Σ ε i j ≥ ε i − γ i.

( ε i j nào đó có thể bằng 0) vì ta có Σ γ j = Σ ε j = ε Do đó: α i j + γ i j > α i j + ε i j ≥ α i + ε i > α i + γ i

1 δ i k , bằng cách thay γ i j bằng γ i j δ i j , i j và thay γ i bằng γ i + δ i j có entropy j lớn hơn Sự phân chia mới này có i số hạng đầu tiên ε 1 , ε 2 , ã ã ã , ε i thỏa mãn (2.9).

Nếu ε i < γ i ta làm hoàn toàn tơng tự. Σ { ã ã ã ≥ } Σ i i j j Σ α i + ε i = α i + γ i +

− ∀ Σ δ i j Theo bổ đề trên, sự phân chia thu đợc từ các γ i

Chúng ta có thể chuyển đổi bất kỳ sự phân chia nào thành sự phân chia chuẩn trong tối đa n bước, với mỗi bước làm tăng entropy Điều này dẫn đến một chứng minh có tính xây dựng cho thấy sự phân chia chuẩn tạo ra entropy cực đại.

Sự phân chia chuẩn là cách phân chia duy nhất tối đa hóa H Hơn nữa, quá trình tính toán phân chia này đã được trình bày rõ ràng và có thể dễ dàng lập trình.

Chúng tôi tổng kết cuộc thảo luận trên bằng định lý 2.4.8, trong đó cho U = {θ 1 , θ 2 , , θ n } và m là một mật độ trên 2 U với m(θ i) = α i và m(U) = 1 - α i Định lý khẳng định rằng tồn tại chính xác một mật độ f trên i.

U mà tơng thích với m và có entropy lớn nhất

Nếu α 1 ≤ α 2 ≤ ã ã ã ≤ α n , thì mật độ đợc cho bởi f (θ i ) = α i + ε i , víi Σ k α 1 + ε 1 = α 2 + ε 2 = ã ã ã = α k + ε k ≤ α k+1 ≤ ã ã ã ≤ α n

Mật độ này đợc xây dựng bằng cách đặt các α i theo thứ tự tăng dần, đặt δ i = α k − α i , i = 1, 2, ã ã ã , k với k cực đại sao cho Σ δ i ≤ m(U )

Trong bài viết này, chúng ta thảo luận về trường hợp m(Ⓢ i ) = α i, với Ⓢ 1, Ⓢ 2, , Ⓢ n là một phân hoạch của U Đầu tiên, chúng ta nhận thấy rằng có một phép gán tạo ra entropy cực đại Tập hợp các phép gán này có thể được xem như một tập con đóng và bị chặn.

R |U| và entropy là hàm liên tục của các phép gán trong R, dẫn đến việc đạt được cực đại Cực đại entropy có thể đạt được bằng cách gán giá trị mỗi θ trong Ⓢ i với khối m(Ⓢ i )/| Ⓢ i | và tiếp tục thực hiện quá trình này Để hiểu rõ hơn, cần lưu ý rằng hai phần tử trong Ⓢ i phải có xác suất cuối cùng là như nhau Nếu hai phần tử trong Ⓢ i được gán giá trị xác Σ { } − Σ ε i ≥ 0, điều này sẽ được thể hiện rõ ràng hơn.

Tập đóng ngẫu nhiên và tôpô liên quan

Trong chương 1, chúng ta đã nghiên cứu các tập ngẫu nhiên có giá trị trên một tập hữu hạn U Ở phần này, chúng ta sẽ chuyển sang xem xét các tập ngẫu nhiên nhận giá trị trong một tập vô hạn không đếm được, cụ thể là với U = R^d.

Một véctơ ngẫu nhiên X : Ω → R d được xem như một tập ngẫu nhiên với các giá trị là các tập đơn {x} trong tập lũy thừa của R d, trong đó các tập đơn là các tập đóng trong R d Do đó, véctơ ngẫu nhiên có thể được định nghĩa là một tập ngẫu nhiên nhận các tập đóng làm giá trị Tương tự, các quá trình điểm cũng là các tập ngẫu nhiên như vậy Nếu X : Ω → R + là một biến ngẫu nhiên không âm, thì S(ω) = [0, X(ω)] là một tập ngẫu nhiên trên R +, nhận các giá trị trong lớp các tập đóng của R +.

Miền tin cậy được xác định là tập hợp các tập con đóng ngẫu nhiên của R d, cho thấy tính chất ngẫu nhiên trong các ứng dụng Định nghĩa chặt chẽ về các tập ngẫu nhiên là cần thiết để đảm bảo tính chính xác của các phần tử ngẫu nhiên.

Giả sử U là một tập hợp và B là một lớp con đặc biệt của các tập con trong 2^U, với (Ω, A, P) là một không gian xác suất đã cho Để xác định các phần tử ngẫu nhiên trên Ω, cần định nghĩa một σ-trường σ(B) gồm các tập con của B Cụ thể, ta sẽ lấy U =

R d Nh vậy, B sẽ đợc lấy là F(R d ), hoặc đơn giản là F , lớp tất cả các tập con đóng của R d Hai câu hỏi còn lại là:

Để xác định các độ đo xác suất trên σ(F), trước tiên cần xây dựng một tôpô phù hợp trên F Sau đó, σ(F) sẽ được định nghĩa là σ-trường Borel tương ứng với tôpô đã xây dựng.

Chúng tôi đang tìm kiếm một tôpô T trên không gian F, sao cho các luật xác suất trên các tập đóng ngẫu nhiên có thể được mô tả bằng các đối tượng đơn giản hơn.

Khi xem một tập hữu hạn U nh là một không gian tôpô với tôpô rời rạc, tất cả các tập con của U đều là tập mở Trong bối cảnh này, một tập ngẫu nhiên hữu hạn X trên U được coi là một tập đóng ngẫu nhiên Luật xác suất của X nh được xác định qua một độ đo xác suất trên σ-trường của 2 U, cụ thể là tập lũy thừa của 2 U Độ đo này được xác định một cách duy nhất thông qua phiếm hàm khả năng T: 2 U → [0, 1].

Do đó, khi U = R d , và X : Ω → F , ta muốn có các tập con của F có dạng F A = {F ∈ F : F ∩ A ƒ= ∅} với A ⊆ R d , thuộc vào σ - trờng

Borel σ (F) mà đợc sinh ra bởi tôpô T Nhng khi đó, tập phần bù của

F A là F A = {F ∈ F : F ∩ A = ∅} cũng phải nằm trong σ(F).

Từ sự xem xét này dẫn tới cách dới đây để định nghĩa một tôpô thích hợp trên F

Các khoảng mở trong R là cơ sở cho tôpô của nó, do đó không gian các tập đóng F của R d có thể được tôpô hóa theo phương pháp tương tự.

Cho F, G, K lần lợt biểu thị lớp các tập con đóng, mở, và compac của R d Cho A ⊆ R d , F A = {F ∈ F : F ∩ A Đặt K

Hơn nữa, với G ∈ G , ta có: = F K

Khi đó, B được xem là cơ sở cho tôpô T trên F, và tôpô sinh ra từ B được gọi là tôpô hit-or-miss của F Đồng thời, σ-trường Borel kết hợp trên F được ký hiệu là B(F).

Tập đóng ngẫu nhiên trên R d được định nghĩa trong không gian xác suất (Ω, A, P), trong đó X được xem là một ánh xạ từ Ω đến R d, với A là σ-algebra.

Trong không gian xác suất (Ω, A, P), một tập đóng ngẫu nhiên X trên R^d được định nghĩa là ánh xạ X: Ω → R^d có thể đo được theo A - B(F) Luật xác suất của X, ký hiệu là P_X, được xác định là độ đo xác suất P_X trên B(F), với công thức P_X = P_X^{-1}.

Ví dụ về tập mức ngẫu nhiên hóa cho hàm ϕ : R d → [0, 1] là nửa liên tục dưới, với điều kiện rằng với mọi a ∈ R, tập hợp {x ∈ R d : ϕ(x) ≥ a} là một tập đóng trong R d Giả sử α : Ω → [0, 1] là một biến ngẫu nhiên có phân bố đều Ta định nghĩa S : Ω → F(R d ) bằng S(ω) = {x ∈ R d : ϕ(x) ≥ α(ω)} Do đó, S được xác định là một tập đóng ngẫu nhiên trên R d.

Tập ngẫu nhiên và các vấn đề liên quan

Mối quan hệ 1-1 giữa hàm phân bố và hàm mật độ

Phần này thiết lập một nền tảng tổng quát để nghiên cứu các hàm tập, với U là một tập hữu hạn Nghiên cứu về đại số liên thuộc của một tập trên vành giao hoán có đơn vị là cần thiết để chỉ ra mối quan hệ 1-1 giữa hàm phân bố và hàm mật độ của một tập đóng ngẫu nhiên Định nghĩa 3.1.17 cho rằng với U là một tập hữu hạn và F = {f : 2 U → R}, nếu f, g ∈ F và r ∈ R, thì các mối quan hệ giữa chúng có thể được xác định.

Mệnh đề 3.1.1 F là một không gian véctơ trên R.

Chứng minh Theo Định nghĩa 3.1.17 về phép cộng hai hàm tập và phép nhân một hàm tập với một số thực ta có thể suy ra đợc:

Một cơ sở cho F đó là tập các hàm {f Y : Y ⊆ U} đợc định nghĩa bởi f Y (Y ) = 1 và f Y (X) = 0 nếu X Y Do đó, F có 2 |U| chiều trên

R. Định nghĩa 3.1.18 Giả sử A là tập các hàm (2 U ) [2] → R, với (2 U ) [2] =

{(X, Y ) : X ⊆ Y ⊆ U} Trên A định nghĩa phép cộng theo từng điểm và phép nhân theo công thức:

A là một vành có đơn vị trong đại số liên thuộc của hai tập hợp U trên trường R Đơn vị của A được xác định bởi hàm δ(X, X) = 1 và δ(X, Y) = 0 khi X khác Y.

Phép cộng trong một vành được ký hiệu bằng dấu "+" và được xác định bởi công thức (α + β)(X, Y) = α(X, Y) + β(X, Y) Trong đó, 0 được biểu thị bởi ánh xạ 0(X, Y) = 0 cho mọi tập hợp con X ⊆ Y Để chứng minh A là một vành, cần chỉ ra các điều kiện sau cho mọi α, β, γ thuộc A.

1) (A, +) là nhóm aben Điều này dễ dàng đợc suy ra theo định nghĩa phép cộng theo từng điểm và ánh xạ 0 trên A.

5) α ∗ δ = δ ∗ α = α Đợc suy ra theo định nghĩa phép nhân và ánh xạ δ trên A. Σ

Trong vành A với đơn vị là δ, không phải mọi phần tử α khác không đều có nghịch đảo Định lý 3.1.10 chỉ ra rằng một phần tử α có nghịch đảo nếu và chỉ nếu ∀X, α(X, X) ≠ 0 Nghịch đảo của α được xác định theo quy nạp với công thức α −1 (X, X) = 1/α(X, X) và α −1 (X, Y) = −1/α(X, X) khi X thuộc tập Σ Z.

Chứng minh * Điều kiện cần: Nếu α có nghịch đảo là β , thì (α∗β)(X, X) = α(X, X)β(X, X) = δ(X, X) = 1, nên α(X, X) ƒ= 0 ∀X

*Điều kiện đủ: Giả sử rằng ∀X, α(X, X) ƒ= 0 Ta cần một phần tử β sao cho α∗β = β ∗α = δ Đặc biệt, ta cần (α∗β )(X, Y ) = δ(X,

Y ) = 0 với X ⊂ Y và (α ∗ β)(Y, Y ) = δ(Y, Y ) = 1 Ta định nghĩa β(X, Y ) một cách quy nạp trên số phần tử giữa X và Y Nếu

X = Y , thì đặt β(X, X) = 1/α(X, X) (do α(X, X) ƒ= 0) Nếu số phần tử giữa X và Y lớn hơn hoặc bằng một, ta muốn có:

Phơng trình này có thể đợc giải cho β(X, Y ) vì α(X, X) ƒ= 0, Suy ra: α −1 (X, Y ) = β(X, Y ) = −1 α(X, X) X⊂ Σ Z

Do đó α ∗ β = δ Tơng tự, có một phần tử γ sao cho γ ∗ α = δ Khi đó (γ ∗ α) ∗ β = δ ∗ β = β

Các phần tử trong một vành mà có phần tử nghịch đảo đợc gọi là các unit.

Có hai unit rất đặc biệt trong A Đó là: i) à(X, Y ) = (−1) |Y \X| là hàm Mobius. ii) ξ(X, Y ) = 1 là hàm Zeta.

Phần tử ξ được định nghĩa đơn giản là giá trị bằng 1 ở mọi nơi, trong khi phần tử à là nghịch đảo của nó Các hàm này đóng vai trò rất quan trọng trong toán học.

Mệnh đề 3.1.2 Trong vành A , à ∗ ξ = ξ ∗ à = δ , nghĩa là à và ξ là nghịch đảo của nhau.

Có một phép toán tự nhiên diễn ra giữa các phần tử của không gian véctơ F và các phần tử của đại số liên thuộc A, được mô tả trong Σ Σ.

1 nÕu X = Y định nghĩa theo sau: Định nghĩa 3.1.19 Cho α ∈ A, f ∈ F , và X ∈ 2 U , đặt:

Mệnh đề 3.1.3 F là một môđun (phải) trên vành A, nghĩa là: ∀f, g ∈ F ,

Chứng minh Với A là vành có đơn vị và F là nhóm aben với phép "+" Xét ánh xạ: F ì A −→ F

Chú ý rằng ∀f ∈ F , f ∗ ξ ∗ à = f ∗ à ∗ ξ = f (do ξ ∗ à = à ∗ ξ = δ ) F → F : f ›→ f ∗ à và F → F : f ›→ f ∗ ξ là các ánh xạ 1-1 từ F tới F , và là các nghịch đảo của nhau. f ∗ à đợc gọi là nghịch đảo Mobius của f

Sau đây là một vài cơ sở lập luận cần thiết để nghiên cức các hàm phân bố và các hàm mật độ của tập ngẫu nhiên. Σ Σ Σ Σ

X Z⊆ X Định nghĩa 3.1.20 Cho k ≥ 2 Một phần tử f ∈ F là đơn điệu bậc k nếu với mọi tập con khác rỗng S của 2 U mà |S| ≤ k , f

X∈T f là đơn điệu bậc vô hạn nếu nó là đơn điệu bậc k với mọi k

Mục tiêu của chúng tôi là nhận diện các hàm f, mà là các nghịch đảo Mobius của các ánh xạ đơn điệu bậc k Việc này tương tự như việc xác định các hàm f sao cho f ∗ ξ là đơn điệu bậc k, với f = g ∗ là nghịch đảo Mobius của g, trong đó g là hàm đơn điệu bậc k và f ∗ ξ = g ∗ à ∗ ξ = g Ngoài ra, có một dạng thay thế cho vế phải của bất đẳng thức trên.

Bổ đề 3.1.2 f : 2 U → R Giả sử S là một tập con của 2 U Đặt Γ = Γ(S) là tập các tập con mà đợc chứa trong ít nhất một tập X trong

Biểu thức cuối cùng là tổ hợp tuyến tính của các hàm f(Y), trong đó Y là tập con của một số phần tử trong S Khi cố định Y, chúng ta sẽ xác định hệ số của f(Y) Đặt T_Y là tập con của S, trong đó mỗi phần tử đều chứa Y.

Suy ra điều phải chứng minh. f (Y ) = f (Y )

Tất nhiên, kết quả cũng có thể đợc phát biểu nh sau:

Tập Γ đóng vai trò quan trọng trong dạng sau: Cho X ⊆ U với |X| ≥ 2 Đặt

(ii)Mọi tập con thực sự Y của X đợc biểu diễn duy nhất bằng giao của các tập trong S Trên thực tế: Y = (X −

(iii) Tập Γ cho tập S này chính xác là các tập con thực sự Y của

X (không chứa X ) Ta sẽ sử dụng những cơ sở lập luận này cho định lý sau đây. Định lý 3.1.11 Nếu f ∗ ξ là đơn điệu bậc k , thì f (X) ≥ 0 với 2 ≤ |X| ≤ k

Chứng minh Giả sử rằng f ∗ ξ là đơn điệu bậc k , và 2 ≤ |C| ≤ k Với

Tập hợp Γ = Γ(S) bao gồm các tập con được chứa trong ít nhất một tập X thuộc S Các phần tử của Γ là các tập con của A, trong đó không chứa một phần tử cụ thể nào.

C , và do đó chính xác là các phần tử mà không chứa C Vì vậy:

A = C , ta nhận đợc điều phải chứng minh.

Hệ quả sau có sự chú ý đặc biệt.

Hệ quả 3.1.1 f ∗ ξ là đơn điệu bậc vô hạn nếu và chỉ nếu f (X) ≥ 0 với

Chứng minh *Điều kiện cần: Giả sử f ∗ ξ là đơn điệu bậc vô hạn Cho

|X| ≥ 2 Ta cần chứng minh f (X) ≥ 0. Đặt S = {X − {x} : x ∈ X} Khi đó, sử dụng lý luận Γ là tập của tất cả các tập con của X trừ bản thân X , ta có:

Giả sử rằng f (X) ≥ 0 ∀X sao cho 2 ≤ |X| Đặt S là một tập khác rỗng các tập con của U Ta cần chứng minh

X∈T Đặt Γ = Γ(S) nh đợc định nghĩa trong Bổ đề Sử dụng lý luận rằng Γ chứa tất cả các tập con Y sao cho f (Y ) < 0 (do f (X) ≥ 0 ∀X mà 2 ≤ |

⇒ f ∗ ξ là đơn điệu bậc vô hạn.

Hệ quả 3.1.2 Các mệnh đề sau đây là đúng.

1)Các đại lợng không đổi là đơn điệu bậc vô hạn Trên thực tế,

2)Nếu f và g là đơn điệu bậc k , thì f + g cũng đơn điệu bậc k 3)Nếu f là đơn điệu bậc k và r ≥ 0, thì rf là đơn điệu bậc k

4)Một hàm f là đơn điệu bậc k nếu và chỉ nếu với r ∈ R, f + r là đơn điệu bậc k

Dựa vào Định nghĩa 3.1.17, 3.1.19 và Định lý về hàm đơn điệu bậc k, ta có thể khẳng định tính đúng đắn của các mệnh đề liên quan Cụ thể, Định lý 3.1.12 chỉ ra rằng nếu hàm f là đơn điệu bậc 2, thì f sẽ đơn điệu khi và chỉ khi f(∅) là giá trị nhỏ nhất của f.

Chứng minh *Điều kiện cần: Nếu f là đơn điệu bậc 2 và f đơn điệu.

Do ∅ ⊆ X , ∀X ⇒ f (∅) ≤ f (X), ∀X ( f đơn điệu) ⇒ f (∅) là giá trị nhỏ nhất của f

*Điều kiện đủ: Giả sử f đơn điệu bậc hai, và f (∅) là giá trị nhỏ nhất của f Cho Y ⊆ X , thì X = Y ∪ Z với Y ∩ Z = ∅ Theo Định nghĩa về tính 2-đơn điệu f (X) = f (Y ∪ Z) ≥ f (Y ) + f (Z) − f (∅)

Vì f (∅) là giá trị nhỏ nhất của f nên f (Z) ≥ f (∅)

⇒ f là đơn điệu. Định lý 3.1.13 f ∗ ξ là đơn điệu nếu và chỉ nếu ∀A, C mà |C| = 1 thì

Chứng minh Rõ ràng rằng f ∗ξ là đơn điệu nếu và chỉ nếu với A = B∪{b} ,

Lấy C = {b} ta có điều phải chứng minh.

Có một sự kết nối mật thiết giữa các hàm phân bố trên 2 U và các hàm mật độ trên 2 U Ta sẽ thiết lập sự kết nối này.

Hàm phân bố F : 2 U → [0, 1] được định nghĩa là một hàm phân bố nếu thỏa mãn ba điều kiện: thứ nhất, F (∅) = 0; thứ hai, F (U) = 1; và thứ ba, F là hàm đơn điệu bậc vô hạn.

Một hàm phân bố được xác định là đơn điệu bậc k cho mọi k, và theo Định lý 3.1.12, giá trị nhỏ nhất của hàm phân bố là f(∅) = 0 Định nghĩa 3.1.22 chỉ ra rằng một mật độ trên 2 U là hàm f: 2 U → [0, 1] thỏa mãn hai điều kiện: thứ nhất, f(ã) phải lớn hơn hoặc bằng 0, và thứ hai, X phải là tập con của U.

U f (X) = 1 Định lý sau sẽ chỉ rõ đợc sự kết nối này. Định lý 3.1.14 Giả sử f là một mật độ trên 2 U với f (∅) = 0 Khi đó: 1, (f ∗ ξ)(∅) = 0

3, f ∗ ξ là đơn điệu bậc vô hạn.

Hay nói cách khác, f ∗ ξ là hàm phân bố. Σ Σ

3, Để chứng minh f ∗ ξ là đơn điệu bậc vô hạn ta chứng minh f (X) ≥ 0 víi

Ta có: Vì f là mật độ nên f (X) ≥ 0, ∀X ∈ 2 U

⇒ f ∗ ξ là đơn điệu bậc vô hạn.

Định lý 3.1.15 khẳng định rằng hàm phân bố F sẽ là đúng nếu và chỉ nếu hàm F* là mật độ, và giá trị của F* tại tập rỗng ∅ là 0 Điều này cho thấy sự tương ứng chính xác giữa các hàm phân bố và các mật độ.

Chứng minh Nếu F ∗ à là mật độ nhận giá trị 0 tại ∅ , thì theo Định lý trớc: (F ∗ à) ∗ ξ = F ∗ (à ∗ ξ) = F là hàm phân bố Giả sử rằng F là hàm phân bố, khi đó: Σ

Xét với các tập có lực lợng bằng 1: {x}

Vì F là đơn điệu bậc vô hạn nên (F ∗ à)(X) ≥ 0 với |X| ≥ 2

Vậy F ∗ à là mật độ có (F ∗ à)(∅) = 0. Σ ∗ Σ

Ta nhận đợc hệ quả chỉ rõ mối quan hệ giữa hàm phân bố và hàm mật độ của một tập ngẫu nhiên nh sau:

Hệ quả 3.1.3 Cho D là tập các mật độ trên 2 U với giá trị 0 tại ∅ , và B là tập các hàm phân bố trên 2 U Khi đó

D đảo là à ξ B là tơng ứng 1-1 với nghịch

Chứng minh Hệ quả đợc suy ra từ Định lý 3.1.15 ở trên.

Hệ quả 3.1.4 Một hàm phân bố F là một độ đo xác suất nếu và chỉ nếu F ∗ à là một mật độ trên U , tức là, nếu và chỉ nếu (F ∗ à)(X)

Chứng minh Hệ quả dễ dàng đợc chứng minh với chú ý rằng F (X) = Σ x∈X f (x), với f là mật độ trên U cho độ đo F trên 2 U

TÝch ph©n Choquet

Phần này trình bày khái niệm tích phân của các hàm tập không cộng tính, mà ta gọi là tích phân Choquet.

Cho X là một biến ngẫu nhiên không âm đợc định nghĩa trên (Ω, A, P ). Khi đó:

Trong phần 2.3, chúng tôi đã phân tích rằng khi thông tin thống kê không đầy đủ, giới hạn dưới của các giá trị kỳ vọng của biến ngẫu nhiên X có thể được xác định dựa trên phân bố F của một tập ngẫu nhiên.

Khi đó, ta có định nghĩa khởi đầu của Choquet về tích phân

∫ ∫ Định nghĩa 3.2.23 Cho X là một biến ngẫu nhiên không âm đợc định nghĩa trên (Ω, A, P ), F là một hàm tập đơn điệu trên A

+∞ F (X > t)dt đợc gọi là tích phân Choquet của 0 X đối với hàm tập đơn điệu F (không nhÊt thiÕt céng tÝnh).

Ta sẽ thiết lập một khái niệm khá tổng quát về tích phân

Choquet của các hàm tập mà không cần là σ - cộng tính Khái niệm này của tích phân Choquet sẽ tổng quát hóa tích phân Lebesgue.

Cho Ω là một tập hợp, và hàm à là hàm tập nhận giá trị thực, được định nghĩa trên lớp A của các tập con của Ω, bao gồm cả tập rỗng ∅ Đặc biệt, hàm à thỏa mãn điều kiện à(∅) = 0.

∀A, B ∈ A với A ⊆ B , ta có à(A) ≤ à(B), nghĩa là, à là một hàm tập đơn điệu không giảm.

Tích phân của các hàm f xác định trên miền Ω được xem xét với việc mở rộng giá trị tới ±∞, nhằm tạo thuận lợi cho việc phân tích Do đó, miền giá trị của các hàm này được xác định trong đoạn [−∞, +∞] Tất cả các giá trị cực đại của hàm cũng sẽ được xem xét trong bối cảnh này.

(ω) : ω ∈ A ⊆ Ω} , tồn tại Các phép toán số học đợc mở rộng từ R

= (−∞, +∞) tới R = [−∞, +∞] theo cách thông thờng.

Giả sử A là một σ - trờng các tập con của Ω Cho f : Ω → R là A −

B(R) - đo đợc với B(R) là σ - trờng Borel trên R đợc sinh bởi B(R) và

B(R + ) = B([0, +∞]) = {A ∩ [0, +∞] : A ∈ B(R)} = {A : A ⊆ [0, +∞] ∩ B(R)} Để tránh các biểu thức vô nghĩa nh −∞, +∞ , ta xét tách rời các hàm không âm và không dơng.

Cho f : Ω → R + là A − B(R + ) - đo đợc, khi đó tồn tại một dãy tăng f 1 , f 2 , ã ã ã của các hàm đơn giản f n : Ω → [0, +∞], là các hàm có dạng

R và A 1 , A 2 , ã ã ã , A n là các phần tử rời nhau từng đôi của A , sao cho ∀ω ∈

N Õ u n → f : Ω → [−∞, +∞], th× ta viÕt: ∞ f (ω) = f + (ω) − f − (ω) Với f + và f − là các ánh xạ từ Ω tới [0,

+∞], và f là đo đợc nếu và chỉ nếu cả f + và f − là đo đợc.

Khi à là một độ đo σ - cộng tính không âm trên (Ω, A), tÝch ph©n Lebesgue của một hàm f không âm đối với à đợc định nghĩa là: f

Với f 1 , f 2 , ã ã ã là dãy tăng các hàm đơn giản và hội tụ tới f , và

V × à là cé ng tính nên đại lợng f (ω)dà(ω) đợc định nghĩa tốt

Nó độc lập với các cách Ω chọn riêng biệt của f n

Cho f : Ω → R đo đợc, ta định nghĩa: f

Với mỗi t > 0, (f − > t) và (f ≥ −t) tạo thành một phân hoạch của Ω Theo tính cộng tính của à , à(f − > t) = à(Ω) − à(f ≥ −t), suy ra (3.1)

Vẫn trong trờng hợp à(Ω) < ∞ , cho A ∈ A , tơng tự ta nhận đợc: fdà =

∫ ∫ Σ fdà = ∞ à(f > t)dt Vế phải là mét tÝch ph©n của hàm

Đối với độ đo Lebesgue dt trên [0, ∞], hàm số t −→ à(f > t) được định nghĩa tốt khi hàm f là đo được Nếu à là một hàm đơn điệu trên (Ω, A) và f là A − B[0, ∞] - đo được, thì (f > t) thuộc A.

∀t ∈ [0, ∞] Vì à tăng, t −→ à(f > t) là hàm giảm và nó là

B([0, ∞]) − B([0, ∞]) - đo đợc. Điều này đợc chứng minh nh sau: Cho t ∈ [0, ∞], đặt ϕ(t) = à(f > t). Khi đó:

Thật vậy, nếu inf{ϕ < s} thu đợc tại a , thì cho b ≥ a , ta có ϕ(b) ≤ ϕ(a) < s nên b ∈ (ϕ < s) Ngợc lại, nếu ϕ(c) < s , thì a ≤ c theo định nghĩa của a

Nếu a = inf{ϕ < s} không thu đợc, khi đó nếu ϕ(b) < s , ta luôn có a < b Ngợc lại, nếu c > a , khi đó tồn tại y sao cho ϕ(y)

< s và a < y < c Nhng ϕ là giảm, nên ϕ(c) ≤ ϕ(y) < s Do đó c ∈ (ϕ < s).

Vậy cho f : Ω → [0, ∞], ta có thể định nghĩa tích phân Choquet của f đối với à là C à (f ) = ∞ à(f > t)dt

Khi đó, ta có định nghĩa tổng quát của tích phân Choquet nh sau:0 Định nghĩa 3.2.24 Khi f : Ω → [−∞, +∞] và à(Ω) < ∞ , tích phân Choquet của f đối với à đợc định nghĩa là

Ta nói rằng f là à - khả tích trên A khi C à (1 A f ) < ∞

Khi à(Ω) < ∞, à(Ω) = 1 thì "biến" f có "phân bố" ϕ (t) =  à(f > t) nếu t ≥ 0

"Giá trị kì vọng" của f theo à là tích phân Lebesgue của phân bố ϕ f (t), đó là:

A n là các tập con rời nhau từng đôi của Ω và a 0 = 0 < a n n 1 < ã ã ã < a n (f ≥ 0), ta có: à(f > t) = Σ à [

Σ Σ [ à A j j=i dt = i= 1 j= i Tính chất 4 Tích phân Choquet có các tính chất sau: i)Tích phân Choquet là đơn điệu và đồng nhất dơng bậc

1 ii)Tích phân Choquet không cộng tính.

Tính chất i): Tích phân Choquet là đơn điệu và đồng nhất dơng bậc 1, nghĩa là: f ≤ g ⇒ C à (f ) ≤ C à (g) (f ≤ g ⇒ {f > t} ≤ {g > t} ⇒ à(f

Tính chất ii): Tích phân Choquet không thỏa mãn tính cộng tính.

Ví dụ, nếu f = (1/4)1 A và g = (1/2)1 B với A ∩ B = ∅ thì

Suy ra: C à (f + g) ƒ= C à (f ) + C à (g) ( à(A ∪ B) ƒ= à(A) + à(B) do à không phải cộng tính) Tuy nhiên, nếu ta xét hai hàm đơn giản f và g có dạng f = a1 A + b1 B với A ∩

Tổng quát hơn, đẳng thức này đúng cho f = j a j

A 1 , ã ã ã , A n là rêi nhau tõng đôi, và 0 ≤ a 1

Đạo hàm Radon - Nikodym

Tơng tự phần trớc, ta cũng có khái niệm đạo hàm Radon -

Nikodym của hai độ đo không cộng tính.

Cho à và ν là hai hàm đo σ-cộng tính trên σ-đại số U Nếu tồn tại một hàm U-đo f : U → [0, ∞) sao cho à(A) = ∫ fdν với mọi tập A ∈ U, thì f được gọi là đạo hàm Radon-Nikodym của à đối với ν, ký hiệu là f = dà/dν.

Ta biết rằng, trờng hợp trên xảy ra khi và chỉ khi à là tuyệt đối liên tục đối với ν , ký hiệu à

Ngày đăng: 23/12/2021, 19:34

w