Phân rã ANOVA
Phân rã ANOVA cổ điển
Trước hết ta sử dụng kí hiệu x u = (x i 1 , , x i |u| ) với i 1 , , i |u| ∈ u Khi đó ta có Định nghĩa 1.1 Cho Ω = [0, 1], D := {1,
2, , d} , dà(x) = dx và V (d) là khụng gian các hàm bình phương khả tích Khi đó phân rã f (x) = f u (x u ), u⊆D trong đó và phép chiếu cho bởi f u (x u ) := P u f (x u ) − f v (x v ) v
[0,1] d−|u| được gọi là một phân rã ANOVA cổ điển. f (x)dx D\u
Phương sai của hàm f có thể viết như sau σ 2 (f ) σ 2 (f u ), ở đây σ 2 (f u ) là
Phương sai của f u và chỉ số σ²(f u) σ²(f) thể hiện độ nhạy toàn cục, giúp đo lường mức độ quan trọng của f u so với f Dựa vào phân tích phương sai, chúng ta định nghĩa số chiều hiệu dụng cho α ∈ (0, 1] như sau: Định nghĩa 1.2 xác định số chiều hiệu dụng theo nghĩa chặt chẽ của hàm f là số nguyên dương nhỏ nhất d t sao cho u⊆{ ∑ 1, ,d t } và σ²(f u) ≥ ασ²(f) Định nghĩa 1.3 đưa ra số chiều hiệu dụng theo nghĩa chồng chất của hàm f là số nguyên dương nhỏ nhất d s.
Hai bổ đề sau đưa ra quan hệ giữa số chiều hiệu dụng và sai số xấp xỉ.
Bổ đề 1.1 Cho d t kí hiệu là số chiều chặt cụt của f Khi đó với α ∈ (0, 1] và f d := ∑ f u (x u ) ta có ||f − f d || 2 ≤ (1 − α)σ 2 (f ).
∑ σ 2 (f u ) ™ (1 − α)σ 2 (f u ). Điều này cho ta điều phải chứng minh. u⊆{1, ,d t
Bổ đề 1.2 Cho d s là số chiều chồng chất của f Khi đó với α ∈ (0, 1] và f ds
Chứng minh Tương tự bổ đề 1.1, ta có
Từ đây ta có điều phải chứng minh.
1 Từ hai bổ đề trên ta nhận thấy phương pháp tính tích phân tạo ra sai số nhỏ nếu α gần 1 Các điểm tựa ngẫu nhiên là được phân bố đều theo số chiều lớn đến mức mà ta có thể hi vọng rằng If dt là được xấp xỉ tốt khi số chiều chặt cụt d t nhỏ Đồng thời đánh giá
Phương pháp lưới thưa cho tích phân có số chiều cao thành công nhờ khả năng tính toán hiệu quả các hàm số có số chiều hiệu dụng thấp Đặc biệt, khi d s hoặc d t nhỏ, phương pháp này kết hợp với việc làm mịn lưới thưa theo số chiều giúp cải thiện độ chính xác của kết quả tính toán.
2 Chúng ta có thể lựa chọn Ω = R và độ đo Gauss dà(x) = φ d (x)dx trong đó φ d (x) = e
2 d là kí hiệu mật độ Gauss chuẩn Điều này cảm sinh một phép chiếu (2π) 2
Phép chiếu này sinh ra phân rã ANOVA với trọng Gauss Dựa trên phân rã này số chiều hiệu dụng của f được định nghĩa tương tự như (8) và (9).
Phân hoạch ANOVA có điểm neo
Sử dụng các kí hiệu trong Định nghĩa 1.1, ta có Định nghĩa 2.1 với Ω = [0, 1] và độ đo Dirac tại a ∈ [0, 1] được ký hiệu là dà(x) = δ(x − a)dx Phân rã f (x) = f u (x u ) trong đó f u (x u ) := P u f (x u ) − f v (x v ) được gọi là phân rã ANOVA có điểm neo, với phép chiếu P u f (x u ) = f (x )| x =a\xu v⊂u Tại đây, f (x)| x=a\xi = f (a 1 , , a i−1 , x i , a i+1 , a d ) và f (x)| x=a\xu = f (a 1 , , x 1 , x i 1 , , x iu , , a d ) với x u = (x i 1 , x i 2 , , x iu ).
Phân rã ANOVA có điểm neo, khác với phân rã phương sai cổ điển, vì các hàm dưới dấu tích phân được thay thế bằng sự đánh giá hàm tại điểm neo a ∈ [0, 1] d cho trước Phương pháp này được gọi là Cut-HDMR và đã được nghiên cứu trong tài liệu [2].
Phân rã ANOVA cổ điển rất hữu ích trong việc phân tích tầm quan trọng của các số hạng với số chiều khác nhau và tương tác giữa chúng Tuy nhiên, nó không được sử dụng như một công cụ thiết kế để xây dựng lược đồ tích phân do yêu cầu tính tích phân của số hạng hằng trong phân hoạch cổ điển Ngược lại, phân rã ANOVA có điểm neo lại mang lại lợi thế vì số hạng con của nó dễ tính toán hơn, chỉ cần thay việc tính tích phân bằng việc tính giá trị của hàm tại điểm neo a ∈ [0, 1] đã cho.
Khái niệm số chiều hiệu dụng được xác định lại thông qua phân rã ANOVA có điểm neo, mang đến một góc nhìn mới mẻ Trong bối cảnh cổ điển, số chiều hiệu dụng được tính toán dựa trên chuẩn trong.
Số chiều hiệu dụng cho trường hợp cú điểm neo dựa trờn toỏn tử |I(ã)| vỡ |I(f )| |
[0, ∫ 1] d f (x)dx| ≤ ||f|| L1 Do vậy nó liên quan đến chuẩn trong L 1.
Trong trường hợp cổ điển, số chiều hiệu dụng xác định giới hạn sai số cho xấp xỉ, như đã nêu trong bổ đề 1.1 và 1.2 Chúng ta sẽ áp dụng số chiều hiệu dụng trong trường hợp điểm neo để tính toán sai số cho tích phân Để bắt đầu, ta đặt
Số chiều chặt cụt trong trường hợp có neo được định nghĩa là số nguyên dương nhỏ nhất \( d_t \) sao cho tổng các giá trị tuyệt đối của tích phân của tất cả các số hạng trong phân rã \( u \) thuộc tập hợp \( \{ \sum 1, , d_t \} \) và \( u \) không rỗng.
|If u | “ α^σ(f ) (12) Định nghĩa 2.3 Số chiều chồng chất trong trường hợp có điểm neo là số nguyên dương nhỏ nhất d s sao cho
Hai bổ đề sau đưa ra quan hệ giữa số chiều hiệu dụng trong trường hợp có điểm neo và sai số tích phân.
Bổ đề 1.3 Cho d t là kí hiệu số chiều chặt cụt của f trong trường hợp có điểm neo ứng với α ∈ (0, 1] và f dt (x) : u⊆{1, ,d t } f u (x u ), khi đó ta có
Từ đây suy ra điều phải chứng minh.
Bổ đề 1.4 Cho d s là số chiều chồng chất của f trong trường hợp có điểm neo ứng
∑ với α ∈ (0, 1] và f ds (x) : |u|≤d s f u (x u ), khi đó ta có
Nhận xột: Chỳng ta cú thể lựa chọn Ω = R và dà(x) = δ(x − a)φ d (x)dx với a ∈ R d cho trước và φ d là mật độ Gauss Điều này sinh ra phép chiếu
Nhờ có (3), một phân rã tương ứng của f : R d → R, được suy ra như phân rã
ANOVA có điểm neo với trọng Gauss.
Dựa trên phân rã này, số chiều hiệu dụng của phân rã ANOVA có điểm neo với hàm trọng Gauss có thể được định nghĩa tương tự như (12), (13).
Phương pháp tính tích phân theo số chiều
Sự chặt cụt và rời rạc hóa
Chúng ta sẽ phát triển lớp mới các phương pháp tính tích phân, bắt đầu với miền Ω = [0; 1] Chúng ta sử dụng độ đo Dirac đặt tại điểm a ∈ [0, 1] d, từ đó xác định u⊆ D |u|.
∑. Áp toán tử tích phân cho phân rã có điểm neo (3), tích phân d− chiều được phân hoạch tuyến tính, thành tổng hữu hạn d d
Chú ý là trong vế phải của (17) mỗi tích phân j chiều có
Dựa trên phân rã (17), chúng ta định nghĩa một lớp phương pháp tính tích phân tổng quát nhằm xấp xỉ giá trị của If với j số hạng từ 1 đến d.
1 Chặt cụt: Chúng ta chỉ lấy tập con S của tất cả các chỉ số u ⊆ D, do đó ta đã chặt cụt tổng (17), ở đây ta giả sử tập S thỏa mãn điều kiện chấp nhận được đó là u ⊆ S; v ⊂ u ⇒ v ∈ S (18)
Ví dụ: S dt := {u ⊆ D : u ⊆ {1, , d t }} hoặc S ds := {u ⊆ D : |u| ≤ d s }.
2 Rời rạc hóa: Với mỗi u ⊆ S, chúng ta tính toán sự xấp xỉ cho If u Chúng ta lựa chọn công thức tính tích phân |u| - chiều Q u , bắt đầu từ q ∅ = f (a), khi đó q u := Q u (P u f ) − q v (19) v⊂u được xem là xấp xỉ của If u (dựa vào công thức (16)) Rõ ràng thấy rằng chúng ta tránh được việc tính toán giá trị tích phân của hàm f u Chúng ta có thể chọn Q u tùy ý và có thể là khác nhau phụ thuộc vào u.
Bây giờ ta định nghĩa một công thức tính tích phân
A S (f) được định nghĩa là tổng hợp các giá trị q u (20) với u thuộc S, coi như là xấp xỉ của hàm If Đồng thời, n được ký hiệu là n u với u thuộc S, đại diện cho số lượng các điểm đánh giá của hàm f, trong đó n u biểu thị số điểm đánh giá của Q u.
Sai số và chi phí
Đầu tiên chúng ta xem xét trường hợp của phương pháp tính tích phân tùy ý
Q u Đầu tiên chúng ta có đánh giá sai số u⊆ D i=
Sai số của phương trình (20) phụ thuộc vào phương pháp tính tích phân Q u và lựa chọn tập chỉ số S Số hạng thứ hai phản ánh sai số mô hình hóa một cách chặt chẽ, trong khi số hạng thứ nhất thể hiện sai số rời rạc hóa, dựa vào sai số của từng số hạng trong phân rã ANOVA có điểm neo.
Mục tiêu của chúng ta là đạt được sự cân bằng giữa chi phí và độ chính xác thông qua việc so sánh chi phí của phương pháp tính tích phân Q u với tầm quan trọng của số hạng f u trong phân rã ANOVA có điểm neo Để làm điều này, chúng ta sẽ liên hệ độ chính xác của phương pháp tính tích phân Q u với độ chính xác của các phương pháp khác.
Để bắt đầu, chúng ta cố định α ∈ (0, 1] và giả sử rằng d s và d t lần lượt là số chiều chồng chất và số chiều chặt cụt trong phân rã ANOVA có điểm neo Trước tiên, chúng ta sẽ định nghĩa tập hợp liên quan.
S dt ,d s := {u ⊆ {1, , d t } : |u| ™ d s } (22) Khi đó ta có bổ đề
Bổ đề 1.5 Cho S = S ds ,d t , khi đó với mỗi ε > 0 cho trước và Q u là phép tính tích phân sao cho |I(P u f ) − Q u (P u f )| ≤ ε(|u|) với ε(j)
|I(f ) − A S f| ≤ ε + 2(1 − α)^σ(f ). u∈ ∑ S d tds f u Mặt khác, ta lại có sai số mô hình hóa được đánh giá bởi
Hơn nữa ta có công thức biểu diễn tường minh
Vì |I(P v f ) − Q v (P v f )| ™ ε(|v|) đối với mọi v ⊆ u nên
Chứng minh Ta có |I(f ) − A S f| ™ If − If dt ,d s + If dt ,d s − A S f , trong đó f dt d s :∑ ∑ ∑
∑ ∑ ε(j). Ở đây chúng ta đã sử dụng ( |u| ) tập v ⊆ u thỏa mãn điều kiện |v| = j Sử dụng j định nghĩa của ε(j) ta có thể đánh giá được sai số rời rạc hóa bởi
Vậy bổ đề đã được chứng minh.
Tiếp theo ta sẽ liên hệ sai số |If − A S f| với chi phí n = n u của phương pháp u∈S
Mục tiêu của chúng tôi là cân bằng chi phí và độ chính xác trong tính toán Phương pháp Q u được xây dựng dựa trên công thức tích phân U m với m điểm, hội tụ với mỗi f ∈ C r ([0, 1]) với tốc độ m −r Khi r = 1, công thức hình thang có thể được áp dụng, trong khi với r tùy ý, công thức Gauss cũng có thể sử dụng Theo Định lý 1.1, nếu chọn S = S dt, d s và Q u là tích tenxơ |u| - chiều của quy tắc.
Nếu |A S f| c(d t , d s )n ds r + 2(1 − α)σ(f) với tất cả hàm f ∈ C r ([0, 1] d ), thì hằng số c(d t , d s) phụ thuộc vào số chiều hiệu dụng d t và d s trong trường hợp có điểm neo nhưng không phụ thuộc vào số chiều d Tương tự như bổ đề trước, ta có f dt,d s: u∈S dt,d s f u Vì f ∈ C r ([0, 1] d) và f u ∈ C r ([0, 1] |u|) với mọi u ⊆ D, nên Q u hội tụ với tốc độ r Theo định nghĩa, Q u.
([ ] − là kí hiệu phần nguyên ) điểm đánh giá hàm sao cho
|I(P u f ) − Q u (P u f )| ™ c(|u|)n − ds , trong đó c(|u|) > 0 là hằng số chỉ phụ thuộc vào cấp |u| Ta lại có
− 1)(d ) ds , trong đó c(d s ) :=max j=1,2 ,d s c(j) Như vậy đến đây định lí được chứng minh hoàn toàn.
Số hạng đầu tiên trong giới hạn sai số phản ánh sai số rời rạc hóa phụ thuộc vào n, trong khi số hạng thứ hai thể hiện sai số mô hình hóa, phụ thuộc vào α Hơn nữa, chi phí để đạt được một sai số rời rạc hóa đã được quy định trước không phụ thuộc vào số mũ của số chiều thông thường, mà lại liên quan đến số chiều chồng chất khi có điểm neo.
Xây dựng tiên nghiệm sử dụng không gian hàm có trọng
! s t sử dụ ng kh ôn g gia n hà m có trọ ng
T rong thực tế số chiề u hiệu dụng của f là thườ ng khôn g được biết trướ c.
Các chiều này không thể tính toán do việc này thường tốn kém, ít nhất là phải trả chi phí cao như khi thực hiện tính tích phân của chúng.
Do vậy thô ng thư ờng , khó khă n mà c h ú n g t a h a y g ặ p p h ả i l à x á c đ ị n h t ậ p
Để khắc phục trở ngại này, chúng ta cần sử dụng các phương pháp phù hợp để xác định lớp hàm nào đã được định nghĩa trong không gian hàm xác định có trọng số.
Số hạng f trong phân rã ANOVA có vai trò quan trọng, với điểm neo được xác định rõ ràng Tiếp theo, chúng ta sẽ xác định tập S, bao gồm tất cả các chỉ số u tương ứng với trọng số lớn nhất γ u.
Nhiều hàm f với số chiều hiệu dụng thấp có thể được hiểu theo hai nghĩa: chặt cụt hoặc chồng chất Với hai loại hàm này, chúng ta có thể hy vọng xác định tập chỉ số S γ, bao gồm các số hạng quan trọng nhất.
• Giả sử rằng ta có một chuỗi các trọng γ 1 ≥ γ 2 ≥ ≥ γ d ≥ 0, khi đó trọng tích được xác định bởi γ u := γ j , (24) j∈u trong đó u ⊆ D Ở đây
Trong nghiên cứu này, chúng ta sẽ xem xét tập chỉ số S γ, nhằm xác định các số hạng quan trọng nhất cho các hàm f có số chiều chặt cụt nhỏ Các kí hiệu này sẽ được sử dụng thường xuyên trong các phần tiếp theo của luận văn Mặc dù có nhiều trọng phổ biến có thể áp dụng trong quá trình xây dựng, chúng ta sẽ chỉ tập trung vào việc chuyển đổi bài toán lựa chọn tập S thành bài toán xác định trọng γ, miễn là các điều kiện chấp nhận được thỏa mãn.
PHƯƠNG PHÁP TÍNH TÍCH PHÂN TỐI ƯU TRÊN LƯỚI THƯA
Trong chương này, chúng tôi áp dụng phương pháp tích tenxơ Q u để xấp xỉ tích phân If u, cho phép kết hợp sự chặt chẽ của phân rã ANOVA và rời rạc hóa chuỗi con Phương pháp này giúp tối ưu hóa sự cân bằng giữa sai số mô hình hóa và sai số rời rạc hóa.
Lưới thưa tổng quát
Cho hàm một biến f : [0, 1] −→ R và một dãy các số nguyên không giảm m k , k ∈ N, ta đặt m k
U mk f := w i,k f (x i,k ) (25) i=1 là kí hiệu của một phép tính tích phân với m k điểm x i,k và trọng w i,k đồng thời chuỗi này hội tụ tới If khi k → ∞ Chúng ta quy ước rằng m 1 = 1, U 1 f = f (
1 ) và công thức tính tích phân sai phân
∆ k := U mk − U mk−1 (26) d với U m 0 = 0 và mọi k ≥ 1 Bây giờ cho f : [0, 1] → R là hàm nhiều biến Khi đó tích phân d - chiều có thể được viết thành tổng thu gọn vô hạn
If = ∆ k , f (27) k∈N d ở đây k ∈ N d là kí hiệu tích các chỉ số với k j > 0 và
Một lớp các phương pháp tính tích phân đặc biệt cho xấp xỉ của If dựa vào việc chặt cụt tổng trên, thông qua việc sử dụng tập chỉ số xấp xỉ I ⊂ N d Tập chỉ số này có vai trò quan trọng trong việc cải thiện độ chính xác của các phép tính xấp xỉ.
∑ coi như là sự làm mịn của tập S ⊆ D Tuy nhiên tập I phải thỏa mãn điều kiện chấp nhận được đó là
Nếu k ∈ I và l ™ k thì l ∈ I, (29) trong đó l ™ k nghĩa là l j ™ k j với mọi j = 1, 2 , d Theo hướng này phương pháp lưới thưa tổng quát
SG I f := ∆ k f (30) k∈I có thể đạt được như đã đề cập trong các tài liệu [3], [4], [12] Các phương pháp tính tích phân khác nhau sử dụng những cách tiếp cận khác nhau để chặt cụt Chẳng hạn, trong phương pháp lưới thưa cổ điển, người ta lựa chọn tập chỉ số một cách cụ thể.
1 k j , hoặc đối với phương pháp tích thì tập I lại có dạng
Mối quan hệ giữa phương pháp tính tích phân trên lưới thưa với phương pháp tính tích phân theo số chiều
thưa với phương pháp tính tích phân theo số chiều
Phương pháp lưới thưa có mối quan hệ chặt chẽ với phân rã ANOVA, có thể coi là sự làm mịn của phép phân rã này Cụ thể, phương pháp lưới thưa mở rộng mỗi số hạng của phân rã ANOVA thành một cơ sở vô hạn, sau đó cắt ngắn sự mở rộng này một cách gần đúng Điều này cho thấy phương pháp lưới thưa là một trường hợp đặc biệt của phương pháp (20), trong đó tập S và Q u được chọn một cách hệ thống nhằm khai thác độ trơn của hàm dưới dấu tích phân Điểm neo a = (1, ).
Chúng ta bắt đầu với bổ đề sau
Bổ đề 2.1 Cho f u và P u f như trong (16) đồng thời kí hiệu
Khi đó ∆ k f = ∆ k (P u f ) nếu k ∈ N v và v ⊆ u Hơn nữa, ∆ k f = ∆ k f u nếu k
Chứng minh Việc chứng minh bổ đề này khá đơn giản, thật vậy nếu k ∈ N v và v ⊆ u thì k j = 1 với mọi j ̸∈ u và do vậy ∆ k f = ∆ k (P u f ) vì rằng ∆ k f = ∆ k 1 ⊗∆ k 2
⊗∆ kd và ∆1 f = P ∅ f = f ( 1 ) với mọi hàm một biến f Tiếp theo cho k ∈ N u , ta được
Với mọi j ∈ v, ta có ∆ k f v = 0 nhờ tính trực giao của phép phân hoạch có điểm neo Điều này cho phép kết luận rằng ∆ k f = ∆ k (P u f ) = ∆ k f u với mọi k ∈ N u Từ đó, ta suy ra điều cần chứng minh.
Bây giờ sử dụng bổ đề trên và If = ∆ k f ta được k∈N d
Lại do (17) nên ta cũng thu được If u⊆D
If u , khi đó ta có
Tiếp theo, chúng ta sẽ chặt cụt tổng này bằng cách chọn tập chỉ số I u ⊂ N u với mọi u ⊆ D, đảm bảo tập này thỏa mãn điều kiện chấp nhận được Khi đó, q u := ∆ k f (33) k∈I u được xem như là sự xấp xỉ của If u Tương ứng, phương pháp (20) với tập S = D có thể được viết tường minh là A S f = ∑ q u = ∑.
N u (34) Định lý 2.1 Phương pháp tính tích phân (20) với điểm neo a = ( 1 , , 1 ), tập chỉ
{} số S = D và phương pháp tính tích phân
Q u f := ∆ k f (35) v⊆u k∈I v trùng với phương pháp lưới thưa tổng quát (30).
Chứng minh Ta sẽ chứng minh (20) trùng với (33) và (35), thật vậy ta có
Từ đó suy ra điều phải chứng minh. v⊂u k∈I v
Lưới thưa tối ưu trong không gian có trọng
Trong Mục 2.2, chúng ta đã giới thiệu tập chỉ số I ⊂ N d như là sự làm mịn của tập S ⊆ D và công thức tính tích phân đặc biệt Q u, tương ứng với phương pháp lưới thưa tổng quát Mục tiêu của mục này là xác định tập chỉ số I, nhằm cân bằng sai số mô hình hóa và sai số rời rạc hóa một cách tối ưu cho hàm dưới dấu tích phân từ không gian hàm Sobolev Chúng ta sẽ xem xét công thức tính tích phân một biến U mk trong (25) được xác định bởi công thức hình thang, với giả định rằng m 1 = 1, U 1 f = f (0) và m i = 1 + 2 i−2 cho mọi i ≥ 2, từ đó phân tích dựa trên không gian hàm một biến với chuẩn.
, (36) ở đây γ ∈ (0, 1] là kí hiệu của một trọng nào đó Trong trường hợp nhiều biến chúng ta xem xét một dãy các trọng
Chú ý là mỗi u ⊆ D ta có một trọng γ u Tiếp theo, ta định nghĩa không gian tích tenxơ u⊂ v v⊆u k∈I v v⊂u k∈I v
H 1 ([0, 1]), trong đó chuẩn xác định bởi ||f|| 2 1 2 1,mi u∈D x
Tỉ lệ giữa chi phí và lợi nhuận
Trong không gian H mix ([0, 1] d), chúng ta xác định tập chỉ số I cho phương pháp lưới thưa tổng quát SG I, nhằm tối ưu hóa tỷ lệ giữa lợi nhuận và chi phí Để thực hiện điều này, mỗi chỉ số k ∈ N d sẽ được kết hợp với một chi phí địa phương, được xác định bởi số điểm đánh giá hàm n k theo quy tắc ∆ k f Kết quả là m i ™ 2 i−1 dẫn đến d n k = m k j ™ 2 |k−1| 1 =: c k.
Bây giờ chúng ta đặt γ k : j=1, , d k j >1
Bổ đề 2.2 Ta có bất đẳng thức γ j Khi đó ta có bổ đề sau trong đó
Chứng minh Trước hết ta chứng minh tính chất U mi −1 f −
1 −1 f ™ 2 −i+1 ||f ′ || với mọi i “ 2.Thật vậy, ta có
Khi đó với i = 2 cho ta
Suy ra tính chất này đúng khi i = 2 Với i ≥ 3 thì từ (*) ta nhận được
Do đó ta nhận được x j−1, i
Chúng ta sẽ chứng minh bổ đề bằng cách xem xét trường hợp một biến Đầu tiên, chúng ta cần chứng minh rằng |∆ i f| ™ γ 1/2 2 −i+1 ||f| | 1,γ cho mọi i ≥ 2 Thật vậy, trước hết, ta có
Bây giờ sử dụng tích tenxơ ∆ k = ⊗ d ∆ k ta dành được điều cần phải chứng minh i cho bổ đề, từ đó suy ra điều phải chứng minh.
Chúng ta xem b k như một lợi nhuận địa phương kết hợp với chỉ số k ∈ N d Lợi nhuận toàn cục của phương pháp (31) được xác định
B I := b k (40) k∈I Điều này dẫn đến bài toán tối ưu chặt là tìm max B I , w N để thu được lợi nhuận n I =w
Bài toán tối ưu hóa chi phí toàn cục với mỗi chi phí n I được xác định có thể được đơn giản hóa thành bài toán sắp xếp tỷ lệ chi phí và lợi nhuận địa phương Tỷ lệ này được tính theo công thức cbr k := b k /c k = 2 −2|k−1|.
Tập chỉ số tối ưu I bao gồm tất cả các chỉ số có tỉ lệ lợi nhuận và chi phí lớn hơn hoặc bằng một hằng số nhất định, với cbr được xác định bởi công thức cbr := 2 − 2(l−1) và k = (l, 1, , 1) Định lý 2.2 trình bày rằng trong trường hợp có trọng, tập chỉ số tối ưu sẽ được xác định theo một cách cụ thể, đảm bảo tính hiệu quả trong việc lựa chọn các chỉ số.
Chứng minh Đầu tiên ta sử dụng
∑ 1 log 2 (γ j ) k trong đó D k := {j ∈ D : k j > 1} Từ đó chúng ta nhận được cbr k = 2 −(|k−1| 1 +σ k ) Như vậy chúng ta thấy ngay rằng cbr k “ cbr k ⇔ − 2(|k − 1| 1 + σ k ) “ −2(l − 1)
Từ đây định lí được chứng minh.
Một kết quả của phương pháp lưới thưa với tập chỉ số I l,γ là
Chú ý là phương pháp SG l,γ là phương pháp lưới thưa cổ điển trong trường hợp không có trọng nghĩa là nếu γ j = 1 với mọi j = 1, 2, , d thì SG l,γ ≡ SG l
Ví dụ 2.4.1 trình bày tập chỉ số I l,γ với l=7 như trong hình 2.1, với d=2 và các lựa chọn trọng số khác nhau γ = γ(γ 1 , γ 2) Tỉ lệ lợi nhuận và chi phí địa phương của các chỉ số k = (k 1 , k 2), với k i ∈ {1, , 8} và i = 1, 2, được nhấn mạnh Đồng thời, các chỉ số k ∈ I l,γ với l = 7 được biểu thị bằng các chấm.
∑ thể hơn tập I l,γ có thể được biểu diễn bởi I l,γ = I u , trong đó chúng ta có 4 u⊂{1,2} tập con đó là
Tập hợp I 12 được định nghĩa là {(k 1 , k 2) : k 1 , k 2 > 1; |k| 1 < b 12 }, trong đó b 1 , b 2 , b 12 thuộc tập số tự nhiên N và phụ thuộc vào các tham số γ 1 , γ 2 cùng với số chiều d và l Cần lưu ý rằng có 4 tập con tương ứng với chỉ số của phương pháp lưới thưa cổ điển, trong đó thường sử dụng 2 d tập con, mỗi tập con tương ứng với một số hạng của phân rã ANOVA.
Hình 2.1: Các tập chỉ số tối ưu I l,γ trên mức l=7
Phân tích chi phí
Trong mục tiếp theo chúng ta sử dụng n(d, l, γ) để kí hiệu số các điểm đánh giá hàm của phương pháp SG l,γ
Bổ đề 2.3 (Chi phí của lưới thưa cổ điển) Cho m i ™ 2 i−1 , khi đó ta có n(d, l) ™ 2 l l + d − 2 d − 1
Từ đây suy ra điều phải chứng minh d −
Như một hệ quả của Bổ đề 2.3 với m i ™ 2 i thì số điểm đánh giá trong phương pháp lưới thưa đó thỏa mãn n(d, l) ™ 2 d+l l + d − 2
(45) d − 1 Định lý 2.3 (Chi phí của lưới thưa có trọng) Cho m i ™ 2 i−1 , khi đó ta có l ∑
Chứng minh Trước hết chúng ta có I l,γ u∈D I u , trong đó
Do vậy ta có đánh giá n(d, l, γ) ™ k∈I l,γ n k = n k (46) u⊆D k∈I u
Cho h ∈ (N \ {1}) |u| là kí hiệu của véc tơ gồm các thành phần của k ∈ I u mà lớn hơn 1 Chúng ta có thể viết
= h ∈ (N \ {1}) |u| : |h| 1™ l − |u| − σ u + 2 |u| − 1 , trong đó σ u = σ j Chúng ta thấy rằng I u là tập chỉ số của một lưới thưa cổ điển
|u| - chiều bắt đầu với m j∈u 1 = 2 điểm và với mức l − σ u − |u|, do vậy dựa vào hệ quả của Bổ đề 2.3 ta được n k k∈I u = n(|u| , l
Bằng cách sử dụng σ u = − log 2 (γ u )/4 và 2 −σu = γ 1/4 ta có điều phải chứng minh.
Phân tích sai số
Bây giờ chúng ta xem xét sai số của phương pháp SG l,γ Chúng ta có bổ đề sau
Bổ đề 2.4 (Sai số của lưới thưa cổ điển) Cho SG l là kí hiệu phương pháp lưới thưa cổ điển với tập chỉ số (31) và giả sử l “ d
Chứng minh Sử dụng (27), (30) và bổ đề 2.2 với γ j = 1 với mọi j = 1, 2,
Tuy nhiên ta lại có thì
(l + d − 1) j với mọi j = 0, , d − 1, nên ta có
Từ đây ta suy ra điều phải chứng minh.
Nếu SG l là ký hiệu cho phương pháp lưới thưa cổ điển với tập chỉ số I, bắt đầu với m 1 = 2 và l “ d - 1, thì từ định lý trên, ta có thể rút ra hệ quả quan trọng.
If − SG l f ™ k∈(N\{1}) d \I 2 −|k−1| 1 ||f|| 1 ™ 2 −d−l A(d, l)||f|| 1 (48) Định lý 2.4 (Sai số của lưới thưa có trọng) Cho l “ d − 1 log 2 (γ {1, ,d} ) −
1, khi đó ta có If − SG l,γ f
Chứng minh Trước hết từ (38) và (39) ta có
∪ b k ||f|| 1,γ , (49) ở đây N d \ I l,γ = (N u \ I u ) Trong đó N u và I u được xác định lần lượt như ở u⊆D
(34) và trong chứng minh của định lí 2.3 Tiếp tục sử dụng (39) ta nhận được k∈ ∑ N d \I l,γ
Trong bài viết này, chúng ta xem xét mối quan hệ giữa các chỉ số γ và tập chỉ số của lưới thưa cổ điển |u| Cụ thể, với γ u = γ j = 2 − 4 σu, chúng ta nhận thấy rằng j thuộc u và I u tương ứng với tập chỉ số này Bằng cách áp dụng định lý 2.3, chúng ta có thể xác định rằng chiều của lưới bắt đầu với m 1 = 2 điểm và mức l − σ u − |u| Hơn nữa, từ (48), ta có k thuộc ∑ N u \I u.
Nếu l “ d − 1 log 2 (γ {1, ,d} ) − 1 thì theo trên ta có l − σ u “ |u| − 1 với mọi u
) (52) Điều này có được là do theo định nghĩa của A(d, l) và Bổ đề 2.4 Cuối cùng sử dụng
1/2 1/4 σ u = − log (γ u )/4 và γ 2 σu = γ đồng thời kết hợp (49) - (52) ta thu được điều
Nhận xét Định lí 2.4 thực chất là mở rộng Bổ đề 2.4 trong trường hợp không có trọng γ j = 1 với mọi j = 1, , d Điều này dễ dàng kiểm tra được vì rằng
=2 −l A(d, l)||f|| 1 Ở đây đẳng thức thứ 2 suy ra từ đồng nhất của Vandermonde.
Phân tích của sai số so với chi phí
Sử dụng kết quả từ Mục 2.5 và 2.6, chúng ta sẽ phân tích sai số của phương pháp SG l,γ dưới dạng hàm chi phí n = n(d, l, γ) Bắt đầu với trường hợp cổ điển, chúng ta sẽ trình bày các yếu tố ảnh hưởng đến sai số và chi phí của phương pháp này.
Bổ đề 2.5 Với mỗi f ∈ H mix ([0, 1] d ) và l “ d−1 ta có |If − SG f| = O(n − 1(log2 n) 2(d−1) ), ở đây n là kí hiệu số các điểm đánh giá được sử dụng trong phương pháp
Chứng minh Trước hết theo Bổ đề 2.4 ta có A(d, l) = O(l d−1 ), cũng nhờ bổ đề này ta có ước lượng
O , ở đây chúng ta đã sử dụng l ™ log 2 n, n = O(2 l l d−1 ) và Bổ đề 2.3 Từ đó cho ta điều phải chứng minh. Định lý 2.5 Cho l “ d − 1 log 2 (γ {1, ,d} ) − 1 Khi đó ta có
Chứng minh Trước hết chúng ta chứng minh n(d, l, γ) ™ 2 l B(d, l, γ) (54)
∏ j là do các trọng là được sắp xếp theo kích thước của chúng Khi đó, dựa vào Định lí 2.3 ta nhận được n(d, l, γ) ™
Bất đẳng thức trên có được là do tính đơn điệu tăng theo n của ( n )
Tương tự vậy từ Định lí 2.4 ta thu được
If − SG l,γ f ™ 2 −l 2dB(d, l, γ)||f|| 1,γ (55) Kết hợp (54) và (55) chúng ta có
Thật vậy, ta để ý rằng γ {1, ,j}
= γ i “ γ u với mọi u mà |u| = j Điều này có i= được
||f|| 1,γ Định lí được chứng minh.
Bây giờ chúng ta có một vài nhận xét về Định lí 2.5 như sau
• Trong trường hợp không có trọng γ j = 1, j = 1, , d chúng ta có B(d, l, γ) = A(d, l) = O((log 2 n) d−1 ), do vậy Định lí 2.5 là sự mở rộng của trường hợp cổ điển trong Bổ đề 2.5
Định lý 2.5 chứng minh rằng phương pháp SG l,γ hội tụ với tốc độ n −1, không phụ thuộc vào số chiều Tuy nhiên, sai số vẫn phụ thuộc vào giá trị B(d, l, γ) Tổng quát, chúng ta có thể nhận thấy rằng B(d, l, γ) = O(l d−1).
• Giá trị SG l,γ là giảm theo kích thước của trọng, hơn thế nữa mức l ∗ := d − log 2 (γ {1, ,j} )/4 (56) lại tăng khi giảm kích thước của trọng
Sai số bị chặn ở (53) phụ thuộc vào chuẩn ||f|| 1,γ của hàm trong dấu tích phân, và chuẩn này có thể tăng nhanh theo số mũ khi số chiều d gia tăng, điều này tạo ra thách thức cho bài toán có số chiều cao.
MỘT SỐ ỨNG DỤNG TRONG TÀI CHÍNH VÀ KẾT QUẢ SỐ
Kết quả số
Xây dựng đường đi ngẫu nhiên (RW)
Đầu tiên, ta định nghĩa các ký hiệu W = (W1, W2, , Wd) là véc tơ ngẫu nhiên, với t_k = k∆t cho k = 1, 2, , d và ∆t = T/d, trong đó T là khoảng thời gian đã cho và d là số chiều của tích phân Ma trận hiệp phương sai của quá trình được ký hiệu là C ∈ R^(d×d), với các phần tử c_ij = Cov(W(t_i), W(t_j)) min(t_i, t_j) Khi áp dụng phương pháp xây dựng đường đi ngẫu nhiên (random walk), ma trận A được chọn là ma trận Cholesky của C.
Xây dựng cầu Brown (BB)
Giả sử t i < t j < t k Khi đó công thức cầu Brown được viết dưới dạng
∼ N (0, 1), ở đây ρ = j − i Giả sử rằng d là lũy thừa của 2, d = 2 m , m và cho W = 0, khi k−i đó ta có
Ma trận cụ thể tương ứng với cầu Brown được trình bày chi tiết trong [16].
Xây dựng thành phần chủ yếu (PCA)
Việc xây dựng thành phần chính (PCA) dựa trên phân hoạch giá trị riêng của ma trận hiệp phương sai C Ma trận A được xác định thông qua công thức λ d v 1d, phản ánh cách thức tạo ra các thành phần chính từ dữ liệu.
Trong bài viết này, chúng ta sẽ khám phá mối quan hệ giữa véc tơ riêng và giá trị riêng trong ma trận hiệp phương sai C Cụ thể, ký hiệu v ij đại diện cho tọa độ thứ j của véc tơ riêng thứ i, trong khi λ i thể hiện giá trị riêng thứ i Việc hiểu rõ về véc tơ riêng và giá trị riêng là rất quan trọng trong phân tích dữ liệu và thống kê.
Phương pháp lưới thưa là một kỹ thuật hiệu quả trong việc tính tích phân, đặc biệt là đối với hàm một biến Việc áp dụng công thức tính tích phân cho hàm này giúp tối ưu hóa quá trình tính toán và đạt được kết quả chính xác hơn.
Việc xây dựng lưới thưa trong phần (4) đang mở ra hướng đi mới cho tính toán tích phân Nếu một công thức tích phân được định nghĩa trên R, tích phân (59) có thể được xử lý bằng phương pháp tính tích phân trực tiếp trên R^d Chúng ta sẽ áp dụng phương pháp lưới thưa thích nghi theo số chiều dựa trên công thức Gauss-Hermite, gọi tắt là phương pháp SGH Để thực hiện công thức tích phân một biến trên đoạn [0, 1], cần phải biến đổi tích phân (59) trên R^d thành tích phân trên hình hộp đơn vị [0, 1]^d, sử dụng phép đổi biến z = ϕ^−1(x), trong đó ϕ là hàm phân phối chuẩn tích lũy thông thường, với g(x) := f.
Chúng ta có thể áp dụng phương pháp lưới thưa thích nghi theo số chiều dựa trên công thức Patterson Gauss cho tích phân g(x)dx trong khoảng [0,1] Phương pháp này đã được chứng minh lần đầu tiên trong tài liệu [13] và nó là trường hợp đặc biệt của công thức (20).
Trước khi chuyển sang phần tiếp theo, chúng ta sẽ giới thiệu các cụm từ viết tắt MC, QMC, CUHRE, COW, CPW, CAD, SGH, SGP, tương ứng với các phương pháp tích phân khác nhau.
• Phương pháp Monte Carlo (MC),
• Phương pháp tựa Monte Carlo (QMC),
• Phương pháp tích thích nghi địa phương (CUHRE),
• Phương pháp hỗn hợp của hai phương pháp QMC và phương pháp CUHRE với trọng phụ thuộc vào bậc (COW),
• Phương pháp hỗn hợp của hai phương pháp QMC và phương pháp CUHRE với trọng tích (CPW),
• Phương pháp hỗn hợp của hai phương pháp QMC và phương pháp CUHRE với sự thích nghi theo số chiều (CAD),
• Phương pháp lưới thưa dựa trên công thức Gauss - Hermite (SGH),
• Phương pháp lưới thưa dựa trên công thức Gauss - Patterson (SGP).
Tùy chọn kiểu Châu Á
Mô hình bài toán
Trước hết tiền chi trả của một tùy chọn kiểu Châu Á với trung bình hình học được định nghĩa bởi
Mô hình Black-Scholes mô tả sự phát triển của giá tài sản với phương trình dS_t = àS_t d t + σS_t dB_t, trong đó à là tỷ lệ thu nhập mong đợi, σ là độ biến động, và B_t là chuyển động ngẫu nhiên Tại thời điểm đáo hạn T, giá thực hiện quyền chọn được ký hiệu là K, và các thời điểm t_j được xác định bởi t_j = t_{j-1} + ∆t với j = 1, , d và ∆t = T/d, bắt đầu từ t_0 = 0.
Brown tiờu chuẩn Giả sử r là tỉ lệ lói suất phi rủi ro, khi đú với à = r ta cú nghiệm cho phương trình (60) là
Do vậy giá tùy chọn Châu Á mô phỏng một phần của chuyển động Brown Cách tiếp cận theo chuỗi tạo ra chuyển động Brown tuần tự theo thời gian
∆tZ với j = 1, 2, , d, j j−1 ở đây Z 1 , Z 2 , , Z d là các biến ngẫu nhiên có hàm phân phối chuẩn tắc hay Z j
Giá của tùy chọn tại thời điểm t = 0 được xác định bởi
E[e −rT g(S t ,S , , S t )], ở đây E là kì vọng hay giá trị trung bình, g(S t 1 , S t 2 , , S td ) là hàm chi trả tài chính.
Ta định nghĩa (y₁, y₂, , y_d)ᵀ = (Bₜ, Bₜ, , Bₜ)ᵀ là một phân phối chuẩn với kỳ vọng E(y) = 0 và ma trận hiệp phương sai V = min(t₁, t₂)ₕ Với α = log S + (r − σ)t, ta có Sₜⱼ = exp(αⱼ + σyⱼ) Khi đó, hàm chi trả có thể được viết lại dưới dạng g(Sₜ, Sₜ, , Sₜ) = g(e^(α₁ + σy₁), , e^(α_d + σy_d)) =: H(y).
Giá trị của tùy chọn tại thời điểm t = 0 có thể được viết như là
Trong bài viết này, A là ma trận tùy ý thỏa mãn điều kiện AA T = V, với (y 1 , y 2 , , y d ) T = A(z 1 , z 2 , , z d ) T và p d (z) là mật độ Gauss chuẩn Cuối cùng, tiền chi trả được xác định dựa trên trung bình hình học với công thức max (0, ).
Giả sử A_j là tổng của các cột thứ j của ma trận A, giá trị của một tùy chọn Châu Á với hình thức trung bình hình học có thể được diễn đạt dưới dạng một tích phân d chiều, cụ thể là e^(-rT).
T , j = 1, , d. và ϕ(.) là hàm phân phối chuẩn tắc.
Số chiều hiệu dụng
Trong bảng 3.1, chúng tôi trình bày các chiều chặt cụt của hàm dưới dấu tích phân trong trường hợp có điểm neo, với các giá trị khác nhau của α nằm trong khoảng [0.9, 0].
9999] Ở đây d = 16 và các tham số được cho bởi
∑m := m ở đây A k = a jk với a jk là phần tử của ma trận A, đồng thời t
Trong hầu hết các trường hợp cổ điển, số chiều chặt cụt thường trùng với trường hợp có điểm neo Chẳng hạn, với K = 0 và α = 0,999, chúng ta thu được các giá trị d t = 15, 14, 3, 1 tương ứng với các phương pháp RW, BB, PCA, LT Các giá trị này cũng tương tự cho trường hợp có điểm neo Hơn nữa, dáng điệu hội tụ của các phương pháp MC, QMC, COW, CPW, CAD, SGP, SGH được thể hiện rõ trong hình 3.4 và 3.5.
Hình 3.1: Số chiều chặt cụt của giá lựa chọn kiểu Châu Á.
Sai số và chi phí tích phân
Tốc độ hội tụ của phương pháp MC luôn ổn định ở mức khoảng 0,5, như dự đoán từ luật số lớn, và không bị ảnh hưởng bởi các con đường xây dựng do toàn bộ phương sai không thay đổi Ngược lại, tốc độ hội tụ của phương pháp QMC được cải thiện khi áp dụng BB, PCA hoặc LT, vì các con đường này giúp tập trung tổng phương sai vào một số biến đầu tiên Do đó, phương pháp QMC thường vượt trội hơn MC, đạt được tốc độ hội tụ cao hơn, sai số tương đối nhỏ hơn và ít dao động hơn.
Ảnh hưởng của con đường xây dựng là đáng kể hơn khi áp dụng các phương pháp tính tích phân như COW, CPW, CAD, SGP và SGH Điều này xảy ra vì các phương pháp này phù hợp với số chiều hiệu dụng của bài toán thông qua việc lựa chọn không gian hàm có trọng hoặc làm mịn lưới thích ứng Sự hội tụ của các phương pháp này được cải thiện đáng kể nhờ con đường xây dựng, giúp giảm số chiều hiệu dụng của hàm dưới dấu tích phân liên kết Ví dụ, khi K = 0, hiệu quả của các phương pháp tính tích phân với số chiều lớn được cải thiện rõ rệt khi chuyển từ RW sang BB và PCA.
Trong khi COW, CPW, CAD và SGP cho thấy kết quả tương tự hoặc kém hơn QMC trong trường hợp RW, chúng lại có hiệu suất tương đối tốt hơn QMC và thể hiện sự mạnh mẽ rõ ràng trong các trường hợp BB, PCA và LT tương ứng.
Một nghiên cứu so sánh tốc độ hội tụ của ba phương pháp COW, CPW và CDA cho thấy rằng cả ba phương pháp này đều mang lại kết quả tương tự nhau Đặc biệt, COW và CPW thường cho kết quả trùng lặp trong hầu hết các trường hợp.
Phương pháp SGH trong bài toán Châu Á 0 (Asian 0) là một giải pháp hiệu quả, độc lập với quá trình xây dựng Phương pháp này tận dụng số chiều hiệu dụng thấp thông qua việc làm mịn lưới thưa với số chiều thích nghi, cho phép tối ưu hóa độ trơn của hàm dưới dấu tích phân Nhờ đó, SGH tránh được sự biến đổi về hình cầu đơn vị, giúp giảm sai số xuống dưới 10^(-12) chỉ với một khoảng cách nhất định.
10 5 , 10 4 , 10 3 , 10 2 hàm đánh giá tương ứng với các trường hợp RW, BB, PCA, và LT.
Bảng 3.2 Số chiều chồng chất trong trường hợp có điểm neo.
Trái phiếu lãi suất không
Mô hình bài toán
Trong mô hình Vasicek, tỉ lệ lãi suất ngắn hạn được mô tả bởi phương trình dr(t) := k(θ − r(t))dt + σdB(t), với điều kiện ban đầu r(0) = 0 Ở đây, W(t) biểu thị một chuyển động Brown chuẩn, trong đó θ và k là các hằng số dương, còn σ là ký hiệu cho độ biến động của thị trường Mô hình này được áp dụng theo lý thuyết giá cả chênh lệch của Hull.
(2001), giá của một trái phiếu giảm giá ở thời điểm t = 0 có dạng
P (T ) = E exp − r(s)ds Để tìm nghiệm cho phương trình vi phân ngẫu nhiên ở trên chúng ta sử dụng rời rạc hóa Euler - Maruyama với bước ∆t = T/d trên lưới t j := j∆t, j = 1,
2, , d có dạng rời rạc như sau r j = r j−1 + a(b − r j−1)∆t + σ√
∆tz j , (62) ở đây a, b là các hằng số dương và z j ∼ N (0, 1) với mọi j = 1, 2, , d Khi đó dạng rời rạc của (62) được cho bởi
Bây giờ ta đặt β = 1 − a∆t, khi đó (62) có thể viết dưới dạng r j − b = (r j−1 − b)β + σ√
∆z j , j = 1, , d. Điều này dẫn đến phương trình ma trận
0 ở đây H là véc tơ với phần tử H j = b + (r 0 − b)β j Từ đây suy ra rằng r j = σ√
Do vậy ta có ex p
H j ) và tham số γ j được cho bởi γ j = −σ∆t 3/2 (
Ta chỉ quan tâm a ̸= 0, khi đó β ̸= 1 và do vậy d
Lúc này P d (T ) có thể viết dưới dạng
Sử dụng phép đổi biến z j = ϕ −1 (x j ) với ϕ(z) là hàm phân phối chuẩn, ta đưa tích phân trên về dạng
Theo các chuyên gia số học chúng ta xem xét d = 512 và sử dụng các tham số a = 0.1817303, b = 0.0825398957, σ = 0.0125901, r(0) = 0.021673 và T = 5.
Số chiều hiệu dụng
Nghiên cứu số chiều hiệu dụng cho bài toán này cho thấy rằng trong trường hợp cổ điển, số chiều hiệu dụng gần như trùng khớp với trường hợp có điểm neo Cụ thể, với α = 0.99, chúng ta đạt được d t = 420, 7, 1, 1 khi sử dụng các phương pháp RW, BB, PCA, LT cho trường hợp có điểm neo, trong khi đó, số liệu cho trường hợp cổ điển là d t = 419, 7, 1, 1.
Sự xây dựng đường đi có ảnh hưởng lớn đến số chiều chặt cụt, với α gần 1, số chiều d t gần bằng 512 khi sử dụng phương pháp RW Ngược lại, khi áp dụng BB, PCA hoặc LT, số chiều d t giảm đáng kể Đặc biệt, phương pháp LT đạt kết quả tối ưu với d t = 1 cho bài toán này Hơn nữa, kết quả tính toán trong bảng 3.4a cho thấy các hàm có số chiều chồng chất thấp d t ≈ 2 trong trường hợp có điểm neo và d s gần như không phụ thuộc vào cách xây dựng đường đi.
Sai số và chi phí tích phân
Phương pháp số khác nhau như RW, BB, PCA và LT được áp dụng cho bài toán Vasicek 512 chiều, với hình 3.6 minh họa rõ ràng sự hội tụ của các phương pháp này Kết quả thu được tương tự như trong bài toán Châu Á.
Mặc dù số chiều thông thường d = 512 là cao, nhưng các phương pháp RW, BB, COW, CPW và CAD đều cho kết quả tương tự như QMC Khi kết hợp với LT, tất cả các phương pháp này một lần nữa xác định chính xác số chiều quan trọng của bài toán Tốc độ hội tụ của các phương pháp này nhanh như trong trường hợp bài toán một biến, mặc dù d = 512 rất lớn Đến nay, SGH được xem là phương pháp hiệu quả nhất.
Việc khai thác số chiều hiệu dụng thấp và độ trơn của hàm dưới dấu tích phân giúp SGH đạt được độ chính xác cao Điều này được thực hiện thông qua sự kết hợp với PCA hoặc LT chỉ với khoảng 1000 điểm đánh giá hàm.
Trong bài viết này, chúng ta xem xét việc lát mỏng 2 chiều qua tập chỉ số I tương ứng với tập chỉ số k, có dạng (k1, k2, 1, , 1) và (k1, 1, , 1, k2) với k1, k2 ≠ 1 Hình 2 minh họa các tập chỉ số trong ví dụ xây dựng cầu Brown, trong đó tất cả các chỉ số k được làm nổi bật bằng các nốt Chúng ta thấy rằng chỉ số (3,1, ,1) nằm trong I, trong khi chỉ số (1, ,1,3) thì không Thêm vào đó, các giá trị |∆kf| được thể hiện qua mã màu.
Giá trị trong khoảng từ 10^0 (màu đỏ) đến 10^−16 (màu xanh) với k1, k2 trong khoảng từ 1 đến 7 cho thấy sự giảm nhanh chóng của các giá trị này khi k1 và k2 tăng lên Cụ thể, các giá trị sẽ thấp hơn 10^−10 nếu k1 > 4 hoặc k2 > 4 Đối với số chiều d = 512, hình 2b chỉ ra rằng |∆k| < 10^−10 nếu k2 > 1, điều này phản ánh số chiều chặt chẽ trong bài toán Vasicek liên quan đến việc xây dựng cầu Brown.
Kết quả trong hình 3.2 cho thấy rằng một tập hợp chỉ số I nhỏ có thể đủ để chụp tất cả các chỉ số k tương ứng với sự phân bố giá trị tích phân đáng kể Điều này lý giải tại sao phương pháp SGH có thể đạt được độ chính xác cao với chi phí thấp.
Hình 3.2: Lát mỏng hai chiều qua tập chỉ số I với ε = 10 −3 cho bài toánVasicek với xây dựng cầu Brownian
Trái vụ bảo đảm bằng tài sản thế chấp
Mô hình của bài toán
Chúng ta sẽ phân tích bài toán CMO như đã trình bày trong tài liệu [10], cụ thể là một đảm bảo thế chấp tài sản với thời hạn d tháng Đặt t k = ∆t.k với k = 1, 2, , d, trong đó ∆t là chiều dài chu kỳ của một tháng Giá trị hiện tại của tổng tất cả tiền nợ được tính bằng công thức g(z) := ∑(k=1 đến d) u k m k, với u k = (1 + i j ) −1 (j=0) là yếu tố giảm giá cho tháng k, phụ thuộc vào tỷ lệ lãi suất i j Tỷ lệ lãi suất i k cho tháng k được xác định theo công thức i k := K k e σ(z 1 + z 2 + + z k ) i 0.
Trong bài viết này, các biến ngẫu nhiên z_j (với j = 1, 2, , d) được phân phối chuẩn đều, trong khi i_0 là tỉ lệ lãi suất ban đầu và σ là hằng số dương Để đảm bảo E[i_k] = i_0, ta định nghĩa K_0 = e^{-σ/2} Tiền nợ hàng tháng tại thời điểm t_k được tính bằng công thức m_k = c r_k ((1 - ω_k) + ω_k c_k), trong đó c là số tiền trả hàng tháng Hơn nữa, d-k c_k được xác định bởi (1 + i_0)^{-j} với j từ 0 đến k-1, và r_k = (1 - ω_j) với j = 1 Phần còn lại của thế chấp r_k phụ thuộc vào khoản trả trước ω_k trong tháng k, với ω_k = K_1 + K_2 arctan(K_3 i_k + K_4), trong đó K_1, K_2, K_3, K_4 là các hằng số liên quan đến tỉ lệ thanh toán trước ω_k.
Giá trị hiện tại của kì vọng của tổng tất cả tiện nợ có thể được viết như một tích phân d chiều
Chúng ta sẽ xem xét hiệu quả tính toán số của tích phân này, sử dụng các tham số i 0 = 0.007, c = 1, K 1 = 0.01 và K 2 = −0.005 theo các chuyên gia số học.
K 3 = 10, K 4 = 0.5 và σ = 0.0004 Với d = 256 chúng ta giành được PV= 119.21588257.
Số chiều hiệu dụng
Chúng ta tiếp tục sử dụng tham số như trong [12] và xem xét trường hợp d = 256 Đầu tiên, chúng ta phân tích số chiều chồng chất trong bài toán CMO với điểm neo Kết quả cho thấy d s ™ 2 cho mọi α ∈ [0.9, 0.9999] và tất cả các phương pháp xây dựng con đường, như thể hiện trong bảng 3.4b Bảng 3.3b trình bày số chiều chặt cụt, cho thấy con đường xây dựng chỉ ảnh hưởng nhỏ đến số chiều chặt cụt khi có điểm neo Tuy nhiên, lợi thế của các phương pháp BB, PCA và LT so với RW không rõ ràng trong bài toán CMO Với α = 0.9, chúng ta có d t = 123 cho RW và LT, trong khi số chiều chặt cụt này giảm xuống còn d t = 18 và d t = 13 tương ứng cho BB và PCA.
Với yêu cầu độ chính xác cao như α = 0.99, các phương pháp xây dựng mô hình thường không giảm thiểu đáng kể số chiều Trong bài toán CMO, số chiều hiệu dụng trong trường hợp cổ điển khác biệt rõ rệt so với số chiều chặt cụt khi có điểm neo Các phương pháp như BB, PCA và LT cho thấy khả năng cắt giảm số chiều đáng kể, trong đó LT có thể giảm số chiều chồng chất xuống chỉ còn một trong trường hợp cổ điển.
Hình 3.3: Số chiều chặt cụt của bài toán Vasicek và CMO.
Chi phí và sai số tích phân
phí và sai số tích phân
Tiếp theo các kết quả bằng số tương ứng được minh họa trong hình
Chúng ta có thể quan sát được rằng phương pháp tựa
(QMC) là hội tụ nhanh hơn, ít dao động so với phương pháp Monte Carlo nếu chúng ta chuyển từ RW tới
Phương pháp SGP hoạt động tương tự như phương pháp Monte Carlo (QMC) trong trường hợp BB và PCA, và kém hơn trong trường hợp RW và LT Các phương pháp hỗn hợp như CUHRE/QMC, COW, CPW và CAD mang lại kết quả tốt nhất khi kết hợp với PCA, vượt trội hơn so với QMC và SGP Cuối cùng, phương pháp SGH kết hợp với BB hoặc PCA là hiệu quả nhất cho bài toán CMO, đạt tốc độ hội tụ cao và kết quả chính xác nhất Với 10^4 điểm đánh giá hàm, phương pháp SGH có sai số tương đối nhỏ hơn khoảng 100 lần so với phương pháp QMC.
(a) Vasicek problem (dQ2) (b) CMO problem (d%6)
Bảng 3.4 Số chiều chồng chất trong trường hợp cổ điển.
LT không cải thiện sự hội tụ của phương pháp tính tích phân theo số chiều so với RW, mặc dù giành được kết quả tối ưu d t = 1 cho bài toán CMO Điều này cho thấy hiệu quả của phương pháp tính tích phân phụ thuộc vào số chiều chặt cụt trong trường hợp có điểm neo Hơn nữa, phương pháp QMC hội tụ nhanh hơn và ít dao động hơn với LT so với RW, cho thấy rằng dáng điệu hội tụ của QMC liên quan nhiều hơn đến số chiều hiệu dụng d t trong trường hợp cổ điển thay vì có điểm neo.
Cuối cùng, cần lưu ý rằng số chiều chặt cụt d t có ảnh hưởng đến điểm neo, điều này giải thích cho hiệu quả không cao của phương pháp SGH trong trường hợp này Tốc độ hội tụ nhanh được lý giải bởi số d t cao trong bài toán.
1e - 4 2 2 2 2 chiều chồng chất thấp d s ™ 2 và bởi độ trơn của hàm dưới dấu tích phân
Hình 3.4: Dáng điệu hội tụ của các phương pháp khác nhau cho bài toán Asian 0 với số chiều d.
Hình 3.5: Dáng điệu hội tụ của các phương pháp số khác nhau cho bài toán Asian 100 với số chiều d.
Hình 3.6: Dáng điệu hội tụ của các phương pháp khác nhau cho bài toán Vasicek số chiều dQ2.
Hình 3.7: Dáng điệu hội tụ của các phương pháp khác nhau cho bài toán CMO với số chiều d%6.
Nội dung của luân văn chủ yếu dựa vào những kết quả đã được đề cập trong bài báo: Michael Griebel, Markus Holtz , "Dimension - wise integration of high
- dimensional functions with applications to finance", Journal of Complexity 26
Trong bài viết năm 2010, chúng tôi đã trình bày một loạt phương pháp tính toán tích phân có số chiều cao, đồng thời giới thiệu các khái niệm mới về số chiều hiệu dụng trong trường hợp có điểm neo Chúng tôi cũng đã giải thích rằng việc sử dụng phương pháp lưới thưa kết hợp với phân rã ANOVA có điểm neo, cùng với sự rời rạc hóa chuỗi con, cho phép tối ưu hóa việc cân bằng giữa sai số mô hình hóa và sai số rời rạc hóa.
Bài viết này trình bày ứng dụng tài chính liên quan đến tích phân của hàm trơn với số chiều lên đến 512, trong đó phương pháp lưới thưa thích nghi theo số chiều dựa trên công thức Gauss - Hermite (phương pháp SGH) cho hiệu quả tối ưu Phương pháp này tận dụng số chiều hiệu dụng thấp của tích phân nhờ vào việc làm mịn lưới thưa và khai thác độ trơn của hàm dưới dấu tích phân, tránh biến đổi đặc biệt về hình cầu đơn vị Kết quả nghiên cứu có thể mở rộng theo nhiều hướng, chẳng hạn như xác định các lớp hàm cho số chiều hiệu dụng khi có điểm neo trùng với số chiều hiệu dụng trong trường hợp cổ điển Chúng tôi đã chỉ ra rằng bài toán giá cả của cổ phiếu hoặc trái phiếu không lãi suất thuộc về những lớp hàm này, nhưng bài toán CMO thì không.
Khi lựa chọn điểm neo, điều quan trọng là xác định cách tối ưu để đạt hiệu quả cao nhất Ngoài ra, trong tương lai, có thể nghiên cứu thêm các lĩnh vực như cải thiện phương pháp tính tích phân trong không gian nhiều chiều mà không cần sử dụng lưới thưa, đặc biệt là việc cân bằng giữa sai số mô hình hóa và quá trình rời rạc hóa.
Ứng dụng từ tài chính có thể được cải thiện bằng cách thay thế phương pháp CUHRE bằng một phương pháp thích nghi địa phương khác, cho phép xử lý trực tiếp tích phân trên R d, giúp tránh việc biến đổi đặc biệt về hình cầu đơn vị.
Chúng ta hy vọng sẽ phát triển những phương pháp tương tự hoặc thậm chí hiệu quả hơn từ phương pháp tính tích phân theo số chiều dựa trên lưới thưa Cuối cùng, hầu hết các phương pháp và kết quả của chúng ta không chỉ giới hạn trong lĩnh vực tài chính mà còn có thể áp dụng trong các lĩnh vực khác như vật lý và hóa học.
[1] F.J Hikernell (1998), "A generalized discepancy quadrature error bound", Math Comput, 67, pp 299 - 322.
[2] H Rabitz, O Alis (1999), "General foundation of high - dimension model rep- resentaions", Journal of mathematical chemistry, 25, pp 197 - 233".
[3] Hegland (2003), "Adaptive spare grids", ANZIAM J 44, C335 - C353.
[4] G Wasilkowski , H Woz’niakowski (1999), "Weighted tensor product algorithms for linear multivariate problems", J complexity 15, pp 402 - 447.
[5] Imai,Tan (2006), "A general dimension reduction technique for derivative pric- ing", Journal of computaion finance 10 (2), pp 129 -155.
[6] J Bersten, T Espelid, A Genz (1991), "Algorithms 698: DCUHRE - An adaptive multidimensional integration routine for a vector of integrals", ACM Transac- tions on mathematical Software, 17, pp 452 - 456.
[7] Michael Griebel, Markus Holtz (2010), "Dimension - wise integration of high - dimensional functions with applications to finance", Journal of Complexity 26, pp 455 - 489.
[8] M Griebel (2006), "Sparse grids and related approximation schemes for higher dimensional problems", in: L Pardo, A Pinkus, E.Suli, M Todd (Eds), Found- taions of Computational Mathematics (FoCM05), Santander, Cambridge Uni- versity Press, pp 106 -161.
[9] Ninomiya, S Tezuka (1996), "Toward real - time pricing of complex financial derivatives", Applied Mathematical Finance 3, pp 1 - 20.
[10] R Caflisch, W.Morokoff, A Owen (1997), "Valuation of Mortgage backed secu- rities using Brownian bridges to reduce effective dimention", J Comp Finance,