Trong mục này chúng ta giả sử rằng hạchK là cố định và chúng ta quan tâm đến cách chọn dải thông h. Viết M ISE =M ISE(h) tức là sai số tích
phân bình phương là một hàm phụ thuộc vào dải thông h và giá trị lí tưởng của hxác định như sau
hid =argmin
h>0 M ISE(h). (1.65)
Tuy nhiên, giá trị này chỉ là lí thuyết vì M ISE(h) phụ thuộc vào mật độ p chưa biết. Những kết quả trong mục trước không cho phép ta xây dựng một ước lượng với giá trị lí tưởng này. Để giải quyết vấn đề đó ta sẽ ứng dụng phương pháp khác. Trong hoàn cảnh này, ý tưởng chung là sử dụng sai số của ước lượng không chệch. Thay thế cho M ISE(h) trong (1.65) bằng việc đề cập đến sự cực tiểu hóa ước lượng không chệch hoặc xấp xỉ không chệch của M ISE(h).
Bây giờ, ta mô tả sự thực hành phổ biến của ý tưởng này bởi sự thừa nhận chéo. Đầu tiên, chú ý rằng
M ISE(h) =Ep
Z
(ˆpn−p)2 =Ep
Z ˆ p2n−2
Z ˆ pnp
+
Z p2
Trong biểu thức trên và phần còn lại của mục này ta sẽ viết ngắn gọn R(ã ã ã) thay thế cho R
(ã ã ã)dx. Vỡ tớch phõn R
p2 không phụ thuộc vàoh, sự cực tiểu hóa hid của M ISE(h) như đã định nghĩa ở (1.65) cũng là cực tiểu hóa hàm
J(h)=4 Ep Z
ˆ p2n−2
Z ˆ pnp
.
Bây giờ chúng ta sẽ quan sát ước lượng không chệch của J(h). Việc này đủ để tìm một ước lượng không chệch cho mỗi lượng Ep
R pˆ2n và Ep
R pˆnp . Tồn tại một ước lượng không chệch thường R
ˆ
p2n của lượngEp
R pˆ2n
. Bởi vậy phần còn lại phải tìm một ước lượng không chệnh của EpR
ˆ pnp
. Ta có ˆ
pn,−i(x) = 1 (n−1)h
X
j6=i
K
Xj−x h
.
Chúng ta sẽ chỉ ra một ước lượng không chệch của G=Ep
R pˆnp là Gˆ = 1
n
n
X
i=1
ˆ
pn,−i(Xi).
Thật vậy, vì Xi là i.i.d, ta có Ep( ˆG) = Ep
Z ˆ
pn,−1(Xi)
= Ep
"
1 (n−1)h
X
j61
Z K
Xj −z h
p(z)dz
#
= 1 h
Z p(x)
Z K
Xj −x h
p(z)dzdx với điều kiện là biểu thức cuối là hữu hạn.
Mặt khác,
G = Ep
Z ˆ pnp
= Ep
"
1 nh
n
X
i=1
Z K
Xj −z h
p(z)dz
#
= 1
h Z
p(x) Z
K
x−z h
p(z)dzdx,
tức là G=Ep
Gˆ .
Tóm lại, một ước lượng không chệch củaJ(h) có thể được viết như sau:
CV(h) = Z
ˆ p2n− 2
n
n
X
i=1
ˆ
pn,−i(Xi),
trong đú CV là viết tắt của "sự thừa nhận chộo". Hàm CV(ã) được gọi là tiêu chuẩn thừa nhận chéo. Vì thế ta có các kết quả sau.
Mệnh đề 1.4.1. Giả sử rằng hàm K : R→ R, với mật độ xác suất p thỏa mãn R
p2 <∞ và h >0 ta có Z Z
p(x)
K
x−z h
p(z)dzdx <∞.
Khi đó
Ep[CV(h)] = M ISE(h)− Z
p2.
Bởi vậy,CV(h)cho một ước lượng không chệch củaM ISE(h), ở trên thì R p2 không phụ thuộc vào h. Điều này có nghĩa là sự cực tiểu hóa của hàm h 7→ M ISE(h) và h 7→ Ep[CV(h)] giống nhau. Nói cách khác, sự cực tiểu húa của Ep[CV(h)] xấp xỉ hàm CV(ã) là hàm mà cú thể được tớnh từ cỏc quan sỏt X1, X2,ã ã ã , Xn:
hCV =argmin
h>0 CV(h) Khi hàm CV(ã) đạt giỏ trị cực tiểu (như hỡnh 1.4).
Tóm lại, ta định nghĩa ước lượng thùa nhận chéo pˆn,cv của mật độp như sau:
ˆ
pn,cv(x) = 1 nhcv
n
X
i=1
K
Xi−x hcv
.
Đây là một ước lượng hạch vơi dải thông ngẫu nhiên hcv phụ thuộc vào mẫu X1,ã ã ã , Xn. Ước lượng này được chỉ ra dưới những điều kiện phự hợp, sai số tích phân bình phương của ước lượngpˆn,cv là tương đương một cách tiệm cận tới giả thiết ước lượng hạch có dải thônghidmà ta đã định nghĩa trong (1.65).
Không chỉ sự thừa nhận chéo đưa tới cách xây dựng ước lượng không chệch. Mà còn tồn tại phương pháp khác: ví dụ, ta có thể sử dụng giải tích Fourier của ước lượng mật độ, đặc biệt, công thức (1.48). ChoK là một hạch đối xứng (giá trị thực) mà biến đổi Fourier Kˆ của K thuộc L1(R)∩L2(R).
Xột hàm J(ã)˜ được xỏc định bởi J(h)˜ =4
Z
−2 ˆK(hω) + ˆK2
1− 1 n
|φn(ω)|2dω (1.66) +2
n Z
Kˆ(hω)dω
= Z
−2 ˆK(hω) + ˆK2
1− 1 n
|φn(ω)|2dω+ 4πK(0) nh , trong đó φnlà hàm đặc trưng thực nghiệm và ta đã sử dụng, biến đổi Fourier
ngược, R Kˆ(ω)dω= 2πK(0). Từ (1.46) và Định lí 1.3.1 ta có Ep =
Z
−2 ˆK(hω) + ˆK2(hω)
1− 1 n
(1− 1
n)|φn(ω)|2dω(1.67) +1
n
1− 1 n
Z
K(hω)dωˆ
=
1− 1 n
Z
1−Kˆ(hω)2
|φ(ω)|2− Z
|φ(ω)|2dω +1
n Z
1− |φ(ω)|2Kˆ2(hω)dω
.
Vì vậy, sự cực tiểu hóa của hàmh7→Ep J(h)˜
và h7→M ISE(h)giống nhau. Giống như trờn bõy giờ ta xấp xỉ sự cực tiểu húa của M ISE(ã)bởi
˜h=argmin
h>0
J(h).˜
Đây là một dải thông đạt được từ sai số ước lượng không chệch nhưng khác dải thông thừa nhận chéo hcv. Ước lượng mật độ tương ứng với dải thông này là
˜
pn(x) = 1 n˜h
n
X
i=1
K
Xi −x
˜h
.
Có thể chỉ ra rằng, dưới những điều kiện phù hợp, dáng điệu của ước lượng p˜n tương tự pˆn,cv: MISE của p˜n là tiệm cận tới giả ước lượng hạch lí tưởng tương ứng với dải thông hid đã định nghĩa trong (1.65).