L ỜI CẢM ƠN
2.1. Giới thiệu bài toán nhân chập trên
Trong thống kê, bài toán giải chập được mô tả một cách tổng quát như sau: Tìm ước lượng của f từ các quan sát thực nghiệm được cho bởi
h = f * G = ∫f (x−y)dG y( ) (2.1)
trong đó ∗ là tích chập hàm mật độ f với hàm phân phối xác suất tương ứng G, với các biến ngẫu nhiên độc lập X ,..., X1 n được quan sát, trong đó mỗi Xj đều có hàm phân phối G. Các biến ngẫu nhiên này được xem như dữ liệu. Trong nhiều tình huống thực tế, các dữ liệu này không thể có được trực tiếp, do sai số trong đo lường. Do đó, chúng ta có thể quan sát các dữ liệu bị nhiễu Y ,..., Y1 n thay vì các dữ liệu thật X ,..., X1 n. Mô hình cơ bản của dữ liệu bị nhiễu Y ,..., Y1 n là cộng thêm sai số đo lường, tức là, bất kì một quan sát thực nghiệm đều được giới hạn bởi các dữ liệu
Y j = X j + εj , j∈{1,..., n}
thay cho các X ,..., X1 n. Các biến ngẫu nhiên độc lập ε1,...,εn đại diện cho sai số hoặc sự bị nhiễu của dữ liệu, hàm mật độ của mỗi εj được gọi là hàm mật độ sai số, kí hiệu là g. Ngoài ra, ta giả sử Xj và εj có giá trị thực và độc lập với nhau. Kết quả cơ bản của lí thuyết xác suất cho hàm mật độ của tổng của hai biến ngẫu nhiên độc lập bằng với tích chập của hai hàm mật độ của chúng, do đó
h = f * g x f (x( ) = ∫ −y)g y dy( ) (2.1*)
trong đó h là hàm mật độ của quan sát Y. Vì bất kì truy cập thực nghiệm trực tiếp đều bị giới hạn bởi h nên (2.1*) cũng chính là bài toán (2.1).
Hàm f được tìm lại từ một quan sát thực nghiệm h bất kì. Do đó ta chỉ có thể ước lượng f từ các quan sát một cách gián tiếp. Trước hết ta đưa ra một phương án thực nghiệm
ˆh, gọi là ước lượng của h. Sau đó, áp dụng phương pháp giải chập đối với ˆh để ước lượng
Do đó, ước lượng ˆh ban đầu phải được lựa chọn phù hợp với các phép thử của thống kê cụ thể, đồng thời phải đảm bảo tính “đủ tốt”. Để giải được bài toán này, trước hết ta phải giả sử rằng hàm phân phối g đã biết. Tuy nhiên, trong thực tế việc xác định g có thể chỉ tương đối vì nó phụ thuộc nhiều yếu tố, như các điều kiện bị hạn chế trên f hoặc bổ sung thêm dự liệu, hoặc các phép thử lặp đi lặp lại,… .
Có nhiều phương pháp giải bài toán này. Ở đây, ta đưa ra một phương pháp khá phổ biến để giải bài toán trong thống kê phi tham số. Đó là phương pháp dựa trên các hàm