5.3. ĐẶC ĐIỂM CHUNG CỦA QUÁ TRÌNH DÒNG CHẢY
5.3.4. Tương quan và bổ sung tài liệu
Khái niệm về tương quan thông qua khái niệm về hàm số và phi hàm số như sau:
Nếu có một mối quan hệ chặt chẽ Y = f(X), tức là nếu biết X sẽ tính chính xác được Y thông qua hàm toán học f hoặc ngược lại. Quan hệ kiểu như vậy gọi là quan hệ hàm số, hoặc có thể gọi là quan hệ tương quan chặt chẽ (hình 5.5-a).
Nếu X và Y là những đại lượng không có quan hệ với nhau, không có ảnh hưởng tới nhau, biết đại lượng này cũng không tìm được một quy luật nào để có thể suy luận ra đại lượng kia, thì X và Y không có quan hệ tương quan với nhau. Lúc đó X và Y còn được gọi là những đại lượng ngẫu nhiên độc lập (hình 5.5-b).
Nếu X và Y là hai đại lượng có quan hệ, có ảnh hưởng đối với nhau nhưng mối quan hệ không chặt chẽ dưới dạng hàm số, người ta gọi chúng có quan hệ tương quan với nhau (hình 5.5-c).
(a) r = 12 (b) r = 02 (c) 0 < r < 12
Y Y Y
X X Xi X
i i
Hình 5.5: (a) Quan hệ hàm số; (b) Không có quan hệ; (c) Quan hệ tương quan Để đánh giá mối quan hệ giữa hai đại lượng, người ta sử dụng một hệ số gọi là hệ số tương quan, ký hiệu là r. Vì r có thể nhận giá trị âm, cho nên người ta còn sử dụng bình phương của hệ số tương quan để đánh giá. Giá trị của r2 biến thiên trong khoảng [0,1].
Nếu: r2 = 1 thì ta có tương quan hàm số (tương quan chặt)
Nếu: 0 < r2 < 1 ta có quan hệ tương quan
Nếu: r2 = 0 thì không có quan hệ tương quan, các đại lượng độc lập với nhau.
Công thức tính toán hệ số tương quan r giữa hai đại lượng có quan hệ tương quan tuyến tính được thiết lập thông qua bài toán với minh họa trong hình 5.5-c.
Giả thiết X và Y có quan hệ tương quan tuyến tính, ta có thể viết hàm số sao cho đồ thị hàm số phù hợp nhất đối với các điểm đã có (đường liền đậm nét trong hình 5.5-c). Phương trình tương quan tuyến tính có dạng:
y = ax + b (5.55)
Tiêu chuẩn đánh giá sự phù hợp của đường tương quan thường lấy là tổng bình phương sai số là nhỏ nhất. Từ tiêu chuẩn này chúng ta sẽ đi xây dựng công thức tính hệ số tương quan r.
Lấy điểm thực đo I bất kỳ có tọa độ là xi và yi, mặt khác nếu thay xi vào phương trình tương quan (5.55) sẽ tính được y'i. Gọi khoảng cách chênh lệch (sai số) giữa tung độ điểm thực đó và điểm tính toán là Si ta có:
Si = I I' = yi – y'i = yi – (axi – b) (5.56) Tổng bình phương sai số là:
( )
n 2 n 2
i i i
i 1 i 1
S y ax b
= = = − −
∑ ∑ (5.57)
Lấy đạo hàm bậc nhất của tổng bình phương sai số theo x, theo a và theo b và cho bằng zero, sẽ xác định được các hệ số a và b như sau:
n i i i 1
n 2 2
i i 1
x y n x y a
x n x
=
=
∑ −
=
∑ −
(5.58)
n n
2
i i i
i 1 i 1
n 2 2
i i 1
y x x x y
b
x n x
= =
=
∑ − ∑
=
∑ −
(5.59) Nếu cho b = 0, hay dời trục tọa độ về điểm gốc ứng với giá trị trung bình của
x và y ta có:
( )
n
i i
i 1
n 2
i i 1
(x x) (y y) a
x x
=
=
− −
∑
=
∑ −
(5.60)
Sau khi thay a vào và rút gọn ta có phương trình tương quan:
( ) y
x
y y r x x σ
− = −
σ (5.61)
Trong đó: σx và σy là khoảng lệch quân phương của x và y; r là hệ số tương quan được xác định theo công thức:
n n
i i i i
i 1 i 1
n n n n
2 2 2 2 2 2
i i i i
i 1 i 1 i 1 i 1
x y n x y (x x) (y y)
r
x n x y n y (x x) (y y)
= =
= = = =
− − −
∑ ∑
= =
− − − −
∑ ∑ ∑ ∑
(5.62)
Nếu hệ số tương quan tính ra lớn hơn ±0,9 thì có thể coi quan hệ tương quan khá chặt và có thể sử dụng phương trình tương quan để kéo dài và bổ sung tài liệu.
Bổ sung tài liệu bằng phân tích tương quan:
Loại ứng dụng thứ nhất: Nếu hai đại lượng ngẫu nhiên X và Y có quan hệ tương quan khá chặt chẽ, ta có thể tính hệ số tương quan theo (5.62) sau đó xây dựng phương trình tương quan (còn gọi là phương trình hồi quy) (5.61). Thay giá trị xi đã biết của đại lượng x vào phương trình tương quan sẽ tìm được giá trị yi tương ứng. Như vậy đại lượng Y được bổ sung hay kéo dài phụ thuộc vào độ dài của đại lượng X và mối quan hệ tương quan giữa hai đại lượng. Trường hợp này có thể áp dụng khi hai lưu vực
là tương tự nhau. Tức là tại hai tuyến nghiên cứu trên cùng một dòng sông, một tuyến có nhiều tài liệu quan trắc, còn tuyến kia ít hơn. Hoặc tại hai tuyến nghiên cứu trên hai lưu vực nhưng điều kiện khí hậu, địa chất, thủy văn... là tương tự và mối quan hệ giữa hai đại lượng nghiên cứu tương quan khá chặt chẽ với nhau.
Loại ứng dụng thứ hai: Hệ số tương quan được sử dụng rộng rãi trong những mô hình tính toán mô phỏng nhằm tạo tài liệu tại những tuyến nghiên cứu có ít hoặc không có tài liệu quan trắc dòng chảy.