Nguyên lý cơ bản

Một phần của tài liệu Quan trắc môi trường Trịnh Quang Huy Trường ĐH Nông nghiệp Hà Nội 2010 (Trang 91 - 98)

II. TỔ CHỨC THỰC HIỆN VÀ PHƯƠNG PHÁP LẤY MẪU

II.4. KIỂM SOÁT CHẤT LƯỢNG MẪU

II.4.2. Các phương pháp thống kê thường được sử dụng trong xử lý số liệu

II.4.2.1. Nguyên lý cơ bản

Khi các mẫu phân tích được tiến hành lập lại trên cùng một mẫu, các kết quả phân tích giống nhau không thu được tương ứng với mỗi lần đo. Các kết quả giữa các lần đo có thể biểu diễn bằng đồ thị dưới dạng phân bố chuẩn. Số lượng lớn mẫu được đo lặp lại cho phép xây dựng đường cong phân bố, dạng của đường cong này thường được phân bố theo đường Gauss.

Hình 10. Tn xut phân b thu được t các mu được đo lp li trên cùng mt mu Đường cong phân bố thể hiện mối quan hệ giữa giá trị số học của kết quả phân tích và khả năng có thể xuất hiện. Sự phân bố sắc xuất lân cận khoảng tối đa là đối xứng. Các thông số chính biểu diễn sự phân bố là giá tr trung bình (mean), x, và độ lch chun, s.

Cả hai giá trị đề có thể tính được khi xử lý các số liệu đo đạc.

Giá tr trung bình (mean) được xác định như sau:

n

X X

X = X1+ 2+... n

Trong đó X1, X2,...Xn là giá trị được xem xét Độ lch chun (s)

1

... 2

22 21

− +

± +

= ∑

n

f f

s f n

Trong đó f là độ lệch của một phép đo từ giá trị trung bình (mean)

Nồngđộ

Kết quả

n là số phép đo

Ví dụ Tính toán giá trị trung bình và độ lệch chuẩn

Thể tích khác nhau của ba lần chuẩn độ trên cùng một mẫu. Giá trị trung bình và độ lệch chuẩn x và độ lệch chuẩn s được tính toán như sau:

Bảng 12. Tính toán giá trị trung bình và độ lệch chuẩn mL x

giả định x

mL

x x− mL

f2

mL2

21,33 21,37 -0,04 0,0016 21,30 21,37 -0,07 0,0049 21,34 21,37 -0,03 0,0009 21,45 21,37 +0,08 0,0064 21,42 21,37 +0,05 0,0025

x=106,84 ∑ f2 =0,0163

ml

x 21,37

5 84 , 106 =

=

ml

s 0,06

4 0163 ,

0 =±

±

=

Độ lệch chuẩn, s, là thông số thống kê dơi vào khoảng cho phép của phép đo của một số lần đo. Nếu là một phân bố chuẩn

sc xut rơi vào khong cho phép ca phép đo đạt 68%. Giá tr đo s bng giá tr trung bình ± mt ln độ lch chun . Ví d x±s,

sc xut rơi vào khong cho phép ca phép đo đạt 95%. Giá tr đo s bng giá tr trung bình ± hai ln độ lch chun , ví d x±2s

sc xut rơi vào khong cho phép ca phép đo đạt 99%. Giá tr đo s bng giá tr trung bình ± ba ln độ lch chun , ví d x±3s. Tt c các giá tr nm ngoàix±3s được xem là không bình thường.

Trở lại với ví dụ đưa ra ở trên

• 68% giá trị nằm trong khoảng 21.37 ml ± 0.06 ml ví dụ từ 21.31 ml đến 21.43 ml

• 95% giá trị trong khoảng 21.37 ml ± 2 0.06 ml ví dụ từ 21.35 ml đến 21.49 ml Đôi khi, sử dụng mối quan hệ giữa giá trị độ lệch chuẩn s, và giá trị trung bình x là có lợi . Nói một cách khác, sai số phân tích sẽ luôn có giá trị khi liên quan với giá trị của mẫu đo. Một cách biểu thị khác của độ lệch chuẩn tương đối hoặc hệ số biến động, CV, là tỷ số giữa độ lệch chuẩn và giá trị trung bình đại số:

C *100%

X V = s

Trở lại với ví dụ trên:

C *100% 0.3%

37 . 21

06 .

0 =

= ±

ml V ml

Tuy nhiên, kết quả phân tích thường không tuân theo phân bố chuẩn. Các phân bố khác được tính đến, ví dụ khi đánh giá số liệu của các nguồn nước phụ thuộc vào thời gian (ví dụ. nước sông, phân tích bao gồm nước lũ) hoặc sự đo đạc cùng một bởi nhiều phòng thí nghiệm khác nhau. Chỉ thị cho giá trị phân bố bất thường khi CV>100%.

Đặc tính của các đường cong phân bố (xiên phải = xiên dương, xiên trái = xiên âm) chỉ thị sự không phù hợp của thông tin thông kê, ví dụ các loại nước khác nhau, hoặc lỗi hệ thống trong khi đo. Trong những trường hợp này, các số liệu phải được kiểm tra thống kê riêng biệt, do giá trị trung bình và độ lệch chuẩn không cung cấp đủ các thông tin.

Trước khi thực hiện các xử lý thống kê đối với các số liệu trong phòng thí nghiệm, điểm quan trọng là cần phải nhận định và loại trừ các giá trị bất thường. Kiểm tra bằng phương pháp thống kê đã được phát triển để sàng lọc các đối tượng này. Một số phương trình toán học được dùng để tính toán các thông số đo đạc và sau đó các kết quả có thể so sánh với các giá trị đã được công bố. Các phương pháp kiểm tra quan trọng bao gồm:

DIXON-test

Các giá trị đo được của một mẫu được xắp xếp theo kích thước và có thể sử dụng phương trình sau:

• Với N≤ 7

xN

x x Q x

= −

1 2 1

• Với N≥ 7

1 1

2 1

− −

= − xN

x x Q x

Trong đó:

x1: gía trị bị nghi ngờ sai lệch

x2: gía trị lân cận trong tập hợp mẫu

xN: giá trị cuối cùng của tập hợp mẫu

Thông số kiểm tra, Q sau đó được so sánh với bảng giá trị tương ứng tại mức ý nghĩa 95% (xem bảng phụ lục). Nếu Q vượt quá giá trị trong bảng, giá trị x1 được kiểm tra là giá trị sai lệch nên được loại bỏ. Đối với các kiểm tra tiếp theo của một phân bố chuẩn là

bắt buộc. Các cặp số liệu không có phân bố chuẩn có thể chuyển dạng phân bố chuẩn như chuyển về dạng logarit.

F-test

Phép kiểm tra này được thiết kế để so sánh hai độ lệch chuẩn (kết quả thu được từ hai phương pháp phân tích). Có thể tiến hành như sau:

• Sử dụng phương trình 2

2 2 1

s F = s

Trong đó giá trị lớn nhất đối với sự biến động s2 nằm trên tử số. Thông số F thường được kiểm tra ở mức ý nghĩa 95%. Khi F lớn hơn giá trị trong bảng (xem phụ lục), độ lệch chuẩn là khác biệt.

f1=N1-1 f2=N2-1 t- test

t- test được dùng để so sánh hai giá trị trung bình với cùng hoặc khác biến. Hai phương pháp khác nhau được dùng đó là:

a) one – sample t- test

Phương pháp này so sánh giá trị trung bình với giá trị thực và do đó chỉ ra các sai số hệ thống.

s N x t x

=

t: được so sánh với giá trị tương ứng trong bảng với mức ý nghĩa 95%. Khi t lớn hơn giá trị trong bảng, giá trị trung bình có sai số hệ thông. Ở đây f = N – 1

b) two – sample t- test

Phương pháp này so sánh sự khác biệt giữa hai giá trị trung bình x1 và x2 từ hai phân tích khác nhau của cùng một mẫu.

2 1

2 2 1

1

N N

N N s

x t x

d +

= −

với ( ) ( )

2 1 1

2 1

2 2 2 2 1 1

− +

− +

= −

N N

s N s sd N

Các giá trị được tính toán vượt quá trong giá trị trong bảng cho thấy sự khác biệt giữa các giá trị trung bình tại mức ý nghĩa 95% và do đó, cả hai giá trị trung bình tạo ra từ các tập hợp khác biệt. Ở đây, f=N1+N2-2.

Khi nghiên cứu mối quan hệ giữa hai cặp số liệu đo đạc, cơ sở của sự khác biệt giữa hàm số và quan hệ thống kê nên được xem xét. Quan hệ hàm số có thể nghịch đảo và được xác định đối với mỗi cặp giá trị. Quan hệ thống kê cũng có thể nghịch đảo nhưng không được xác định rõ ràng. Hình 11 mô phỏng để làm rõ hơn điều này

Hình 11. Các dng thng kê khác nhau đối vi hai biến độc lp

Ở hình C, không có mối quan hệ rõ ràng; hình D quan hệ chặt theo cấp độ; hình B, quan hệ thống kê tuyến tính nghịch và hình A cho thấy quan hệ hàm số tuyến tính thuận.

Mức độ quan hệ thống kê tuyến tính có thể được xác định bằng phân tích tương quan.

Mức độ liên kết được thể hiện bởi hệ số tương quan va loại quan hệ thể hiện bằng độ dốc của đường cong. Đồ thị biểu diễn phương trình được xác định bằng cách thực hiện phân tích hồi quy (phương pháp bình phương bé nhất). Cả hai kỹ thuật thường được dùng để chuẩn bị và đánh giá đồ thị hiệu chuẩn của các phép phân tích. Phương trình như sau:

Tương quan:

( )( ) ( ∑− ) ( ∑ − )

= −

2 2

.

y y x x

y y x r x

i i

i i

R luôn nằm trong khoảng từ +1 đến -1. Khi r=0, sự đo đạc độc lập với yếu tố khác. Khi r= ±1, tương quan là một hàm tuyến tính.

Hi quy tuyến tính:

y là giá trị phụ thuộc vào giá trị x:

y = a + bx trong đó:

( )

( x ) ( x ) nn

x y y

x

b /

. .

2

2 ∑

∑ ∑ ∑

= x b y a= − Ví dụ:

Đường cong hiệu chỉnh được tính toán từ nồng độ của một dung dịch chuẩn được biết trước và giá trị hấp phụ đo được cho phép tính toán được các thông số hồi quy và hệ số tương quan trong bảng dưới đây. Điểm quan trọng cần hiểu đối với N<5 của một tương quan là không có ý nghĩa lớn. Để đạt được mức có nghĩa trong tính toán tương quan. Số mẫu đo tối thiểu phải > 10.

Tính toán hồi quy và hệ số tương quan đối với đường hiệu chỉnh Nồng

độ x

y x2 x.y xx ( )xx 2 yy ( )yy 2 ( )( )xx yy

0 0,030 0 0 -15 225 -0,301 0,093 4,515

5 0,132 25 0,660 -10 100 -0,199 0,040 1,990 10 0,236 100 2,360 -5 25 -0,095 0,009 0,475 15 0,335 225 5,025 0 0 0,004 0 0 20 0,419 400 8,380 5 25 0,088 0,008 0,440 25 0,542 625 13,550 10 100 0,211 0,045 2,110 30 0,623 900 18,690 15 225 0,292 0,085 4,380

∑105 ∑2,317 ∑2275 ∑48,665 ∑700 ∑0,280∑13,910

=15

x y=0,331

01987 , 700 0

91 , 13 7

/ 105 2275

7 / 137 , 2 . 105 665 , 48

2 = =

= − b

033 , 0 15 . 01987 , 0 331 ,

0 − =

a=

Phương trình hồi quy tuyến tính sẽ là:

x y=0,033+0,01987.

Hệ số tương quan r:

9936 , 14 0

910 , 13 280 , 0 . 700

910 ,

13 = =

= r

Kết quả của đường cong hồi quy tuyến tính cho thấy tương quan rất chặt (r=0.9936).

Một phần của tài liệu Quan trắc môi trường Trịnh Quang Huy Trường ĐH Nông nghiệp Hà Nội 2010 (Trang 91 - 98)

Tải bản đầy đủ (PDF)

(212 trang)