Phân phối Student và chuẩn t

Một phần của tài liệu Giáo trình xử lý số liệu và quy hoạch thực nghiệm hóa học (Trang 32 - 36)

Chương 2: Hàm phân phối xác suất và chuẩn thống kê

2.2. Phân phối Student và chuẩn t

2.2.1. Cơ sở thống kê và ứng dụng phân phối Student

Phân phối Student được đề xuất ra năm 1899 sau quá trình tính toán, kiểm soát hàm lượng men trong sản xuất bia bởi William Sealy Gosset.

Biểu thức hàm số của phân phối Student có dạng:

φ(t, f) = B (1 +t2

f)

−f+1

2 (2.4)

Trong đó : tf=x−μ

S𝑥̅ là hằng số student hay chuẩn t (2.5) Sx̅là độ sai chuẩn, à là giỏ trị thực hay kỳ vọng của tập số liệu.

Hàm phân bố student φ(t, f) phụ thuộc vào biến số t là một biến ngẫu nhiên và bậc tự do (f = N – 1) của tập số liệu.

Đồ thị của hàm phân phối Student có dạng như hình 2.2:

Hình 2.2. Đồ thị hàm phân phối xác suất Student

Khi bậc tự do của tập số liệu càng lớn (N càng lớn) thì độ nhọn của đồ thị càng lớn, hình dạng của đồ thị càng giống với đồ thị của phân phối chuẩn.

Phân phối Student sẽ trở thành phân phối Gauss khi tập số liệu có N ≥ 30. Hay nói cách khác, nếu tập số liệu có N ≥ 30 ta dùng phân phối Gauss để áp dụng cho việc tính toán thống kê thay cho phân phối Student.

Đồ thị của hàm phân phối Student có ý nghĩa hình học giống như đồ thị của hàm phân số Gauss, diện tích giới hạn của hàm phân phối với trục hoành (tích phân xác định của hàm) chính là xác suất. Ứng với mỗi giá trị xác suất (diện tích giới hạn) có thể tính được giá trị t tương ứng và giá trị này phụ thuộc vào số bậc tự do f.

Biểu thức tính xác suất (độ tin cậy) theo phân bố Student có dạng như sau :

Xác suất hai phía:

P = ∫ φ(t, f) dt−t+t (xác suất hai phía từ –t đến +t) (2.6) Nếu lấy tích phân trong toàn bộ từ – đến + thì xác suất bằng 1

Xác suất trái:

P = ∫−∞t φ(t, f) dt (xác suất từ –∞ đến t) (2.7) Xác suất phải:

P = ∫t+∞φ(t, f) dt (xác suất từ t đến +∞) (2.8) Đối với một tập số N liệu thực nghiệm có giá trị trung bình x, độ sai chuẩn S𝑥̅, khoảng biến thiên của tập số liệu (ε) ở một độ tin cậy nhất định (p) được tính theo công thức 2.9:

ε = x −μ = t(p,f). Sx̅ = t(p,f).Sx

√N với t(p,f) là hệ số phủ (2.9) Như vậy, ta có thể biểu diễn giá trị của tập số liệu sau khi tính toán thống kê theo biểu thức:

μ = x ± t(p,f).Sx̅ = x ± t(p,f).Sx

√N (2.10)

Ngoài ứng dụng để ước lượng khoảng biến thiên, chuẩn t còn được sử dụng nhiều trong đánh giá sai số thô, đánh giá độ đúng của phương pháp phân tích (t–test),…

2.2.2. Hàm Excel tính toán phân phối Student 2.2.2.1. Hàm Excel tính giá trị xác suất

Sử dụng hàm T.DIST.2T hoặc TDIST để tính xác suất hai phía theo công thức 2.6 của phân phối Student với cú pháp:

fx=T.DIST.2T(t, degrees_freedom)

fx=TDIST(t, degrees_freedom,tails) chọn tail = 2

Đối với xác suất một phía, sử dụng hàm TDIST chọn tail =1. Khi quan tâm đến xác suất một phía bên trái ta dùng T.DIST (công thức 2.7) và hàm T.DIST.RT cho xác suất một phía bên phải (công thức 2.8).

fx=T.DIST(t, degrees_freedom, cumulative) fx=T.DIST.RT(t, degrees_freedom)

Trong đó:

t: giá trị hằng số Student;

degrees_freedom: bậc tự do của tập số liệu;

cumulative: giá trị 0 cho phân phối tích lũy, 1 cho mật độ xác suất.

Lưu ý: Giá trị xác suất tính từ các hàm trên tương ứng với giá trị α = 1–P, với P là độ tin cậy.

Ví dụ 2.5: Tính xác suất theo phân phối Student với tập số liệu có bậc tự do giá trị f = 19 với t = 2.093 cho xác suất hai phía và t = 1.729 cho xác suất một phía.

Giải:

Xác suất hai phía: Sử dụng các hàm TDIST hoặc T.DIST.2T ta có:

fx=TDIST(2.093,19,2) = 0.050 (mỗi phía là 0.025) fx=T.DIST.2T(2.093,19) = 0.05 (mỗi phía là 0.025)

Xác suất một phía: Các hàm TDIST, T.DIST, T.DIST.RT:

fx=TDIST(1.729,19,1) = 0.05 (một phía);

fx=T.DIST(1.729,19,0) = 0.05 (phía trái);

fx=T.DIST.RT(1.729,19) = 0.05 (phía phải).

Ta thấy rằng trong Excel, có một số hàm thống kê của phân phối Student có ý nghĩa giống nhau nhưng cú pháp sử dụng là khác nhau.

Kết quả xác suất phía trái và phía phải được mô phỏng như hình 2.3.

Hình 2.3. Xác suất theo phân phối Student hai phía với t = 2.039 và một phía ứng với t=1.729, bậc tự do f = 19

2.2.2.1. Hàm Excel xác định giá trị hằng số Student

Giá trị hằng số t có thể tra cứu bằng bảng t hoặc bằng hàm TINV hoặc T.INV ở một độ tin cậy nhất định trong các trường hợp sau:

Với xác suất hai phía:

fx=TINV(probability, degrees_freedom) hoặc

fx=T.INV.2T(probability, degrees_freedom) Với xác suất một phía:

fx=T.INV(probability, degrees_freedom) với xác suất trái (t < 0) Ví dụ 2.6: Tính giá trị chuẩn t của tập số liệu có tự do f = 19 ứng với xác suất hai phía bằng 0.0500, xác suất một phía là 0.0250

t = TINV(0.0500,19) = 2.0930;

t = T.INV.2T(0.0500,19) = 2.0930;

t = T.INV(0.050,19) = –1.729 (xác suất trái). Kết quả thu được giống như trong Ví dụ 2.5 và được mô phỏng như hình 2.3

Một phần của tài liệu Giáo trình xử lý số liệu và quy hoạch thực nghiệm hóa học (Trang 32 - 36)

Tải bản đầy đủ (PDF)

(299 trang)