Phần 3: So sánh giữa phương pháp nghiên cứu mẫu và phương pháp nghiên cứu tổngthể - Phương pháp nghiên cứu mẫu là phương pháp thu thập dữ liệu từ một phần nhỏ, được gọi là mẫu, đại diện
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA QUẢN TRỊ KINH DOANH
-*** -BÁO CÁO NHÓM 2
MÔN HỌC: Lý Thuyết Xác Suất Thống Kê
Trang 2THÀNH VIÊN NHÓM 2
1 Trần Quốc Anh
2 Nguyễn Thùy Dung
3 Lê Đức Thọ
4 Phạm Quốc Huy
5 Vũ Thùy Dương
6 Nguyễn Diệu Linh
7 Trần Ngọc Phong
8 Nguyễn Việt Thái
9 Lã Thị Hải Anh
10 Hà Bảo Sơn
11 Vũ Đăng Công
4
Trang 3Phần 1:Bằng phương pháp nghiên cứu tổng thể hãy:
- cho biết chiều cao trung bình của trong lớp bạn
- tính độ lệch tiêu chuẩn của chiều cao trong lớp
- tính tỉ lệ chiều cao sv có chiều cao từ 1.6-1,65m
- tính tỉ lệ sv có chiều cao 1,6m
- tính tỉ lệ sv có chiều cao trên 1.65m.
Bài làm Chiều cao
x i
Số SV
n i
x i n i n i x i2
Trang 4a)Chiều cao trung bình trong lớp là :
Ta có x¿∑(x i n i)
∑n i =151,13
92 ≈ 1,6427 m
b)Độ lệch chuẩn là:S=√ ∑(n i x i
2
)
∑n i −¯x2
= √248, 9457
92 −( 1,6427 ) 2
≈ 0,0864 m
c) Gọi A là tỉ lệ sinh viên có chiều cao từ 1m6-1m65 là: f(A)= 3292≈ 0.35
d) Gọi B là tỉ lệ sinh viên có chiều cao 1m6: f(B)=1092≈ 0,1
e) Gọi C là tỉ lệ sinh viên có chiều cao trên 1m65: f(C)= 3492≈ 0.37
6
Trang 5Câu 2: Bằng phương pháp ngiên cứu mẫu hãy cho biết chiều cao trung bình của sinh viên trong lớp của bạn và nêu phương pháp lấy mẫu mà bạn sử dụng
Bài làm
Trang 6Phương pháp lẫy mẫu ngẫu nhiên
Nhóm 1:1m73,1m63,1m56 X1=1m64
Nhóm 2:1m79,1m54,1m64 X2=1m66
Nhóm 3:1m74,1m68,1m50 X3=1m64
Nhóm 4:1m60,1m80,1m57 X4=1m66
Nhóm 5:1m60,1m49,1m54 X5=1m54
Nhóm 6:1m60,1m55,1m65 X6=1m60
Nhóm 7:1m62,1m80,1m68 X7=1m70
Nhóm 8:1m58,1m60,1m55 X8=1m58
Nhóm 9:1m70,1m78,1m96 X9=1m81
Chiều cao trung bình sinh viên trong lớp là:X=1
9∑
i=1 9
X i ≈1m65
Trang 7Phần 3: So sánh giữa phương pháp nghiên cứu mẫu và phương pháp nghiên cứu tổng
thể
- Phương pháp nghiên cứu mẫu là phương pháp thu thập dữ liệu từ một phần nhỏ,
được gọi là mẫu, đại diện cho toàn bộ quần thể nghiên cứu Mục đích là sử dụng dữ liệu thu thập được từ mẫu để ước tính các đặc điểm của quần thể
- Phương pháp nghiên cứu tổng thể là phương pháp thu thập dữ liệu từ tất cả các
thành viên trong quần thể nghiên cứu Phương pháp này cung cấp dữ liệu chính xác
và đầy đủ nhất về quần thể, nhưng thường tốn kém và mất nhiều thời gian hơn phương pháp nghiên cứu mẫu
Dưới đây là bảng so sánh chi tiết hai phương pháp:
Phương
pháp
Tiêu chí
Phương pháp nghiên cứu
Kích thước
mẫu
Tính đại diện Mẫu cần phải đại diện
Trang 8- Lựa chọn phương pháp nghiên cứu nào phụ thuộc vào nhiều yếu tố, bao gồm: + Mục tiêu nghiên cứu: Mục đích của nghiên cứu là gì? Bạn cần thu thập thông tin
gì?
+ Tài nguyên: Bạn có bao nhiêu tiền và thời gian để thực hiện nghiên cứu? + Quần thể nghiên cứu: Quần thể nghiên cứu có quy mô như thế nào? Phân bố như
thế nào?
+ Độ chính xác: Mức độ chính xác của dữ liệu bạn cần đạt được là bao nhiêu? Nhìn chung, phương pháp nghiên cứu mẫu là một lựa chọn hiệu quả và tiết kiệm khi cần thu thập dữ liệu từ một quần thể lớn Tuy nhiên, cần lưu ý rằng kết
quả thu được từ nghiên cứu mẫu chỉ là ước tính và có thể có sai số Do đó, cần lựa chọn phương pháp lấy mẫu phù hợp để đảm bảo tính đại diện của mẫu cho quần thể
Phương pháp nghiên cứu tổng thể phù hợp với các nghiên cứu cần dữ liệu chính
xác và đầy đủ, đặc biệt là khi quần thể nghiên cứu nhỏ hoặc dễ tiếp cận Tuy nhiên, phương pháp này thường tốn kém và mất nhiều thời gian hơn phương pháp nghiên cứu mẫu
Ngoài hai phương pháp nghiên cứu trên, còn có một số phương pháp nghiên cứu khác như nghiên cứu thí nghiệm, nghiên cứu mô tả, nghiên cứu phi thực nghiệm, v.v Việc lựa chọn phương pháp nghiên cứu phù hợp phụ thuộc vào nhiều yếu tố cụ thể của mỗi nghiên cứu
Ví dụ về phương pháp nghiên cứu mẫu:
Một nhà nghiên cứu muốn tìm hiểu ý kiến của học sinh về chương trình giáo dục mới Nhà nghiên cứu không thể khảo sát tất cả học sinh trên toàn quốc, vì vậy họ chọn lấy mẫu ngẫu nhiên 1.000 học sinh từ các trường học khác nhau trên khắp đất nước Dữ liệu thu thập được từ 1.000 học sinh này sẽ được sử dụng để ước tính ý kiến của tất cả học sinh về chương trình giáo dục mới
Một công ty muốn tìm hiểu thói quen mua sắm của khách hàng Công ty tiến hành khảo sát trực tuyến cho 100 khách hàng đã mua sắm tại cửa hàng của họ trong tháng qua Dữ liệu thu thập được từ 100 khách hàng này sẽ được sử dụng để ước tính thói quen mua sắm của tất cả khách hàng
Ví dụ về phương pháp nghiên cứu tổng thể:
Trang 9Một cơ quan chính phủ muốn điều tra mức độ hài lòng của người dân đối với các dịch vụ công Cơ quan này tiến hành khảo sát tất cả các hộ gia đình trong một thành phố nhất định Dữ liệu thu thập được từ tất cả các hộ gia đình sẽ cung cấp bức tranh chính xác về mức độ hài lòng của người dân đối với các dịch vụ công
Một công ty muốn tìm hiểu hiệu quả của một loại thuốc mới Công ty tiến hành thử nghiệm lâm sàng trên 500 bệnh nhân Tất cả bệnh nhân tham gia thử nghiệm đều được dùng thuốc mới và theo dõi tác dụng của thuốc Dữ liệu thu thập được từ tất cả
500 bệnh nhân sẽ cung cấp thông tin chính xác về hiệu quả của thuốc mới
Trang 10Phần 4: Luật số lớn và định lý giới hạn
3.4.1.Hội tụ theo xác suất
Định lý: Dãy các biến ngẫu nhiên trong cùng 1 phép thử X1, X2,…Xn (n≥1) gọi là hội tụ theo xác suất về biến ngẫu nhiên X, ký hiệu: Xn P
n →∞ X nếu:,
∀ ε>0, P {∣ X n −X ∣≥ ε }=0
⇨ Như vậy dãy các biến ngẫu nhiên X1, X2,… hội tụ theo xác suất về biến ngẫu nhiên X thì với n đủ lớn, thực tế gần như chắc chắn ta có thể coi rằng X không khác mấy so n
với X
phương pháp thống kê và xác định tính chắc chắn của các dự đoán dựa trên mẫu ngẫu nhiên
3.4.2 Định lý ( Bất đẳng thức) Trêbưsép
Định lý: Giả sử X là biến ngẫu nhiên có kỳ vọng và phương sai hữu hạn, khi đó với mọi
ε> 0ta có:
{∣ X−E X ∣ ≥ ε}≤ Dx
ε2
Sử dụng công thức xác suất biến cố đôi ta cũng có
{∣ X−E X ∣ ≤ ε}≥1− Dx
ε2
hạn trên cho phân bố của biến ngẫu nhiên Nó cung cấp một cách tiếp cận chặt chẽ hơn cho việc xác định xác suất của sự phân bố của một biến ngẫu nhiên, mà không cần biết cụ thể về hình dạng của phân bố đó
⇨ Ứng dụng rộng rãi trong nhiều lĩnh vực: cơ sở cho phương pháp đo lường trong vật
lý, cơ sở cho lý thuyết mẫu ứng dụng trong thống kê
3.4.3.Luật số lớn Bernoulli
Xét phép thử ngẫu nhiên C và A là một biến cố liên quan đến phép thử C Tiến hành n lần độc lập phép thử C và gọi k là tần số xuất hiện biến cố A trong n phép thử đó n
fn = k n
n được gọi là tần suất xuất hiện của A trong n phép thử
Định lý: Tần suất f n hội tụ theo xác suất về xác suất p của biến cố A, nghĩa là với mọi ε> 0
P{|f n − p|< ε}=1
Trang 11⇨ Nếu X X X1, 2,… n là các biến ngẫu nhiên độc lập và có phân phối Bernoulli với xác suất
thuyết, và phân tích dữ liệu
3.4.4 Định lý giới hạn Moivre-Laplace
Định lý: Đối với dãy các biến ngẫu nhiên X , X ,… độc lập có cùng phân bố Bernoulli 1 2
tham số p thì:
Với mọi x ϵ R , P{X 1 +…+Xn np−
√npq ≤ x}=∅(x)
- Cho phép xấp xỉ phân bổ nhị thức B(n;p) với phân bổ chuẩn N(np;npq) khi n đủ lớn
- Xấp xỉ là tốt khi np và nq > 5 hoặc khi npq > 20
phân phối nhị thức khi số lần thử nghiệm lớn Điều này làm cho việc áp dụng phân phối chuẩn trở nên khả thi và tiện lợi trong nhiều tình huống thực tế
đoán xác suất và mô phỏng Monte Carlo
Trang 124.20
Khả năng làm ra sản phẩm phế phẩm trong 250 máy tính là
=5 a)
Gọi biến cố A có đúng 2 máy phế phẩm
Xác suất để làm ra 2 máy phế phẩm trong 250 máy tính P(X=2)
Áp dụng công thức Poisson
P(X=2) =e-5
0.0842
Vậy xác suất để có 2 máy phế phẩm là P(X=2)=0.0842
b)
Gọi biến cố B có không quá 2 máy phế phẩm P(
Vậy ta có các trường hợp có số máy bị hỏng lần lượt là 0,1,2
Áp dụng công thức Poisson
P(X=0) =6.738*10-3
P(X=1)= 0.0336
P(X=2)=0.0842
P(X = P(X=0)+ P(X=1)+ P(X=2)
=6.738*10 +0.0336+0.0842-3
=0.1246
Vậy xác suất có ít hơn 2 máy phế phẩm là P(X = 0.1246 4.21
Gọi X là số khách đến ăn trong đợt 1
Gọi số khách đến ăn trong đợt 2 là 1000-X
Khi đó X (1000; )
Dùng xấp xỉ chuẩn để tìm k số chỗ nhỏ nhất sao cho P(X<k ;1000-X<k)
P(1000-k<X<k)
K -(1000-k)2 2
Trang 13Vậy cần ít nhất 500 chỗ để xác suất biến cố “ không đủ chỗ cho người đến ăn” bé hơn 1%
4.22
a)
Gọi X là số người trúng tuyển trong 325 người dự tuyển X
Vì n=325 >100
và np=325*0.9=292.5; n(1-p)=325*0.1=32.5
Có thể X N(µ, ) với µ=np=325*0.9=292.5 và , =2 (q=1-p)
Xác suất để số người trúng tuyển không vượt quá chỉ tiêu là
Vậy xác suất để số người trúng tuyển không vượt chỉ tiêu là 0.9172
b)
Để tìm số lượng người dự thi cho phép để biến cố “ số người trúng tuyển không vượt quá chỉ tiêu tuyển sinh” không vượt quá 0.99
Với X
)