Giống như một mẫu sample Câu hỏi: Trước khi rút ra bất kỳ kết luận nào vềmối quan hệ giữa các biến được hiển thị trong bảngchéo cross tabulation, bạn nên: a.. Cắt tỉa dữ liệu data trimmi
Trang 1Câu hỏi: Trong một tập dữ liệu có chứa các giá trịngoại lai (outliers), đâu là phương pháp đo lường
xu hướng trung tâm ít phù hợp nhất?
a Tứ phân vị thứ 2 (2nd quartile)
b Trung vị (Median)
c Giá trị trung bình (Mean)
Câu hỏi: Nghiên cứu thống kê thực nghiệm lớnnhất từng được thực hiện là nghiên cứu về:
a Bệnh bại liệt (Polo)
b Bệnh sốt rét (Malata)
c Bệnh bạch hầu (Diphtheria)
d Bệnh tả (Cholera)
Trang 2Câu hỏi: Đâu không phải là ví dụ về một công tybán hoặc cung cấp dữ liệu kinh doanh?
a Cục điều tra dân số (Census Bureau)
b Bloomberg
c Dow Jones & Co
d Dun & Bradstreet
Câu hỏi: Các phép toán số học không phù hợp cho:
a Tập dữ liệu lớn
b Cả dữ liệu phân loại và dữ liệu định lượng
c Dữ liệu phân loại
Trang 3d Dữ liệu định lượng
Câu hỏi: Một quần thể (population) là:
a Luôn có kích thước bằng với mẫu (sample)
b Việc lựa chọn một mẫu ngẫu nhiên
c Tập hợp tất cả các phần tử quan tâm trong mộtnghiên cứu cụ thể
d Giống như một mẫu (sample)
Câu hỏi: Trước khi rút ra bất kỳ kết luận nào vềmối quan hệ giữa các biến được hiển thị trong bảngchéo (cross tabulation), bạn nên:
a Xây dựng biểu đồ chấm (dot plot) và tìm khoảngcách đáng kể
Trang 4b Điều tra xem có biến ẩn nào có thể ảnh hưởngđến kết luận không
c Xây dựng biểu đồ phân tán (scatter diagram) vàtìm đường xu hướng
d Phát triển phân phối tần số tương đối (relativefrequency distribution)
Câu hỏi: Thu nhập là một ví dụ về biến sử dụngthang đo:
a Thang đo định danh (normal scale)
b Thang đo tỷ lệ (ratio scale)
c Thang đo khoảng (interval scale)
d Thang đo thứ tự (ordinal scale)
Trang 5Câu hỏi: Một nhóm sinh viên đi ăn tối tại một nhàhàng địa phương Tổng hóa đơn là
344.79 18.85 Hỏi có bao nhiêu sinh viên đi ăn tối?
a Không được kiểm soát
b Được kiểm soát
c Không thể là số
Trang 6d Phải là số
Câu hỏi: Chức năng trong bảng điều khiển dữ liệutương tác cho phép người dùng truy cập và phântích ở mức độ chi tiết hơn được gọi là:
a Biến đổi (transformation)
b Đào sâu (drilling down)
c Phân tích nguyên nhân gốc rễ (root-causeanalysis)
d Cắt tỉa dữ liệu (data trimming)
Câu hỏi: Biểu đồ được sử dụng để so sánh tần số,tần số tương đối hoặc tần số phần trăm của các biếnphân loại là:
Trang 7a Biểu đồ thanh xếp chồng (stacked bar chart)
b Biểu đồ tròn (pie chart)
c Biểu đồ thân và lá (stem-and-leaf display)
d Biểu đồ phân tán (scatter diagram)
Câu hỏi: Nếu một tập dữ liệu có số lượng quan sátchẵn, trung vị:
a Không thể xác định được
b Là giá trị trung bình của hai phần tử ở giữa
c Phải bằng giá trị trung bình
d Là giá trị trung bình của hai phần tử ở giữa khitất cả các phần tử được sắp xếp theo thứ tự
Trang 8Câu hỏi: Trung bình hình học của năm quan sát là:
a Căn bậc hai của tích của 5 quan sát
b Giống như trung bình có trọng số
c Căn bậc năm của tích của 5 quan sát
d Giống như trung bình
Câu hỏi: Một đặc tính quan tâm cho các phần tửđược gọi là:
a Mẫu (sample)
b Chất lượng (quality)
c Tập dữ liệu (data set)
d Biến (variable)
Trang 9Câu hỏi: Một số đo quan trọng về hình dạng củaphân phối là:
a Điểm z (z-score)
b Phương sai (variance)
c Hệ số biến thiên (coefficient of variation)
d Độ lệch (skewness)
Câu hỏi: Giá trị trung bình của một mẫu:
a Luôn nhỏ hơn giá trị trung bình của quần thể
b Được tính bằng cách tổng các giá trị dữ liệu vàchia tổng cho
A
A
Trang 10c Được tính bằng cách tổng tất cả các giá trị dữliệu và chia tổng cho số lượng phần tử
d Luôn bằng giá trị trung bình của quần thể
Câu hỏi: Phương pháp đồ họa nào sau đây thể hiệnmối quan hệ giữa hai biến:
a Biểu đồ tần suất (Histogram)
b Biểu đồ tròn (Pie chart)
c Biểu đồ chấm (Dot plot)
d Bảng chéo (Cross tabulation)
Câu hỏi: Các yếu tố tăng trưởng cho dân số củaChattanooga trong hai năm qua là 8 và 12 Trungbình hình học có giá trị là:
Trang 11a 20
b 36
c 30
d 96
Câu hỏi: Giá trị số của phương sai:
a Âm nếu giá trị trung bình âm
b Luôn lớn hơn giá trị số của độ lệch chuẩn
c Có thể lớn hơn hoặc nhỏ hơn giá trị số của độlệch chuẩn
d Luôn nhỏ hơn giá trị số của độ lệch chuẩn
Câu hỏi: Tiến sĩ Kurt Thearling, một chuyên giahàng đầu trong lĩnh vực, định nghĩa khai phá dữ
Trang 12liệu là "việc trích xuất thông tin từ cơ sở dữliệu".
a Kịp thời, chính xác
b Tự động, dự đoán
c Có chủ đích, hữu ích
d Toàn diện, sâu sắc
Câu hỏi: Một giá trị số được sử dụng làm thước đotóm tắt cho một mẫu, chẳng hạn như giá trị trungbình mẫu, được gọi là:
a Giá trị trung bình quần thể (population mean)
b Thống kê mẫu (sample statistic)
c Tham số mẫu (sample parameter)
Trang 13d Tham số quần thể (population parameter)
Câu hỏi: Từ một quần thể có kích thước 400, mộtmẫu ngẫu nhiên gồm 40 phần tử được chọn Trung
vị của mẫu:
a Phải là 200, vì 400 chia cho 2 bằng 200
b Phải bằng trung vị của quần thể, nếu mẫu thực
sự ngẫu nhiên
c Phải là 10, vì 400 chia cho 40 bằng 10
d Không có phương án nào trong số này là đúng
Câu hỏi: Nếu hệ số biến thiên là
A
A và trung bình là
P
P, thì phương sai là:
Trang 15Câu hỏi: Các phương pháp khác nhau để phát triểnthông tin hữu ích từ các cơ sở dữ liệu lớn đượcthiết kế theo:
a Xử lý dữ liệu
b Kho dữ liệu
c Dữ liệu lớn
d Khai thác dữ liệu
Trang 16c Giá trị trung bình (Mean)
Câu hỏi: Nghiên cứu thống kê thực nghiệm lớnnhất từng được thực hiện là nghiên cứu về:
a Bệnh bại liệt (Polio)
Trang 17b Bloomberg
c Dow Jones & Co
d Dun & Bradstreet
Câu hỏi: Các phép toán số học không phù hợp cho:
a Tập dữ liệu lớn
b Cả dữ liệu phân loại và dữ liệu định lượng
c Dữ liệu phân loại
d Dữ liệu định lượng
Câu hỏi: Một quần thể (population) là:
a Luôn có kích thước bằng với mẫu (sample)
b Việc lựa chọn một mẫu ngẫu nhiên
c Tập hợp tất cả các phần tử quan tâm trong một nghiên cứu cụ thể
d Giống như một mẫu (sample)
Trang 18Câu hỏi: Trước khi rút ra bất kỳ kết luận nào vềmối quan hệ giữa các biến được hiển thị trong bảngchéo (cross tabulation), bạn nên:
a Xây dựng biểu đồ chấm (dot plot) và tìm khoảngcách đáng kể
b Điều tra xem có biến ẩn nào có thể ảnh hưởng đến kết luận không
c Xây dựng biểu đồ phân tán (scatter diagram) vàtìm đường xu hướng
d Phát triển phân phối tần số tương đối (relativefrequency distribution)
Câu hỏi: Thu nhập là một ví dụ về biến sử dụngthang đo:
a Thang đo định danh (nominal scale)
b Thang đo tỷ lệ (ratio scale)
c Thang đo khoảng (interval scale)
Trang 19d Thang đo thứ tự (ordinal scale)
Câu hỏi: Một nhóm sinh viên đi ăn tối tại một nhàhàng địa phương Tổng hóa đơn là 344.79 Mỗisinh viên trả phần bằng nhau là 18.85 Hỏi có baonhiêu sinh viên đi ăn tối?
a Không được kiểm soát
b Được kiểm soát
c Không thể là số
d Phải là số
Trang 20Câu hỏi: Chức năng trong bảng điều khiển dữ liệutương tác cho phép người dùng truy cập và phântích ở mức độ chi tiết hơn được gọi là:
a Biến đổi (transformation)
b Đào sâu (drilling down)
c Phân tích nguyên nhân gốc rễ (root-causeanalysis)
d Cắt tỉa dữ liệu (data trimming)
Câu hỏi: Biểu đồ được sử dụng để so sánh tần số,tần số tương đối hoặc tần số phần trăm của các biếnphân loại là:
a Biểu đồ thanh xếp chồng (stacked bar chart)
b Biểu đồ tròn (pie chart)
c Biểu đồ thân và lá (stem-and-leaf display)
d Biểu đồ phân tán (scatter diagram)
Trang 21Câu hỏi: Nếu một tập dữ liệu có số lượng quan sátchẵn, trung vị:
a Không thể xác định được
b Là giá trị trung bình của hai phần tử ở giữa
c Phải bằng giá trị trung bình
d Là giá trị trung bình của hai phần tử ở giữa khitất cả các phần tử được sắp xếp theo thứ tự
Câu hỏi: Trung bình hình học của năm quan sát là:
a Căn bậc hai của tích của 5 quan sát
b Giống như trung bình có trọng số
c Căn bậc năm của tích của 5 quan sát
d Giống như trung bình
Câu hỏi: Một đặc tính quan tâm cho các phần tửđược gọi là:
a Mẫu (sample)
Trang 22b Phương sai (variance)
c Hệ số biến thiên (coefficient of variation)
d Độ lệch (skewness)
Câu hỏi: Giá trị trung bình của một mẫu:
a Luôn nhỏ hơn giá trị trung bình của quần thể
b Được tính bằng cách tổng tất cả các giá trị dữ liệu và chia tổng cho số lượng phần tử
c Được tính bằng cách tổng các giá trị dữ liệu vàchia tổng cho
Trang 23d Luôn bằng giá trị trung bình của quần thể
Câu hỏi: Phương pháp đồ họa nào sau đây thể hiệnmối quan hệ giữa hai biến:
a Biểu đồ tần suất (Histogram)
b Biểu đồ tròn (Pie chart)
c Biểu đồ chấm (Dot plot)
d Bảng chéo (Cross tabulation)
Câu hỏi: Các yếu tố tăng trưởng cho dân số củaChattanooga trong hai năm qua là 8 và 12 Trungbình hình học có giá trị là:
Trang 24a Âm nếu giá trị trung bình âm
b Luôn lớn hơn giá trị số của độ lệch chuẩn
c Có thể lớn hơn hoặc nhỏ hơn giá trị số của độ lệch chuẩn
d Luôn nhỏ hơn giá trị số của độ lệch chuẩn
Câu hỏi: Tiến sĩ Kurt Thearling, một chuyên giahàng đầu trong lĩnh vực, định nghĩa khai phá dữliệu là "việc trích xuất thông tin từ cơ sở dữliệu"
a Kịp thời, chính xác
b Tự động, dự đoán
c Có chủ đích, hữu ích
d Toàn diện, sâu sắc
Câu hỏi: Một giá trị số được sử dụng làm thước đotóm tắt cho một mẫu, chẳng hạn như giá trị trungbình mẫu, được gọi là:
Trang 25a Giá trị trung bình quần thể (population mean)
b Thống kê mẫu (sample statistic)
c Tham số mẫu (sample parameter)
d Tham số quần thể (population parameter)
Câu hỏi: Từ một quần thể có kích thước 400, mộtmẫu ngẫu nhiên gồm 40 phần tử được chọn Trung
vị của mẫu:
a Phải là 200, vì 400 chia cho 2 là 200
b Phải bằng trung vị của quần thể, nếu mẫu thực sự ngẫu nhiên
c Phải là 10, vì 400 chia cho 40 là 10
d Không có phương án nào đúng
Câu hỏi: Nếu hệ số biến thiên là A và giá trị trungbình là P, thì phương sai là:
a 2800
b 28
Trang 26c 1.75
d 794
· Từ một quần thể có kích thước 400, một mẫungẫu nhiên gồm 40 phần tử được chọn Trung vịcủa mẫu:
a Phải là 200, vì 400 chia cho 2 bằng 200
b Phải bằng trung vị của quần thể, nếu mẫu thực sự ngẫu nhiên
c Phải là 10, vì 400 chia cho 40 bằng 10
d Không có phương án nào trong số này làđúng
· Nếu hệ số biến thiên là A và trung bình là P, thìphương sai là:
a 2800
b 28
Trang 27a Xử lý dữ liệu
b Kho dữ liệu
Trang 28c Dữ liệu lớn
d Khai thác dữ liệu