Nguồn gốc môn học
Thống kê, theo nghĩa thông thường, đã được con người chú ý từ thời cổ đại thông qua việc ghi chép đơn giản.
Cuối thế kỷ XVII, sự phát triển mạnh mẽ của lực lượng sản xuất đã dẫn đến sự ra đời của phương thức sản xuất tư bản chủ nghĩa, với kinh tế hàng hóa và các ngành sản xuất riêng biệt ngày càng gia tăng Phân công lao động xã hội cũng trở nên phát triển hơn, tạo ra tính chất xã hội cao trong sản xuất và mở rộng thị trường toàn cầu Để đáp ứng nhu cầu về thông tin cho mục đích kinh tế, chính trị và quân sự, các nhà tư bản và nhà nước tư bản cần thu thập dữ liệu về thị trường, giá cả, sản xuất, nguyên liệu và dân số Vì vậy, công tác thống kê đã phát triển nhanh chóng, dẫn đến sự hình thành ba nhóm tác giả được coi là những người khai sáng cho ngành khoa học thống kê.
- Những người đầu tiên đưa ngành khoa học thống kê đi vào thực tiễn, đại diện cho những tác giả này là nhà kinh tế học người Đức H.Conhring (1606 -
1681), năm 1660 ông đã giảng dạy tại trường đại học Halmsted về phương pháp nghiên cứu hiện tượng xã hội dựa vào số liệu điều tra cụ thể.
William Petty, một nhà kinh tế học người Anh, đã đóng góp quan trọng vào sự phát triển của môn học chính thống thông qua tác phẩm "Số học chính trị" xuất bản năm 1682 Ông là một trong những người tiên phong trong việc áp dụng phân tích thống kê, góp phần hoàn thiện nền tảng lý thuyết cho các nghiên cứu kinh tế sau này.
- Thống kê được gọi với nhiều tên khác nhau thời bấy giờ, sau đó năm 1759 một giáo sư người Đức, Achenwall (1719-1772) lần đầu tiên dùng danh từ
“Statistics” (một thuật ngữ gốc La tinh “Status”, có nghĩa là Nhà nước hoặc trạng thái của hiện tượng) - sau này người ta dịch ra là “Thống kê”.
Kể từ thời điểm đó, thống kê đã có sự phát triển mạnh mẽ và ngày càng hoàn thiện, nhờ vào đóng góp của nhiều nhà toán học và thống kê học nổi tiếng như M.V Lomonosov (Nga, 1711-1765), Laplace (Pháp, 1749-1827), I Fisher và W M Pearsons.
Thống kê là gì?
Định nghĩa 6 2.2 Chức năng của thống kê 6 3 Các khái niệm thường dùng trong thống kê
Thống kê là một tập hợp các phương pháp nhằm thu thập, tổng hợp và trình bày số liệu, giúp tính toán các đặc trưng của đối tượng nghiên cứu Mục tiêu của thống kê là hỗ trợ quá trình phân tích, dự đoán và ra quyết định hiệu quả.
2.2 Chức năng của thống kê
Thống kê thường được phân thành 2 lĩnh vực:
Thống kê mô tả là những phương pháp dùng để thu thập, tóm tắt và trình bày số liệu, nhằm tính toán và mô tả các đặc điểm của dữ liệu một cách rõ ràng và có hệ thống.
Thống kê suy luận là một lĩnh vực quan trọng trong nghiên cứu, bao gồm các phương pháp ước lượng các đặc trưng của tổng thể từ mẫu dữ liệu Nó cho phép phân tích mối liên hệ giữa các hiện tượng nghiên cứu, đồng thời hỗ trợ trong việc dự đoán và ra quyết định dựa trên thông tin thu thập từ kết quả quan sát mẫu.
- Thu thập và xử lý số liệu:
Dữ liệu thu thập thường phong phú nhưng hỗn độn, không đủ cho quá trình nghiên cứu Để có cái nhìn tổng quát về nghiên cứu, cần phải xử lý và trình bày số liệu một cách tổng hợp, cũng như tính toán các chỉ số cần thiết Kết quả từ quá trình này sẽ giúp khái quát đặc trưng của tổng thể nghiên cứu.
- Nghiên cứu các hiện tượng trong hoàn cảnh không chắc chắn:
Trong nghiên cứu, thường xảy ra tình trạng thông tin về đối tượng nghiên cứu không đầy đủ, mặc dù các nhà nghiên cứu đã nỗ lực tìm kiếm Chẳng hạn, việc xác định nhu cầu thị trường đối với một sản phẩm hay đánh giá tình trạng kinh tế hiện tại là những yếu tố khó khăn trong việc thu thập thông tin chính xác.
Trong nhiều trường hợp, việc nghiên cứu toàn bộ quan sát của tổng thể không hiệu quả về kinh tế, thời gian và tính kịp thời Điều này đã thúc đẩy thống kê phát triển các phương pháp nghiên cứu một phần của tổng thể, cho phép suy luận về hiện tượng tổng quát với độ tin cậy cao Phương pháp điều tra chọn mẫu chính là giải pháp tối ưu cho vấn đề này.
- Nghiên cứu mối liên hệ giữa các hiện tượng:
Các hiện tượng nghiên cứu thường có mối liên hệ chặt chẽ với nhau, chẳng hạn như mối quan hệ giữa chi tiêu và thu nhập, hay giữa lượng vốn vay với các yếu tố như chi tiêu, thu nhập và trình độ học vấn Ngoài ra, còn có mối liên hệ giữa tốc độ phát triển kinh tế với sự phát triển của các ngành, lạm phát và tốc độ phát triển dân số Hiểu rõ những mối liên hệ này là rất quan trọng, giúp cải thiện khả năng dự đoán trong các nghiên cứu kinh tế.
Dự đoán là một công việc thiết yếu trong mọi lĩnh vực Trong quá trình dự đoán, có thể phân loại thành nhiều loại khác nhau, mỗi loại phục vụ cho mục đích và nhu cầu riêng.
Dự đoán có thể được thực hiện dựa vào hai phương pháp chính: định lượng và định tính Trong lĩnh vực thống kê, chúng ta thường tập trung vào phương pháp định lượng, nhằm cung cấp cho các nhà quản lý cái nhìn khoa học và cụ thể hơn, từ đó hỗ trợ họ trong việc đưa ra quyết định chính xác.
(2) Dự đoán dựa vào nội suy và dựa vào ngoại suy.
Dự đoán nội suy là quá trình suy luận dựa trên bản chất của hiện tượng, ví dụ như phân tích mối quan hệ giữa sản lượng sản phẩm và các yếu tố đầu vào như vốn, lao động và trình độ khoa học kỹ thuật.
Dự đoán dựa vào ngoại suy là quá trình quan sát sự biến động của hiện tượng trong thực tế, từ đó tổng hợp thành quy luật và sử dụng quy luật này để suy luận về sự phát triển trong tương lai Chẳng hạn, để đánh giá kết quả hoạt động của một công ty, người ta thường xem xét kết quả kinh doanh qua nhiều năm.
Ngoài ra, người ta còn có thể phân chia dự báo thống kê ra thành nhiều loại khác.
3 Các khái niệm thường dùng trong thống kê
Tổng thể thống kê (Populations) 8 3.2 Mẫu (Samples) 8 3.3 Quan sát (Observations) 9 3.5 Tham số tổng thể 9 3.6 Tham số mẫu 9 4 Các loại thang đo
Thống kê tổng thể là việc tập hợp các đơn vị cá biệt của sự vật, hiện tượng dựa trên một đặc điểm chung để quan sát và phân tích chúng về mặt lượng Những đơn vị tạo thành hiện tượng này được gọi là các đơn vị tổng thể.
Để xác định một tổng thể thống kê, việc đầu tiên là xác định tất cả các đơn vị thuộc tổng thể đó Thực chất, quá trình này là nhằm xác định rõ ràng các đơn vị tổng thể trong nghiên cứu thống kê.
Trong nhiều trường hợp, tổng thể có thể được nhận diện rõ ràng qua các đơn vị của nó, được gọi là tổng thể bộ lộ Ngược lại, tổng thể tiềm ẩn là những tổng thể mà các đơn vị không dễ dàng nhận biết và có ranh giới không rõ ràng Việc xác định đầy đủ và chính xác các đơn vị trong tổng thể tiềm ẩn gặp nhiều khó khăn, dẫn đến khả năng nhầm lẫn và bỏ sót Ví dụ, tổng thể của những người yêu thích nhạc cổ điển hay những người mê tín dị đoan đều thuộc về loại tổng thể tiềm ẩn này.
Mẫu là một phần của tổng thể, được chọn để đại diện cho toàn bộ và dùng để suy diễn Tất cả các phần tử trong mẫu phải thuộc tổng thể, nhưng không phải tất cả phần tử của tổng thể đều nằm trong mẫu Việc xác định mẫu có thể gây nhầm lẫn, đặc biệt khi tổng thể nghiên cứu là tổng thể tiềm ẩn.
Khi chọn mẫu để làm cơ sở suy diễn cho tổng thể, điều quan trọng là mẫu phải đại diện cho toàn bộ Tuy nhiên, việc này không hề đơn giản và chúng ta chỉ có thể nỗ lực giảm thiểu sự sai biệt mà không thể loại bỏ hoàn toàn.
Là mỗi đơn vị của mẫu ; trong một số tài liệu còn được gọi là quan trắc. 3.4 Tiêu thức thống kê
Các đơn vị tổng thể có nhiều đặc điểm khác nhau, nhưng trong thống kê, chỉ một số đặc điểm được chọn để nghiên cứu, gọi là tiêu thức thống kê Tiêu thức thống kê phản ánh các đặc điểm của đơn vị tổng thể và được chia thành hai loại: tiêu thức thuộc tính, phản ánh loại hoặc tính chất của đơn vị như ngành kinh doanh hay nghề nghiệp, và tiêu thức số lượng, thể hiện đặc trưng của đơn vị tổng thể bằng con số, ví dụ như năng suất của một loại cây trồng.
Tiêu thức số lượng được chia làm 2 loại:
- Loại rời rạc: là loại các giá trị có thể của nó là hữu hạn hay vô hạn và có thể đếm được.
- Loại liên tục: là loại mà giá trị của nó có thể nhận bất kỳ một trị số nào đó trong một khoảng nào đó.
Tham số mẫu là giá trị quan sát được từ một tập hợp con của tổng thể, giúp mô tả đặc trưng của hiện tượng nghiên cứu Trong thống kê toán học, chúng ta thường gặp các tham số tổng thể như trung bình tổng thể (μ), tỷ lệ tổng thể (p) và phương sai tổng thể (σ²) Bên cạnh đó, trong quá trình nghiên cứu thống kê, còn có nhiều tham số tổng thể khác như tương quan tổng thể (ρ) và hồi quy tuyến tính tổng thể.
Tham số mẫu là giá trị tính toán từ một mẫu, được sử dụng để suy rộng cho tham số tổng thể Trong xác suất thống kê, tham số mẫu đóng vai trò là ước lượng điểm cho tham số tổng thể khi chưa biết rõ giá trị của nó Một số tham số mẫu tiêu biểu bao gồm: trung bình mẫu (x), tỷ lệ mẫu (pˆ), phương sai mẫu (S²) và hệ số tương quan mẫu (r).
4 Các loại thang đo Đứng trên quan điểm của nhà nghiên cứu, chúng ta cần xác định các phương pháp phân tích thích hợp dựa vào mục đích nghiên cứu và bản chất của dữ liệu Do vậy, đầu tiên chúng ta tìm hiểu bản chất của dữ liệu thông qua khảo sát các cấp độ đo lường khác nhau vì mỗi cấp độ sẽ chỉ cho phép một số phương pháp nhất định mà thôi.
Khái niệm 10 4.2 Các loại thang đo 10 4.3 Xác định nội dung thông tin, thu thập thông tin 11 - Nguồn số liệu 12 Chương 2 Quá trình nghiên cứu của thống kê 15 Giới thiệu
Số đo là quá trình gán các dữ liệu định lượng hoặc ký hiệu cho những hiện tượng quan sát được Ví dụ, nó có thể liên quan đến các đặc điểm của khách hàng như sự chấp nhận, thái độ, sở thích hoặc các đặc điểm liên quan khác đối với sản phẩm mà họ sử dụng.
- Thang đo: là tạo ra một thang điểm để đánh giá đặc điểm của đối tượng nghiên cứu thể hiện qua sự đánh giá, nhận xét.
- Thang đo danh nghĩa (Nominal scale):
Thang đo thuộc tính là loại thang đo dùng cho dữ liệu không có thứ bậc hay mối quan hệ hơn kém, nơi các con số chỉ mang tính chất mã hóa Ví dụ, trong tiêu thức giới tính, ta có thể đánh số 1 cho nam và 2 cho nữ, nhưng không thể thực hiện các phép tính đại số với các con số này.
- Thang đo thứ bậc (Ordinal scale):
Thang đo thuộc tính được sử dụng để phân loại dữ liệu có sự so sánh, ví dụ như trình độ thành thạo của công nhân được chia thành các bậc từ 1 đến 7 Tương tự, trong các trường đại học, giảng viên cũng được phân loại thành các cấp như Giáo sư, P.Giáo sư, Giảng viên chính và Giảng viên Tuy nhiên, thang đo này không cho phép thực hiện các phép tính đại số.
- Thang đo khoảng (Interval scale):
Thang đo này được sử dụng cho dữ liệu số lượng và có thể xếp hạng các đối tượng nghiên cứu, với khoảng cách bằng nhau trên thang đo phản ánh sự tương đồng trong đặc điểm của chúng Với thang đo này, ta có thể thực hiện các phép tính đại số, ngoại trừ phép chia không có ý nghĩa Ví dụ, điểm thi của sinh viên A là 8, trong khi sinh viên B là 4, nhưng không thể khẳng định rằng sinh viên A giỏi gấp đôi sinh viên B.
- Thang đo tỷ lệ (Ratio scale):
Thang đo số lượng cho phép so sánh dữ liệu một cách rõ ràng Chẳng hạn, nếu thu nhập trung bình một tháng của ông A là 2 triệu đồng và của bà B là 4 triệu đồng, ta có thể khẳng định rằng thu nhập của bà B gấp đôi so với ông A.
Tuỳ theo thang đo chúng ta có thể có một số phương pháp phân tích phù hợp, ta có thể tóm tắt như sau:
Phương pháp phân tích thống kê thích hợp với các thang đo
Loại thang đo Đo lường độ tập trung Đo lường độ phân tán Đo lường tính tương quan Kiểm định
1 Thang biểu danh Mốt Không có Hệ số ngẫu nhiên Kiểm định 2
2 Thang thứ tự Trung vị Sô phần trăm Dãy tương quan Kiểm định dấu
3 Thang khoảng Trung bình Độ lệch chuẩn
Hệ số tương quan Kiểm định t, F
4 Thang tỷ lệ Trung bình tỷ lệ
Tất cả các phép trên
Sử dụng tất cả các phép trên 4.3 Xác định nội dung thông tin, thu thập thông tin
Tùy thuộc vào mục đích nghiên cứu, việc xác định nội dung thông tin cần thu thập là rất quan trọng Thông tin được sử dụng trong quá trình nghiên cứu cần phải đáp ứng các yêu cầu cơ bản để đảm bảo tính chính xác và hiệu quả.
Để đảm bảo tính thích đáng trong nghiên cứu, số liệu thu thập cần phải phù hợp và đáp ứng mục đích nghiên cứu, có thể là trực tiếp hoặc gián tiếp Đối với thông tin dễ tiếp cận, chúng ta thường sử dụng số liệu trực tiếp, như hỏi khách hàng về nhu cầu của họ Tuy nhiên, đối với những nội dung nhạy cảm hoặc khó thu thập, việc sử dụng số liệu gián tiếp liên quan là cần thiết Ví dụ, để tìm hiểu thu nhập cá nhân, chúng ta có thể thu thập thông tin về nghề nghiệp, đơn vị công tác, chức vụ, nơi ở và phương tiện đi lại.
Độ chính xác của thông tin trong nghiên cứu là yếu tố quan trọng, đảm bảo rằng các phân tích và kết luận phản ánh đúng bản chất của hiện tượng Việc sử dụng dữ liệu có giá trị và đáng tin cậy sẽ góp phần nâng cao độ tin cậy của nghiên cứu.
Thông tin kịp thời không chỉ cần phải chính xác và phù hợp mà còn phải phục vụ hiệu quả cho công tác quản lý và quá trình ra quyết định.
Khách quan là việc thu thập số liệu không bị ảnh hưởng bởi sự chủ quan của người thu thập, người cung cấp thông tin, và cả trong thiết kế bảng câu hỏi Mặc dù đạt được tính khách quan tưởng chừng dễ dàng, nhưng thực tế rất khó để hoàn toàn khắc phục vấn đề này; chúng ta chỉ có thể tối đa hóa việc hạn chế yếu tố chủ quan Chẳng hạn, một hành động đơn giản như tiếp cận với đáp viên cũng có thể tác động đến kết quả trả lời của họ.
Khi nghiên cứu một hiện tượng cụ thể, người nghiên cứu có thể sử dụng dữ liệu đã có sẵn, bao gồm cả dữ liệu công bố và chưa công bố, hoặc tự thu thập dữ liệu cần thiết Dựa vào cách thức này, dữ liệu được chia thành hai loại: dữ liệu sơ cấp và dữ liệu thứ cấp.
+ Dữ liệu thứ cấp (Secondary data):
Dữ liệu thứ cấp là thông tin đã được tổng hợp và xử lý sẵn, có thể thu thập từ nhiều nguồn khác nhau.
(1) Số liệu nội bộ: là loại số liệu đã được ghi chép cập nhật trong đơn vị hoặc được thu thập từ các cuộc điều tra trước đây.
Dữ liệu từ các ấn phẩm của nhà nước, bao gồm niên giám thống kê và thông tin cập nhật hàng năm, cung cấp cái nhìn tổng quan về tình hình dân số lao động, kết quả sản xuất của các ngành kinh tế, cũng như số liệu về văn hóa và xã hội.
(3) Báo, tạp chí chuyên ngành: Các báo và tạp chí đề cập đến vấn đề có tính chất chuyên ngành như tạp chí thống kê, giá cả thị trường,
(4) Thông tin của các tổ chức, hiệp hội nghề nghiệp: Viên nghiên cứu kinh tế, phòng thương mại
(5) Các công ty chuyên tổ chức thu thập thông tin, nghiên cứu và cung cấp thông tin theo yêu cầu.
Số liệu thứ cấp có ưu điểm về tính kinh tế nhờ khả năng chia sẻ chi phí và cung cấp thông tin kịp thời Tuy nhiên, dữ liệu này thường chỉ là thông tin cơ bản, đã qua xử lý, nên có thể không đầy đủ hoặc không phù hợp cho nghiên cứu Số liệu thứ cấp ít được sử dụng cho dự báo thống kê, nhưng thường được áp dụng trong việc tổng quan nội dung nghiên cứu và phát hiện vấn đề nghiên cứu Bên cạnh đó, số liệu thứ cấp còn giúp đối chiếu kết quả nghiên cứu, kiểm tra tính chính xác và phát hiện những vấn đề mới để định hướng nghiên cứu tiếp theo.
Dữ liệu sơ cấp (Primary data) là thông tin thu thập từ các cuộc điều tra, được chia thành hai loại: điều tra toàn bộ và điều tra chọn mẫu Điều tra toàn bộ tiến hành thu thập thông tin từ tất cả các đơn vị trong tổng thể, giúp thu thập dữ liệu đầy đủ và chính xác Tuy nhiên, loại hình điều tra này thường gặp một số trở ngại nhất định.
Số lượng đơn vị thuộc tổng thể chung thường rất lớn cho nên tiến hành điều tra toàn bộ mất nhiều thời gian và tốn kém.
Trong một số trường hợp do thời gian kéo dài dẫn đến số liệu kém chính xác do hiện tượng tự biến động qua thời gian.
Phân tổ thống kê
Khái niệm 15 1.2 Nguyên tắc phân tổ 15 1.3 Phân tổ theo tiêu thức thuộc tính 15 1.4 Phân tổ theo tiêu thức số lượng 15 1.5 Bảng phân phối tần số (Frequency table) 17 1.6 Các loại phân tổ thống kê 17 2 Bảng thống kê (Statistical table)
Phân tổ, hay còn gọi là phân lớp thống kê, là phương pháp chia các đơn vị tổng thể thành nhiều tổ, lớp hoặc nhóm dựa trên một hoặc một số tiêu thức nhất định, nhằm thể hiện các tính chất khác nhau của chúng.
Tổng thể cần được phân chia một cách rõ ràng, với mỗi đơn vị thuộc về một tổ chức duy nhất Mỗi đơn vị trong tổ chức đó phải thuộc về tổng thể mà nó đại diện.
1.3 Phân tổ theo tiêu thức thuộc tính
Khi tiêu thức thuộc tính chỉ có một vài biểu hiện, mỗi biểu hiện đó có thể được phân chia thành một tổ Chẳng hạn, trong trường hợp tiêu thức giới tính, các biểu hiện như nam và nữ có thể được tổ chức theo cách này.
Khi tiêu thức thuộc tính có nhiều biểu hiện, chúng ta cần kết hợp các nhóm nhỏ dựa trên sự tương đồng hoặc gần giống nhau Ví dụ, trong ngành công nghiệp chế biến, có thể phân tổ thành các nhóm như thực phẩm và đồ uống, thuốc lá, dệt may, v.v.
1.4 Phân tổ theo tiêu thức số lượng
- Trường hợp tiêu thức số lượng có ít biểu hiện, thì cứ mỗi một lượng biến có thể thành lập một tổ.
Ví dụ 2.1: phân tổ công nhân trong một xí nghiệp dệt theo số máy do mỗi công nhân thực hiện.
Số máy/Công nhân Số công nhân
- Trường hợp tiêu thức số lượng có nhiều biểu hiện, ta phân tổ khoảng cách mỗi tổ và mỗi tổ có một giới hạn:
- Giới hạn trên: lượng biến nhỏ nhất của tổ.
- Giới hạn dưới: lượng biến lớn nhất của tổ.
Tuỳ theo mục đích nghiên cứu, người ta phân ra 2 loại phân tổ đều và phân tổ không đều.
Phân tổ đều là phương pháp phân chia dữ liệu với khoảng cách giữa các tổ bằng nhau, thường được áp dụng trong nghiên cứu phân phối tổng thể hoặc để làm cho bảng thống kê trở nên gọn gàng hơn.
Việc xác định số tổ hình không có tiêu chuẩn tối ưu và phụ thuộc vào kinh nghiệm của từng người Dưới đây là một phân chia tổ mang tính chất tham khảo.
- Xác định số tổ (Number off classes):
Số tổ = (2 x n)0,3333 n: Số đơn vị tổng thể
- Xác định khoảng cách tổ (Class interval): k X max − X min
- Xác định tần số (Frequency) của mỗi tổ: bằng cách đếm các quan sát rơi vào giới hạn của tổ đó.
Một số qui ước khi lập bảng phân tổ:
- Trường hợp phân tổ theo tiêu thức số lượng rời rạc thì giới hạn trên và giới hạn dưới của 2 tổ kế tiếp nhau không được trùng nhau.
Ví dụ 2.2: Các xí nghiệp ở tỉnh X được phân tổ theo tiêu số lượng công nhân:
Số lượng công nhân Số xí nghiệp
- Trường hợp phân tổ theo tiêu thức số lượng loại liên tục, thường có qui ước sau:
* Giới hạn trên và giới hạn dưới của 2 tổ kế tiếp trùng nhau.
* Quan sát có lượng biến bằng đúng giới hạn trên của một tổ nào đó thì đơn vị đó được xếp vào tổ kế tiếp.
Ví dụ 2.3: phân tổ các tổ chức thương nghiệp theo doanh thu.
Doanh thu (triệu đồng) Số tổ chức thương nghiệp
1.5 Bảng phân phối tần số (Frequency table)
Sau khi phân tổ, chúng ta có thể sử dụng bảng phân phối tần số để trình bày số liệu, từ đó nắm bắt được những tính chất cơ bản của hiện tượng nghiên cứu.
Lượng biến Tần số Tần số tương đối Tần số tích lũy x1 x2
xk f1 f2 fi fk f1/n f2/n fi/n fk/n f1 f1+ f2 f1+ f2+ + fi f1+ f2+ + fk
1Trong đó lượng biến có thể là giá trị cụ thể hoặc là một khoảng.
1.6 Các loại phân tổ thống kê
Trong nghiên cứu thống kê, bảng phân tổ kết cấu đóng vai trò quan trọng trong việc làm rõ bản chất của hiện tượng trong các điều kiện cụ thể và giúp phân tích xu hướng phát triển của hiện tượng theo thời gian.
Ví dụ 2.4: Để xem xét cơ cấu giữa các nhóm ngành trong một quốc gia nào đó ta lập bảng như sau:
Bảng 2.1 Cơ cấu tổng sản phẩm của quốc gia X theo nhóm ngành, 2003 -2007 Đơn vị tính: %.
Tổng sản phẩm theo nhóm ngành 2003 2004 2005 2006 2007
Nông, lâm nghiệp và thủy sản 24,53 23,24 23,03 22,54 21,76 Công nghiệp và xây dựng 36,73 38,13 38,49 39,47 40,09
Bảng kết cấu cho thấy sự chuyển dịch rõ rệt trong cơ cấu ngành, với nhóm ngành công nghiệp và xây dựng có xu hướng gia tăng, trong khi nhóm ngành nông, lâm, thủy sản lại có xu hướng giảm.
Khi phân tổ liên hệ, các tiêu thức được chia thành hai loại: tiêu thức nguyên nhân và tiêu thức kết quả Phương pháp này giúp nghiên cứu mối liên hệ giữa nhiều yếu tố, chẳng hạn như mối quan hệ giữa năng suất và lượng phân bón, hay giữa năng suất lao động của công nhân với tuổi nghề, bậc thợ và trình độ trang bị kỹ thuật.
Ví dụ 2.5: Ta có bảng phân tổ liên hệ sau:
Bảng 2.2 Liên hệ giữa năng suất lao động với trình độ kỳ thuật nghề nghiệp của quốc gia X năm 2007
Tuổi nghề (Năm) Số công nhân Sản lượng cả năm (tấn)
Năng suất lao động bình quân (tấn) Đã được đào tạo kỹ thuật dưới 5 5-10 10-15 15-20 trên 20
Chưa được đào tạo kỹ thuật dưới 5 5-10 10-15 15-20 trên 20
Chung cho cả doanh nghiệp - 200 18.000 90
2 Bảng thống kê (Statistical table)
Để phát huy hiệu quả của các tài liệu điều tra thống kê, việc trình bày kết quả tổng hợp một cách rõ ràng và thuận tiện là rất cần thiết, nhằm phục vụ cho việc phân tích thống kê sau này.
Bảng thống kê là phương pháp trình bày tài liệu thống kê một cách hệ thống và rõ ràng, giúp nêu bật các đặc trưng định lượng của hiện tượng nghiên cứu Tất cả các bảng thống kê đều chứa các con số của từng bộ phận và thể hiện mối liên hệ chặt chẽ giữa chúng.
2.2 Cấu thành bảng thống kê
- Về hình thức: Bảng thống kê bao gồm các hàng, cột, các tiêu đề, tiêu mục và các con số.
Các hàng cột thể hiện qui mô của bảng, số hàng và cột càng nhiều thì bảng thống kê càng lớn và càng phức tạp.
Tiêu đề của bảng thống kê không chỉ phản ánh nội dung mà còn thể hiện ý nghĩa của từng chi tiết bên trong Đầu tiên, bảng có tiêu đề chung, tiếp theo là các tiêu đề nhỏ (tiêu mục) tương ứng với tên riêng của từng hàng và cột, giúp người đọc hiểu rõ hơn về thông tin mà mỗi cột đại diện.
Bảng thống kê bao gồm hai phần chính: phần chủ đề và phần giải thích Phần chủ đề tóm tắt nội dung tổng thể của bảng, phân chia thành các đơn vị và bộ phận cụ thể Nó cung cấp thông tin về đối tượng nghiên cứu, bao gồm các loại hình và địa phương khác nhau, cũng như các khoảng thời gian nghiên cứu liên quan đến một hiện tượng nhất định.
Phần giải thích gồm các chỉ tiêu giải thích các đặc điểm của đối tượng nghiên cứu, tức là giải thích phần chủ đề của bảng.
Trong bảng thống kê, phần chủ đề thường được đặt ở bên trái, trong khi phần giải thích thường nằm ở phía trên Tuy nhiên, cũng có những trường hợp mà vị trí của chúng có thể được thay đổi.
2.3 Các yêu cầu và qui ước xây dựng bảng thống kê
Các mức độ của hiện tượng kinh tế - xã hội
Số tuyệt đối
Số tuyệt đối là chỉ tiêu thể hiện quy mô và khối lượng của các hiện tượng hoặc quá trình kinh tế - xã hội trong một khoảng thời gian và không gian cụ thể.
Số tuyệt đối trong thống kê là các con số phản ánh quy mô của tổng thể hoặc từng bộ phận trong tổng thể, như số doanh nghiệp, số nhân khẩu, số học sinh, và số lượng cán bộ khoa học Ngoài ra, nó còn bao gồm tổng các trị số theo các tiêu thức cụ thể, chẳng hạn như tiền lương của công nhân, giá trị sản xuất công nghiệp, và tổng sản phẩm trong nước (GDP).
Số tuyệt đối là công cụ quan trọng trong đánh giá và phân tích thống kê, đóng vai trò thiết yếu trong việc xây dựng chiến lược phát triển kinh tế Nó giúp tính toán các mặt cân đối và nghiên cứu các mối quan hệ kinh tế - xã hội, đồng thời là cơ sở để xác định các chỉ tiêu tương đối và bình quân.
Có hai loại số tuyệt đối: Số tuyệt đối thời kỳ và số tuyệt đối thời điểm.
Số tuyệt đối thời kỳ là chỉ tiêu phản ánh quy mô và khối lượng của các hiện tượng trong một khoảng thời gian cụ thể Ví dụ điển hình bao gồm giá trị sản xuất công nghiệp trong tháng, quý hoặc năm, cũng như sản lượng lương thực trong các năm 2005, 2006 và 2007.
Số tuyệt đối thời điểm thể hiện quy mô và khối lượng của một hiện tượng tại một thời điểm cụ thể, chẳng hạn như dân số của một địa phương vào lúc 0 giờ ngày.
01/04/2005; giá trị tài sản cố định có đến 31/12/2007; lao động làm việc của doanh nghiệp vào thời điểm
Số tương đối
Số tương đối là chỉ tiêu thể hiện mối quan hệ so sánh giữa hai chỉ tiêu thống kê, có thể là cùng loại nhưng khác nhau về thời gian hoặc không gian, hoặc giữa hai chỉ tiêu khác loại nhưng có liên quan Trong quá trình so sánh, một trong hai chỉ tiêu sẽ được chọn làm gốc (chuẩn) để thực hiện phép so sánh.
Số tương đối có thể được biểu hiện bằng số lần, số phần trăm (%) hoặc phần nghìn (‰), hay bằng các đơn vị kép (người/km2, người/1000 người; đồng/1000đồng, ).
Trong công tác thống kê, số tương đối đóng vai trò quan trọng trong việc phản ánh các đặc điểm như kết cấu, quan hệ tỷ lệ, tốc độ phát triển và mức độ hoàn thành kế hoạch Nó cũng giúp đánh giá mức độ phổ biến của các hiện tượng kinh tế - xã hội trong các điều kiện về thời gian và không gian cụ thể.
Số tương đối và số tuyệt đối cần được sử dụng kết hợp để có cái nhìn đầy đủ hơn về dữ liệu Số tương đối thường là kết quả của việc so sánh giữa hai số tuyệt đối và có thể thay đổi đáng kể tùy thuộc vào gốc so sánh Một số tương đối lớn có thể không có ý nghĩa nếu trị số tuyệt đối tương ứng nhỏ, trong khi một số tương đối nhỏ lại có thể rất quan trọng nếu trị số tuyệt đối lớn Chẳng hạn, trong những năm 1960, 1% dân số Việt Nam tăng tương đương với 300 nghìn người, nhưng đến năm 2000, cùng mức tăng 1% lại tương ứng với 800 nghìn người.
Dựa vào nội dung mà số tương đối thể hiện, có thể phân loại thành năm loại chính: số tương đối động thái, số tương đối kế hoạch, số tương đối kết cấu, số tương đối cường độ, và số tương đối không gian.
2.1 Số tương đối động thái
Số tương đối động thái là chỉ tiêu thể hiện sự biến động theo thời gian của các chỉ tiêu kinh tế - xã hội Để tính toán số tương đối này, người ta so sánh hai mức độ của chỉ tiêu tại hai thời điểm khác nhau Mức độ của thời kỳ nghiên cứu được gọi là mức độ kỳ báo cáo, trong khi mức độ của thời kỳ dùng làm cơ sở so sánh được gọi là mức độ kỳ gốc.
Trong hai mức độ nghiên cứu, mức độ tử số (yI) được coi là mức độ cần phân tích, hay còn gọi là mức độ kỳ báo cáo Trong khi đó, mức độ ở mẫu số (y0) là mức độ kỳ gốc, thường được sử dụng làm cơ sở so sánh.
Khi y0 được giữ cố định qua các kỳ nghiên cứu, ta sẽ có một kỳ gốc ổn định, cho phép so sánh một chỉ tiêu nào đó giữa hai thời kỳ khác nhau Thông thường, năm gốc được chọn là năm đầu tiên trong dãy số để thực hiện các phân tích này.
Nếu y0 thay đổi qua các kỳ nghiên cứu, điều này cho thấy sự biến động liên tục của hiện tượng trong các giai đoạn khác nhau Kỳ gốc liên hoàn giúp chúng ta hiểu rõ hơn về sự phát triển và thay đổi của hiện tượng theo thời gian.
Ví dụ 3.1: Sản lượng hàng hóa tiêu thụ (1.000 tấn) của một công ty X qua các năm như sau:
Sản lượng hàng hóa (1.000 tấn) 240,0 259,2 282,5 299,5 323,4 355,8 387,8
Tốc độ phát triển liên hoàn
- Mối liên hệ giữa tốc độ phát triển định gốc và tốc độ phát triển liên hoàn Nếu ta có dãy số sau:
Thời kỳ 1 2 3 n-1 n yi y1 y2 y3 … yn-1 yn
2.2 Số tương đối so sánh
Số tương đối so sánh là chỉ tiêu thể hiện mối quan hệ giữa hai bộ phận trong một tổng thể hoặc giữa hai hiện tượng tương tự nhưng khác nhau về điều kiện không gian Ví dụ, có thể so sánh dân số thành thị với dân số nông thôn, hoặc so sánh số lượng nam giới với nữ giới; cũng như giá trị tăng thêm của doanh nghiệp ngoài quốc doanh so với doanh nghiệp quốc doanh Thêm vào đó, năng suất lúa của tỉnh X có thể được so sánh với năng suất lúa của tỉnh Y, và số học sinh đạt kết quả học tập khá giỏi có thể được đối chiếu với số học sinh có kết quả trung bình.
3 Số đo độ tập trung – số bình quân (Measures of central tendency):
Số bình quân là chỉ tiêu thể hiện mức độ điển hình của một tập hợp các đơn vị cùng loại, được xác định theo một tiêu thức nhất định Trong thống kê, số bình quân thường được sử dụng để nêu bật những đặc điểm chung và phổ biến nhất của các hiện tượng kinh tế.
Tiền lương bình quân của công nhân trong doanh nghiệp phản ánh mức lương phổ biến nhất, đại diện cho sự đa dạng trong các mức lương của công nhân Tương tự, thu nhập bình quân đầu người tại một địa phương cũng thể hiện mức thu nhập phổ biến, đại diện cho các mức thu nhập khác nhau của cư dân trong khu vực đó.
Số bình quân được sử dụng để so sánh các đặc điểm của những hiện tượng khác nhau về quy mô, đồng thời làm cơ sở để đánh giá mức độ đồng đều giữa các đơn vị tổng thể.
Theo vai trò đóng góp khác nhau của các thành phần trong quá trình bình quân hoá, số bình quân chung được phân loại thành hai loại chính: số bình quân giản đơn và số bình quân gia quyền.
Số trung bình giản đơn được tính bằng cách tổng hợp các thành phần tham gia bình quân hóa, trong đó mỗi thành phần có vai trò về quy mô (tần số) đóng góp như nhau.
Số trung bình gia quyền, hay trung bình có trọng số, được tính dựa trên sự đóng góp khác nhau của các thành phần tham gia bình quân hóa theo tần số Để đảm bảo tính chính xác và ý nghĩa của số trung bình, cần tính cho các đơn vị có cùng một tính chất, thường được gọi là tổng thể đồng chất Điều này đòi hỏi phải áp dụng phương pháp phân tổ thống kê một cách khoa học và chính xác, đồng thời kết hợp giữa số bình quân tổ và số bình quân chung.
Chỉ số trong thống kê
Chỉ số trong thống kê là số tương đối biểu hiện quan hệ so sánh giữa hai mức độ của một hiện tượng nghiên cứu.
Chỉ số thống kê là một công cụ quan trọng để so sánh hai mức độ của hiện tượng ở hai thời điểm hoặc không gian khác nhau, giúp nêu bật sự biến động theo thời gian hoặc sự khác biệt về không gian liên quan đến hiện tượng nghiên cứu.
Doanh số của công ty A trong năm 2003 đạt 110,7% so với năm 2002, tương đương với 1,107 lần, phản ánh mối quan hệ so sánh giữa doanh thu của công ty qua hai năm.
Chỉ số thống kê được thể hiện bằng số tương đối, nhưng cần phân biệt giữa chỉ số và số tương đối Chỉ số phản ánh mối quan hệ so sánh giữa hai mức độ của một hiện tượng, trong khi số tương đối có thể so sánh giữa hai mức độ của cùng một hiện tượng hoặc giữa hai hiện tượng khác nhau Các loại số tương đối như động thái, không gian và kế hoạch được xem là chỉ số, trong khi số tương đối cường độ không được coi là chỉ số.
1.2 Phân loại chỉ số trong thống kê
- Nếu căn cứ vào đặc điểm thiết lập quan hệ so sánh thì chỉ số thống kê được chia thành ba loại sau:
Chỉ số phát triển là thước đo so sánh giữa hai mức độ của hiện tượng tại hai thời điểm khác nhau Chẳng hạn, doanh số của công ty A trong năm 2003 so với năm 2002 là một ví dụ điển hình về chỉ số phát triển, cho thấy sự biến động doanh số của công ty qua hai năm.
Chỉ số kế hoạch thể hiện mối quan hệ so sánh giữa các mức độ thực tế và kế hoạch của các chỉ tiêu nghiên cứu Nó bao gồm chỉ số nhiệm vụ kế hoạch và chỉ số thực hiện kế hoạch, giúp đánh giá hiệu quả thực hiện các mục tiêu đề ra.
Chỉ số không gian thể hiện mối quan hệ so sánh giữa hai mức độ của hiện tượng tại hai điều kiện không gian khác nhau Chẳng hạn, giá gạo tẻ tại chợ A vào ngày 1/4/2006 so với chợ B là 96,8%, tương đương với 0,968 lần.
- Nếu căn cứ vào phạm vi tính toán thì chỉ số thống kê được chia thành hai loại:
Chỉ số đơn (cá thể) là chỉ số thể hiện sự biến động của từng phần tử trong một tổng thể Ví dụ điển hình bao gồm chỉ số giá bán lẻ của một mặt hàng, chỉ số sản lượng của một loại sản phẩm, và chỉ số khối lượng giao dịch của một loại cổ phiếu.
Chỉ số tổng hợp là chỉ số thể hiện sự biến động chung của một nhóm đơn vị hoặc toàn bộ tổng thể nghiên cứu Ví dụ, chỉ số giá tiêu dùng (CPI) phản ánh sự biến động chung của giá bán các mặt hàng, trong khi chỉ số khối lượng sản phẩm công nghiệp cho thấy biến động chung về khối lượng sản phẩm trong ngành công nghiệp.
- Nếu căn cứ vào tính chất của chỉ tiêu nghiên cứu thì chỉ số thống kê chia thành hai loại:
Chỉ số chỉ tiêu khối lượng được thiết lập để thể hiện quy mô và khối lượng chung của hiện tượng nghiên cứu Ví dụ về các chỉ số này bao gồm chỉ số lượng hàng hóa tiêu thụ và chỉ số quy mô lao động.
Chỉ số chỉ tiêu chất lượng là các chỉ số quan trọng như chỉ số giá cả, chỉ số giá thành và chỉ số năng suất lao động, được thiết lập nhằm đánh giá và theo dõi hiệu quả hoạt động kinh tế.
1.3 Tác dụng của chỉ số trong thống kê
Chỉ số là công cụ hữu hiệu trong việc nêu bật sự biến động tổng hợp của các hiện tượng phức tạp và cho phép phân tích chi tiết những biến động này cùng với các tác động cụ thể của chúng.
- Biểu hiện biến động của hiện tượng nghiên cứu qua thời gian Ý nghĩa này biểu hiện rõ nhất ở chỉ số phát triển.
- Biểu hiện biến động của hiện tượng qua những điều kiện không gian khác nhau, tác dụng này được thể hiện qua các chỉ số không gian.
- Biểu hiện nhiệm vụ kế hoạch và phân tích tình hình thực hiện kế hoạch đối với các chỉ tiêu nghiên cứu.
Phân tích vai trò và ảnh hưởng của từng nhân tố là rất quan trọng trong việc hiểu rõ sự biến động của hiện tượng kinh tế phức tạp Mỗi nhân tố đóng góp một phần vào sự thay đổi của nền kinh tế, và việc nhận diện các yếu tố này giúp chúng ta nắm bắt được bản chất của các biến động kinh tế Điều này không chỉ hỗ trợ trong việc dự đoán xu hướng mà còn cung cấp cơ sở để đưa ra các quyết định chính sách hiệu quả nhằm ổn định và phát triển kinh tế.
- Hệ thống chỉ số trong thống kê
Mặc dù các chỉ số thống kê cung cấp thông tin về sự biến động của hiện tượng nghiên cứu một cách riêng biệt, nhưng trong các lĩnh vực kinh tế-xã hội và hoạt động kinh doanh, việc phân tích mối liên hệ giữa các hiện tượng là rất cần thiết Do đó, để hiểu rõ hơn về các mối quan hệ tác động, chúng ta có thể kết hợp các chỉ số thành hệ thống chỉ số Hệ thống chỉ số này là một tập hợp các chỉ số liên quan, tạo thành một phương trình cân bằng, giúp phân tích và đánh giá hiệu quả hơn.
Hệ thống chỉ số thường được sử dụng để phân tích mối quan hệ giữa các chỉ tiêu biến động trong nghiên cứu kinh tế Nhiều chỉ tiêu tổng hợp có thể được hình thành từ các yếu tố liên quan, thể hiện qua các phương trình kinh tế Chính những mối quan hệ này là cơ sở để thiết lập các hệ thống chỉ số hiệu quả.
Chỉ số sản lượng = Chỉ số năng suất lao động x Chỉ số quy mô lao động
Hệ thống chỉ số bao gồm chỉ số toàn bộ và các chỉ số nhân tố Chỉ số toàn bộ thể hiện sự biến động của hiện tượng phức tạp do tác động của tất cả các nhân tố Ví dụ, chỉ số sản lượng là chỉ số toàn bộ, trong khi chỉ số năng suất lao động và chỉ số quy mô lao động là các chỉ số nhân tố.
Điều tra chọn mẫu .40 Điều tra chọn mẫu, ưu điểm, hạn chế và điều kiện vận dụng 40
Quá trình nghiên cứu thống kê gồm các giai đoạn: Thu thập số liệu, xử lý tổng hợp và phân tích, dự báo.
Trong thu thập số liệu thường áp dụng hai hình thức chủ yếu: Báo cáo thống kê định kỳ và điều tra thống kê.
Báo cáo thống kê định kỳ là phương thức thu thập số liệu thống kê được thực hiện thường xuyên theo quy định của cơ quan có thẩm quyền, áp dụng cho nhiều năm Ngược lại, điều tra thống kê là hình thức thu thập số liệu theo phương án cụ thể cho từng cuộc điều tra, bao gồm mục đích, nội dung, đối tượng, phạm vi và phương pháp thực hiện Điều tra thống kê ngày càng trở nên phổ biến trong nền kinh tế thị trường đa dạng Có hai loại điều tra thống kê: điều tra toàn bộ, thu thập số liệu từ tất cả các đơn vị, và điều tra không toàn bộ, chỉ thu thập từ một phần đơn vị Điều tra không toàn bộ còn được chia thành điều tra trọng điểm, điều tra chuyên đề và điều tra chọn mẫu, trong đó kết quả của điều tra chọn mẫu được sử dụng để mô tả đặc điểm của tổng thể.
1.1 Điều tra chọn mẫu, ưu điểm, hạn chế và điều kiện vận dụng
1.1.1 Khái niệm điều tra chọn mẫu Điều tra chọn mẫu là loại điều tra không toàn bộ, trong đó người ta chọn một cách ngẫu nhiên một số đủ lớn đơn vị đại diện trong toàn bộ các đơn vị của tổng thể để điều tra rồi dùng kết quả thu thập được tính toán, suy rộng thành các đặc điểm của toàn bộ tổng thể Ví dụ: để có năng suất và sản lượng lúa của một địa bàn điều tra nào đó người ta chỉ tiến hành thu thập số liệu về năng suất và sản lượng lúa thu trên diện tích của một số hộ gia đình được chọn vào mẫu của huyện để điều tra thực tế, sau đó dùng kết quả thu được tính toán và suy rộng cho năng suất và sản lượng lúa của toàn huyện. Điều tra chọn mẫu được ứng dụng rất rộng rãi trong thống kê kinh tế - xã hội như: Điều tra năng suất, sản lượng lúa; Điều tra lao động - việc làm; Điều tra thu nhập, chi tiêu của hộ gia đình; Điều tra biến động thường xuyên dân số; Điều tra chất lượng sản phẩm công nghiệp.
Trong nhiều lĩnh vực như tự nhiên, đời sống sinh hoạt và y học, việc áp dụng điều tra chọn mẫu là rất phổ biến Ví dụ, để đo lượng nước mưa trong một khu vực, người ta chỉ cần chọn một số điểm và đặt ống nghiệm để thu thập dữ liệu, từ đó tính toán lượng nước trung bình cho toàn khu vực Tương tự, khi nghiên cứu tác động của thuốc lá đến sức khoẻ, các nhà nghiên cứu chọn một nhóm người hút thuốc để kiểm tra sức khoẻ, và từ kết quả đó, họ có thể rút ra kết luận về ảnh hưởng của thuốc lá đối với sức khoẻ cộng đồng.
1.1.2 Ưu điểm của điều tra chọn mẫu
Do chỉ tiến hành điều tra trên một bộ phận đơn vị mẫu trong tổng thể nên điều tra chọn mẫu có những ưu điểm sau:
- Tiến hành điều tra nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê.
- Tiết kiệm nhân lực và kinh phí trong quá trình điều tra.
Việc thu thập nhiều chỉ tiêu thống kê, đặc biệt cho những chỉ tiêu phức tạp mà không thể điều tra rộng rãi, cho phép phản ánh đa dạng các khía cạnh của hiện tượng nghiên cứu Kết quả điều tra sẽ cung cấp thông tin cần thiết để phân tích các mối quan hệ liên quan.
Để giảm thiểu sai số phi chọn mẫu, cần chú ý đến các yếu tố như sai số do công cụ đo lường, tính trung thực và trình độ của phỏng vấn viên, cũng như sự biến động của dữ liệu Trong thực tế, sai số phi chọn mẫu luôn tồn tại và ảnh hưởng lớn đến chất lượng số liệu thống kê, đặc biệt với các chỉ tiêu phức tạp và khó thu thập Việc điều tra mẫu cho phép tuyển chọn điều tra viên tốt hơn, cung cấp hướng dẫn nghiệp vụ chi tiết hơn, và dành nhiều thời gian hơn cho mỗi đơn vị điều tra Điều này giúp các đối tượng cung cấp thông tin trả lời chính xác hơn, từ đó làm giảm sai số phi chọn mẫu.
Nghiên cứu các hiện tượng kinh tế - xã hội và môi trường thường không thể thực hiện bằng phương pháp điều tra toàn bộ Ví dụ, việc nghiên cứu trữ lượng khoáng sản, thuỷ sản hay kiểm tra tình trạng phá huỷ đòi hỏi các phương pháp tiếp cận khác để thu thập dữ liệu chính xác và hiệu quả.
1.1.3 Hạn chế của điều tra chọn mẫu
Khi tiến hành điều tra chọn mẫu, việc thu thập số liệu chỉ diễn ra trên một số đơn vị nhất định, dẫn đến việc kết quả có thể bị sai số, gọi là sai số chọn mẫu - sai số do tính đại diện Sai số này phụ thuộc vào độ đồng đều của chỉ tiêu nghiên cứu, kích thước mẫu và phương pháp tổ chức chọn mẫu Để giảm thiểu sai số chọn mẫu, có thể tăng kích thước mẫu trong phạm vi cho phép và lựa chọn phương pháp tổ chức chọn mẫu phù hợp nhất.
Kết quả của điều tra chọn mẫu không thể phân nhỏ theo mọi phạm vi và tiêu thức nghiên cứu như điều tra toàn bộ Việc này chỉ khả thi ở một mức độ nhất định, tùy thuộc vào kích thước mẫu, phương pháp tổ chức chọn mẫu và mức độ đồng nhất giữa các đơn vị theo các chỉ tiêu được khảo sát.
1.1.4 Điều kiện vận dụng của điều tra chọn mẫu Điều tra chọn mẫu thường được vận dụng trong các trường hợp sau:
Trong các trường hợp quy mô điều tra lớn, việc thay thế cho điều tra toàn bộ là cần thiết do hạn chế về kinh phí và nhân lực Việc thu thập nhiều chỉ tiêu trong các cuộc điều tra như thu nhập, chi tiêu hộ gia đình, năng suất lúa, và vốn đầu tư của các đơn vị ngoài quốc doanh thường gặp khó khăn về thời gian, ảnh hưởng đến tính kịp thời của số liệu thống kê Thêm vào đó, một số điều tra như đánh giá mức độ ô nhiễm môi trường nước cũng không thể thực hiện toàn bộ do khó khăn trong việc xác định tổng thể.
Quá trình điều tra chất lượng sản phẩm như thịt hộp và cá hộp thường liên quan đến việc phá hủy sản phẩm, ví dụ như việc y tá lấy máu của bệnh nhân để xét nghiệm Nếu tiến hành điều tra toàn bộ sản phẩm, chi phí có thể tăng cao và chất lượng hàng hóa sẽ bị giảm sút, hoặc lượng máu trong cơ thể bệnh nhân có thể bị phá hủy hoàn toàn Điều này tạo ra thách thức lớn trong việc thực hiện điều tra một cách hiệu quả trong thực tế.
Để thu thập thông tin tiên nghiệm phục vụ cho điều tra toàn diện, cần tiến hành khảo sát mức độ tín nhiệm của ứng cử viên thông qua việc lấy mẫu từ một nhóm cử tri nhất định Việc này phải được thực hiện trước khi diễn ra bầu cử chính thức để đảm bảo tính chính xác và ý nghĩa của kết quả.
Để đảm bảo chất lượng dữ liệu trong các cuộc điều tra toàn bộ quy mô lớn như Tổng Điều tra Dân số và Nhà ở, việc thu thập và đánh giá số liệu là rất quan trọng Sai số do khai báo và thu thập thông tin thường gặp phải có thể ảnh hưởng nghiêm trọng đến độ tin cậy của số liệu Do đó, cần thực hiện điều tra chọn mẫu quy mô nhỏ hơn để xác định mức độ sai số và từ đó đánh giá độ tin cậy của dữ liệu Nếu cần thiết, các số liệu từ cuộc điều tra toàn bộ có thể phải được chỉnh lý để đảm bảo tính chính xác.
1.2 Sai số chọn mẫu và phạm vi sai số chọn mẫu:
Sai số chọn mẫu là sự khác biệt giữa giá trị ước lượng từ mẫu và giá trị thực tế của tổng thể, thường được gọi là sai số do tính đại diện Loại sai số này xảy ra trong các cuộc điều tra chọn mẫu, khi chỉ một số ít đơn vị được khảo sát nhưng kết quả lại được áp dụng cho toàn bộ tổng thể Sai số chọn mẫu có hai loại chính.
Sai số có hệ thống là hiện tượng xảy ra khi phương pháp chọn lựa có hệ thống được áp dụng, dẫn đến kết quả điều tra luôn bị lệch so với giá trị thực tế theo một hướng nhất định.
Sai số ngẫu nhiên xuất hiện khi các đơn vị trong tổng thể được chọn theo nguyên tắc ngẫu nhiên, không bị ảnh hưởng bởi ý định của người điều tra.
- Sai số chọn mẫu dùng để ước lượng chỉ tiêu nghiên cứu theo khoảng tin cậy.
- Là cơ sở để xác định cỡ mẫu cho các cuộc điều tra được tiến hành về sau. 1.3 Đơn vị chọn mẫu, dàn chọn mẫu