1. Trang chủ
  2. » Giáo án - Bài giảng

Giáo trình kinh tế lượng

144 65 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 144
Dung lượng 3,05 MB

Cấu trúc

  • CHƯƠNG 1

  • GIỚI THIỆU VỀ KINH TẾ LƯỢNG

  • 1.1 Tại sao phải học kinh tế lượng ?

  • 1.2 Kinh tế lượng là gì?

  • 1.2.1.Ước lượng các mối quan hệ kinh tế

  • 1.2.2 Kiểm định giả thuyết

  • 1.2.3 Dự báo

  • 1.3. Các kiểu dữ liệu kinh tế lượng

  • 1.3.1 Số liệu theo chuỗi thời gian (Time-series Data):

  • 1.3.2 Số liệu chéo (Cross-section Data):

  • 1.3.3 Số liệu tổng hợp (Panel or Longitudinal Data):

  • 1.3.4 Tính chính xác của số liệu:

  • 1.4. Phương pháp thực hiện một nghiên cứu kinh tế

  • 1.4.1. Các bước thực hiện

  • 1.4.2. Khái niệm hồi quy

  • 1.4.3. Các thành phần của một mô hình hồi quy

  • 1.4.4. Sự khác nhau giữa các dạng quan hệ

  • CHƯƠNG 2

  • TÓM TẮT VỀ XÁC SUẤT VÀ THỐNG KÊ

  • 2.1. Biến ngẫu nhiên

  • 2.2 Xác suất

  • 2.2.1 Xác suất biến ngẫu nhiên nhận được một giá trị cụ thể

  • 2.2.1.1. Một số khái niệm

    • 2.2.1.2. Xác xuất

  • 2.2.2 Hàm mật độ xác suất (phân phối xác suất)

    • 2.2.2.1. Hàm mật độ xác suất -Biến ngẫu nhiên rời rạc

    • 2.2.2.2 Hàm mật độ xác suất (pdf)-Biến ngẫu nhiên liên tục.

    • 2.2.2.3. Hàm đồng mật độ xác suất -Biến ngẫu nhiên rời rạc

    • 2.2.2.4. Hàm đồng mật độ xác suất cho biến ngẫu nhiên liên tục

    • 2.2.2.5. Xác suất có điều kiện

  • 2.2.3 Một số đặc trưng của phân phối xác suất

  • 2.2.3.1. Một số công thức tổng

    • 2.2.3.2. Giá trị kỳ vọng hay giá trị trung bình

    • 2.2.3.3. Phương sai

    • 2.2.3.4. Hiệp phương sai

    • 2.2.3.5. Hệ số tương quan

  • 2.3. Một số phân phối xác suất quan trọng

  • 2.3.1. Phân phối chuẩn

  • 2.3.2. Phân phối

  • 2.3.3. Phân phối t

  • 2.3.4. Phân phối F

  • 2.3.5. Ước lượng và sự lấy mẫu

  • 2.3.6. Phân phối giá trị trung bình của mẫu

  • 2.3.7. Khoảng tin cậy của giá trị trung bình của phân phối chuẩn

  • 2.3.8. Kiểm định giả thuyết

  • CHƯƠNG 3

  • MÔ HÌNH HỒI QUY TUYẾN TÍNH

  • 3.1 Một mô hình kinh tế

  • 3.2. Mô hình kinh tế lượng

  • 3.2.1. Mô hình hồi quy 2 biến

  • 3.2.2. Mô hình hồi quy tổng thể (Population regression function- PRF) 

  • 3.2.3 Mô hình hồi quy mẫu (Sample regression function- SRF)

  • 3.2.4. Tính tuyến tính trong mô hình hồi quy

  • 3.3. Ước lượng các tham số của m

  • ô hình hồi quy theo phương pháp bình phương nhỏ nhất (Ordinary Least Squares – OLS)

  • 3.4. Các giả thiết cơ bản:

  • 3.5. Phương sai và hiệp phương sai của

  • Giá trị kỳ vọng:

  • 3.7. Sử dụng mô hình hồi quy phi tuyến

  • 3.7.1. Mô hình hồi quy qua gốc tọa độ

  • 3.7.2. Mô hình tuyến tính logarit (hàm log-log):

  • 3.7.3. Mô hình log -lin

  • 3.7.4. Mô hình lin-log

  • 3.7.5. Mô hình nghịch đảo

  • 3.8. Ước lượng khoảng

  • 3.9. Kiểm định giả thuyết

  • 3.10. Vùng từ chối cho giả thuyết thay thế

  • 3.10.1. Các loại giả thuyết.

  • 3.10.2. Vùng từ chối cho giả thuyết thay thế theo các phương pháp kiểm định.

  • 3.10.3. Kiểm định sự phù hợp của mô hình- phương pháp kiểm định F

  • 3.11 Kiểm định tham số kết hợp tuyến tính:

  • 3.12. Vấn đề dự báo

  • 3.13 Trình bày kết quả hồi quy

  • 3.14. Thang đo

  • CHƯƠNG 4

  • MÔ HÌNH HỒI QUY BỘI

  • 4.1. Mô hình hồi quy cơ bản.

  • 4.1.1. Mô hình hồi quy tuyến tính 3 biến

    • 4.1.1.1. Hàm hồi quy tổng thể và các giả thiết của mô hình

    • 4.1.1.2. Ước lượng các tham số của mô hình bằng OLS

    • 4.1.1.3. Phương sai của các ước lượng

    • 4.1.1.4. Hệ số xác định và hệ số xác định hiệu chỉnh

    • 4.1.1.5. Khoảng tin cậy của các tham số

    • 4.1.1.6. Kiểm định giả thuyết

  • 4.1.2. Mô hình hồi quy k biến:

  • 4.2. Các giả thiết của mô hình:

  • 4.3. Ước lượng các tham số của mô hình bằng OLS:

  • 4.4. Phương sai của các ước lượng

  • 4.5. Tính chất của các ước lượng

  • 4.6. Hệ số xác định bội và hệ số xác định bội hiệu chỉnh

  • 4.7. Khoảng tin cậy các tham số và kiểm định các giả thiết thống kê

  • 4.7.1. Khoảng tin cậy của các hệ số hồi quy:

  • 4.7.2. Kiểm định giả thiết cho các hệ số hồi quy

  • 4.8. Kiểm định sự phù hợp của hàm hồi quy

  • 4.9. Kiểm định WALD (Kiểm định tổ hợp các tham số):

  • 4.10. Chiến lược xây dựng mô hình :

  • 4.10.1. Hậu quả của việc thiếu biến quan trọng hoặc thừa biến không quan trọng:

  • Kiểm định của Ramsey, Reset test:

  • 4.10.2. Chiến lược xây dựng mô hình:

    • 4.10.2.1. Tiêu chuẩn chọn lựa mô hình

    • 4.10.2.2. Kiểm tra mô hình có vi phạm các giả thiết hay không

  • CHƯƠNG 5

  • HỒI QUY VỚI BIẾN ĐỘC LẬP LÀ BIẾN GIẢ

  • 5.1 Bản chất của biến giả

  • 5.1.1. Mô hình trong đó biến giải thích là biến giả

  • 5.1.2. Một số chú ý

  • 5.2. Hồi quy với một biến lượng và một biến chất

  • 5.2.1 Trường hợp khi biến chất chỉ có 2 phạm trù:

  • 5.2.2 Trường hợp khi biến chất có nhiều hơn 2 phạm trù

  • 5.3. Hồi quy với một biến lượng và hai biến chất

  • 5.4. So sánh hai hồi quy

  • 5.4.1 Tư tưởng cơ bản:

  • Tiết 18

  • 5.4.2. So sánh 2 hồi quy- kiểm định Chow:

  • 5.4.3. So sánh hai hồi quy – phương pháp biến giả:

  • 5.5. Ảnh hưởng tương tác giữa các biến giả

  • 5.6 Sử dụng biến giả trong phân tích mùa

  • 5.7 Hồi quy tuyến tính từng khúc

  • CHƯƠNG 6

  • ĐA CỘNG TUYẾN (Multicollinearity)

  • 6.1. Bản chất của đa cộng tuyến:

  • 6.2. Đa cộng tuyến hoàn hảo

  • 6.3. Đa cộng tuyến không hoàn hảo

  • 6.4. Nguồn gốc của đa cộng tuyến (multicollinearity)

  • 6.4.1. Do phương pháp thu thập dữ liệu

  • 6.4.2. Dạng hàm mô hình

  • Tiết 21

  • 6.5. Hậu quả

  • 6.5.1. Đa cộng tuyến hoàn hảo

  • Khi có đa cộng tuyến hoàn hảo xảy ra, thì các hệ số hồi quy là không xác định còn các sai số tiêu chuẩn là vô hạn và do đó ta sẽ không ước lượng được mô hình. Để trình bày đơn giản, ta xét mô hình hồi quy 3 biến và chúng ta sử dụng dạng độ lệch.

  • 6.5.2. Hậu quả khi có đa cộng tuyến không hoàn hảo

  • 6.6. Nhận dạng đa cộng tuyến

  • 6.7. Các giải pháp khắc phục đa cộng tuyến

  • CHƯƠNG 7

  • HIỆN TƯỢNG PHƯƠNG SAI SAI SỐ THAY ĐỔI (Heteroskedasticity-HET)

  • 7.1. Giới thiệu

  • 7.2. Hậu quả:

  • 7.2.1. Tác động lên tính chất của các ước lượng OLS:

  • 7.2.2. Tác Động Lên Các Kiểm Định Giả Thuyết

  • 7.2.3. Tác Động Lên Việc Dự Báo

  • 7.3. Nguyên nhân xảy ra hiện tượng HET

  • 7.4. Nhận dạng hiện tượng HET

  • 7.4.1. Bằng trực gíac và kinh nghiệm:

  • 7.4.2. Phân tích bằng đồ thị (Graphical analysis)

  • 7.4.3. Kiểm định nhân tử Lagrange (Lagrange Multiplier Test – LM Test):

    • 7.4.3.1. Kiểm định Park

    • 7.4.3.2. Kiểm định Glejser

    • 7.4.3.3. Kiểm định White

    • 7.4.3.4. Kiểm định Goldfeld-Quandt

  • 7.5. Biện pháp khắc phục

  • 7.5.1. Bình phương tối thiểu tổng quát (hoặc trọng số)

  • 7.5.2. Bình Phương Tối Thiểu Tổng Quát Khả Thi (FGLS)

  • 7.5.3. Tái cấu trúc mô hình

  • TƯƠNG QUAN CHUỐI (Auto Regression)

  • 8.1. Giới thiệu

  • 8.2. Hậu quả:

  • 8.2.1. Tác động lên tính chất của các ước lượng

  • 8.2.2. Tác động lên các kiểm định giả thuyết

  • 8.2.3. Tác động lên việc dự báo

  • 8.3. Nguyên nhân xảy ra hiện tượng tương quan chuỗi

  • 8.3.1. Nguyên nhân khách quan

  • 8.3.2. Nguyên nhân chủ quan

  • 8.4. Nhận dạng hiện tượng tương quan chuỗi

  • 8.4.1. Bằng trực giác và kinh nghiệm:

  • 8.4.2. Phân tích bằng biểu đồ (Graphical analysis)

  • 8.4.3. Kiểm định tương quan bậc nhất (Durbin - Watson):

  • 8.4.4. Kiểm định nhân tử Lagrange (LM Breusch – Godfrey)

  • 8.5. Biện pháp khắc phục

  • 8.5.1. Thay đổi dạng hàm

  • 8.5.2. Thủ tục ước lượng

  • TÀI LIỆU THAM KHẢO

Nội dung

Kinh tế lượng là một môn khoa học về đo lường các mối quan hệ kinh tế diễn ra trong thực tế. Kinh tế lượng cung cấp các phương pháp phân tích về mặt lượng mối quan hệ giữa các chỉ tiêu kinh tế cùng với sự tác động qua lại giữa chúng dựa trên cơ sở các số liệu thu thập từ thực tế nhằm củng cố thêm các giả thiết kinh tế từ đó đưa ra các quyết định đúng đắn hơn. Kinh tế lượng ngày nay là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính, nhằm định lượng các mối quan hệ kinh tế, dự báo khả năng phát triển hay diễn biến của các hiện tượng kinh tế và phân tích các chính sách kinh tế.

Tại sao phải học kinh tế lượng ?

Kinh tế lượng (KTL) là nền tảng quan trọng cho các phương pháp đo lường trong lĩnh vực kinh tế, bao gồm các công cụ nghiên cứu trong kế toán, tài chính, marketing và quản lý Ngoài ra, KTL còn được áp dụng bởi các nhà khoa học xã hội trong việc nghiên cứu lịch sử, phân tích chính sách và các vấn đề xã hội học, cũng như trong các lĩnh vực lâm nghiệp và kinh tế nông nghiệp Hơn nữa, KTL đóng vai trò thiết yếu trong việc đào tạo sinh viên khối ngành kinh tế, giúp họ nắm vững các kỹ năng cần thiết cho sự nghiệp tương lai.

Khóa học "Suy nghĩ như một nhà kinh tế" giúp người học làm quen với các khái niệm kinh tế cơ bản như chi phí cơ hội, nguồn lực khan hiếm, lợi thế cạnh tranh và các mô hình kinh tế như cung cầu Qua đó, người học sẽ có cái nhìn đa chiều về hành vi kinh tế, hiểu rõ cách thức hoạt động của thị trường cũng như tác động của các chính sách đến thị trường.

Kinh tế lượng là công cụ quan trọng giúp đo lường các mối quan hệ kinh tế, mang lại cái nhìn mới cho các nhà kinh tế trong việc phân tích hiện tượng kinh tế Với sự phát triển của công nghệ thông tin, sức mạnh của kinh tế lượng đã gia tăng đáng kể, khiến cho các số liệu trở nên dễ hiểu hơn Điều này không chỉ hỗ trợ việc xác thực các lý thuyết kinh tế mà còn cung cấp cơ sở vững chắc cho quá trình ra quyết định trong sản xuất kinh doanh và hoạch định chính sách, chiến lược kinh tế xã hội.

Nếu bạn dự định theo học các bậc cao hơn như Thạc sỹ hoặc Tiến sỹ, KTL là môn học không thể thiếu trong các ngành kinh tế Môn học này cung cấp công cụ và kỹ thuật thiết yếu cho việc nghiên cứu và phân tích kinh tế.

Kinh tế lượng là gì?

Thuật ngữ “Econometrics” được dịch sang tiếng Việt là “Kinh tế lượng học” hoặc “Đo lường kinh tế”, ngắn gọn hơn là “Kinh tế lượng”.

Có rất nhiều quan niệm, định nghĩa về kinh tế lượng khác nhau, bao gồm các khái niệm của các tác giả sau:

Kinh tế lượng (KTL) là sự giao thoa giữa kinh tế học, toán học và thống kê, nhằm mục đích lượng hóa, kiểm định và dự báo các mối quan hệ kinh tế Với ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau, KTL đã trở thành công cụ quan trọng phục vụ cho nhiều mục đích đa dạng.

Kinh tế lượng được chia thành 2 ngành chính sau:

Nguyên lý kinh tế lượng: bao gồm việc tìm ra những phương pháp thích hợp cho việc đo lường các mối liên hệ kinh tế

Kinh tế lượng ứng dụng là việc sử dụng các phương pháp kinh tế lượng để xác định vấn đề và thực hiện nghiên cứu trong các lĩnh vực như cung cầu sản xuất, đầu tư, tiêu thụ, và các lĩnh vực khác liên quan đến nguyên lý kinh tế.

Trong kinh tế, chúng ta giải thích các mối quan hệ kinh tế bằng các phương trình toán học

Mối quan hệ giữa thu nhập và tiêu dùng cho thấy rằng mức độ chi tiêu phụ thuộc vào một hàm số nào đó của thu nhập.

 Nhu cầu của cá nhân đối với hàng hóa (ví dụ như đối với Honda Accord) có thể được trình bày như sau:

Nhu cầu của xe Honda Accord, ký hiệu là Q d, phụ thuộc vào giá của xe Toyota (P), giá của các hãng cạnh tranh khác (P s), giá của hàng hóa bổ trợ như gas và xăng (P c), cùng với mức thu nhập (INC) Giả sử hàm cầu cho xe Honda Accord là hàm tuyến tính, ta có thể diễn đạt mối quan hệ này một cách rõ ràng.

Nếu viết theo mô hình kinh tế lượng ta có

Các phương trình này đại diện cho mô hình kinh tế tổng quát, cho phép chúng ta phân tích sự tương tác giữa các biến kinh tế và từ đó hiểu rõ hơn về các vấn đề kinh tế.

Trong quá trình ra quyết định và lựa chọn, việc hiểu rõ mối quan hệ giữa các biến kinh tế là rất quan trọng Chúng ta cần xác định mức độ thay đổi của một biến để có thể tác động hiệu quả đến các biến khác.

Mở rộng hơn, kinh tế lượng quan tâm đến 3 nội mục tiêu chính sau:

 Ước lượng các mối quan hệ kinh tế.

 Đối chiếu lý thuyết kinh tế với thực tế, qua đó kiểm định các giả thuyết liên quan đến hành vi kinh tế.

 Dự báo hành vi của các biến số kinh tế

1.2.1.Ước lượng các mối quan hệ kinh tế

Kinh tế học thực nghiệm sử dụng dữ liệu để ước lượng các mối quan hệ kinh tế, cung cấp nhiều ví dụ minh họa cho các khía cạnh này.

Các nhà phân tích và các công ty thường quan tâm ước lượng cung/cầu của các sản phẩm, dịch vụ

Phân tích tác động của quảng cáo và khuyến mãi lên doanh số của một công ty.

Các nhà phân tích thị trường chứng khoán nghiên cứu mối liên hệ giữa giá cổ phiếu và các đặc điểm của công ty phát hành, cũng như tình hình kinh tế tổng thể.

Nhà nước đang tiến hành đánh giá tác động của các chính sách tiền tệ và tài chính đối với những biến số quan trọng như tỷ lệ thất nghiệp, thu nhập, xuất nhập khẩu, lãi suất, tỷ lệ lạm phát và thâm hụt ngân sách.

Một điểm tốt của kinh tế lượng là quan tâm đến việc kiểm định giả thuyết về các hành vi kinh tế

 Nhà hoạch định chính sách muốn biết xem trên thực tế thực sự có sự phân biệt đối xử về mức lương giữa nam và nữ hay không?

Các công ty cũng muốn xác định xem chiến dịch quảng cáo của mình có thực sự tác động làm tăng doanh thu hay không?

Công ty muốn biết lợi nhuận tăng hay giảm theo quy mô hoạt động?

Các công ty thuốc lá và các nhà nghiên cứu y khoa đang chú ý đến việc liệu các báo cáo tổng quan về mối liên hệ giữa hút thuốc và ung thư phổi, cũng như các bệnh hô hấp khác, có thực sự dẫn đến sự giảm tiêu thụ thuốc lá đáng kể hay không.

Các nhà kinh tế vĩ mô muốn đánh giá hiệu quả của các chính sách nhà nước

Khi các biến số đã được xác định và tác động của chúng đến chủ thể nghiên cứu được đánh giá, chúng ta có thể áp dụng các mối quan hệ ước lượng để dự đoán giá trị trong tương lai.

Các công ty dự báo doanh thu, lợi nhuận, chi phí sản xuất, … cần thiết cho hoạt động sản xuất kinh doanh

Chính phủ dự báo về thâm hụt ngân sách, lạm phát và nhu cầu năng lượng để xây dựng chiến lược đầu tư và ký kết các thỏa thuận mua năng lượng từ bên ngoài.

 Các công ty dự báo các chỉ số thị trường chứng khoán và giá cổ phiếu

 Chính phủ dự đoán những con số như thu nhập, chi tiêu, lạm phát, thất nghiệp, và thâm hụt ngân sách và thương mại

Các địa phương thường xuyên dự báo mức tăng trưởng của mình qua các yếu tố như dân số, việc làm, số lượng nhà ở, tòa nhà thương mại, và xưởng công nghiệp Bên cạnh đó, nhu cầu về trường học, đường xá, trạm cảnh sát, trạm cứu hỏa và các dịch vụ công cộng cũng được xem xét kỹ lưỡng.

Các kiểu dữ liệu kinh tế lượng

Số liệu có thể được phân loại theo nhiều cách tùy thuộc vào tính chất của từng dự án nghiên cứu, bao gồm số liệu thực nghiệm và phi thực nghiệm, số liệu thứ cấp và sơ cấp, cũng như số liệu định tính và định lượng Trong lĩnh vực nghiên cứu kinh tế, số liệu thường được chia thành số liệu thời gian, số liệu chéo và số liệu tổng hợp.

1.3.1 Số liệu theo chuỗi thời gian (Time-series Data):

Số liệu theo chuỗi thời gian là tập hợp các quan sát về giá trị của một biến số tại các thời điểm khác nhau trong cùng một khoảng thời gian lặp lại, chẳng hạn như ngày, tuần, tháng, quý hay năm Khoảng thời gian này được gọi là tần số của số liệu, và có thể được phân loại thành nhiều loại như ngày, tuần, tháng, quý hoặc năm.

 Về chỉ số giá tiêu dùng Việt Nam qua các năm

Chỉ số giá tiêu dùng

 Doanh thu theo năm, tháng; GDP hằng năm, hằng quý, …; Tổng điều tra dân số trong 20 năm qua

1.3.2 Số liệu chéo (Cross-section Data):

Dữ liệu chuỗi thời gian bao gồm các quan sát được ghi nhận ở những thời điểm khác nhau, trong khi số liệu chéo tập trung vào một hoặc nhiều biến được thu thập đồng thời tại một thời điểm cụ thể.

Số liệu về chỉ số giá năm 2015

Chỉ số giá tiêu dùng 101,54

Nhược điểm của số liệu chéo: “Tính không thuần nhất”

Do khi ta đưa các đơn vị không thuần nhất vào phân tích thống kê, tác động kích thước hay tác động quy mô phải được tính đến.

1.3.3 Số liệu tổng hợp (Panel or Longitudinal Data):

Một loại dữ liệu phổ biến mà các nhà nghiên cứu thường sử dụng là dữ liệu tổng hợp, bao gồm cả số liệu chuỗi thời gian và số liệu chéo.

Số liệu tổng hợp là sự kết hợp của 2 loại số liệu trên.

Số liệu về chỉ số giá qua các năm

Chỉ số giá tiêu dùng

1.3.4 Tính chính xác của số liệu:

Thông thường, chất lượng của số liệu phục vụ cho nghiên cứu kinh tế thường không đủ tốt Nguyên nhân của vấn đề này có thể là:

Trong nghiên cứu khoa học xã hội, có thể xảy ra sai số trong quá trình quan sát hoặc có thể bỏ sót thông tin quan trọng, hoặc cả hai Điều này xảy ra bởi vì phần lớn dữ liệu trong lĩnh vực này thường không dựa trên thực nghiệm.

 Do cách tính gần đúng hay làm tròn số, sai số đo lường sẽ nảy sinh trong khi thu thập số liệu

Trong quá trình thực hiện phiếu điều tra, việc không thể đáp ứng đầy đủ các câu hỏi có thể dẫn đến những sai lầm nghiêm trọng, ví dụ như chỉ trả lời khoảng 40% câu hỏi và phân tích dựa trên những đáp ứng không đầy đủ, trong khi 60% còn lại không được trả lời Hiện tượng này được gọi là “thiên lệch lựa chọn” Khi người phỏng vấn không thể hoặc không muốn trả lời những câu hỏi nhạy cảm, đặc biệt là liên quan đến tài chính, sẽ tạo ra tình trạng “thiên lệch về lựa chọn”.

Các phương pháp chọn mẫu trong thu thập số liệu có sự đa dạng, điều này dẫn đến khó khăn trong việc so sánh kết quả giữa các đợt điều tra.

 Số liệu kinh tế thông thường có được ở mức rất tổng hợp

Do yêu cầu bảo mật, một số liệu nhất định chỉ có thể được công bố ở mức tổng hợp cao, chẳng hạn như thông tin tổng doanh số và giá trị kim ngạch xuất nhập khẩu, mà không thể cung cấp chi tiết cụ thể.

 Ngoài ra còn rất nhiều nguyên nhân khác nữa

Cần lưu ý rằng chất lượng đầu ra phụ thuộc vào cách thu thập dữ liệu, vì vậy việc đánh giá cẩn thận quá trình này là rất quan trọng trong nghiên cứu thực nghiệm Nhà điều tra không chỉ cần chọn dữ liệu phù hợp với vấn đề nghiên cứu mà còn phải nhận thức được các hạn chế của dữ liệu đang sử dụng, vì tính chính xác của các kết luận phụ thuộc vào độ chính xác của dữ liệu đó.

Phương pháp thực hiện một nghiên cứu kinh tế

Để thực hiện một nghiên cứu thực nghiệm, một nhà nghiên cứu phải có câu trả lời thỏa đáng cho những câu hỏi sau:

Mô hình có ý nghĩa kinh tế không? Cụ thể, mô hình có thể hiện mọi quan hệ tương thích ẩn trong quá trình phát dữ liệu hay không?

Dữ liệu có đáng tin cậy không?

 Phương pháp ước lượng sử dụng có phù hợp không? Có sai lệch trong các ước lượng tìm được không?

 Các kết quả của mô hình so với các kết quả từ những mô hình khác như thế nào?

 Kết quả thể hiện điều gì? Kết quả có như mong đợi dựa trên lý thuyết kinh tế hoặc cảm nhận trực giác không?

Mặc dù có nhiều quan điểm khác nhau, nghiên cứu kinh tế lượng thường được chia thành 7 bước cụ thể Để minh họa, chúng ta sẽ xem xét ví dụ về ước lượng hệ số tiêu dùng biên của một quốc gia, với quy trình thực hiện theo thứ tự 7 bước.

Bước 1: Nêu ra các giả thuyết, các lý thuyết kinh tế.

Keynes phát biểu như sau:

Quy luật tâm lý cơ sở chỉ ra rằng tiêu dùng của cá nhân thường tăng lên khi thu nhập tăng, nhưng mức tăng này không tỷ lệ thuận với sự gia tăng thu nhập.

Keynes đã đề xuất định đề về "khuynh hướng tiêu dùng cận biên" (MPC - marginal propensity to consume), cho rằng sự thay đổi trong tiêu dùng tỷ lệ thuận với sự thay đổi thu nhập Cụ thể, khi thu nhập tăng thêm 1 đơn vị tiền tệ, tiêu dùng của người dân sẽ tăng lên, nhưng mức tăng này luôn nằm trong khoảng lớn hơn 0 và nhỏ hơn 1 (0 < MPC < 1).

Bước 2: Thiết lập mô hình (về hành vi tiêu dùng)

Ông Keynes nhấn mạnh mối quan hệ tích cực giữa mức tiêu dùng và thu nhập, tuy nhiên, ông không cung cấp một hàm cụ thể nào cho mối quan hệ này Hàm tuyến tính đơn giản nhất phản ánh ý tưởng của ông là: C = 0 < < 1, trong đó C đại diện cho chi phí tiêu dùng.

: hệ số chặn, : hệ số góc, đây là MPC

Chi tiêu tiêu dùng có mối quan hệ tuyến tính với thu nhập, phản ánh một mô hình toán học cho sự tương tác giữa hai yếu tố này.

Về mặt hình học, chúng ta có thể biểu diễn như sau:

Nêu ra các giả thuyết

Thiết lập mô hình Xi

Y X Y X Y X Y X 3 2 1 Miền Trung Miền Bắc Miền Tiền lương công nhân làm việc trong khu vực tư nhân

X Y 2 1 Tiền lương công nhân làm việc trong khu vực nhà nước

Quá trình sản xuất A Ước lượng mô hình Kiểm định các giả thiết

Ra quyết địnhThu thập số liệu

Xác định mô hình kinh tế lượng cho hàm tiêu dùng:

Mô hình toán học về hành vi tiêu dùng đặt ra một số hạn chế, vì mối quan hệ giữa tiêu dùng và thu nhập thường không phản ánh đúng thực tế Ngoài thu nhập, hành vi tiêu dùng còn bị ảnh hưởng bởi nhiều yếu tố khác như số lượng thành viên trong gia đình, độ tuổi của các thành viên và tôn giáo.

Kinh tế lượng sử dụng mô hình toán kinh tế để mô tả chính xác các mối quan hệ giữa các biến kinh tế, từ đó giúp phân tích và đưa ra kết luận phù hợp.

Trong đó, u là sai số (biến ngẫu nhiên)

Mô hình ước lượng này có sai số, với số hạng sai số u thay đổi theo từng quan sát Số hạng này đại diện cho các yếu tố ảnh hưởng đến biến phụ thuộc nhưng không được đưa vào mô hình.

Mô hình Kinh tế lượng về chi tiêu được trình bày ở đây là mô hình hồi quy tuyến tính đơn biến, thể hiện mối quan hệ tuyến tính giữa chi tiêu và thu nhập Tuy nhiên, mối quan hệ này không hoàn toàn chính xác.

Bước 3: Thu thập số liệu.

Thiết lập mô hình Xi

Y X Y X Y X Y X 3 2 1 Miền Trung Miền Bắc Miền Tiền lương công nhân làm việc trong khu vực tư nhân

X Y 2 1 Tiền lương công nhân làm việc trong khu vực nhà nước

Quá trình sản xuất A và B là hai yếu tố quan trọng trong việc thiết lập mô hình toán để ước lượng mô hình kinh tế lượng Để thực hiện điều này, cần thu thập các số liệu cụ thể về tiêu dùng và thu nhập Giả sử chúng ta đã thu thập được các số liệu cần thiết cho việc phân tích.

Số liệu về tiêu dùng cá nhân (C) và tổng thu nhập quốc nội –GDP () của Mỹ từ năm

1982-1996 (Đơn vị tính: USD/người)

Bước 4: Ước lượng mô hình (ước lượng các tham số của mô hình kinh tế lượng):

Sau khi thiết lập mô hình và thu thập dữ liệu, nhiệm vụ chính là ước lượng các thông số chưa biết để đánh giá ảnh hưởng của các biến đối với dữ liệu hiện có Chúng ta sẽ thảo luận về vấn đề ước lượng mô hình trong các chương sau Hiện tại, với dữ liệu đã thu thập, kỹ thuật phân tích hồi quy được sử dụng để ước lượng các tham số, cho ra kết quả cụ thể là 184,08 và 0,7064 Kết quả này cho phép ước lượng hàm tiêu dùng một cách chính xác.

Hàm tiêu dùng cá nhân được ước lượng là 184.08 + 0.7064, cho thấy đường hồi quy phù hợp với dữ liệu thu thập Với hệ số MPC là 0,7, có nghĩa là trung bình, mỗi khi thu nhập tăng 1 đơn vị, tiêu dùng sẽ tăng 0,7 đơn vị Mối quan hệ giữa tiêu dùng và thu nhập không hoàn toàn chính xác, vì không phải tất cả các điểm dữ liệu đều nằm trên đường hồi quy, nhưng về trung bình, tiêu dùng sẽ tăng 0,7 khi thu nhập tăng 1 đơn vị.

Bước 5 trong quy trình kiểm định các giả thuyết là rất quan trọng, vì ước lượng sơ bộ của mô hình kinh tế lượng không phải lúc nào cũng mang lại kết quả chính xác Công thức của mô hình này chịu ảnh hưởng lớn từ lý thuyết kinh tế, sự hiểu biết của nhà phân tích về các hành vi tiềm ẩn, cũng như các kinh nghiệm và nghiên cứu trước đây.

Mô hình này chỉ cung cấp khung tổng quát cho các vấn đề kinh tế lượng, dẫn đến những kết quả đầu tiên có thể gây ngạc nhiên cho người điều tra Các biến quan trọng, có ưu tiên cao có thể xuất hiện sau những biến thực nghiệm không quan trọng hoặc có ảnh hưởng theo hướng không mong đợi.

Nhà kinh tế thường xuyên kiểm định mô hình để đảm bảo rằng các giả định và phương pháp ước lượng phù hợp với dữ liệu thu thập Mục tiêu là tìm ra những kết luận thuyết phục, không thay đổi nhiều về đặc trưng của mô hình Để đạt được điều này, việc thiết lập lại mô hình và ước lượng lại bằng nhiều kỹ thuật khác nhau là cần thiết Kiểm định giả thuyết không chỉ nhằm cải thiện đặc trưng của mô hình mà còn để xác minh tính chính xác của các lý thuyết kinh tế.

Biến ngẫu nhiên

Biến ngẫu nhiên là một loại biến mà giá trị của nó chỉ được xác định khi được quan sát Đây là những giá trị không thể dự đoán chính xác, mà chỉ có thể xảy ra với một xác suất nhất định Nói cách khác, biến ngẫu nhiên là biến số có các giá trị khả thi tương ứng với các xác suất khác nhau.

Ký hiệu: bằng ký tự hoa X, Y, Z,… Các giá trị của biến ngẫu nhiên tương ứng được biểu thị bằng ký tự thường x, y, z hoặc

Ví dụ: Biến X là giá trị xuất hiện khi gieo 1 hạt xúc xắc X có thể có các giá trị từ

1-6, xác suất xảy ra mỗi giá trị đều =1/6.

Biến ngẫu nhiên có hai loại chính: rời rạc và liên tục Biến ngẫu nhiên rời rạc chỉ nhận một số lượng hữu hạn hoặc vô hạn đếm được các giá trị, trong khi biến ngẫu nhiên liên tục có thể nhận vô số giá trị trong một khoảng nhất định.

 Biến ngẫu nhiên rời rạc

Khi tung một con súc sắc, ký hiệu X đại diện cho số chấm xuất hiện X là một biến ngẫu nhiên rời rạc vì nó chỉ có thể nhận các giá trị là 1, 2, 3, 4, 5 hoặc 6.

Hay X là số lượng máy tính mà các hộ gia đình ngẫu nhiên sở hữu, hoặc số lần một cá nhân cần đến bác sĩ nha khoa.

Cũng có những ví dụ của biến ngẫu nhiên chỉ nhận hai giá trị, như khi phỏng vấn điện thoại, câu trả lời nhận được chỉ “Có” hoặc “Không”

 Biến ngẫu nhiên liên tục

Chiều cao Y của một người được chọn ngẫu nhiên trong nhóm là một biến ngẫu nhiên, vì giá trị của nó chỉ được xác định sau khi đo đạc Ví dụ, khi đo được chiều cao 167 cm, ta có thể nghĩ rằng chiều cao là một biến rời rạc, nhưng thực tế Y có thể nhận bất kỳ giá trị nào trong khoảng từ 160 cm đến 170 cm, tùy thuộc vào độ chính xác của phép đo Do đó, Y là một biến ngẫu nhiên liên tục.

Giá trị GDP của Việt Nam là một biến ngẫu nhiên liên tục, có thể dao động từ 0 đến vô hạn Các biến kinh tế vĩ mô khác như lãi suất, giá trị đầu tư và giá trị tiêu dùng cũng thuộc loại biến ngẫu nhiên liên tục.

Lưu ý: Hai biến ngẫu nhiên độc lập khi giá trị của biến này không bị ảnh hưởng bởi giá trị của biến khác.

Xác suất

2.2.1 Xác suất biến ngẫu nhiên nhận được một giá trị cụ thể

 Phép thử: Một phép thử có 2 đặc tính: không biết chắc kết quả nào xảy ra; nhưng biết được các kết quả có thể xảy ra.

Không gian mẫu là tập hợp tất cả các kết quả có thể xảy ra từ một phép thử, được ký hiệu là S Mỗi kết quả trong không gian mẫu được gọi là một điểm mẫu.

Biến cố: Biến cố là một tập con của không gian mẫu.

Ví dụ 2.1: Gọi Z là tổng số điểm phép thử tung hai con xúc xắc Ta có:

Tổng số điểm là 7 hoặc 11

Tổng số điểm là 2 hoặc 3 hoặc 12

 Hợp của các biến cố: A xảy ra hay B xảy ra

 Giao của các biến cố: C xảy ra và D xảy ra

Tần suất là khái niệm liên quan đến việc khảo sát biến X, cụ thể là số điểm khi tung xúc xắc Giả sử bạn thực hiện n lần tung, thì số lần xuất hiện của mỗi giá trị sẽ được ghi lại Tần suất xuất hiện của kết quả được tính dựa trên số lần giá trị đó xuất hiện so với tổng số lần tung.

Nếu số phép thử đủ lớn thì tần suất xuất hiện tiến đến xác suất xuất hiện

Khi số lượng phép thử tăng đến vô hạn, tần suất xuất hiện của một biến cố sẽ tiến gần đến một giá trị xác định, được gọi là xác suất Nói cách khác, xác suất là giới hạn của tần suất khi số phép thử trở nên vô hạn, phản ánh xác suất của biến ngẫu nhiên (X) nhận được một giá trị cụ thể.

Tuy không thể tiến hành vô hạn phép thử trong thực tế, nhưng với một số lượng phép thử đủ lớn, chúng ta có thể coi xác suất gần bằng với tần suất xảy ra.

Tính chất của xác suất

2.2.2 Hàm mật độ xác suất (phân phối xác suất)

2.2.2.1 Hàm mật độ xác suất -Biến ngẫu nhiên rời rạc

Khi X nhận các giá trị riêng rẽ

Hàm số f được xác định bởi được gọi là hàm mật độ xác suất rời rạc của X P(X=) là xác suất biến X nhận giá trị

Ký hiệu là hàm PDF hay PF.

 Xét biến ngẫu nhiên X là số điểm của phép thử tung một con xúc xắc Hàm mật độ xác suất được biểu diễn dạng bảng như sau.

Bảng mật độ xác suất của biến ngẫu nhiên rời rạc X

 Xét biến Z là tổng số điểm của phép thử tung 2 con xúc xắc Hàm mật độ xác suất được biểu diễn dưới dạng bảng như sau.

Bảng mật độ xác suất của biến ngẫu nhiên rời rạc Z

Biểu đồ tần suất của biến ngẫu nhiên Z

2.2.2.2 Hàm mật độ xác suất (pdf)-Biến ngẫu nhiên liên tục

Biến ngẫu nhiên liên tục có giá trị trong một khoảng nhất định và không thể đếm được Hàm mật độ xác suất của biến này được biểu diễn dưới dạng một phân phối Ví dụ, hàm phân phối xác suất của biến ngẫu nhiên thu nhập của một cá nhân, ký hiệu là X, nhận giá trị từ 0 đến vô cùng.

Hàm phân phối xác suất cho biến ngẫu nhiên liên tục

Ta có thể tính toán xác suất thu nhập của một người nằm trong khoảng $100 đến

Tổng quát, hàm mật độ xác suất của một biến ngẫu nhiên liên tục có tính chất như sau:

2 = Diện tích nằm dưới đường pdf giữa a và b

3 Tổng diện tích dưới đường pdf bằng 1

2.2.2.3 Hàm đồng mật độ xác suất -Biến ngẫu nhiên rời rạc

Một đại lý bán lẻ máy tính cung cấp hai loại sản phẩm: máy tính cá nhân và máy in Số lượng máy tính (X) và máy in (Y) được bán ra thay đổi theo từng ngày Giám đốc đại lý đã thu thập dữ liệu về số lượng thiết bị bán ra trong 200 ngày để phân tích.

Phân phối tần suất của hai biến ngẫu nhiên X và Y

Trong 200 ngày, bảng dữ liệu cho thấy có 30 ngày đại lý bán được 4 máy tính và 4 máy in, cùng với 2 ngày chỉ bán được 4 máy tính mà không có máy in nào Những con số này minh họa cho phân phối tần suất kết hợp Khi chia mỗi số liệu trong bảng cho tổng số 200, ta có thể xác định xác suất của hai biến xuất hiện đồng thời.

Bảng phân phối đồng mật độ xác suất của hai biến ngẫu nhiên rời rạc X và Y cho phép chúng ta xác định xác suất xảy ra đồng thời của chúng Hàm đồng mật độ xác suất này cung cấp thông tin về mối quan hệ giữa X và Y, đồng thời giúp phân tích tính độc lập thống kê của hai biến này.

Biến ngẫu nhiên X và Y được coi là độc lập trong thống kê khi hàm đồng mật độ xác suất f(x,y) bằng tích của các hàm mật độ xác suất biên f(x) và f(y) Điều này có nghĩa là sự phân phối xác suất chung của hai biến này có thể được xác định từ các phân phối xác suất riêng lẻ của chúng.

Hàm mật độ xác suất biên

Xác suất biên của biến ngẫu nhiên X là xác suất mà X nhận một giá trị nhất định, không phụ thuộc vào giá trị của biến ngẫu nhiên Y Phân phối của các xác suất này được gọi là hàm phân phối xác suất biên.

: hàm mật độ xác suất biên của X : hàm mật độ xác suất biên của Y

Ví dụ2.4: Ta tính hàm mật độ xác suất biên đối với số liệu cho ở ví dụ 2.3

2.2.2.4 Hàm đồng mật độ xác suất cho biến ngẫu nhiên liên tục

Hàm đồng mật độ xác suất của biến ngẫu nhiên liên tục X và Y là f(x,y) thỏa mãn là hàm như sau:

Hàm mật độ xác suất biên được tính như sau hàm mật độ xác suất biên của X hàm mật độ xác suất biên của Y

2.2.2.5 Xác suất có điều kiện

Hàm số , xác suất X nhận giá trị x với điều kiện Y nhận giá trị y, được gọi là xác suất có điều kiện của X.

Hàm số , xác suất Y nhận giá trị y với điều kiện X nhận giá trị x, được gọi là xác suất có điều kiện của Y.

Xác suất có điều kiện được tính như sau hàm mật độ xác suất có điều kiện của X hàm mật độ xác suất có điều kiện của Y

Hàm mật độ xác suất có điều kiện của một biến có thể được tính toán dựa trên hàm đồng mật độ xác suất và hàm mật độ xác suất biên của biến còn lại.

Ví dụ 2.5 : Tiếp tục ví dụ trên 2.4

2.2.3 Một số đặc trưng của phân phối xác suất

2.2.3.1 Một số công thức tổng

2 Nếu a là hằng số:

3 Nếu X và Y là 2 biến độc lập:

4 Giá trị trung bình của X:

5 Tính chất của giá trị trung bình:

2.2.3.2 Giá trị kỳ vọng hay giá trị trung bình

Cho 1 biến ngẫu nhiên X, có thể có các giá trị tương ứng với các xác suất có thể xảy ra f(x i) Kỳ vọng:

Người ta thường ký hiệu kỳ vọng là :

Ví dụ 2.6: Tính giá trị kỳ vọng biến X (số điểm của phép thử) tung 1 con xúc xắc

 Một số tính chất của giá trị kỳ vọng

1 với a là hằng số

2 với a và b là hằng số

3 Nếu X và Y là độc lập thống kê thì

4 Nếu X là một biến ngẫu nhiên có hàm mật độ xác suất f(x) thì

, nếu X rời rạc , nếu X liên tục

 Giá trị kỳ vọng có điều kiện

Trong các câu hỏi kinh tế, giá trị kỳ vọng thường được đề cập, chẳng hạn như lương kỳ vọng (trung bình) của một người đã học 16 năm Để tính toán giá trị này, ta sử dụng công thức xác định giá trị kỳ vọng của biến X với điều kiện Y=y.

Phương sai là thước đo phổ biến nhất để đánh giá độ phân tán của một biến ngẫu nhiên Trong khi giá trị kỳ vọng chỉ cho biết trọng tâm của biến, phương sai lại cung cấp thông tin về cách các giá trị riêng lẻ phân tán xung quanh giá trị trung bình.

Phương sai đo lường mức độ phân tán của các giá trị X xung quanh giá trị trung bình Khi các giá trị X phân tán rộng, phương sai sẽ có giá trị lớn, cho thấy sự biến động cao trong dữ liệu.

Căn bậc hai của phương sai là độ lệch chuẩn Ký hiệu:

Tính chất của phương sai:

1 Phương sai của một hằng số bằng không

2 Nếu X và Y là hai biến ngẫu nhiên độc lập, thì:

3 Nếu a, b là hằng số thì:

4 Nếu X và Y là hai biến đọc lập và a, b là hằng số, thì

5 Trong tính toán chúng ta sử dụng công thức sau:

Ví dụ 2.7: Với biến X là số điểm của phép thử tung 1 con xúc xắc Trong ví dụ

2.6 ta đã xác định được Tính

X và Y là hai biến ngẫu nhiên có kỳ vọng lần lượt là àx và ày Hiệp phương sai giữa X và Y thể hiện mối quan hệ tuyến tính của chúng.

Một số phân phối xác suất quan trọng

Là phân phối có dạng hình quả chuông, đối xứng qua đường thẳng đứng đi qua giá trị trung bình Hàm mật độ xác suất có dạng:

Trong đó  là kỳ vọng,  2 là phương sai của biến ngẫu nhiên X

Nếu X có phân phối chuẩn thì nó được ký hiệu như sau: X  N(,  2 )

Phần lớn các biến số kinh tế thu thập được đều có có phân phối chuẩn.

Ta có đồ thị của hàm mật độ xác suất phân phối chuẩn như sau:

Hàm mật độ xác suất phân phối chuẩn

Tính chất của phân phối chuẩn

Hàm mật độ xác suất của phân phối chuẩn có đặc điểm đối xứng quanh giá trị trung bình, với hàm phân phối xác suất (PDF) đạt đỉnh tại giá trị trung bình và giảm dần khi di chuyển về các cực trị Điều này có nghĩa là xác suất để một biến ngẫu nhiên theo phân phối chuẩn có giá trị xa giá trị trung bình càng thấp.

Khoảng 68% diện tích dưới đường phân phối xác suất (pdf) nằm trong khoảng ± σ, khoảng 95% diện tích nằm trong khoảng ± 2σ, và khoảng 99,7% diện tích nằm trong khoảng ± 3σ.

4 Định lý giớí hạn trung tâm 1: Một kết hợp tuyến tính các biến có phân phối chuẩn, trong một số điều kiện xác định cũng là một phân phối chuẩn Ví dụ và thì với a và b là hằng số có phân phối Y Đây là một tính chất đặc biệt quan trọng của phân phối chuẩn trong kinh tế lượng

5 Định lý giới hạn trung tâm 2: Dưới một số điều kiện xác định, giá trị trung bình mẫu của một biến ngẫu nhiên sẽ gần như tuân theo phân phối chuẩn.

Trong trường hợp biến X có phân phối chuẩn và có trung bình  = 0, phương sai

 2 =1, ta gọi X có phân phối chuẩn tắc.

Ta không thể so sánh các phân phối chuẩn có các tính chất khác nhau Cho nên, người ta quy về cùng một biến chuẩn tắc như sau

Nếu biến ngẫu nhiên X có phân phối chuẩn với trung bình  và phương sai ², thì biến Z, được định nghĩa là một kết hợp tuyến tính của X, sẽ có phân phối chuẩn với trung bình bằng 0 và phương sai bằng 1.

Bất kỳ biến ngẫu nhiên nào theo phân phối chuẩn với giá trị trung bình và phương sai xác định đều có thể chuyển đổi thành biến chuẩn tắc, điều này giúp đơn giản hóa quá trình tính xác suất Để hiểu rõ hơn về vai trò của phân phối chuẩn tắc, chúng ta sẽ xem xét một ví dụ cụ thể.

Giả sử X là số lượt khách du lịch quốc tế hàng ngày của một công ty du lịch, tuân theo phân phối chuẩn với giá trị trung bình 70 và phương sai 9, tức là X ~ N(70, 9) Để tính xác suất trong một ngày bất kỳ công ty có số khách du lịch quốc tế vượt quá 75, ta cần áp dụng các phương pháp thống kê phù hợp.

X theo phân phối chuẩn với giá trị trung bình và phương sai đã biết, do đó, sẽ theo phân phối chuẩn hóa với trung bình bằng 0 và phương sai bằng 1 Thay vì tìm P(X > 75), ta có thể tìm P(Z > 1.67) bằng cách tra bảng giá trị xác suất tích lũy của phân phối chuẩn hóa trong các sách thống kê.

Nếu X1, X2,…, Xn là các biến ngẫu nhiên độc lập với phân phối chuẩn tắc có trung bình bằng 0 và phương sai bằng 1, thì tổng của chúng tuân theo phân phối Chi-bình phương với n bậc tự do.

Phân phối Chi bình phương với các bậc tự do khác nhau

Tính chất của phân phối

1 Khác với phân phối chuẩn, phân phối chỉ có giá trị dương từ 0 đến vô cùng

2 Phân phối là một phân phối nghiêng, độ nghiêng của phân phối phụ thuộc vào số bậc tự do Khi bậc tự do thấp, phân phối bị nghiêng trái, nhưng khi bậc tự do tăng lên, phân phối sẽ đối xứng và tiến dần về phân phối chuẩn.

3 Giá trị trung bình của một biến ngẫu nhiên theo phân phối Chi bình phương là k và phương sai là 2k (k là số bậc tự do) Đây là một tính chất đáng chú ý của phõn phối Chi bỡnh phương vỡ phương sai gấp đụi giỏ trị trung bỡnh (à = k và σ 2

Tổng của hai biến có phân phối sẽ cũng có phân phối với số bậc tự do bằng tổng các bậc tự do của chúng Phân phối này thường được áp dụng trong phân tích kinh tế lượng, đặc biệt cho các biến ngẫu nhiên dạng bình phương, như trong kiểm định phương sai của hạn nhiễu và các kiểm định phần dư sử dụng phương trình hồi quy.

Nếu x~N(0,1) và là độc lập thống kê thì

Nghĩa là Z tuân theo phân phối Student hay nói gọn là phân phối t với k= n-1 bậc tự do

Tính chất của phân phối t

1.Vậy, t là phân phối của một biến chuẩn tắc chia cho căn thức của giá trị trung bình của một biến theo phân phối Chi bình phương.

2 Giống như phân phối chuẩn tắc, phân phối t có giá trị trung bình , nhưng phương sai là (với n là số bậc tự do)

3 Phân phối t đối xứng giống như phân phối chuẩn nhưng đẹp hơn và có đuôi dài hơn Và khi k  +, Z tiệm cận đến phân phối chuẩn tắc Trong thực hành, khi bậc tự do lớn hơn 30 người ta thay phân phối t bằng phân phối chuẩn tắc

Nếu và là độc lập thống kê thì:

X tuân theo theo phân phối F với bậc tự do Và khi  + thì phân phối F dần tiến về phân phối chuẩn

Như vậy, F là phân phối của tỷ số của giá trị trung bình của hai biến theo phân phối Chi bình phương

Phân phối F với các bậc tự do khác nhau

Tính chất của phân phối F f(t)

1 Phân phối F lệch về bên trái, khi bậc tự do và đủ lớn, phân phối F tiến đến phân phối chuẩn.

2 với điều kiện và với điều kiện

3 Bình phương của một phân phối t với n bậc tự do là một phân phối F với 1 và n bậc tự do

4 Nếu bậc tự do mẫu khá lớn thì

Phân phối F đóng vai trò quan trọng trong kinh tế lượng, đặc biệt khi thực hiện phân tích phương sai (ANOVA) và kiểm định các biến theo tỷ số giữa các phương sai Các kiểm định như kiểm định giả thiết đồng thời, kiểm định Wald và kiểm định Chow đều dựa vào phân phối F để đưa ra kết luận chính xác.

Khi bậc tự do đủ lớn, các phân phối Chi-squares, phân phối t và phân phối F sẽ tiến gần đến phân phối chuẩn Những phân phối này được xem là có liên quan đến phân phối chuẩn.

2.3.5 Ước lượng và sự lấy mẫu

Một mô hình kinh tế

Để giới thiệu về mô hình hồi quy, chúng ta sẽ đi từ mô hình đơn giản nhất, nhưng quan trọng.

Chúng ta nghiên cứu mối quan hệ giữa thu nhập và chi tiêu của hộ gia đình bằng cách chọn ngẫu nhiên các hộ trong một địa phương Mục tiêu là khảo sát những hộ gia đình có chi tiêu khoảng $1000/tháng Trong nghiên cứu này, chúng ta phỏng vấn một số hộ với câu hỏi “Tháng trước, chi tiêu của gia đình anh/chị là bao nhiêu?” Y được định nghĩa là số tiền chi tiêu hàng tháng, là một biến ngẫu nhiên liên tục với hàm phân phối xác suất khác nhau giữa các hộ, phụ thuộc vào nhiều yếu tố như độ tuổi và thói quen ăn uống.

Với Y là tiền chi tiêu hằng tháng; và X là thu nhập hằng tháng.

Theo lý thuyết kinh tế, chi tiêu cho một hàng hóa phụ thuộc vào thu nhập của người tiêu dùng Trong mối quan hệ này, thu nhập (Y) được coi là biến phụ thuộc, trong khi hàng hóa (X) là biến độc lập Mối quan hệ giữa thu nhập và chi tiêu có thể được biểu diễn dưới dạng hàm số.

Trong kinh tế lượng, chi tiêu Y được xem là biến ngẫu nhiên, và chúng ta thu thập dữ liệu để nghiên cứu mối quan hệ giữa chi tiêu và thu nhập X (Y=f(X)) Tuy nhiên, hình thức của hàm này vẫn chưa được xác định rõ Để đơn giản hóa, chúng ta ký hiệu chi tiêu của hộ gia đình trong một tháng là Y, phụ thuộc vào thu nhập X Trong nhiều tài liệu kinh tế, phương trình tiêu dùng và thu nhập thường được mô tả bằng mối quan hệ tuyến tính, và chúng ta giả định rằng mô hình sử dụng để thể hiện mối quan hệ này cũng tương tự.

Phương trình hồi quy giản đơn, được ký hiệu là (3.1), bao gồm hai tham số chưa biết là β1 và β2, tương ứng với hệ số chặn và hệ số góc Tham số β1 biểu thị chi tiêu trung bình của hộ gia đình khi thu nhập bằng 0, trong khi β2 cho thấy sự thay đổi của chi tiêu trung bình khi thu nhập tăng thêm 1 đô la.

Mô hình kinh tế lượng

3.2.1 Mô hình hồi quy 2 biến

Mô hình miêu tả hành vi kinh tế thể hiện mối quan hệ giữa chi tiêu (Y) và thu nhập (X), cho phép dự đoán chi tiêu nếu biết thu nhập Tuy nhiên, thực tế cho thấy chi tiêu còn chịu ảnh hưởng từ nhiều yếu tố khác như tuổi tác, sở thích, nghề nghiệp, giới tính, số con trong gia đình, tôn giáo và các yếu tố ngẫu nhiên như bệnh tật hay thời tiết Do đó, cần điều chỉnh phương trình để phản ánh đúng thực tế.

Trong đó thể hiện cho tất cả các yếu tố khác có ảnh hưởng đến chi tiêu cho ngoài thu nhập.

Mô hình hồi quy tuyến tính hai biến được thể hiện qua phương trình (3.2), trong đó biến Y (chi tiêu) là biến phụ thuộc và biến X (thu nhập) là biến độc lập Mô hình này minh họa mối quan hệ phụ thuộc giữa chi tiêu và thu nhập.

X và Y là hai biến số thể hiện một tổng thể nào đó).

Như vậy mô hình hồi quy hai biến bao gồm những thành phần sau:

Biến phụ thuộc: (Y) hay còn được gọi là biến được giải thích (explained variable), là biến số mà ta đang quan tâm đến giá trị của nó.

Biến độc lập (X) là biến số có ảnh hưởng đến biến phụ thuộc, thường được gọi là biến giải thích hoặc biến điều khiển Những biến này có giá trị quan sát được, ví dụ như thu nhập của người dân.

Các hệ số hồi quy: (β1; β2)

β1 là hệ số chặn, chính là giá trị trung bình của biến phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0.

Hệ số góc β2 thể hiện mối quan hệ giữa biến độc lập và giá trị trung bình của biến phụ thuộc Cụ thể, khi β2 > 0, nếu biến độc lập X tăng (hoặc giảm) một đơn vị, giá trị trung bình của biến phụ thuộc Y sẽ tăng (hoặc giảm) β2 đơn vị Lưu ý rằng β2 cũng có thể có giá trị âm.

Sai số ngẫu nhiên là đại lượng phản ánh các yếu tố ảnh hưởng đến Y ngoài X, thường được gọi là sai số ngẫu nhiên không quan sát được Sai số này phát sinh do nhiều nguyên nhân khác nhau.

Bỏ sót biến giải thích: chúng ta có thể biết một cách chính xác biến giải thích

X là biến độc lập và Y là biến phụ thuộc Tuy nhiên, chúng ta chưa xác định rõ ràng các biến khác có ảnh hưởng đến Y Do đó, X được sử dụng như một yếu tố đại diện cho tất cả các biến không được đưa vào mô hình.

Vì sai số trong quá trình thu thập số liệu cần thiết

Khi thực hiện phân tích hồi quy, việc thiếu sót các số liệu cần thiết là một vấn đề nghiêm trọng Dù đã xác định được các biến bị loại khỏi mô hình và hình thức của mô hình hồi quy, nhưng nếu không thể thu thập dữ liệu cho những biến này, quá trình phân tích sẽ gặp khó khăn.

Ngoài các biến giải thích đã có trong mô hình còn có một số tác động khác đến biến phụ thuộc Y nhưng chúng ta không thể tiên đoán được.

Do đó, để hàm hồi quy có ý nghĩa, cần đưa ra giả thiết cho thành phần này là: tại mỗi giá trị của X thì kỳ vọng của u bằng 0:

3.2.2 Mô hình hồi quy tổng thể (Population regression function- PRF)

Mô hình hồi quy tổng thể là mô hình được xây dựng dựa trên số liệu của tất cả các đối tượng cần nghiên cứu

Mô hình hồi quy tổng thể có dạng như sau:

Ta có thể xây dựng mô hình hồi quy tổng thể ngẫu nhiên

 là giá trị thực tế cụ thể của biến phụ thuộc ứng với quan sát thứ i

 là giá trị thực tế cụ thể của biến độc lập ứng với quan sát thứ i

 là hệ số chặn, là tung độ gốc, là giá trị của Y khi X nhận giá trị bằng 0.

 là hệ số góc, là độc dốc của đường hồi quy, cho biết mức thay đổi của Y khi X thay đổi 1 đơn vị

 là sai số ngẫu nhiên ứng với quan sát thứ i

Nếu PRF chỉ có một biến độc lập, nó được gọi là hàm hồi quy đơn Ngược lại, khi PRF có hai biến độc lập trở lên, nó được gọi là hàm hồi quy bội Trong trường hợp này, các hệ số hồi quy β1 và β2 được xem là các tham số của tổng thể.

Để sử dụng các ứng dụng của mô hình hồi quy, cần xác định các hệ số hồi quy tổng thể β1 và β2 Tuy nhiên, do không thể thu thập số liệu cho toàn bộ tổng thể, giá trị của các hệ số này chỉ có thể được ước lượng thông qua số liệu mẫu Điều này dẫn đến khái niệm hồi quy mẫu, sẽ được trình bày trong phần tiếp theo.

3.2.3 Mô hình hồi quy mẫu (Sample regression function- SRF)

Giả sử có một mẫu ngẫu nhiên kích thước n bao gồm các quan sát của biến Y và X Từ mẫu này, chúng ta xây dựng các ước lượng cho các hệ số hồi quy tổng thể β1 và β2, được ký hiệu tương ứng Mô hình hồi quy mẫu sẽ ứng với từng quan sát trong dữ liệu.

Ký hiệu mũ trên đầu biểu thị giá trị ước lượng từ mẫu, không phản ánh giá trị thực của tổng thể Các hệ số hồi quy mẫu, hay còn gọi là hệ số ước lượng, là những ước lượng cho các hệ số tổng thể β1 và β2 Điều này cho phép ta ước lượng giá trị Y dựa trên biến X Bằng cách sử dụng dữ liệu từ một mẫu ngẫu nhiên, chúng ta có thể xây dựng mô hình hồi quy mẫu ngẫu nhiên.

Với là sai số trong mẫu, là ước lượng của

Ví dụ 3.2: Bảng sau đây cho số liệu về mức chi tiêu (Y- USD/tháng) và thu nhập hàng tháng (X- USD/tháng) của một mẫu gồm 10 hộ gia đình.

Các giá trị trong bảng số liệu thể hiện mức chi tiêu hàng tháng (USD) của từng hộ gia đình, tương ứng với mức thu nhập được nêu ở dòng dưới.

Mối quan hệ giữa mức thu nhập và chi tiêu trung bình của mẫu trên có thể được thể hiện qua hàm hồi quy, với mức thu nhập là 2 USD/tháng.

Với các giá trị β1; β2 ta có thể đưa ra các kết luận như sau :

Khi thu nhập bằng 0 thì chi tiêu trung bình là $234/ tháng ; và khi thu nhập tăng lên $10 thì chi tiêu là $239/ tháng,…

Nếu thu nhập của hộ gia đình tăng thêm 1 đô la mỗi tháng, thì chi tiêu trung bình sẽ tăng khoảng 0,5152 đô la mỗi tháng Điều này cho thấy sự ảnh hưởng của thu nhập đến mức chi tiêu của các hộ gia đình.

Khi thu nhập tăng lên, chi tiêu cũng có xu hướng tăng, nhưng mức tăng chi tiêu thường thấp hơn so với mức tăng thu nhập Cụ thể, khi thu nhập tăng 1$, chi tiêu chỉ tăng 0.5$ Điều này phản ánh đúng kỳ vọng trong lý thuyết kinh tế về mối quan hệ giữa thu nhập và chi tiêu.

3.2.4 Tính tuyến tính trong mô hình hồi quy

Ước lượng các tham số của mô hình hồi quy theo phương pháp bình phương nhỏ nhất (Ordinary Least Squares – OLS)

ô hình hồi quy theo phương pháp bình phương nhỏ nhất (Ordinary Least Squares – OLS)

Phương pháp ước lượng bình phương nhỏ nhất (OLS) được Gauss giới thiệu vào cuối thế kỷ 18 và hiện nay vẫn là phương pháp phổ biến nhất trong các mô hình hồi quy tuyến tính, mặc dù đã có nhiều phương pháp ước lượng mới được phát triển Để hiểu rõ hơn về OLS, chúng ta sẽ xem xét mô hình hồi quy tổng thể.

Việc thu thập dữ liệu từ toàn bộ tổng thể là rất khó khăn, vì vậy để ước lượng các tham số β1 và β2, chúng ta cần áp dụng phương pháp sử dụng dữ liệu mẫu Giả sử từ tổng thể, chúng ta có một mẫu ngẫu nhiên với kích thước n, bao gồm các quan sát của hai đại lượng, được ký hiệu là {(x, y)}.

Với lần lượt là các ước lượng cần tìm β1 và β2 với thông tin mẫu trên, khi đó ta có hàm hồi quy mẫu:

Gọi sai lệch giữa giá trị thực tế và giá trị ước lượng tương ứng từ hàm hồi quy mẫu là phần dư (residuals), ký hiệu là :

Chúng ta có thể minh hoạ hàm hồi quy mẫu và phần dư như trong hình vẽ dưới đây:

Phương pháp OLS (Phương pháp bình phương tối thiểu) giúp xác định đường thẳng gần nhất với các quan sát bằng cách tối thiểu hóa khoảng cách giữa đường thẳng và các điểm dữ liệu Mục tiêu là tìm ra các giá trị sao cho sai lệch tổng hợp giữa giá trị thực tế và giá trị ước lượng từ hàm hồi quy là nhỏ nhất.

Sai lệch tổng hợp này được định nghĩa là tổng bình phương các phần dư:

Như vậy phương pháp OLS chủ trương xác định bằng cách giải bài toán cực trị sau đây :

Hay Điều kiện để phương trình trên đạt cực trị là:

Hệ phương trình trên tương đương với:

Giải hệ ta thu được: Đặt ; ( là trung bình mẫu của X và Y)

Các mẫu khác nhau sẽ cho ra các giá trị khác nhau, hay còn gọi là các biến ngẫu nhiên Cần phân biệt rõ ràng giữa các biến ngẫu nhiên này và các hệ số tổng thể, vì hệ số tổng thể là các tham số có giá trị duy nhất cho mỗi tổng thể.

Ví dụ 3.3: Dựa trên số liệu trong ví dụ 3.2 về chi tiêu và thu nhập, chúng ta có thể ước lượng tham số tổng thể β1 và β2 Độ co giãn thu nhập là chỉ tiêu quan trọng để đánh giá sự thay đổi của chi tiêu khi thu nhập biến động Trong mối quan hệ tuyến tính, độ co giãn được tính toán theo công thức cụ thể.

Trong mô hình kinh tế 2 biến, ta có độ co giãn

Như vậy độ co giãn của chi tiêu trung bình đối với thu nhập là:

Ví dụ 3.4: Từ ví dụ 3.3 ta có độ co giãn tại điểm trung bình như sau:

Từ ví dụ 3.3 ta có: và Độ co giãn:

Một nghiên cứu cho thấy rằng việc tăng 1% thu nhập hàng tháng sẽ dẫn đến sự gia tăng 0.78% trong chi tiêu hàng tháng Nếu độ co giãn của chi tiêu nhỏ hơn 1, hàng hóa được coi là hàng hóa thiết yếu; ngược lại, nếu độ co giãn lớn hơn 1, hàng hóa sẽ được xem là hàng hóa xa xỉ.

Các kết quả ước lượng từ các mẫu khác nhau trong cùng một tổng thể có thể biến động lớn, dẫn đến sự khác biệt đáng kể với các hệ số hồi quy tổng thể.

Để đảm bảo rằng các ước lượng mô hình (j=1,2) là đáng tin cậy cho các hệ số hồi quy tổng thể tương ứng, cần có các tiêu chí kiểm định và phương pháp phân tích phù hợp, thay vì chỉ dựa vào ước lượng đơn giản.

Như vậy câu hỏi đặt ra ở đây là:

 Khi nào thì (j=1,2) là các ước lượng đáng tin cậy cho các giá trị chưa biết

Nếu các ước lượng (j=1,2) được coi là đáng tin cậy, thì mức độ chính xác của chúng sẽ được xem xét Chúng ta sẽ cùng khám phá xem liệu các ước lượng này có hoàn toàn đáng tin hay không trong phần tiếp theo của bài học.

Các giả thiết cơ bản

Để thực hiện ước lượng các tham số theo phương pháp OLS, thì mô hình hồi quy phải thỏa các giả thiết cơ bản sau:

Giả thiết 1 đề xuất rằng mối quan hệ giữa Y và X là tuyến tính, trong đó biến giải thích không mang tính ngẫu nhiên, tức là các giá trị của chúng đã được xác định trước.

Giả thiết 2 cho rằng sai số ui là biến ngẫu nhiên có trung bình bằng 0, tức là kỳ vọng của nó Hình ảnh minh họa dưới đây thể hiện rõ ràng khái niệm này về mặt hình học.

Giả thiết 3: Sai số ui có phương sai không đổi (phương sai thuần nhất) với mọi i

Giả thiết 4: Không có tự tương quan giữa các ui Hai sai số ui và uj bất kỳ độc lập với nhau (∀ i ≠ j)

Giả thiết 5 cho rằng các giá trị quan sát Xi là cố định và không ngẫu nhiên, điều này ngụ ý rằng không có sự tự tương quan giữa Xi và ui, tức là Cov(Xi, ui) = 0.

Giả thiết 6: Sai số ui tuân theo phân phối chuẩn

Định lý Gauss–Markov khẳng định rằng, khi các giả thiết được thỏa mãn, ước lượng được tính bằng phương pháp bình phương nhỏ nhất sẽ là ước lượng tuyến tính, không thiên lệch và có phương sai nhỏ nhất, tức là hiệu quả nhất Điều này có nghĩa là các ước lượng tuyến tính này là những ước lượng không thiên lệch tốt nhất, được gọi là BLUE.

Phương sai và hiệp phương sai của

Nếu các giả thiết của mô hình được thỏa mãn, thì các ước lượng sẽ là ước lượng không chệch Điều này có nghĩa là giá trị kỳ vọng của các ước lượng này chính là giá trị tổng thể.

Phương sai và độ lệch chuẩn:

Phuơng sai của được định nghĩa:

Phương sai là chỉ số đo lường độ phân tán của các giá trị xung quanh trung bình, cho thấy mức độ gần gũi của giá trị ước lượng với giá trị thực Khi các giả thiết được thỏa mãn, công thức tính phương sai và độ lệch chuẩn sẽ được áp dụng để xác định sự biến thiên trong dữ liệu.

 là phương sai của sai số ngẫu nhiên ui : Do là chưa biết nên dùng ước lượng của nó là

Và se: sai số chuẩn (standard error)

Phương sai của hệ số góc ước lượng phụ thuộc vào phương sai của sai số ngẫu nhiên, điều này phù hợp với trực quan thông thường Khi phương sai của biến phụ thuộc Y cao, việc đánh giá tác động của một biến độc lập lên biến phụ thuộc sẽ trở nên kém chính xác.

Độ phân tán của biến độc lập X xung quanh giá trị trung bình của nó ảnh hưởng đến khả năng thể hiện tác động của X lên Y Khi các giá trị của X càng cách xa nhau, khả năng thể hiện sự ảnh hưởng của X lên Y sẽ dễ dàng hơn, dẫn đến ước lượng chính xác hơn.

 Ước lượng Phương sai của sai số:

Trong công thức này, chúng ta sử dụng phương sai của sai số σ², là giá trị chưa biết trong mô hình hồi quy Để ước lượng phương sai của sai số, ta thực hiện tính toán dựa trên giả thiết đã được thỏa mãn và kích thước mẫu N.

Trong đó , tuy nhiên để đảm bảo tính chất không thiên lệch của mẫu nhỏ, ta chỉnh dùng công thức tính Phương sai của sai số như sau:

 Phân phối của các ước lượng:

Phân phối xác suất của các ước lượng là phân phối chuẩn

Độ phù hợp của mô hình- Hệ số xác định

Biểu đồ đường hồi quy mẫu

Biểu đồ cho thấy không có đường thẳng nào hoàn toàn phù hợp với dữ liệu, vì nhiều giá trị dự báo cách xa giá trị thực tế Để đánh giá mối quan hệ tuyến tính giữa các giá trị quan sát, cần có các chỉ tiêu toán học đo lường độ phù hợp Hệ số xác định R² được sử dụng để đo lường độ phù hợp của mô hình với dữ liệu Để hiểu rõ về R², cần xem xét một số yếu tố quan trọng.

Tổng bình phương toàn phần (TSS) là tổng bình phương của mọi sai lệch giữa giá trị thực tế của Y và giá trị trung bình của Y Nó phản ánh mức độ biến đổi của Y xung quanh giá trị trung bình mẫu, cho thấy sự phân tán của dữ liệu.

Tổng bình phương sai số (Residual Sum of Squares - RSS) là tổng bình phương của tất cả các sai lệch giữa giá trị thực tế và giá trị lý thuyết theo mô hình của Y.

Tổng bình phương hồi quy (Explained Sum of Squares - ESS) là tổng bình phương của tất cả sai lệch giữa giá trị dự đoán của Y theo mô hình và giá trị trung bình của nó Phần này phản ánh độ chính xác của hàm hồi quy.

ESS Người ta đã chứng minh được : TSS = ESS + RSS

Về mặt hình học, ta có thể minh họa bằng sơ đồ sau

R 2 = = 1 – Trong mô hình hồi quy 2 biến, người ta chứng minh được rằng

Trong mô hình hai biến có chứa hệ số chặn, R2 thể hiện tỷ lệ phần trăm sự thay đổi của biến phụ thuộc được giải thích bởi mô hình Điều này có nghĩa là R2 cho biết mức độ phù hợp của mô hình trong việc giải thích biến phụ thuộc.

Hay nói cách khác R2 phản ánh tỷ lệ mô hình phản ánh thực tế

Do RSS và TSS đều không âm và TSS=RSS+ESS Nên ta có: 0 ≤ R2 ≤ 1

Khi RSS = 0, không có sai lệch giữa giá trị quan sát và giá trị ước lượng ui = 0, cho thấy biến X và Y có mối quan hệ tuyến tính hoàn hảo, trong đó biến X giải thích 100% sự thay đổi của biến phụ thuộc Y.

Biến X và Y độc lập thống kê, cho thấy biến X không giải thích được sự thay đổi của biến Y, dẫn đến việc mô hình hồi quy không phù hợp Điều này có nghĩa là mối quan hệ giữa X và Y được thể hiện bởi mô hình hồi quy không tương thích với dữ liệu mẫu, và do đó, mô hình hồi quy tổng thể cũng không được coi là phù hợp.

 Trong mô hình hồi quy hai biến (r là hệ số tương quan mẫu)

Lưu ý rằng nếu mô hình thiếu hệ số chặn, các phát biểu trước đó có thể không còn chính xác, vì nó có thể nhận giá trị âm, dẫn đến việc mất đi ý nghĩa ban đầu.

Ví dụ 3.5: Từ số liệu ở ví dụ 3.2 về thu nhập (X) và chi tiêu (Y) ta tính được: ∑

Kết quả cho thấy biến X (thu nhập) giải thích 98.51% sự thay đổi của biến Y (chi tiêu), cho thấy mức độ phù hợp của hàm hồi quy mẫu là rất cao.

Hệ số tương quan r là số đo mức độ phụ thuộc tuyến tính giữa X và Y và được xác định bởi biểu thức:

Tính chất của hệ số tương quan:

Dấu của r phụ thuộc vào dấu của cov(X,Y) hay dấu của hệ số góc

-r > 0: giữa X và Y có quan hệ đồng biến

-r < 0: X và Y có quan hệ nghịch biến

-r→ ± 1: X và Y có quan hệ tuyến tính chặt chẽ

-r → 0: X và Y có quan hệ tuyến tính không chặt chẽ

Hệ số tương quan có tính chất đối xứng: rXY = rYX

r độc lập với gốc toạ độ và các tỷ lệ Nghĩa là: với a, c > 0, b, d là hằng số, và: và Thì : rXY = rX*Y*

Nếu hai biến X và Y độc lập theo quan điểm thống kê, thì hệ số tương quan giữa chúng sẽ bằng 0 Tuy nhiên, việc r = 0 không đồng nghĩa với việc hai biến này là độc lập.

r chỉ là đại lượng đo sự kết hợp tuyến tính hay phụ thuộc tuyến tính r không có ý nghĩa để mô tả quan hệ phi tuyến

Trong mô hình hồi quy 2 biến: (r là hệ số tương quan mẫu) Có thể chứng minh được rằng

Sử dụng mô hình hồi quy phi tuyến

Giả sử ta có một mô hình kinh tế tiên đoán mối quan hệ giữa một biến phụ thuộc

Mô hình giữa biến phụ thuộc Y và các biến độc lập X thường không chỉ ra chính xác dạng hàm của mối quan hệ giữa chúng, nhưng có thể cung cấp những ý tưởng ban đầu về khả năng tồn tại của các dạng hàm Để tìm ra dạng hàm phù hợp nhất với dữ liệu, cần dựa vào suy luận kinh tế hoặc khảo sát dữ liệu Sau đó, chúng ta tiến hành xây dựng và thử nghiệm nhiều dạng hàm khác nhau để xem chúng có mang lại kết quả tương tự hay không, và nếu không, cần xác định dạng hàm nào cho kết quả hợp lý nhất.

3.7.1 Mô hình hồi quy qua gốc tọa độ

Khi tung độ gốc bằng 0 thì mô hình trở thành mô hình hồi quy qua gốc tọa độ, khi đó hàm hồi quy như sau:

Áp dụng phương pháp OLS đới với mô hình này, ta có:

Với được ước lượng bởi

Trong mô hình này, cần lưu ý hai đặc điểm quan trọng: đầu tiên, giá trị không nhất thiết phải bằng 0; thứ hai, R² có thể bằng 0, vì vậy không nên sử dụng R² mà cần áp dụng các chỉ số khác.

Cần lưu ý rằng không thể so sánh mô hình hồi quy qua gốc tọa độ với R² Do những đặc điểm này, mô hình hồi quy qua gốc tọa độ ít được áp dụng trong thực tế.

3.7.2 Mô hình tuyến tính logarit (hàm log-log):

Cho mô hình hồi quy mũ có dạng như sau:

Bằng cách áp dụng logarit tự nhiên e đối với hai vế của hàm hồi quy, mô hình hồi quy có thể được diễn đạt dưới dạng tuyến tính theo các tham số Mô hình này thường được gọi là mô hình lôgarít-lôgarít, lôgarít kép hoặc tuyến tính lôgarít.

Nếu các giả thiết của mô hình hồi quy tuyến tính được đáp ứng, phương pháp OLS có thể được sử dụng để ước lượng các tham số của mô hình với biến phụ thuộc là và

Như vậy, hệ số của mô hình tuyến tính logarit chính là hệ số co giãn của Y đối với X ( Nghĩa là khi X tăng (giảm) 1% thì Y sẽ tăng (giảm).

Trong nghiên cứu về nhu cầu tiêu thụ cà phê, số lượng tách cà phê mà một người tiêu dùng sử dụng mỗi ngày (Y) được khảo sát cùng với giá bán lẻ thực tế trung bình (X) tính bằng USD/kg Dữ liệu thu thập được đã được phân tích qua mô hình log-log, cho thấy mối quan hệ giữa tiêu thụ và giá cả.

Bằng cách sử dụng eview cho mô hình:

Ta có kết quả hồi quy như sau:

Hệ số co giãn của nhu cầu cà phê theo giá cả là -0.25, cho thấy rằng khi giá cà phê tăng 1%, nhu cầu tiêu thụ cà phê, tính bằng số tách cà phê sử dụng trong một ngày, sẽ giảm trung bình 0,25%.

Khảo sát hàm sản xuất Cobb-Douglas:

Trong mô hình kinh tế, Y đại diện cho sản lượng, K là nhập lượng vốn, và L là nhập lượng lao động Mối quan hệ giữa các yếu tố này là phi tuyến, nhưng có thể được chuyển đổi thành dạng tuyến tính trong các tham số Mô hình này được biết đến như là mô hình lôgarít-lôgarít, lôgarít kép hoặc tuyến tính lôgarít, và nó thể hiện tính tuyến tính theo lôgarít của các biến số.

Ví dụ 3.7 : Dữ liệu về nông nghiệp Đài Loan 1957-72: t (-1.36) (4.80) (0.54)

Y là GNP tính bằng triệu đô la; K là vốn thực tính bằng triệu đô la; L là lượng lao động tính bằng triệu ngày công lao động

Độ co giãn của sản lượng theo vốn là 0,49: Giữ nhập lượng lao động không đổi, gia tăng 1% nhập lượng vốn dẫn đến gia tăng 0,49% sản lượng

 Độ co giãn của sản lượng theo lao động là 1,50: Giữ nhập lượng vốn không đổi, gia tăng 1% nhập lượng lao động dẫn đến gia tăng 1,5% sản lượng

 R2 % có nghĩa là 89% biến thiên trong lôgarít của sản lượng được giải thích bởi lôgarít của lao động và vốn

 Hiệu quả tăng theo quy mô bởi vì: 2 +3 = 1,99

Các nhà kinh tế, doanh nhân và chính phủ thường chú trọng đến tốc độ tăng trưởng của các chỉ số kinh tế quan trọng như dân số, Tổng sản phẩm quốc nội (GNP), lượng cung tiền và tỷ lệ việc làm.

Mô hình này được áp dụng khi chúng ta muốn phân tích tốc độ tăng trưởng của một biến, chẳng hạn như mối quan hệ giữa tốc độ tăng thu nhập và sự thay đổi số năm học hoặc số năm kinh nghiệm Nó cũng hữu ích để xem xét tốc độ tăng tiền gửi tiết kiệm theo thời gian gửi tiền.

Ví dụ 3.8: Giả sử chúng ta có 100 triệu VNĐ và chúng ta gửi số tiền này vào ngân hàng với lãi suất r = 8%/ năm

Vậy công thức lãi kép:

 Y0 là giá trị ban đầu của Y

 Yt là giá trị của Y vào thời điểm t

 r là tỷ lệ tăng trưởng kép của Y

Lấy lôgarít cơ số e của công thức lãi kép: Đặt β1 = lnY0; β2 = ln(1 + r) và viết lại và thêm số hạng sai số vào ta có biểu thức:

Mô hình này là một mô hình tuyến tính với các tham số, trong đó biến phụ thuộc là logarit của Y, còn biến độc lập là "thời gian" t nhận các giá trị từ 1 đến n.

Các mô hình bán logarit (semilog) chỉ có một biến xuất hiện dưới dạng logarit, với biến phụ thuộc được biểu diễn dưới dạng logarit, gọi là mô hình log-lin Ngược lại, nếu biến độc lập xuất hiện dưới dạng logarit, thì đó là mô hình lin-log Dưới đây là dạng hàm tổng quát của mô hình log-lin.

Nếu biến Y tăng 100%, thì hệ số 2 (với 2 > 0) thể hiện tốc độ tăng trưởng (%) của Y so với sự thay đổi tuyệt đối của biến t Ngược lại, nếu 2 < 0, thì 2 biểu thị tốc độ giảm sút của Y.

Hệ số độ dốc đo lường thay đổi tương đối của Y đối với sự thay đổi tuyệt đối cho trước trong giá trị của biến giải thích

Ví dụ 3.9: Lấy số liệu GPD thực của Mỹ trong giai đoạn 1972-1991

Năm RGDP Năm RGDP Năm RGDP

Ta có kết quả hồi quy sau:

Hệ số độ dốc đo lường tốc độ tăng trưởng: GDP thực tăng trưởng với tốc độ 0,0247 mỗi năm, hay 2,47 % mỗi năm

Vào đầu năm 1972, GDP thực ước tính khoảng 3022.68 tỷ đô la, được thể hiện qua công thức ln(RGDP) = 8.0139 Khi lấy e mũ lên, ta thu được giá trị RDGP.

Mô hình xu hướng tuyến tính:

Thay cho việc ước lượng mô hình trên, người ta đôi khi ước lượng mô hình sau:

Mô hình hồi quy Y theo thời gian, được biết đến với tên gọi "mô hình xu hướng tuyến tính", sử dụng biến thời gian t làm biến xu hướng Nếu giá trị của t dương, thì Y có xu hướng tăng lên; ngược lại, nếu t âm, Y sẽ có xu hướng giảm xuống.

Ví dụ 3.10: Với số liệu cho ở ví dụ trước (3.9), đặt Y là RGDP, ta có kết quả hồi quy sau:

Mô hình này được giải thích như sau: trong giai đoạn 1972-1991, trung bình GDP thực của Mỹ tăng với mức độ tuyệt đối 97,68tỷ USD/năm.

Mô hình lin-log cho biết sự thay đổi tuyệt đối của Y khi X thay đổi 1% Ta có dạng hàm tổng quát:

Sử dụng vi phân ta có

Như vậy, nếu X thay đổi 0,01 (hay 1%), thay đổi tuyệt đối của Y là 0,01(

Nă m GNP (tỉ USD) Lượng cung tiền Nă m GNP (tỉ USD) Lượng cung tiền

Từ bảng số liệu trên, hồi quy Y theo lnX ta được mô hình hồi quy:

Ước lượng khoảng

 Giả thiết 6: ui có phân phối N(0, σ 2 ) Với các giả thiết nêu trên, các ước lượng và có các tính chất sau đây :

Chúng là các ước lượng không chệch

Có phương sai cực tiểu

Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ với giá trị thực của phân phối

 từ tính chất này suy ra:

 từ tính chất này suy ra:

Với các tính chất trên chúng ta có thể tìm khoảng tin cậy và kiểm định giả thiết về các tham số hồi quy

Độ tin cậy của ước lượng điểm mà chúng ta đã xác định ở phần trước rất quan trọng, vì trong thực tế, ước lượng này có thể khác biệt so với giá trị thực Trong thống kê, độ tin cậy của ước lượng điểm được đánh giá thông qua sai số chuẩn Do đó, thay vì chỉ dựa vào ước lượng điểm, chúng ta có thể tạo ra một khoảng xung quanh giá trị ước lượng này, với xác suất mà giá trị thực của tham số cần ước lượng nằm trong khoảng đó là 1-α.

Vì là đại lượng ngẫu nhiên nên khoảng là khoảng ngẫu nhiên ;

 được gọi là hệ số tin cậy (hay độ tin cậy) ;

α (0 < α < 1) được gọi là mức ý nghĩa

Ɛ là độ chính xác của ước lượng, (Ɛ > 0)

Khoảng tin cậy được xác định bằng cách xây dựng nhiều lần với hệ số tin cậy, và nếu tính trung bình, sẽ có một tỷ lệ phần trăm nhất định các khoảng này chứa giá trị đúng của tham số cần ước lượng.

Cần lưu ý là, khi ta có số liệu của một mẫu cụ thể, ta có thể tính được giá trị của từ đó tính được giá trị của và

Phân phối Student và khoảng tin cậy của :

Ta có ước lượng tuân theo quy luật phân phối chuẩn đưa về dạng chính tắc như sau:

Tuy nhiên, do được ước lượng bằng Vì vậy đại lượng ngẫu nhiên

Để tính khoảng tin cậy cho các tham số (j=1,2) theo quy luật phân phối Student với bậc tự do là (n-2), công thức chung được áp dụng là dựa trên độ tin cậy 1-α hoặc mức ý nghĩa α.

Với ; và có được khi tra bảng t-Student với bậc tự do (n-2), mức ý nghĩa Hoặc ta có thể sử dụng hàm “TINV” trong excel để tìm giá trị của

Kiểm định giả thuyết

Kiểm định giả thuyết thống kê là quá trình xác định xem kết quả từ dữ liệu thực tế có phù hợp với giả thuyết đã đề ra hay không Điều này có nghĩa là cần đánh giá mức độ sát thực của dữ liệu với giá trị giả thuyết, từ đó quyết định có bác bỏ giả thuyết hay không.

Trong mô hình chi tiêu cá nhân dựa trên thu nhập, nếu chúng ta tin rằng hệ số góc β2 = 0,8 dựa vào lý thuyết hoặc kinh nghiệm trước đó, cần kiểm tra xem giá trị quan sát từ mẫu có phù hợp với giả thuyết này hay không Nếu phù hợp, giả thuyết sẽ được giữ nguyên; nếu không, chúng ta sẽ bác bỏ giả thuyết đã nêu.

Ta có hai thành phần chính trong kiểm định giả thuyết.

Giả thuyết cơ bản, hay còn gọi là giả thiết không-null (H0), đề cập đến một tham số cụ thể trong mô hình, với H0: βj = βj* Để xác nhận giả thuyết H0, chúng ta cần sử dụng số liệu thống kê; nếu không chứng minh được H0 đúng, chúng ta sẽ phải bác bỏ giả thuyết này.

 Giả thuyết đối: H1, là giả thuyết ngược lại với giả thuyết H0, ví dụ với giả thuyết H0: βj = βj*, thì có 3 trường hợp cho H1: H1: βj > βj*, H1: βj < βj* hoặc H1: βj βj*.

Vùng từ chối cho giả thuyết thay thế

 Giả thiết hai phía: H0: βj = βj* độ tin cậy 1-α

 Giả thiết phía phải: H0: βj βj* độ tin cậy 1-α

 Giả thiết phía trái: H0: βj βj* độ tin cậy 1-α

3.10.2 Vùng từ chối cho giả thuyết thay thế theo các phương pháp kiểm định.

Với giả thuyết về hệ số hồi quy như sau:

Với độ tin cậy (1-α), ta có 3 cách kiểm định giả thuyết nêu trên

Cách 1: Phương pháp giá trị tới hạn (kiểm định t)

Nếu : không thể bác bỏ (chấp nhận )

Ngoài ra, nếu ta có giả thuyết phía phải hoặc giả thuyết phía trái, ta có thể áp dụng quy tắc quyết định sau:

Kiểm định phía phải với giả thuyết phía phải ( H 1 : β j β j * )

Kiểm định phía trái với giả thuyết phía trái ( H 1 : β j β j * )

 Cách 2: Phương pháp khoảng tin cậy

Giả sử ta tìm được khoảng tin cậy của là

Với mức ý nghĩa  trùng với mức ý nghĩa của gỉa thiết H0

 Nếu: không thể bác bỏ H0

 Cách 3: Kiểm định bằng P-Value:

 Tính giá trị tới hạn

 Tính khả năng giả thiết H0 bị bác bỏ

Trong các kết quả kiểm định sử dụng phần mềm thống kê, giá trị p-value, hay còn gọi là giá trị xác suất của kiểm định, đóng vai trò quan trọng trong việc đưa ra kết luận cho kiểm định giả thuyết Dựa vào giá trị này, chúng ta có thể xác định tính hợp lệ của giả thuyết đã được đưa ra.

 Nếu p > α: không thể bác bỏ H0.

3.10.3 Kiểm định sự phù hợp của mô hình- phương pháp kiểm định F

Các kiểm định cho phép đánh giá tính phù hợp của các tham số ước lượng với giả thuyết đã đặt ra Tuy nhiên, chúng không cung cấp cái nhìn toàn diện về việc mô hình hồi quy có thực sự phù hợp hay không, tức là liệu biến độc lập có thể giải thích sự thay đổi của biến phụ thuộc hay không.

Thay vì kiểm định tham số hồi quy, chúng ta có thể kiểm định giả thuyết về mức độ phù hợp của mô hình bằng cách kiểm tra giả thuyết H0: R² = 0 với mức ý nghĩa α Quy trình thực hiện kiểm định này sẽ giúp đánh giá độ tin cậy của mô hình hồi quy.

Kiểm định tham số kết hợp tuyến tính

Ngoài việc kiểm định giá trị cụ thể, chúng ta còn có thể kiểm tra xem liệu có sự kết hợp tuyến tính với các tham số khác hay không Trong nhiều trường hợp, việc xác định sự kết hợp tuyến tính giữa các tham số là cần thiết để hiểu rõ hơn về mối quan hệ giữa chúng.

Khi các giả thiết của mô hình hồi quy được thỏa mãn ta có:

Do đó ta tính giá trị kiểm định

Từ đây ta có thể dùng giá trị kiểm định để đưa ra quyết định thống kê.

Vấn đề dự báo

Hàm hồi quy không chỉ được xây dựng và đánh giá các hệ số mà còn có thể được sử dụng để dự báo Có hai loại dự báo chính: dự báo giá trị trung bình có điều kiện của Y, ký hiệu là E(Y|X = X0), và dự báo giá trị cá biệt của Y tại X = X0.

Giả sử cho trước giá trị X = X0, ta dự báo giá trị trung bình và giá trị cá biệt của

Y với độ tin cậy (1-) là:

 Dự báo giá trị trung bình của Y, với E(Y/X 0 )=

Với X = X0, hàm hồi quy mẫu cho ước lượng điểm của E(Y/X0).

Ước lượng điểm không chệch và phương sai nhỏ nhất của E(Y/X0) có sự khác biệt so với giá trị thực Phân bố chuẩn của nó có kỳ vọng toán là β1 + β2 X0 và phương sai tương ứng.

Nhưng σ 2 chưa biết, nên ta sử dụng ước lượng không chệch của σ 2 là 2 , khi đó t = ~ T(n-2)

Do đó khoảng tin cậy của E( Y/ X0 ) với độ tin cậy (1- α) là:

 Dự báo giá trị riêng biệt.

Nếu chúng ta muốn dự báo giá trị riêng biệt Y = Y0 với X = X0 , khi đó ước lượng không chệch của Y0 là 0 = 1 + 2 X0 và Var ( Y0 -) = 2 [1++]

Trình bày kết quả hồi quy

Kết quả phân tích hồi quy thường được trình bày bằng phương trình ước lượng, kèm theo các trị thống kê t dưới mỗi hệ số hồi quy, ví dụ như: t (1,404) (7,14).

Bậc tự do (df: Degree Free)

Một phương pháp khác để trình bày kết quả hồi quy là điền các sai số chuẩn dưới các hệ số hồi quy Tuy nhiên, với sự phát triển của các phần mềm máy tính hiện nay, người dùng có thể dễ dàng trình bày kết quả hồi quy thông qua việc in các bảng tính từ các phần mềm tính toán.

Thang đo

Việc sử dụng các đơn vị đo lường khác nhau, như tấn/ha so với kg/ha, sẽ làm thay đổi giá trị của các biến số, cụ thể là giá trị sẽ giảm đi 1000 lần khi chuyển đổi từ kg/ha sang tấn/ha Điều này đặt ra câu hỏi về ảnh hưởng của các đơn vị đo lường khác nhau đến kết quả ước lượng và phân tích hồi quy.

Khi thay đổi đơn vị của biến phụ thuộc Y, chẳng hạn như khi đơn vị tính giá cả của Y tăng 1000 lần từ USD sang ngàn USD, giá trị của biến Y sẽ giảm đi 1000 lần.

(1) Hàm hồi quy tính theo đơn vị cũ USD:

(2) Hàm hồi quy tính theo đơn vị mới- ngàn USD:

Có thay vào (2) ta có

Kết luận: Việc thay đổi đơn vị tính ảnh hưởng đến các hệ số ước lượng và sai số chuẩn của chúng Trong ví dụ nêu trên, hệ số ước lượng giảm 1000 lần, trong khi R2 vẫn không thay đổi Tương tự, cần thực hiện việc thay đổi đơn vị cho các biến khác.

Trong hàm hồi quy hai biến, việc thay đổi đơn vị tính của X và Y không yêu cầu phải thực hiện hồi quy lại Thay vào đó, chỉ cần áp dụng công thức để chuyển đổi đơn vị tính là đủ.

(*) Hàm hồi quy tính theo đơn vị cũ:

(**) Hàm hồi quy tính theo đơn vị mới:

Ngày đăng: 15/12/2021, 15:13

HÌNH ẢNH LIÊN QUAN

Bảng mật độ xác suất của biến ngẫu nhiên rời rạc X - Giáo trình kinh tế lượng
Bảng m ật độ xác suất của biến ngẫu nhiên rời rạc X (Trang 23)
Bảng phân phối đồng mật độ xác xuất của X và Y. - Giáo trình kinh tế lượng
Bảng ph ân phối đồng mật độ xác xuất của X và Y (Trang 25)
Bảng trên cho thấy trong 200 ngày có 30 ngày đại lý bán được 4 máy tính và 4 máy in, có 2 ngày bán được 4 máy tính nhưng không bán được máy in nào - Giáo trình kinh tế lượng
Bảng tr ên cho thấy trong 200 ngày có 30 ngày đại lý bán được 4 máy tính và 4 máy in, có 2 ngày bán được 4 máy tính nhưng không bán được máy in nào (Trang 25)
Ví dụ 3.2: Bảng sau đây cho số liệu về mức chi tiêu (Y- USD/tháng) và thu - Giáo trình kinh tế lượng
d ụ 3.2: Bảng sau đây cho số liệu về mức chi tiêu (Y- USD/tháng) và thu (Trang 42)
Ví dụ 4.1: Bảng dưới đây cho các số liệu về doanh số bán (Y) ; chi phí chào - Giáo trình kinh tế lượng
d ụ 4.1: Bảng dưới đây cho các số liệu về doanh số bán (Y) ; chi phí chào (Trang 68)
Hình c: đa cộng tuyến cao        Hình d: Đa cộng tuyến rất cao - Giáo trình kinh tế lượng
Hình c đa cộng tuyến cao Hình d: Đa cộng tuyến rất cao (Trang 100)
Hình a : Phương sai không đổi        Hình b : Phương sai thay đổi (tăng dần) - Giáo trình kinh tế lượng
Hình a Phương sai không đổi Hình b : Phương sai thay đổi (tăng dần) (Trang 113)
Đồ thị  nhận biết hiện tượng HET - Giáo trình kinh tế lượng
th ị nhận biết hiện tượng HET (Trang 117)
Đồ thị của phần dư đối với biến giải thích X. Quan sát đồ thị chúng ta thấy sai số có liên hệ tuyến tính với biến giải thích hoặc bằng cách nào đó ta có thể tin tưởng như vậy thì mô hình gốc sẽ được biến đổi bằng cách: chia cả hai vế của mô hình gốc cho - Giáo trình kinh tế lượng
th ị của phần dư đối với biến giải thích X. Quan sát đồ thị chúng ta thấy sai số có liên hệ tuyến tính với biến giải thích hoặc bằng cách nào đó ta có thể tin tưởng như vậy thì mô hình gốc sẽ được biến đổi bằng cách: chia cả hai vế của mô hình gốc cho (Trang 126)
Đồ thị theo thời gian  Đồ thị giữa ( - Giáo trình kinh tế lượng
th ị theo thời gian Đồ thị giữa ( (Trang 133)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w