Giới thiệu về kinh tế lượng
Kinh tế lượng, hay còn gọi là "Econometrics" trong tiếng Anh, là một lĩnh vực nghiên cứu kết hợp giữa kinh tế và thống kê Từ "Econo" có nghĩa là kinh tế, trong khi "Metrics" có nghĩa là đo lường Do đó, kinh tế lượng có thể được hiểu là quá trình đo lường và phân tích các hiện tượng kinh tế.
Lý thuyết kinh tế phát biểu hay nêu lên bản chất của các mối quan hệ kinh tế dưới góc độ định tính
Lý thuyết kinh tế vĩ mô chỉ ra rằng lượng cầu của hàng hóa có mối quan hệ nghịch biến với giá, tức là khi giá tăng, lượng cầu giảm và ngược lại Tuy nhiên, lý thuyết này không cung cấp thông tin định lượng cụ thể về mức độ thay đổi Do đó, nhiệm vụ của kinh tế lượng là xác định chính xác mức độ thay đổi của lượng cầu khi giá biến động.
Nhìn chung, kinh tế lượng quan tâm đến: i Ước lượng các mối quan hệ kinh tế
Đo lường mức độ tác động của việc hạ lãi suất lên tăng trưởng kinh tế
Quảng cáo và khuyến mãi đóng vai trò quan trọng trong việc tăng doanh số của công ty, giúp thu hút khách hàng và tạo sự nhận diện thương hiệu Việc phân tích tác động của các chiến lược này cho phép doanh nghiệp điều chỉnh và tối ưu hóa các hoạt động tiếp thị Đồng thời, việc đối chiếu lý thuyết kinh tế với thực tế sẽ giúp kiểm định các giả thuyết liên quan đến hành vi tiêu dùng, từ đó đưa ra những dự báo chính xác hơn về xu hướng thị trường Sự kết hợp giữa lý thuyết và thực tiễn không chỉ giúp cải thiện hiệu quả kinh doanh mà còn nâng cao khả năng cạnh tranh của công ty.
Kiểm định giả thiết về tác động của chương trình khuyến nông làm tăng năng suất lúa
Có sự phân biệt đối xử về mức lương giữa nam và nữ hay không? iii Dự báo các hành vi của các biến số kinh tế
Dự báo chỉ số VN Index hoặc giá của một loại cổ phiếu
Chính phủ dự báo mức thâm hụt ngân sách, thâm hụt thương mại, lạm phát
Phương pháp luận của kinh tế lượng
Theo phương pháp luận truyền thống, còn gọi là phương pháp luận cổ điển, một nghiên cứu sử dụng kinh tế lượng bao gồm các bước như sau:
1 Phát biểu lý thuyết hoặc giả thiết
Vấn đề nghiên cứu có thể nảy sinh từ thực tiễn hoặc từ lý thuyết kinh tế Các giả thuyết nghiên cứu thường được hình thành dựa trên kinh nghiệm thực tế hoặc kết quả của những nghiên cứu trước đó.
2 trước đó Kết quả của bước này là ta phải xác định được các biến kinh tế và các mối quan hệ giữa các biến đó
Khảo sát lý thuyết về thu nhập và tiêu dùng của Keynes cho thấy rằng tiêu dùng tăng khi thu nhập tăng, nhưng mức tăng của tiêu dùng không tương xứng với mức tăng của thu nhập Dựa trên lý thuyết này, chúng ta xác định hai biến số kinh tế quan trọng là thu nhập và tiêu dùng, với giả thuyết rằng tiêu dùng phụ thuộc vào thu nhập Mục tiêu là ước lượng sự thay đổi của tiêu dùng khi thu nhập thay đổi một đơn vị.
Để xác định đặc trưng của mô hình toán kinh tế cho lý thuyết hoặc giả thiết, bước đầu tiên là xác định mối quan hệ giữa các biến mà không cần chỉ ra dạng cụ thể Tiếp theo, cần chỉ ra dạng hàm của mối quan hệ này Theo lý thuyết thu nhập – tiêu dùng của Keynes, nhà toán kinh tế có thể đề xuất một dạng hàm đơn giản, trong đó X được định nghĩa là thu nhập, đóng vai trò là biến độc lập hoặc biến giải thích.
Y là chi tiêu tiêu dùng (biến phụ thuộc)
X và Y có mối quan hệ tuyến tính như sau: Y 1 2 X
3 Xác định đặc trưng của mô hình kinh tế lượng cho lý thuyết hoặc giả thiết
Mô hình toán học cho thấy mỗi giá trị của X chỉ tương ứng với một giá trị Y duy nhất, tạo thành mối quan hệ hàm số xác định Tuy nhiên, trong thực tế, cùng một mức thu nhập X có thể dẫn đến nhiều mức chi tiêu Y khác nhau Điều này xảy ra vì chi tiêu không chỉ phụ thuộc vào thu nhập mà còn bị ảnh hưởng bởi các yếu tố như độ tuổi, giới tính, tình trạng gia đình và thói quen tiêu dùng.
Do đó, đối với nhà kinh tế lượng mô hình phải như sau: Y 1 2 X U
U là sai số ngẫu nhiên, hay còn gọi là số hạng nhiễu, đại diện cho các yếu tố tác động đến tiêu dùng mà không được xem xét rõ ràng Nó phản ánh ảnh hưởng của các biến độc lập khác nhau đến hành vi tiêu dùng.
Để xác định các tham số 1 và 2, chúng ta cần thu thập dữ liệu và áp dụng các phương pháp thống kê nhằm khám phá bản chất của mối quan hệ giữa các đại lượng Theo nguyên lý thống kê, việc thu thập toàn bộ dữ liệu thực tế là không khả thi.
Nghiên cứu thường gặp khó khăn do tốn nhiều thời gian, công sức và tiền bạc Để tiết kiệm nguồn lực, các nhà nghiên cứu thường chọn một mẫu ngẫu nhiên từ tổng thể để phân tích một tính chất hoặc mối quan hệ nào đó.
5 Ước lượng tham số của mô hình kinh tế lượng
Dựa vào số liệu được điều tra, ta thực hiện ước lượng các tham số 1 , 2 , của mô hình kinh tế lượng theo một trong hai phương pháp sau đây:
Phương pháp bình phương nhỏ nhất (OLS)
Phương pháp hợp lý tối đa (ML)
Kiểm định giả thiết nhắm tới hai vấn đề sau:
Xác định mức độ phù hợp về mặt lý thuyết của mô hình.
Xác định dạng mô hình và chuẩn đoán dấu hiệu có thể vi phạm các giả thiết cổ điển của mô hình.
Trong mô hình thu nhập – tiêu dùng của Keynes, để thể hiện mối quan hệ đồng biến giữa thu nhập và tiêu dùng, hệ số 2 cần có giá trị lớn hơn 0 Tuy nhiên, do mức tăng tiêu dùng không bằng mức tăng thu nhập, nên hệ số này phải nhỏ hơn 1.
Khi mô hình được xác nhận phù hợp với lý thuyết, nó sẽ được áp dụng, chủ yếu để dự báo Đối với giá trị đã cho X = 0, cần tính giá trị trung bình E(Y|X=0) hoặc giá trị cụ thể Y0.
8 Sử dụng mô hình để quyết định chính sách
Giả sử ta chấp nhận mô hình trên, vậy:
Với giá trị 2 ước lượng được ta có thể đánh giá mức tăng của chi tiêu nhanh hay chậm tùy theo mức tăng của thu nhập
Giả sử chính phủ xác định mức chi tiêu Y 0 sẽ duy trì tỷ lệ thất nghiệp ở mức p% mỗi năm Để đạt được mức chi tiêu này, thu nhập cần đảm bảo đạt mục tiêu là 0 0 1.
Số liệu trong kinh tế lượng
Số liệu trong phân tích hồi quy có thể thu thập từ hai nguồn: số liệu điều tra thực tế và số liệu thử nghiệm
Nghiên cứu được thực hiện dựa trên các điều kiện kiểm soát nhằm phân tích ảnh hưởng của việc tự học đến kết quả học tập của sinh viên tại trường đại học Sài Gòn Chúng tôi khảo sát các sinh viên ở nhiều khoa khác nhau để thu thập dữ liệu chính xác và đa dạng.
Số liệu thực tế như giá vàng, tỷ lệ thất nghiệp và giá bất động sản không thể bị kiểm soát bởi các nhà nghiên cứu Việc phân tích ảnh hưởng của một yếu tố đến biến phụ thuộc trở nên khó khăn do không thể kiểm soát hành vi của các yếu tố khác.
Số liệu có thể chia thành ba loại: a) Số liệu thời gian: là số liệu điều tra từ một thực thể ứng với các thời điểm khác nhau
Ví dụ 1 Ta có số liệu thống kê về số sản phẩm của doanh nghiệp X qua các năm cho bởi bảng sau:
15000 15500 15800 16000 16500 17000 b) Số liệu không gian: là số liệu điều tra từ các thực thể khác nhau tại cùng một thời điểm
Dưới đây là số liệu thống kê doanh số bán hàng hàng tháng (USD/tháng) của các cửa hàng trong cùng một doanh nghiệp, được trình bày trong bảng dưới đây.
Doanh số bán hàng happham
1000 2000 3000 4000 c) Số liệu hỗn hợp: là sự kết hợp của hai số liệu trên tại nhiều thời điểm và nhiều thực thể
Ví dụ 3 Có số liệu về tình hình sản xuất của doanh nghiệp A trong 4 tháng đầu năm 2015 như sau:
Thời gian (tháng) Chỉ tiêu
1.Doanh số bán ra (trđ) 2.Số CN ngày đầu tháng 3.% hoàn thành kế hoạch doanh số bán ra
Phân tích hồi quy
Phân tích hồi quy là phương pháp xác định mối quan hệ giữa biến phụ thuộc và một hoặc nhiều biến độc lập, nhằm ước lượng hoặc dự đoán giá trị trung bình của biến phụ thuộc dựa trên giá trị của biến độc lập.
Biến phụ thuộc: biến được giải thích, biến dự báo, biến hồi quy, biến phản ứng, biến nội sinh
Biến độc lập: biến giải thích, biến dự báo, biến hồi quy, biến tác nhân hay kiểm soát, biến ngoại sinh
Trong mô hình hồi quy, biến độc lập là biến xác định không ngẫu nhiên, trong khi biến phụ thuộc là biến ngẫu nhiên với phân phối xác suất Điều này có nghĩa là với mỗi giá trị của biến độc lập, biến phụ thuộc có thể nhận nhiều giá trị khác nhau, nhưng các giá trị này tuân theo một quy luật phân phối xác suất nhất định, thường là quy luật phân phối chuẩn.
1.4.2 Hàm hồi quy tổng thể PRF ( Population Regression Fuction )
Hàm hồi quy tổng thể là hàm hồi quy được xây dựng trên kết quả nghiên cứu khảo sát của tổng thể
Khảo sát chi tiêu và thu nhập của 60 hộ gia đình trong một khu vực nhỏ của nước Mỹ được sử dụng làm ví dụ minh họa cho khái niệm nghiên cứu tổng thể Dựa trên giả thiết rằng khu vực này đại diện cho tổng thể nghiên cứu, bảng số liệu thu thập được sẽ cung cấp cái nhìn sâu sắc về thói quen chi tiêu và mức thu nhập của các hộ gia đình trong khu vực đó.
X: là thu nhập hằng tuần của các hộ gia đình, tính bằng USD
Y: mức chi tiêu trong tuần tính bằng USD
Thu nhập của các hộ gia đình được phân chia thành 10 nhóm, với mức thấp nhất là 80 USD/tuần và mức cao nhất là 260 USD/tuần Mặc dù cùng một mức thu nhập có thể dẫn đến nhiều mức chi tiêu khác nhau, nhưng chúng ta vẫn có thể xác định chi tiêu trung bình cho các hộ gia đình có cùng thu nhập.
Mức chi tiêu trung bình của các gia đình có cùng mức thu nhập X = 80 USD/ tuần:
Tương tự, ta tính được E Y X( | 2 ), , ( |E Y X 10 ) , ta được bảng sau:
Biểu diễn các điểm ( , )X Y i j và ( , ( | ))X E Y X i i i lên hệ trục tọa độ ta được:
Hàm E Y X( | ) i được biểu diễn dưới dạng E Y X( | ) i f X( ) i là hàm hồi quy tổng thể xác định (PRF), cho thấy sự thay đổi giá trị trung bình của Y khi biến độc lập X i nhận các giá trị khác nhau.
E Y X : trung bình của Y với điều kiện X nhận giá trị X i
( ) : i f X là một hàm nào đó của biến độc lập X
Hàm hồi quy tổng thể cho biết giá trị trung bình của biến phụ thuộc Y sẽ thay đổi như thế nào khi biến X nhận các giá trị khác nhau
Nếu PRF có một biến độc lập thì gọi là hàm hồi quy đơn (hồi quy hai biến)
Nếu PRF có từ hai biến độc lập trở lên thì gọi là hàm hồi quy bội (hồi quy đa biến)
Có nhiều dạng khác nhau của f X( ) i , ví dụ: 1 2 X i , 1 2 X i 3 X i 2 , 1 2 lnX i ,
Để xác định dạng của PRF, cần dựa trên lý thuyết kinh tế và đồ thị phân tán thể hiện sự biến thiên của các số liệu quan sát X và Y Tuy nhiên, việc kiểm định tính thích hợp của dạng hàm hồi quy là điều cần thiết.
Ta xét trường hợp đơn giản nhất là PRF có dạng tuyến tính theo tham số 1 , 2 :
Y i : giá trị quan sát thứ i của biến phụ thuộc Y
U i : sai số ngẫu nhiên, nghĩa là xét chêch lệch giữa Y i và E Y X( | ) i , U Y E Y X i i ( | ) i
: tham số chưa biết nhưng cố định và được gọi là hệ số hồi quy
U là đại lượng ngẫu nhiên có thể nhận giá trị âm hoặc dương, thể hiện ảnh hưởng của các yếu tố không được đưa vào mô hình đối với biến phụ thuộc Ngoài thu nhập, nhiều yếu tố khác như hoàn cảnh gia đình, tuổi tác, sở thích và giới tính cũng ảnh hưởng đến chỉ tiêu Sự tồn tại của sai số ngẫu nhiên là điều không thể tránh khỏi trong nghiên cứu này.
Có nhiều yếu tố ảnh hưởng đến Y mà có thể không được nhận diện đầy đủ hoặc thiếu dữ liệu cụ thể Chẳng hạn, sở thích cá nhân có tác động đến chi tiêu, nhưng việc chuyển đổi những yếu tố này thành số liệu cụ thể vẫn là một thách thức.
Không thể đưa tất cả các yếu tố vào mô hình vì làm mô hình phức tạp hơn.
Sai số đo lường trong khi thu nhập số liệu.
Thông thường, ta chỉ chọn một hoặc vài yếu tố quan trọng có ảnh hưởng đến biến phụ thuộc đưa vào mô hình.
1.4.3 Hàm hồi quy mẫu SRF (Sample Regression Fuction)
Trong thực tế, việc khảo sát toàn bộ tổng thể thường không khả thi, do đó, chúng ta chỉ có thể ước lượng giá trị trung bình của biến phụ thuộc dựa trên dữ liệu từ mẫu Hàm hồi quy được phát triển từ mẫu này được gọi là hàm hồi quy mẫu (SRF).
Hàm hồi quy mẫu có thể được biểu diễn theo hàm hồi quy tổng thể, bao gồm hai dạng: dạng xác định và dạng ngẫu nhiên Chẳng hạn, nếu hàm hồi quy tổng thể (PRF) là: i i.
E Y X( | ) 1 2 X hay Y E Y X i ( | ) i U i 1 2 X U i i thì hàm hồi quy mẫu tương ứng là:
𝑌̂ 𝑖 : là ước lượng điểm của E Y X( | ) i
𝛽̂ 1 , 𝛽̂ 2 : là ước lượng điểm của 1 , 2
𝑈̂ 𝑖 : là ước lượng điểm của U i và được gọi là phần dư
Mỗi mẫu dữ liệu tương ứng với một đường hồi quy mẫu (SRF) cụ thể, và mục tiêu là tìm ra SRF gần gũi với đường hồi quy tổng thể (PRF) Điều này có nghĩa là chúng ta cần xác định các hệ số hồi quy 𝛽̂ 1 và 𝛽̂ 2 sao cho gần với các giá trị thực tế 1 và 2 Vấn đề này sẽ được giải quyết trong chương 2.
1.4.4 Phân biệt các loại quan hệ
Quan hệ thống kê Quan hệ hàm số Ứng với mỗi giá trị của biến độc lập có thể có nhiều giá trị khác nhau của biến phụ thuộc
Với mức thu nhập 5 triệu đồng mỗi tháng, người tiêu dùng có thể có nhiều mức chi tiêu khác nhau Mỗi giá trị của biến độc lập sẽ tương ứng với một giá trị duy nhất của biến thụ thuộc, cho thấy mối quan hệ chặt chẽ giữa thu nhập và chi tiêu.
, ứng với mỗi giá trị bán kính khác nhau ta tìm được duy nhất một giá trị diện tích hình tròn
Quan hệ nhân quả Phân tích hồi quy
X và Y được coi là có mối quan hệ nhân quả khi X là nguyên nhân dẫn đến kết quả Y, và ngược lại, nếu có kết quả Y thì có thể suy luận rằng nguyên nhân là X Trong mối quan hệ này, X đóng vai trò là biến độc lập, trong khi Y là biến phụ thuộc.
năng suất trồng trọt cao & thời tiết tốt Vậy thời tiết tốt (X) năng suất trồng trọt cao (Y)
Phân tích hồi quy bao hàm quan hệ thống kê và không nhất thiết phải bao hàm quan hệ nhân quả
tiêu dùng phụ thuộc vào thu nhập nhưng thu nhập không hẳn khiến người ta tiêu dùng
Phân tích hồi quy là phương pháp đo lường mối liên kết tuyến tính giữa hai biến, trong đó không có sự phân biệt về vai trò giữa các biến Điều này cho thấy tất cả các biến đều có tầm quan trọng như nhau trong việc xác định mối quan hệ giữa chúng.
Nghiên cứu mối liên hệ giữa việc hút thuốc và ung thư phổi cho thấy rằng sự gia tăng số người mắc bệnh ung thư phổi có thể liên quan trực tiếp đến tỷ lệ người hút thuốc Điều này cho thấy rằng nếu số ca ung thư phổi tăng lên, thì số người hút thuốc cũng có khả năng gia tăng tương ứng.
Vai trò giữa biến độc lập và biến phụ thuộc phải được xác định rõ ràng
Hồi quy hai biến 2.1 Ước lượng tham số hồi quy bằng phương pháp OLS
Các tính chất của hệ số hồi quy
Các ước lượng không chệch 𝛽̂ 1 và 𝛽̂ 2 được xác định bằng phương pháp OLS có những đặc điểm quan trọng: đầu tiên, chúng được xác định một cách duy nhất cho mỗi mẫu được chọn; thứ hai, 𝛽̂ 1 và 𝛽̂ 2 là các đại lượng ngẫu nhiên và giá trị của chúng sẽ khác nhau tùy thuộc vào các mẫu khác nhau Để đánh giá mức độ biến động của 𝛽̂ 1 và 𝛽̂ 2, ta sử dụng công thức để xác định phương sai và sai số chuẩn của các tham số ước lượng.
Phương sai của tổng thể, ký hiệu là \( \sigma^2 = var(U_i | X_i) \), thường không được biết rõ trong thực tế Để đo lường độ chính xác của mô hình hồi quy, sai số chuẩn của đường hồi quy \( \hat{\sigma} \) được tính bằng độ lệch chuẩn của các giá trị Y xung quanh đường hồi quy mẫu, với công thức \( \hat{\sigma} = \sqrt{\hat{\sigma}^2} \).
2 đã biết 2 chưa biết, thay 2 bởi ước lượng không chệch của nó là 𝜎̂ 2 = 𝑅𝑆𝑆
Ước lượng khoảng tin cậy cho và
a) Ước lượng khoảng tin cậy cho 1 , 2
Giả thiết: Có cỡ mẫu n, có 𝜎̂ 2 , có độ tin cậy (hoặc mức ý nghĩa với 1)
Mục tiêu: Cần tìm ( , ) ( , )a b , c d sao cho 𝛽 1 ∈ (𝑎, 𝑏), 𝛽 2 ∈ (𝑐, 𝑑)
RSS = TSS – ESS (Tính TSS và tính ESS)
Bước 6 𝛽̂ 1 − 𝜀 ≤ 𝛽 1 ≤ 𝛽̂ 1 + 𝜀 𝛽̂ 2 − 𝜀 ≤ 𝛽 2 ≤ 𝛽̂ 2 + 𝜀 Ở bước 5 phải tra bảng phân phối t-student với (n-2) bậc tự do
1 Ước lượng khoảng tin cậy tối đa (hay khoảng tin cậy trái): từ bước 1 đến bước 4 không thay đổi
2 Ước lượng khoảng tin cậy tối thiểu (hay khoảng tin cậy phải) : từ bước 1 đến bước 4 không thay đổi
𝑖 − 𝜀; +∞) ( 1,2)i b) Ước lượng khoảng tin cậy cho 2
Giả thiết: Có cỡ mẫu n, có 𝜎̂ 2 , có độ tin cậy (hoặc mức ý nghĩa với 1)
Mục tiêu: Cần tìm ( , )a b sao cho 𝜎 2 ∈ (𝑎, 𝑏)
Bước 1: Tính RSS (Tính TSS, ESS, RSS = TSS – ESS)
bằng cách tra bảng phân phối Chi – square với (n-2) bậc tự do
3 Ước lượng khoảng tin cậy tối đa (hay khoảng tin cậy trái): bước 1 không thay đổi
4 Ước lượng khoảng tin cậy tối thiểu (hay khoảng tin cậy phải) : bước 1 không thay đổi
Kiểm định giả thiết
Trong thực tế ta thường gặp phải các vấn đề sau:
Kiểm tra tính chính xác và độ tin cậy của thông tin từ các nguồn cung cấp như cá nhân, báo chí hoặc tổ chức là rất quan trọng Việc xác minh này giúp đảm bảo rằng chúng ta tiếp nhận thông tin đúng đắn và có cơ sở, từ đó nâng cao khả năng phân tích và ra quyết định.
- Kiểm tra kết quả tìm được từ một số liệu thực tế có phù hợp với một giả thiết nào đó nêu ra hay không
Kiểm định giả thiết thống kê bao gồm việc xây dựng cặp giả thiết đối lập H0 và H1 để thực hiện quá trình kiểm định.
Cách đặt giả thiết thống kê: gọi là tham số thực tế cần kiểm định, có thể là 1 , , 2 2
Khi đặt giả thiết tham số thực tế ( , , ) 1 0 2 0 0 2 luôn đặt ở vế trái, tham số có sẵn từ giả thiết
Giả thiết H 0 luôn luôn được đặt như sau: H 0 : 0 ( 0 : là giá trị số cho trước)
Giả thiết H 1 được đặt trái với H 0 o Kiểm định phải: H 1 : 0 ( nằm bên phải 0 ) o Kiểm định trái: H 1 : 0 ( nằm bên trái 0 )
2.5.1 Kiểm định giả thiết về các hệ số hồi quy a) Phương pháp khoảng tin cậy
- Tìm khoảng tin cậy cho i
- Nếu i 0 thuộc khoảng tin cậy của i thì ta chấp nhận H 0 , ngược lại ta bác bỏ H 0
Để kiểm định hệ số hồi quy, chúng ta nên áp dụng phương pháp khoảng tin cậy khi đã xác định được khoảng tin cậy của các hệ số này và thực hiện kiểm định với mức ý nghĩa α nhất quán.
24 b) Phương pháp giá trị tới hạn (t-test)
Bước 3:Tìm giá trị tới hạn
Kiểm định trái (“MBB nằm ở bên trái”) Kiểm định phải (“MBB nằm ở bên phải”) c) Phương pháp p-value
Thông thường giá trị p-value sẽ được cung cấp bởi phần mềm ứng dụng Nếu sử dụng phần mềm Eview giá trị p-value chính là Prob
- Kiểm định hai phía: p-value 𝐹 0 ) = 0.6175 > 0.01 nên ta chấp nhận giả thiết H 0 với mức ý nghĩa là 1% v Kiểm định phương sai không thay đổi
Phương sai không thay đổi là một giả thiết quan trọng trong phương pháp OLS của mô hình hồi quy cổ điển Để kiểm tra tính ổn định của phương sai, các phương pháp phổ biến như kiểm định Breusch-Pagan và kiểm định White thường được áp dụng.
Các kiểm định này đều được các phần mềm thông kê cài đặt
Để kiểm định tổng thể nghiên cứu có phương sai đồng nhất hay không với mức ý nghĩa 5%, từ mẫu dữ liệu ở Ví dụ 1, ta có thể áp dụng phương pháp kiểm định Breusch-Pagan.
Bước 1: Đặt giả thiết H 0 : var u X X 1 , , , 2 X k 2 hay ( H 0 : phương sai đồng nhất)
H 1 : var u X X 1 , , , 2 X k 2 hay (H 1 : phương sai thay đổi)
Khi phân tích kết quả từ phần mềm, nếu giá trị p của thống kê F và thống kê LM (Obs*R-squared) đều nhỏ hơn mức ý nghĩa α, chúng ta sẽ bác bỏ giả thuyết H0 Ngược lại, nếu giá trị p của một trong hai thống kê này lớn hơn mức α, chúng ta sẽ chấp nhận giả thuyết H0.
Heteroskedasticity Test: Breusch-Pagan-Godfrey
Obs*R-squared 4.800000 Prob Chi-Square(2) 0.0907 Scaled explained SS 0.223214 Prob Chi-Square(2) 0.8944
Do 0.1012 > 0.05 và 0.0907 > 0.05 nên chấp nhận giả thiết H 0 nghĩa là phương sai tổng thể không thay đổi với mức ý nghĩa là 5% b) Kiểm Định White
Kiểm định White thay thế giả thiết phương sai không đổi bằng giả thiết rằng bình phương của sai số U² không có mối tương quan với các biến độc lập Xᵢ, bình phương của Xᵢ và các biến độc lập tương tác XᵢXⱼ.
Trong mô hình hồi quy với k-1 biến độc lập, chúng ta tiến hành phân tích hồi quy cho sai số U mà không xem xét sự tương tác giữa các biến độc lập.
Bước 1: Đặt giả thiết H 0 : 2 3 2 1 k 0 hay (H 0 : phương sai đồng nhất)
H 1 : có ít nhất hệ số i 0 ( i2, ,2k1) hay (H 1 : phương sai thay đổi)
Bước 2: Dựa vào bảng kết quả của phần mềm, nếu giá trị p của thống kê LM (Obs*R-squared) nhỏ hơn mức ý nghĩa α, chúng ta sẽ bác bỏ giả thuyết H0 Ngược lại, nếu giá trị p lớn hơn α, giả thuyết H0 sẽ được chấp nhận.
Trong mô hình hồi quy ba biến, khi thực hiện phân tích cho sai số U mà không xem xét tích chéo giữa các biến độc lập, ta có thể thu được những kết quả quan trọng Việc này giúp làm rõ mối quan hệ giữa các biến và đánh giá ảnh hưởng của chúng trong mô hình.
Obs*R-squared 5.969097 Prob Chi-Square(2) 0.0506 Scaled explained SS 0.277581 Prob Chi-Square(2) 0.8704
H 1 : có ít nhất một hệ số i 0 ( i2, ,5)
Do 0.0506 > 0.05 nên chấp nhận giả thiết H 0 nghĩa là phương sai tổng thể không thay đổi với mức ý nghĩa là 5%
Ví dụ 2 Ta có số liệu của một mẫu gồm 8 quan sát được cho như sau: i i i
Y i (tấn/tháng): lượng hàng bán được của một loại hàng
X 2 i (triệu đồng/tháng): là thu nhập của người tiêu dùng
X 3 i (ngàn đồng/kg): là giá bán của mặt hàng này
Giả sử E Y X X( | 2 i , 3 i )có mối liên hệ tuyến tính với các biến X 2 i và X 3 i
Để xây dựng hàm hồi quy mẫu 𝑌̂ 𝑖 = 𝛽̂ 1 + 𝛽̂ 2 𝑋 2𝑖 + 𝛽̂ 3 𝑋 3𝑖 + 𝑈̂ 𝑖, cần xác định ý nghĩa của các hệ số hồi quy 𝛽̂ 2 và 𝛽̂ 3 Tiến hành tính toán TSS, ESS và RSS, đồng thời tìm ma trận hệ số tương quan Xác định hệ số xác định và hệ số xác định có điều chỉnh cho mô hình hồi quy này Tính toán ma trận hiệp phương sai và ước lượng khoảng tin cậy cho 𝛽 3 với độ tin cậy 99%, cũng như khoảng tin cậy cho phương sai nhiễu với độ tin cậy 95% Kiểm tra tính ý nghĩa thống kê của hệ số 𝛽̂ 3 với mức ý nghĩa 1% và xác định sự cần thiết của biến giá bán X 3 trong mô hình hồi quy giữa lượng hàng bán được (Y) và thu nhập của người tiêu dùng (X 2) với mức ý nghĩa 1% Thực hiện kiểm định giả thuyết H 0: σ 2 = 0.5 và H 1: σ 2 ≠ 0.5 với mức ý nghĩa 2%, đồng thời kiểm định sự phù hợp của mô hình SRF với mức ý nghĩa 5%.
Khi giá bán của mặt hàng không thay đổi, thì lượng hàng bán được trung bình sẽ thay đổi theo thu nhập của người tiêu dùng, với điều kiện các yếu tố khác vẫn giữ nguyên.
Hồi quy với biến giả 4.1 Hồi quy với biến giả
Kỹ thuật sử dụng biến giả
4.2.1 Mô hình với biến định tính
Trong nghiên cứu này, chúng ta khảo sát mối quan hệ giữa thu nhập của giáo viên và số năm giảng dạy của họ Biến phụ thuộc Y đại diện cho thu nhập, trong khi biến độc lập X thể hiện số năm giảng dạy, được coi là biến định lượng Để phân tích dữ liệu, chúng ta áp dụng mô hình hồi quy tuyến tính với công thức 𝑌̂ 𝑖 = 𝛽̂ 1 + 𝛽̂ 2 𝑋 𝑖, nhằm xác định ảnh hưởng của số năm giảng dạy đến thu nhập của giáo viên.
Khi nghiên cứu sự chênh lệch thu nhập giữa các giáo viên với trình độ khác nhau, cần xem xét ảnh hưởng của trình độ đến thu nhập Điều này yêu cầu bổ sung biến giả Z_i vào mô hình, trong đó i đại diện cho cử nhân.
Ta có các trường hợp sau:
Giáo viên có trình độ cử nhân và thạc sĩ có mức thu nhập khởi điểm khác nhau, tuy nhiên, tốc độ tăng thu nhập của họ theo số năm giảng dạy lại tương đương.
- Trường hợp 2: Thu nhập khởi điểm là như nhau nhưng tốc độ tăng thu nhập là khác nhau
- Trường hợp 3: Thu nhập khởi điểm là khác nhau và tốc độ tăng thu nhập cũng khác nhau
Ta có thể sử dụng biến giả tương ứng với từng tình huống như sau: a) Trường hợp 1: Dịch chuyển số hạng tung độ gốc Đặt 𝛽̂ 1 = 𝛼̂ 0 + 𝛼̂ 1 𝑍 𝑖
Phương trình hồi quy SRF tổng quát có dạng: 𝑌̂ 𝑖 = 𝛼̂ 0 + 𝛼̂ 1 𝑍 𝑖 + 𝛽̂ 2 𝑋 𝑖
SRF ứng với giáo viên có trình độ cử nhân (Z i 0): 𝑌̂ 𝑖 = 𝛼̂ 0 + 𝛽̂ 2 𝑋 𝑖
Nghiên cứu này xem xét ảnh hưởng của trình độ học vấn, cụ thể là đối với giáo viên có trình độ thạc sĩ, đến thu nhập của họ Mô hình được sử dụng là 𝑌̂ 𝑖 = 𝛼̂ 0 + 𝛼̂ 1 + 𝛽̂ 2 𝑋 𝑖 Để xác định xem trình độ học vấn có thực sự tác động đến thu nhập của giáo viên hay không, chúng ta sẽ tiến hành kiểm định giả thuyết liên quan.
b) Trường hợp 2: Dịch chuyển số hạng độ dốc Đặt 𝛽̂ 2 = 𝛼̂ 0 + 𝛼̂ 1 𝑍 𝑖
Phương trình hồi quy SRF tổng quát có dạng: 𝑌̂ 𝑖 = 𝛽̂ 1 + (𝛼̂ 0 + 𝛼̂ 1 𝑍 𝑖 )𝑋 𝑖 = 𝛽̂ 1 + 𝛼̂ 0 𝑋 𝑖 + 𝛼̂ 1 (𝑍 𝑖 𝑋 𝑖 ) SRF ứng với giáo viên có trình độ cử nhân (Z i 0): 𝑌̂ 𝑖 = 𝛽̂ 1 + 𝛼̂ 0 𝑋 𝑖
SRF ứng với giáo viên có trình độ thạc sĩ (Z i 1): 𝑌̂ 𝑖 = 𝛽̂ 1 + 𝛼̂ 0 𝑋 𝑖 + 𝛼̂ 1 𝑋 𝑖 = 𝛽̂ 1 + (𝛼̂ 0 + 𝛼̂ 1 )𝑋 𝑖
Để xác định xem trình độ học vấn có ảnh hưởng đến thu nhập của giáo viên hay không, chúng ta tiến hành kiểm định giả thuyết liên quan đến vấn đề này.
c) Trường hợp 3: Dịch chuyển cả số hạng độ dốc và tung độ gốc Đặt 𝛽̂ 1 = 𝛼̂ 0 + 𝛼̂ 1 𝑍 𝑖
Phương trình hồi quy SRF tổng quát có dạng: 𝑌̂ 𝑖 = 𝛼̂ 0 + 𝛼̂ 1 𝑍 𝑖 + (𝛾̂ 0 + 𝛾̂ 1 𝑍 𝑖 )𝑋 𝑖 = 𝛼̂ 0 + 𝛼̂ 1 𝑍 𝑖 +
SRF ứng với giáo viên có trình độ cử nhân (Z i 0): 𝑌̂ 𝑖 = 𝛼̂ 0 + 𝛾̂ 0 𝑋 𝑖
Mô hình SRF cho giáo viên có trình độ thạc sĩ được biểu diễn bởi phương trình 𝑌̂ 𝑖 = 𝛼̂ 0 + 𝛼̂ 1 + (𝛾̂ 0 + 𝛾̂ 1 )𝑋 𝑖 Để đánh giá ảnh hưởng của trình độ học vấn đến thu nhập của giáo viên, chúng ta sẽ sử dụng kiểm định Wald nhằm kiểm tra giả thuyết liên quan.
Trong thực tế, chúng ta không thể xác định trước trường hợp cụ thể của bài toán Vì vậy, cần phải xem xét lần lượt ba mô hình khác nhau và lựa chọn mô hình phù hợp nhất cho tình huống đó.
Trong trường hợp thứ 3, ta có thể kiểm định giả thiết H0: α1 = γ1 = 0 Nếu chấp nhận H0, điều này cho thấy trình độ học vấn không ảnh hưởng đến thu nhập của giáo viên, và chúng ta có thể áp dụng mô hình hồi quy Y theo X Ngược lại, nếu bác bỏ H0, cần kiểm định riêng từng hệ số để xác định sự khác biệt về thu nhập, xem xét ở tung độ gốc hay độ dốc Nếu chấp nhận H0: α1 = 0, nghĩa là không có sự khác biệt ở tung độ gốc; nếu chấp nhận H0: γ1 = 0, nghĩa là không có sự khác biệt ở độ dốc.
4.2.2 So sánh cấu trúc của mô hình hồi quy
Để kiểm tra sự khác biệt giữa hai phương trình hồi quy, cần xem xét cả hệ số góc và tung độ gốc, vì nếu các phương trình có hệ số góc khác nhau mà không kiểm định tung độ gốc thì kết quả sẽ không có ý nghĩa Do đó, cần áp dụng một phương pháp tổng quát để xác định sự khác biệt giữa các hàm hồi quy thành phần.
Ví dụ 2 Giả sử ta có mẫu thống kê như sau:
Trong đó: Y là chi tiêu của một hộ gia đình (triệu đồng/tháng)
X là thu nhập của hộ gia đình (triệu đồng/tháng)
Z là khu vực sinh sống của hộ, 𝑧 = {1, 𝑛ế𝑢 ℎộ ở 𝑣ù𝑛𝑔 𝑛𝑔𝑜ạ𝑖 𝑡ℎà𝑛ℎ
Hãy thực hiện so sánh hồi quy chi tiêu theo thu nhập của hộ gia đình ở vùng ngoại thành với hộ ở vùng nội thành
Ta xét phương trình hồi quy SRF tổng quát ở trường hợp 3 như sau:
𝑌̂ 𝑖 = 𝛼̂ 0 + 𝛼̂ 1 𝑍 𝑖 + 𝛾̂ 0 𝑋 𝑖 + 𝛾̂ 1 𝑍 𝑖 𝑋 𝑖 SRF ứng với giáo viên có trình độ cử nhân (Z i 0): 𝑌̂ 𝑖 = 𝛼̂ 0 + 𝛾̂ 0 𝑋 𝑖
SRF ứng với giáo viên có trình độ thạc sĩ (Z i 1): 𝑌̂ 𝑖 = 𝛼̂ 0 + 𝛼̂ 1 + (𝛾̂ 0 + 𝛾̂ 1 )𝑋 𝑖
Ta thực hiện các kiểm định như sau:
Kiểm định 2 hồi quy có tung độ gốc giống nhau hay không
Kiểm định 2 hồi quy có hệ số góc giống nhau hay không
Ta có thể gặp các kết luận sau đây:
- Nếu chấp nhận H 0 : 1 0 và chấp nhận H 0 : 1 0 thì hai mô hình hồi quy hoàn toàn giống nhau
- Nếu bác bỏ H 0 : 1 0 và chấp nhận H 0 : 1 0 thì hai mô hình hồi quy song song
- Nếu chấp nhận H 0 : 1 0 và bác bỏ H 0 : 1 0 thì hai mô hình hồi quy đồng quy trên trục tung
- Nếu bác bỏ H 0 : 1 0 và bác bỏ H 0 : 1 0 thì hai mô hình hoàn toàn khác nhau.
Ta có bảng kết quả chạy Eview như sau:
Dependent Variable: Y Method: Least Squares Date: 11/01/17 Time: 20:56 Sample: 1 10
Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.993693 S.D dependent var 8.705043 S.E of regression 0.691300 Akaike info criterion 2.388690 Sum squared resid 2.867378 Schwarz criterion 2.509724 Log likelihood -7.943450 Hannan-Quinn criter 2.255916 F-statistic 473.6959 Durbin-Watson stat 1.329616 Prob(F-statistic) 0.000000
Ta có: xét biến giả Z, p value 0,9898 0,05 nên ta chấp nhận H 0 : 1 0 xét biến tương tác X Z* , p value 0,4133 0,05 nên ta chấp nhận H 0 : 1 0
Hai mô hình hồi quy này cho thấy rằng mối quan hệ giữa chi tiêu và thu nhập của hộ gia đình ở vùng ngoại thành tương tự như ở vùng nội thành.
4.2.3 Hồi quy tuyến tính từng khúc
Khi hàm hồi quy có sự thay đổi cấu trúc theo từng khoảng giá trị của biến độc lập, ta có thể áp dụng hàm hồi quy tuyến tính từng khúc để biểu diễn các cấu trúc khác nhau Ví dụ, trong khảo sát mức chi trả hoa hồng theo doanh thu của một doanh nghiệp, hoa hồng sẽ thay đổi khi doanh thu vượt ngưỡng X* Khi đó, ta có thể sử dụng hàm hồi quy tuyến tính từng khúc để mô tả tốc độ tăng hoa hồng, với độ dốc của đường hồi quy thay đổi tại ngưỡng X* Biến giả được sử dụng để biểu diễn hàm hồi quy tuyến tính từng khúc một cách hiệu quả.
Khi đó, hàm hồi quy tuyến tính từng khúc được biểu diễn dưới dạng:
𝐸(𝑌|𝑋, 𝑍 𝑖 = 0) = 𝛽̂ + 𝛽̂ 1 2 𝑋 𝑖 : hoa hồng trung bình khi doanh thu nhỏ hơn X *
𝐸(𝑌|𝑋, 𝑍 𝑖 = 0) = 𝛽̂ + 𝛽̂ 1 2 𝑋 𝑖 + 𝛽̂ 3 (𝑋 𝑖 − 𝑋 ∗ ): hoa hồng trung bình khi doanh thu lớn hơn X *
Trong bài tập chương 4, đề thi HK2 2015-2016 DTN, một số chuyên gia nhận định rằng mức lương của người lao động trong ngành dệt may không chỉ phụ thuộc vào số năm kinh nghiệm mà còn bị ảnh hưởng bởi giới tính (Nam và Nữ) cũng như vị trí địa lý của nhà máy (Bắc, Trung, Nam) Để phân tích mối quan hệ này, cần đề xuất một mô hình hồi quy nhằm so sánh mức lương giữa Nam và Nữ, cũng như giữa các miền Bắc, Nam và Trung Ý nghĩa của các hệ số trong mô hình sẽ giúp hiểu rõ hơn về sự khác biệt lương giữa các nhóm đối tượng và vị trí địa lý.
Bài 2 (Đề thi HK2 2016-1017 DKE) Người ta cho rằng chi tiêu cho mặt hàng A (Y: ngàn đồng/tháng) không chỉ phụ thuộc vào thu nhập của người tiêu dùng (X: triệu đồng/tháng) mà còn phụ thuộc vào giới tính của người đó (D1 nếu là nam; D0 nếu là nữ) Với số liệu của một mẫu có kích thước n10 người ta đã ước lượng mô hình sau:
Hệ số hồi quy R² = 0,957 cho thấy mô hình hồi quy giải thích 95,7% biến động của dữ liệu Các hệ số hồi quy cung cấp thông tin về mối quan hệ giữa biến độc lập và biến phụ thuộc Hệ số xác định mô hình có hiệu chỉnh cho thấy độ chính xác của mô hình Với mức ý nghĩa 5%, cần kiểm tra xem chi tiêu cho loại hàng A của nam và nữ có sự khác biệt hay không.
Bài 3 (Đề thi HK2 2016-2017 DTN)
Bảng số liệu dưới đây thể hiện kết quả thu thập dữ liệu về thu nhập của người tiêu dùng (X: triệu đồng/năm) và số tiền chi tiêu cho mặt hàng A (Y: triệu đồng/năm).
Với số liệu ở trên ta thêm vào biến Z(Z1 nếu là nam, Z 0 nếu là nữ), ta có kết quả hồi quy như sau: