Các giả thuyết nghiên cứu Dựa trên các nghiên cứu trước đây về các yếu tố ảnh hưởng đến giá nhà, và dựa trên cácbiến có trong tập dữ liệu cung cấp, nhóm nghiên cứu đề xuất các giả thuyế
Trang 1TRƯỜNG ĐẠI HỌC PHENIKAA KHOA KINH TẾ VÀ KINH DOANH
⸎⸎⸎⸎⸎
BÀI TẬP LỚN GIỮA KÌ HỌC PHẦN KINH TẾ LƯỢNG
Đề bài: “Phân tích các yếu tố ảnh hưởng đến giá nhà”
Nhóm sinh viên : 05
Lớp : Kinh tế lượng-1-2-24(N01) Giảng viên : PGS.TS Nguyễn Khánh Doanh Sinh viên thực hiện: 1 Lê Thành Long - 22010124
2 Nguyễn Quốc Nguyên Chương
3 Dương Thanh Bình – 22010044
4 Nguyễn Thế Hà – 22014530
5 Lưu Xuân Phong - 22014525
Năm học : 2024 – 2025
Trang 3MỤC LỤC
1 Giới thiệu
1.1 Đặt vấn đề
1.2 Mục tiêu nghiên cứu
1.3 Đối tượng nghiên cứu
1.4 Phương pháp nghiên cứu
2 Mô hình và các giả thuyết nghiên cứu
2.1 Các giả thuyết nghiên cứu
2.2 Mô hình
3 Phương pháp nghiên cứu
3.1 Mô hình hồi quy
3.1.1 Mối quan hệ giữa biến độc lập và biến phụ thuộc
3.1.2 Xây dựng mô hình lý thuyết
3.1.3 Mô hình hồi quy mẫu (SRM)
3.2 Mô tả bộ dữ liệu sử dụng cho nghiên cứu
3.2.1 Phân tích dữ liệu
3.2.2 Mối tương quan giữa các biến
4 Kết quả nghiên cứu và kiểm định
4.1 Kết quả ước lượng OLS ban đầu
4.1.1 Phương trình hồi quy ước lượng và một vài thông số 4.1.2 Kiểm định các hệ số hồi quy (mức ý nghĩa α = 5%) 4.1.3 Ý nghĩa của các hệ số ước lượng
4.1.4 Ý nghĩa của khoảng tin cậy 95%
4.2 Kiểm định mô hình
Trang 44.2.1 Kiểm định các biến bỏ sót của mô hình 4.2.2 Kiểm định đa cộng tuyến
4.2.3 Kiểm định phương sai sai số thay đổi 4.2.4 Kiểm định phân phối chuẩn phần dư 4.3 Khắc phục các khuyết tật của mô hình
5 Kết quả và thảo luận
5.1 Kết quả
5.2 Thảo luận
Tài liệu tham khảo
Trang 5DANH MỤC BẢNG
Trang 61 GIỚI THIỆU
1.1 Đặt vấn đề
1.2 Mục tiêu nghiên cứu
1.3 Đối tượng nghiên cứu
1.4 Phương pháp nghiên cứu
Trang 72 MÔ HÌNH VÀ CÁC GIẢ THUYẾT NGHIÊN CỨU
2.1 Các giả thuyết nghiên cứu
Dựa trên các nghiên cứu trước đây về các yếu tố ảnh hưởng đến giá nhà, và dựa trên cácbiến có trong tập dữ liệu cung cấp, nhóm nghiên cứu đề xuất các giả thuyết sau:
H1: Thu nhập trung bình trong khu vực (avg_area_income) có tác động tích cực và
đáng kể đến giá nhà.
Giải thích: Khi thu nhập của cư dân trong một khu vực tăng lên, khả năng tài chính
của họ để mua và duy trì nhà ở cũng tăng theo Người có thu nhập cao sẵn sàng chi trả nhiềuhơn cho nhà ở có chất lượng cao hơn, diện tích lớn hơn, hoặc nằm ở các vị trí thuận tiện hơn.Điều này làm tăng nhu cầu về nhà ở trong khu vực đó, đẩy giá nhà lên cao
H2: Tuổi nhà trung bình trong khu vực (avg_area_house_age) có tác động tiêu cực
và đáng kể đến giá nhà.
Giải thích: Các ngôi nhà cũ hơn thường yêu cầu bảo trì và sửa chữa nhiều hơn so với
các ngôi nhà mới, và chúng có thể không có các tính năng và tiện nghi hiện đại mà ngườimua nhà ngày nay mong muốn Do đó, tuổi đời của một ngôi nhà thường có tác động tiêucực đến giá trị của nó
H3: Số lượng phòng trung bình trong khu vực (avg_area_number_of_rooms) có tác động tích cực và đáng kể đến giá nhà.
Giải thích: Số lượng phòng có tác động trực tiếp đến không gian sống và tiện nghi
của một ngôi nhà Nhiều phòng hơn thường có nghĩa là không gian lớn hơn, linh hoạt hơn
và khả năng đáp ứng nhu cầu của nhiều người hơn
H4: Số lượng phòng ngủ trung bình trong khu vực (avg_area_number_of_bedrooms) có tác động tích cực và đáng kể đến giá nhà.
Giải thích: Số lượng phòng ngủ là một yếu tố quan trọng đối với các gia đình Ngôi
nhà có nhiều phòng ngủ phù hợp hơn với gia đình nhiều người hoặc các gia đình muốn cóphòng khách
H5: Dân số trong khu vực (area_population) có tác động tích cực đến giá nhà.
Giải thích: Dân số khu vực cao có thể chỉ ra nhu cầu nhà ở cao Hơn nữa, khu vực
đông dân có thể có nhiều tiện ích hơn (như cửa hàng, nhà hàng, trường học), điều này có thểlàm cho nó hấp dẫn hơn và đẩy giá nhà lên
Trang 82.2 Mô hình
Dựa vào những nghiên cứu về các yếu tố ảnh hưởng đến giá nhà và những đối tượngnghiên cứu đã nêu trên, nhóm đề xuất mô hình nghiên cứu bao gồm: (i) Thu nhập bình quântrong khu vực, (ii) Tuổi bình quân nhà trong khu vực, (iii) Số lượng phòng bình quân trongkhu vực, (iv) Số lượng phòng ngủ bình quân trong khu vực và (v) Dân số trong khu vực Môhình được mô tả như hình:
Trang 93 PHƯƠNG PHÁP NGHIÊN CỨU
3.1 Mô hình hồi quy
3.1.1 Mối quan hệ giữa biến độc lập và biến phụ thuộc
Trang 12
3.1.2 Xây dựng mô hình lý thuyết
Dựa trên những giả thuyết và mối quan hệ giữa các biến, nhóm có bảng mô hình lýthuyết như sau:
vực
area_population Dân số trong khu vực Người +
Dựa trên các biến đã chọn, mô hình hồi quy tổng thể của nhóm như sau:
Trang 13β2: Mức thay đổi giá nhà theo tuổi nhà trung bình trong khu vực
β3: Mức thay đổi giá nhà theo số phòng trung bình trong khu vực
β4: Mức thay đổi giá nhà theo số phòng ngủ trung bình trong khu vực
β5: Mức thay đổi giá nhà theo dân số trong khu vực
u: Sai số ngẫu nhiên, các yếu tố khác ảnh hưởng đến Y mà không được đưa vào môhình
3.1.3 Mô hình hồi quy mẫu (SRM)
Mặc dù nghiên cứu tổng thể cung cấp kết quả chính xác, nhưng lại đòi hỏi chi phí vàthời gian lớn, cũng như độ phức tạp cao Vì vậy, phương pháp nghiên cứu lấy mẫu được ápdụng để giảm thiểu những khó khăn này, đồng thời vẫn đảm bảo được độ chính xác ở mứcchấp nhận được
Ta có mô hình hồi quy mẫu:
Y = ^β 0+ ^β 1 * avg_area_income i + ^β 2* avg_area_house_age i + ^β 3*
avg_area_number_of_rooms i + ^β 4* avg_area_number_of_bedrooms i + ^β 5*
area_population i + e i
Trong đó: i là từng quan sát trong tập mẫu
^βj, j = 0 ,5 là các hệ số hồi quy ước lượng
ei là sai số ước lượng của mỗi quan sát
Trang 143.2 Mô tả bộ dữ liệu sử dụng cho nghiên cứu
3.2.1 Phân tích dữ liệu
Bảng dưới đây cung cấp số liệu thống kê cho từng biến:
Descriptive Statistics
avg area numb~
Giá trung bình của nhà trong khu vực (price): Giá nhà trung bình là 1232072.7, độ
lệch chuẩn 353117.63 là khá lớn, cộng thêm giá nhà trung bình thấp nhất là15938.658 và giá nhà trung bình cao nhất là 2469065.5, điều đó cho thấy giá nhà ởmỗi khu vực có sự chênh lệch nhau lớn
Thu nhập trung bình trong khu vực (avg_area_income): Thu nhập trung bình của khu
vực là 64583.109, độ lệch chuẩn là 10657.991 cho thấy sự chênh lệch giữa thu nhậpcác khu vực có sự chênh lệch nhưng không chênh quá lớn, thu nhập trung bình nhỏnhất là 17796.631 và thu nhập trung bình lớn nhất là 107701.75
Tuổi nhà trung bình trong khu vực (avg_area_house_age): Tuổi nhà trung bình là
5.977, độ lệch chuẩn là 0.991 và tuổi nhà trung bình nhỏ nhất là 2.644, tuổi nhà trungbình lớn nhất là 9.519 cho thấy đa số nhà có tuổi đời khá mới (dưới 10 năm), cũngkhông quá mới hoặc quá cũ
Số lượng phòng trung bình trong khu vực (avg_area_number_of_rooms): Số lượng
phòng trung bình là 6.988, độ lệch chuẩn là 1.006 cho thấy số lượng phòng trung bìnhmỗi khu vực có sự chênh lệch nhau nhưng không quá lớn, số lượng phòng trung bìnhnhỏ nhất là 3.326, số lượng phòng trung bình lớn nhất là 10.76
Trang 15 Số lượng phòng ngủ trung bình trong khu vực (avg_area_number_of_bedrooms): Số
lượng phòng ngủ trung bình là 3.981, độ lệch chuẩn là 1.234 cho thấy sự khác biệt
không quá lớn giữa các khu vưc, số lượng phòng ngủ trung bình nhỏ nhất là 2 và số
lượng phòng ngủ trung bình lớn nhất là 6.5
Dân số trong khu vực (area_population): Dân số trung bình là 1232072.7, độ lệch
chuẩn là 353117.63 cho thấy sự chênh lệch lớn dân số giữa các khu vực, dân số dao
động từ 15938.658 đến 2469065.5 cho thấy có những nơi dân số rất thưa thớt nhưng
có những nơi rất đông đúc
3.2.2 Mối tương quan giữa các biến
Nhóm phân tích mối tương quan giữa các biến của mô hình Mối tương quan cho biết
mức độ liên kết tuyến tính giữa hai biến số Mối tương quan có thể là dương (cùng chiều)
hoặc âm (ngược chiều).Bảng ma trận tương quan như hình dưới:
Biến "price" có mối tương quan mạnh nhất với "avg_area_income" (hệ số tương
quan 0.640) Điều này cho thấy thu nhập trung bình của khu vực có ảnh hưởng đáng
kể đến giá nhà, điều này khá hợp lý vì những khu vực có thu nhập cao thường có giá
nhà cao hơn
"price" cũng có mức tương quan trung bình với "avg_area_house_age" (0.453),
"area_population" (0.409) và "avg_area_number_of_rooms" (0.336) Điều này cho
Trang 16thấy tuổi nhà trung bình, dân số khu vực và số phòng trung bình có ảnh hưởng khámạnh đến giá nhà, nhưng không mạnh bằng thu nhập trung bình.
Biến "avg_area_number_of_bedrooms" (số lượng phòng ngủ trung bình) có mốitương quan yếu với "price" (0.171) Điều này có thể cho thấy rằng số lượng phòngngủ không phải là yếu tố quyết định lớn đến giá nhà
Một số mối tương quan giữa các biến độc lập là rất thấp hoặc gần bằng 0 (ví dụ: giữa
"avg_area_house_age" và "avg_area_income" là -0.002) Điều này có lợi trong môhình hồi quy, vì nó giảm nguy cơ đa cộng tuyến
Trang 174 Kết quả nghiên cứu và kiểm định4.1 Kết quả ước lượng OLS ban đầu
4.1.1 Phương trình hồi quy ước lượng và một vài thông số
Bằng phần mềm Stata cùng với bộ dữ liệu và mô hình hồi quy mẫu ở trên, nhóm đã tiến hành phân tích dữ liệu để thu được kết quả sau:
Trang 18Giả thuyết: H0: β1 = β2 = β3 = β4 = β5
H1: Không phải tất cả các β đều bằng 0
Nhìn vào bảng ta có thể thấy Prob > P =0.000 < 0.05 => Bác bỏ H0 và chấp nhận H1, tức
Kiểm định hệ số (β3) :
Giả thuyết: H0: β3 = 0 (hệ số không có ý nghĩa thống kê)
H1: β3 ≠ 0
Trang 19Chúng ta có thể thấy p-value ≈ 0.000 < 0.05 => Với mức ý nghĩa α = 5%, ta bác bỏ giảthuyết H0 và chấp nhận H1, tức là hệ số β3 có ý nghĩa thống kê, hay số phòng trung bìnhtrong khu vực có ảnh hưởng đến giá nhà.
4.1.3 Ý nghĩa của các hệ số ước lượng hồi quy
Hệ số ^β 0 = -2637299 có nghĩa là giá nhà trung bình sẽ nhỏ hơn 0 khi tất cả các biến độc
lập (avg_area_income, avg_area_house_age, avg_area_number_of_rooms,
avg_area_number_of_bedrooms, area_population) bằng 0
Hệ số ^β 1 = 21.578 có nghĩa là nếu thu nhập trung bình tăng thêm 1 USD trong khi các
biến độc lập khác không đổi thì giá nhà trung bình sẽ tăng 21.578 USD
Hệ số ^β 2 = 165637.02 có nghĩa là nếu tuổi nhà trung bình tăng thêm 1 tuổi trong khi các
biến độc lập khác không đổi thì giá nhà trung bình sẽ tăng thêm 165637.02 USD
Hệ số ^β 3 = 120659.95 có nghĩa là nếu số phòng trung bình tăng thêm 1 phòng trong khi
các biến độc lập khác không đổi thì giá nhà trung bình sẽ tăng thêm 120659.95 USD
Trang 20Hệ số ^β 4 = 1651.139 có nghĩa là nếu số phòng ngủ trung bình tăng thêm 1 phòng trong
khi các biến độc lập khác không đổi thì giá nhà trung bình sẽ tăng thêm 1651.139 USD
Hệ số ^β 5 = 15.201có nghĩa là nếu dân số tăng thêm 1 người trong khi các biến độc lập
khác không đổi thì giá nhà trung bình sẽ tăng thêm 15.201 USD
4.1.4 Ý nghĩa của khoảng tin cậy 95%
Trang 214.2 Kiểm định mô hình
4.2.1 Kiểm định các biến bỏ sót của mô hình
Các biến bỏ sót là những biến quan trọng hoặc có ảnh hưởng đáng kể đến biến phụ thuộc nhưng lại không được đưa vào mô hình hồi quy Việc bỏ sót những biến này có thể làm sai lệch kết quả ước lượng và làm giảm tính chính xác của mô hình
Giả thuyết: H0: Mô hình không có biến nào bị bỏ sót (model has no omitted veriables) H1: Mô hình bị bỏ sót biến
Tiến hành kiểm định Ramsey’s RESET:
Ta thấy p-value = 0.6815 > 0.05 => Với mức ý nghĩa α = 5%, chấp nhận H0 hay mô hình không bỏ sót biến
4.2.2 Kiểm định đa cộng tuyến
Đa cộng tuyến là hiện tượng trong mô hình hồi quy tuyến tính khi có mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập Điều này dẫn đến việc các biến độc lập không còn độc lập với nhau, gây khó khăn cho việc ước lượng chính xác các tham số của mô hình.Với bảng mối tương quan giữa các biến ở trên, mối tương quan giữa các biến thấp (<0.8) nên vì vậy, việc xảy ra đa cộng tuyến là rất thấp Tuy nhiên, chúng ta vẫn sẽ cần đi kiểm định bằng VIF để chắc chắn khẳng định đó là đúng
Trang 22Ta thấy VIF của từng biến đều <10 và >=1 => Mô hình không bị đa cộng tuyến và nếu cóthì mức độ không đáng kể.
4.2.3 Kiểm định phương sai sai số thay đổi
Phương sai sai số thay đổi là hiện tượng mà phương sai của các sai số ước lượng không bằng nhau Nếu mô hình bị phương sai sai số thay đổi thì các ước lượng hồi quy sẽ khôngcòn tốt nhất, các kiểm định hệ số hồi quy và kiểm định F của mô hình trở nên không đángtin cậy
Giả thuyết: H0: Mô hình không bị phương sai sai số thay đổi (homoskedasticity)
H1: Mô hình bị phương sai sai số thay đổi
Đầu tiên, chúng ta hãy nhìn qua biểu đồ của Residuals vs Fitted Values (Phần dư so với giá trị dự đoán)