1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài tập lớn giữa kì học phần kinh tế lượng Đề bài phân tích các yếu tố Ảnh hưởng Đến giá nhà

23 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân tích các yếu tố ảnh hưởng đến giá nhà
Tác giả Lê Thành Long - 22010124, Nguyễn Quốc Nguyên Chương, Dương Thanh Bình - 22010044, Nguyễn Thế Hà - 22014530, Lưu Xuân Phong - 22014525
Người hướng dẫn PGS.TS. Nguyễn Khánh Doanh
Trường học Trường Đại Học Phenikaa
Chuyên ngành Kinh tế lượng
Thể loại Bài tập lớn
Năm xuất bản 2024 - 2025
Thành phố Hà Nội
Định dạng
Số trang 23
Dung lượng 4,18 MB

Nội dung

Các giả thuyết nghiên cứu Dựa trên các nghiên cứu trước đây về các yếu tố ảnh hưởng đến giá nhà, và dựa trên cácbiến có trong tập dữ liệu cung cấp, nhóm nghiên cứu đề xuất các giả thuyế

Trang 1

TRƯỜNG ĐẠI HỌC PHENIKAA KHOA KINH TẾ VÀ KINH DOANH

⸎⸎⸎⸎⸎

BÀI TẬP LỚN GIỮA KÌ HỌC PHẦN KINH TẾ LƯỢNG

Đề bài: “Phân tích các yếu tố ảnh hưởng đến giá nhà”

Nhóm sinh viên : 05

Lớp : Kinh tế lượng-1-2-24(N01) Giảng viên : PGS.TS Nguyễn Khánh Doanh Sinh viên thực hiện: 1 Lê Thành Long - 22010124

2 Nguyễn Quốc Nguyên Chương

3 Dương Thanh Bình – 22010044

4 Nguyễn Thế Hà – 22014530

5 Lưu Xuân Phong - 22014525

Năm học : 2024 – 2025

Trang 3

MỤC LỤC

1 Giới thiệu

1.1 Đặt vấn đề

1.2 Mục tiêu nghiên cứu

1.3 Đối tượng nghiên cứu

1.4 Phương pháp nghiên cứu

2 Mô hình và các giả thuyết nghiên cứu

2.1 Các giả thuyết nghiên cứu

2.2 Mô hình

3 Phương pháp nghiên cứu

3.1 Mô hình hồi quy

3.1.1 Mối quan hệ giữa biến độc lập và biến phụ thuộc

3.1.2 Xây dựng mô hình lý thuyết

3.1.3 Mô hình hồi quy mẫu (SRM)

3.2 Mô tả bộ dữ liệu sử dụng cho nghiên cứu

3.2.1 Phân tích dữ liệu

3.2.2 Mối tương quan giữa các biến

4 Kết quả nghiên cứu và kiểm định

4.1 Kết quả ước lượng OLS ban đầu

4.1.1 Phương trình hồi quy ước lượng và một vài thông số 4.1.2 Kiểm định các hệ số hồi quy (mức ý nghĩa α = 5%) 4.1.3 Ý nghĩa của các hệ số ước lượng

4.1.4 Ý nghĩa của khoảng tin cậy 95%

4.2 Kiểm định mô hình

Trang 4

4.2.1 Kiểm định các biến bỏ sót của mô hình 4.2.2 Kiểm định đa cộng tuyến

4.2.3 Kiểm định phương sai sai số thay đổi 4.2.4 Kiểm định phân phối chuẩn phần dư 4.3 Khắc phục các khuyết tật của mô hình

5 Kết quả và thảo luận

5.1 Kết quả

5.2 Thảo luận

Tài liệu tham khảo

Trang 5

DANH MỤC BẢNG

Trang 6

1 GIỚI THIỆU

1.1 Đặt vấn đề

1.2 Mục tiêu nghiên cứu

1.3 Đối tượng nghiên cứu

1.4 Phương pháp nghiên cứu

Trang 7

2 MÔ HÌNH VÀ CÁC GIẢ THUYẾT NGHIÊN CỨU

2.1 Các giả thuyết nghiên cứu

Dựa trên các nghiên cứu trước đây về các yếu tố ảnh hưởng đến giá nhà, và dựa trên cácbiến có trong tập dữ liệu cung cấp, nhóm nghiên cứu đề xuất các giả thuyết sau:

H1: Thu nhập trung bình trong khu vực (avg_area_income) có tác động tích cực và

đáng kể đến giá nhà.

Giải thích: Khi thu nhập của cư dân trong một khu vực tăng lên, khả năng tài chính

của họ để mua và duy trì nhà ở cũng tăng theo Người có thu nhập cao sẵn sàng chi trả nhiềuhơn cho nhà ở có chất lượng cao hơn, diện tích lớn hơn, hoặc nằm ở các vị trí thuận tiện hơn.Điều này làm tăng nhu cầu về nhà ở trong khu vực đó, đẩy giá nhà lên cao

H2: Tuổi nhà trung bình trong khu vực (avg_area_house_age) có tác động tiêu cực

và đáng kể đến giá nhà.

Giải thích: Các ngôi nhà cũ hơn thường yêu cầu bảo trì và sửa chữa nhiều hơn so với

các ngôi nhà mới, và chúng có thể không có các tính năng và tiện nghi hiện đại mà ngườimua nhà ngày nay mong muốn Do đó, tuổi đời của một ngôi nhà thường có tác động tiêucực đến giá trị của nó

H3: Số lượng phòng trung bình trong khu vực (avg_area_number_of_rooms) có tác động tích cực và đáng kể đến giá nhà.

Giải thích: Số lượng phòng có tác động trực tiếp đến không gian sống và tiện nghi

của một ngôi nhà Nhiều phòng hơn thường có nghĩa là không gian lớn hơn, linh hoạt hơn

và khả năng đáp ứng nhu cầu của nhiều người hơn

H4: Số lượng phòng ngủ trung bình trong khu vực (avg_area_number_of_bedrooms) có tác động tích cực và đáng kể đến giá nhà.

Giải thích: Số lượng phòng ngủ là một yếu tố quan trọng đối với các gia đình Ngôi

nhà có nhiều phòng ngủ phù hợp hơn với gia đình nhiều người hoặc các gia đình muốn cóphòng khách

H5: Dân số trong khu vực (area_population) có tác động tích cực đến giá nhà.

Giải thích:  Dân số khu vực cao có thể chỉ ra nhu cầu nhà ở cao Hơn nữa, khu vực

đông dân có thể có nhiều tiện ích hơn (như cửa hàng, nhà hàng, trường học), điều này có thểlàm cho nó hấp dẫn hơn và đẩy giá nhà lên

Trang 8

2.2 Mô hình

Dựa vào những nghiên cứu về các yếu tố ảnh hưởng đến giá nhà và những đối tượngnghiên cứu đã nêu trên, nhóm đề xuất mô hình nghiên cứu bao gồm: (i) Thu nhập bình quântrong khu vực, (ii) Tuổi bình quân nhà trong khu vực, (iii) Số lượng phòng bình quân trongkhu vực, (iv) Số lượng phòng ngủ bình quân trong khu vực và (v) Dân số trong khu vực Môhình được mô tả như hình:

Trang 9

3 PHƯƠNG PHÁP NGHIÊN CỨU

3.1 Mô hình hồi quy

3.1.1 Mối quan hệ giữa biến độc lập và biến phụ thuộc

Trang 12

3.1.2 Xây dựng mô hình lý thuyết

Dựa trên những giả thuyết và mối quan hệ giữa các biến, nhóm có bảng mô hình lýthuyết như sau:

vực

area_population Dân số trong khu vực Người +

Dựa trên các biến đã chọn, mô hình hồi quy tổng thể của nhóm như sau:

Trang 13

β2: Mức thay đổi giá nhà theo tuổi nhà trung bình trong khu vực

β3: Mức thay đổi giá nhà theo số phòng trung bình trong khu vực

β4: Mức thay đổi giá nhà theo số phòng ngủ trung bình trong khu vực

β5: Mức thay đổi giá nhà theo dân số trong khu vực

u: Sai số ngẫu nhiên, các yếu tố khác ảnh hưởng đến Y mà không được đưa vào môhình

3.1.3 Mô hình hồi quy mẫu (SRM)

Mặc dù nghiên cứu tổng thể cung cấp kết quả chính xác, nhưng lại đòi hỏi chi phí vàthời gian lớn, cũng như độ phức tạp cao Vì vậy, phương pháp nghiên cứu lấy mẫu được ápdụng để giảm thiểu những khó khăn này, đồng thời vẫn đảm bảo được độ chính xác ở mứcchấp nhận được

Ta có mô hình hồi quy mẫu:

Y = ^β 0+ ^β 1 * avg_area_income i + ^β 2* avg_area_house_age i + ^β 3*

avg_area_number_of_rooms i + ^β 4* avg_area_number_of_bedrooms i + ^β 5*

area_population i + e i

Trong đó: i là từng quan sát trong tập mẫu

^βj, j = 0 ,5 là các hệ số hồi quy ước lượng

ei là sai số ước lượng của mỗi quan sát

Trang 14

3.2 Mô tả bộ dữ liệu sử dụng cho nghiên cứu

3.2.1 Phân tích dữ liệu

Bảng dưới đây cung cấp số liệu thống kê cho từng biến:

Descriptive Statistics

avg area numb~

 Giá trung bình của nhà trong khu vực (price): Giá nhà trung bình là 1232072.7, độ

lệch chuẩn 353117.63 là khá lớn, cộng thêm giá nhà trung bình thấp nhất là15938.658 và giá nhà trung bình cao nhất là 2469065.5, điều đó cho thấy giá nhà ởmỗi khu vực có sự chênh lệch nhau lớn

 Thu nhập trung bình trong khu vực (avg_area_income): Thu nhập trung bình của khu

vực là 64583.109, độ lệch chuẩn là 10657.991 cho thấy sự chênh lệch giữa thu nhậpcác khu vực có sự chênh lệch nhưng không chênh quá lớn, thu nhập trung bình nhỏnhất là 17796.631 và thu nhập trung bình lớn nhất là 107701.75

 Tuổi nhà trung bình trong khu vực (avg_area_house_age): Tuổi nhà trung bình là

5.977, độ lệch chuẩn là 0.991 và tuổi nhà trung bình nhỏ nhất là 2.644, tuổi nhà trungbình lớn nhất là 9.519 cho thấy đa số nhà có tuổi đời khá mới (dưới 10 năm), cũngkhông quá mới hoặc quá cũ

 Số lượng phòng trung bình trong khu vực (avg_area_number_of_rooms): Số lượng

phòng trung bình là 6.988, độ lệch chuẩn là 1.006 cho thấy số lượng phòng trung bìnhmỗi khu vực có sự chênh lệch nhau nhưng không quá lớn, số lượng phòng trung bìnhnhỏ nhất là 3.326, số lượng phòng trung bình lớn nhất là 10.76

Trang 15

 Số lượng phòng ngủ trung bình trong khu vực (avg_area_number_of_bedrooms): Số

lượng phòng ngủ trung bình là 3.981, độ lệch chuẩn là 1.234 cho thấy sự khác biệt

không quá lớn giữa các khu vưc, số lượng phòng ngủ trung bình nhỏ nhất là 2 và số

lượng phòng ngủ trung bình lớn nhất là 6.5

 Dân số trong khu vực (area_population): Dân số trung bình là 1232072.7, độ lệch

chuẩn là 353117.63 cho thấy sự chênh lệch lớn dân số giữa các khu vực, dân số dao

động từ 15938.658 đến 2469065.5 cho thấy có những nơi dân số rất thưa thớt nhưng

có những nơi rất đông đúc

3.2.2 Mối tương quan giữa các biến

Nhóm phân tích mối tương quan giữa các biến của mô hình Mối tương quan cho biết

mức độ liên kết tuyến tính giữa hai biến số Mối tương quan có thể là dương (cùng chiều)

hoặc âm (ngược chiều).Bảng ma trận tương quan như hình dưới:

 Biến "price" có mối tương quan mạnh nhất với "avg_area_income" (hệ số tương

quan 0.640) Điều này cho thấy thu nhập trung bình của khu vực có ảnh hưởng đáng

kể đến giá nhà, điều này khá hợp lý vì những khu vực có thu nhập cao thường có giá

nhà cao hơn

 "price" cũng có mức tương quan trung bình với "avg_area_house_age" (0.453),

"area_population" (0.409) và "avg_area_number_of_rooms" (0.336) Điều này cho

Trang 16

thấy tuổi nhà trung bình, dân số khu vực và số phòng trung bình có ảnh hưởng khámạnh đến giá nhà, nhưng không mạnh bằng thu nhập trung bình.

 Biến "avg_area_number_of_bedrooms" (số lượng phòng ngủ trung bình) có mốitương quan yếu với "price" (0.171) Điều này có thể cho thấy rằng số lượng phòngngủ không phải là yếu tố quyết định lớn đến giá nhà

 Một số mối tương quan giữa các biến độc lập là rất thấp hoặc gần bằng 0 (ví dụ: giữa

"avg_area_house_age" và "avg_area_income" là -0.002) Điều này có lợi trong môhình hồi quy, vì nó giảm nguy cơ đa cộng tuyến

Trang 17

4 Kết quả nghiên cứu và kiểm định4.1 Kết quả ước lượng OLS ban đầu

4.1.1 Phương trình hồi quy ước lượng và một vài thông số

Bằng phần mềm Stata cùng với bộ dữ liệu và mô hình hồi quy mẫu ở trên, nhóm đã tiến hành phân tích dữ liệu để thu được kết quả sau:

Trang 18

Giả thuyết: H0: β1 = β2 = β3 = β4 = β5

H1: Không phải tất cả các β đều bằng 0

Nhìn vào bảng ta có thể thấy Prob > P =0.000 < 0.05 => Bác bỏ H0 và chấp nhận H1, tức

Kiểm định hệ số (β3) :

Giả thuyết: H0: β3 = 0 (hệ số không có ý nghĩa thống kê)

H1: β3 ≠ 0

Trang 19

Chúng ta có thể thấy p-value ≈ 0.000 < 0.05 => Với mức ý nghĩa α = 5%, ta bác bỏ giảthuyết H0 và chấp nhận H1, tức là hệ số β3 có ý nghĩa thống kê, hay số phòng trung bìnhtrong khu vực có ảnh hưởng đến giá nhà.

4.1.3 Ý nghĩa của các hệ số ước lượng hồi quy

Hệ số ^β 0 = -2637299 có nghĩa là giá nhà trung bình sẽ nhỏ hơn 0 khi tất cả các biến độc

lập (avg_area_income, avg_area_house_age, avg_area_number_of_rooms,

avg_area_number_of_bedrooms, area_population) bằng 0

Hệ số ^β 1 = 21.578 có nghĩa là nếu thu nhập trung bình tăng thêm 1 USD trong khi các

biến độc lập khác không đổi thì giá nhà trung bình sẽ tăng 21.578 USD

Hệ số ^β 2 = 165637.02 có nghĩa là nếu tuổi nhà trung bình tăng thêm 1 tuổi trong khi các

biến độc lập khác không đổi thì giá nhà trung bình sẽ tăng thêm 165637.02 USD

Hệ số ^β 3 = 120659.95 có nghĩa là nếu số phòng trung bình tăng thêm 1 phòng trong khi

các biến độc lập khác không đổi thì giá nhà trung bình sẽ tăng thêm 120659.95 USD

Trang 20

Hệ số ^β 4 = 1651.139 có nghĩa là nếu số phòng ngủ trung bình tăng thêm 1 phòng trong

khi các biến độc lập khác không đổi thì giá nhà trung bình sẽ tăng thêm 1651.139 USD

Hệ số ^β 5 = 15.201có nghĩa là nếu dân số tăng thêm 1 người trong khi các biến độc lập

khác không đổi thì giá nhà trung bình sẽ tăng thêm 15.201 USD

4.1.4 Ý nghĩa của khoảng tin cậy 95%

Trang 21

4.2 Kiểm định mô hình

4.2.1 Kiểm định các biến bỏ sót của mô hình

Các biến bỏ sót là những biến quan trọng hoặc có ảnh hưởng đáng kể đến biến phụ thuộc nhưng lại không được đưa vào mô hình hồi quy Việc bỏ sót những biến này có thể làm sai lệch kết quả ước lượng và làm giảm tính chính xác của mô hình

Giả thuyết: H0: Mô hình không có biến nào bị bỏ sót (model has no omitted veriables) H1: Mô hình bị bỏ sót biến

Tiến hành kiểm định Ramsey’s RESET:

Ta thấy p-value = 0.6815 > 0.05 => Với mức ý nghĩa α = 5%, chấp nhận H0 hay mô hình không bỏ sót biến

4.2.2 Kiểm định đa cộng tuyến

Đa cộng tuyến là hiện tượng trong mô hình hồi quy tuyến tính khi có mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập Điều này dẫn đến việc các biến độc lập không còn độc lập với nhau, gây khó khăn cho việc ước lượng chính xác các tham số của mô hình.Với bảng mối tương quan giữa các biến ở trên, mối tương quan giữa các biến thấp (<0.8) nên vì vậy, việc xảy ra đa cộng tuyến là rất thấp Tuy nhiên, chúng ta vẫn sẽ cần đi kiểm định bằng VIF để chắc chắn khẳng định đó là đúng

Trang 22

Ta thấy VIF của từng biến đều <10 và >=1 => Mô hình không bị đa cộng tuyến và nếu cóthì mức độ không đáng kể.

4.2.3 Kiểm định phương sai sai số thay đổi

Phương sai sai số thay đổi là hiện tượng mà phương sai của các sai số ước lượng không bằng nhau Nếu mô hình bị phương sai sai số thay đổi thì các ước lượng hồi quy sẽ khôngcòn tốt nhất, các kiểm định hệ số hồi quy và kiểm định F của mô hình trở nên không đángtin cậy

Giả thuyết: H0: Mô hình không bị phương sai sai số thay đổi (homoskedasticity)

H1: Mô hình bị phương sai sai số thay đổi

Đầu tiên, chúng ta hãy nhìn qua biểu đồ của Residuals vs Fitted Values (Phần dư so với giá trị dự đoán)

Ngày đăng: 11/02/2025, 09:58

HÌNH ẢNH LIÊN QUAN

BẢNG PHÂN CÔNG CÔNG VIỆC - Bài tập lớn giữa kì học phần kinh tế lượng Đề bài phân tích các yếu tố Ảnh hưởng Đến giá nhà
BẢNG PHÂN CÔNG CÔNG VIỆC (Trang 2)
Bảng dưới đây cung cấp số liệu thống kê cho từng biến: - Bài tập lớn giữa kì học phần kinh tế lượng Đề bài phân tích các yếu tố Ảnh hưởng Đến giá nhà
Bảng d ưới đây cung cấp số liệu thống kê cho từng biến: (Trang 14)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w