FILE 19_CEOSAL2
CƠ SỞ LÝ THUYẾT VỀ VẤN ĐỀ NGHIÊN CỨU
Nghiên cứu cho thấy có nhiều yếu tố ảnh hưởng đến tiền lương của người lao động, với sự tác động khác nhau từ mỗi yếu tố Tại Việt Nam, thanh niên trong độ tuổi từ 18 đến 25 có nhiều đóng góp cho nền kinh tế, nhưng họ vẫn chưa phải là những người có thu nhập cao Ngược lại, những người ở độ tuổi lớn hơn thường có mức lương cao hơn, mặc dù không phải lúc nào cũng phản ánh đúng năng lực và đóng góp của họ.
>= 50 lại là những người có thu nhập cao nhất
Nghiên cứu của Caponi và Plesca (2007) cho thấy rằng người có học vấn cao thường có thu nhập cao hơn, với mức chênh lệch từ 30% đến 40% so với những người chỉ tốt nghiệp phổ thông trung học Bên cạnh trình độ học vấn, yếu tố ngành nghề cũng đóng vai trò quan trọng trong việc xác định mức lương của người lao động.
Nghiên cứu “Các yếu tố ảnh hưởng đến tiền lương của CEO” sẽ phân tích và đánh giá xu hướng cũng như mức độ tác động của các yếu tố như doanh thu (lsales), giá trị thị trường (lmktval), kinh nghiệm CEO (ceoten), độ tuổi (age), nội dung công việc (comten) và trình độ học vấn (grad) đến mức lương của CEO (lsalary).
THIẾT LẬP, KIỂM ĐỊNH, PHÂN TÍCH LỖI, SỬA LỖI MÔ HÌNH
1 THIẾT LẬP MÔ HÌNH a Chọn biến phụ thuộc và các biến độc lập
Từ file số liệu 19_CEOSAL2 và sử dụng lệnh “des” trong phần mềm stata, ta thu được kết quả như sau:
Contains data from D:\tailieu\ktl\file data\filedata\19_CEOSAL2.DTA obs: 177 vars: 15 17 Aug 1999 23:14 size: 6,549
- storage display value variable name type format label variable label
- salary int %9.0g 1990 compensation, $1000s age byte %9.0g in years college byte %9.0g =1 if attended college grad byte %9.0g =1 if attended graduate school
The dataset for class KTE309.11, Group 19, includes key variables such as years with the company, years served as CEO, sales figures from 1990 in millions, and profits from 1990 in millions Additionally, it contains the market value at the end of 1990, along with logarithmic transformations of salary, sales, and market value The dataset also features squared terms for company tenure and CEO tenure, as well as profit margin calculated as profits as a percentage of sales.
File 19_CEOSAL2 được lập vào 23:44 ngày 17/08/1999 bao gồm 15 biến, 177 quan sát
Dựa trên lý thuyết đã trình bày và dữ liệu từ file 19_CEOSAL2, nhóm đã chọn biến lsalary làm biến phụ thuộc, trong khi các biến lsales, lmktval, ceoten, age, comten và grad được xác định là các biến độc lập Mô hình hồi quy tổng thể và hàm hồi quy mẫu sẽ được xây dựng dựa trên những biến này.
− Mô hình hồi quy tổng thể:
𝜷 ̂ ∗ 𝒈𝒓𝒂𝒅 + 𝜷 𝟓 ̂ ∗ 𝒂𝒈𝒆 𝟔 Trong đó: 𝒖 𝒊 : yếu tố ngẫu nhiên (nhiễu)
Biến định lượng Biến định tính lsalary age comten ceoten lmktval lsales grad
LỚP KTE309.11 _ NHÓM 19 8 c Miêu tả biến
• Sử dụng lệnh “des lsales lmktval ceoten age comten grad ” ta thu được kết quả như sau:
des lsales lmktval ceoten age comten grad storage display value variable name type format label variable label
The article discusses various variables related to a company's leadership and financial metrics, including sales represented as a float and logged for analysis, market value also logged, and the tenure of the CEO in years It highlights the age of the CEO and their duration with the company, along with an indicator for whether they have attended graduate school.
Dưới đây là các biến và ý nghĩa của chúng: "lsalary" là logarit của tiền lương trung bình năm 1990 của CEO; "age" là tuổi của CEO; "grad" là biến số nguyên, bằng 1 nếu CEO tốt nghiệp đại học; "comten" là số năm làm việc ở công ty; "lsales" là logarit của doanh thu công ty năm 1990; "ceoten" là số năm CEO làm việc tại công ty; và "lmktval" là logarit của giá trị thị trường công ty.
sum lsalary lsales lmktval ceoten comten grad age
Variable | Obs Mean Std Dev Min Max
-+ - lsalary | 177 6.582848 6060594 4.60517 8.575274 lsales | 177 7.231025 1.432086 3.367296 10.84545 lmktval | 177 7.39941 1.133414 5.958425 10.72327 ceoten | 177 7.954802 7.150826 0 37 comten | 177 22.50282 12.29473 2 58
Tên biến Số quan sát
Trung bình Độ lệch chuẩn
Số lượng quan sát thiếu giá trị lsalary 177 6.582848 0.6060594 4.60517 8.575274 0 grad 177 0.5310734 0.5004492 0 1 0 age 177 56.42938 8.42189 33 86 0
• Sử dụng lệnh “tab1 lsales lmktval ceoten comten grad age” để xem xét bảng phân phối tần suất các giá trị của các biến:
tab1 lsales lmktval ceoten comten grad age
LỚP KTE309.11 _ NHÓM 19 10 log(sales) | Freq Percent Cum
-> tabulation of lmktval log(mktval) | Freq Percent Cum
-> tabulation of ceoten years as | ceo with | company | Freq Percent Cum
-> tabulation of comten years with | company | Freq Percent Cum
=1 if | attended | graduate | school | Freq Percent Cum
-> tabulation of age in years | Freq Percent Cum
Total | 177 100.00 d Lập bảng tương quan
Trước khi thực hiện hồi quy mô hình, việc xem xét mức độ tương quan giữa các biến là rất quan trọng Sử dụng lệnh corr với các biến lsalary, age, college, comten, sales, và ceoten, chúng ta có thể thu được ma trận tương quan giữa các biến này.
corr lsalary age college comten sales ceoten
| lsalary age college comten sales ceoten -+ - lsalary | 1.0000 age | 0.0906 1.0000 college | -0.0650 -0.1781 1.0000 comten | -0.0023 0.4794 -0.1571 1.0000 sales | 0.4098 0.1271 -0.0215 0.1044 1.0000 ceoten | 0.1147 0.3387 -0.1063 0.3151 -0.0677 1.0000
Nhận xét: Từ ma trận tương quan, ta rút ra một số điểm sau:
Mức độ tương quan giữa biến phụ thuộc lsalary với các biến độc lập như age, comten, ceoten, lsales, grad và lmktval không đồng đều Trong đó, tương quan giữa lsalary và sales tương đối lớn với hệ số r = -0.4098, trong khi tương quan giữa lsalary và comten lại yếu hơn nhiều với hệ số r = -0.
- Tương quan của các biến độc lập với nhau là không lớn, chỉ có tương quan của age và comten là cao hơn cả (r = 0.4794)
• r(lsalary, lsales) = 0.5300 > 0 nên kỳ vọng 𝛽 1 có giá trị dương
• r(salay, lmktval) = 0.4815 >0 nên kỳ vọng 𝛽 2 có giá trị dương
• r(salay,ceoten) = 0.1147 > 0 nên kỳ vọng 𝛽 3 có giá trị dương
• r(salay, age) = 0.0906 > 0 nên kỳ vọng 𝛽 4 có giá trị dương
• r(salay, comten) = -0.0023 < 0 nên kỳ vọng 𝛽 5 có giá trị âm
• r(salay, grad) = 0.0131 > 0 nên kỳ vọng 𝛽 6 có giá trị dương e Chạy mô hình và diễn giải ý nghĩa hệ số hồi quy
• Hồi quy biến lsalary theo các biến lsales lmktval ceoten age comten gradbằng lệnh reg, ta có:
reg lsalary lsales lmktval ceoten age comten grad
Source | SS df MS Number of obs = 177 -+ - F( 6, 170) = 15.55 Model | 22.908898 6 3.81814967 Prob > F = 0.0000 Residual | 41.737315 170 245513618 R-squared = 0.3544
-+ - Adj R-squared = 0.3316 Total | 64.6462131 176 367308029 Root MSE = 49549
- lsalary | Coef Std Err t P>|t| [95% Conf Interval] -+ - lsales | 1927726 0399535 4.82 0.000 1139037 2716415 lmktval | 1006935 0492993 2.04 0.043 003376 1980111 ceoten | 01676 0057118 2.93 0.004 0054849 0280351 age | 000148 0052337 0.03 0.977 -.0101834 0104794 comten | -.0104312 0036879 -2.83 0.005 -.0177112 -.0031512 grad | -.0979702 0779818 -1.26 0.211 -.2519076 0559672 _cons | 4.58892 3386964 13.55 0.000 3.920328 5.257512 -
Từ kết quả chạy hồi quy, ta có phương trình hồi quy mẫu:
• Phân tích kết quả hồi quy:
- Số quan sát đưa vào phân tích obs = 177
- Phần tổng bình phương các độ lệch giữa giá trị lsalary với giá trị trung bình của nó SST
Tổng bình phương sai lệch giữa giá trị của biến lsalary từ hàm hồi quy mẫu và giá trị trung bình của chúng là SSE = 22.908898.
- Tổng bình phương các phần dư SSR = 41.737315
- Sai số chuẩn của ước lượng Root MSE =0.49549
Mô hình có mức độ phù hợp với thực tế là R² = 0.3544, cho thấy tính phù hợp của mô hình không cao Điều này có nghĩa là các biến độc lập trong mô hình chỉ giải thích được 35.44% sự thay đổi của tiền lương trung bình của CEO.
• Với độ tin cậy 95% ta có khoảng tin cậy 2 phía của các hệ số hồi quy:
Hệ số hồi quy Khoảng tin cậy 2 phía với độ tin cậy 95%
Giải thích ý nghĩa các tham số:
𝜷 ̂ = 0.1927726 > 0 ∶ Với giả thiết các yếu tố khác không đổi, mức lương trung bình của 𝟏 CEO năm 1990tăng 19.27726% khi doanh thu của công ty tăng1%
𝜷 ̂ = 0.1006935 > 0: Với giả thiết các yếu tố khác không đổi, giá trị thị trường của công ty 𝟐 tăng 1% thì tiền lương trung bình của CEO năm 1990tăng 10.06935%
𝜷 ̂ = 0.01676 > 0: với giả thiết các yếu tố khác không đổi, khi số năm làm CEO ở công ty tăng 𝟑 lên 1 năm thì tiền lương trung bình của CEO năm 1990 tăng lên 1.676%
𝜷 ̂ = 0.000148 > 0: Với giả thiết các yếu tố khác không đổi, khi số tuổi của CEO tăng thêm 1 𝟒 tuổi thì tiền lương trung bình năm 1990 của CEO tăng 0.0148%
Khi giữ nguyên các yếu tố khác, mỗi năm kinh nghiệm làm việc tại công ty sẽ dẫn đến việc giảm 1.04312% tiền lương trung bình hàng năm của CEO vào năm 1990.
𝜷 ̂ = -0.0979702 < 0: Với giả thiết các yếu tố khác không đổi, nếu CEO tốt nghiệp đại học thì 𝟔 tiền lương trung bình của CEO năm 1990 giảm 9.79702%
2 KIỂM ĐỊNH MÔ HÌNH a Kiểm định ý nghĩa ý nghĩa thống kê của các biến:
Với mô hình thiết kế ở trên, chúng ta tiến hành kiểm định ý nghĩa thống kê của các biến độc lập
Sử dụng thống kê t = 𝛽 ̂ 𝑗 − 𝛽 𝑗
- Phương pháp kiểm định: Kiểm định bằng phương pháp p- value
- Quy tắc kiểm định: nếu giá trị p-value lớn hơn mức ý nghĩa α = 0,05 thì ta có cơ sở bác bỏ giả thuyết H 0 , chấp nhận giả thuyết H 1
Kết quả từ phân tích hồi quy cho thấy giá trị p-value của các biến độc lập như tuổi (age) và trình độ học vấn (grad) lớn hơn 0,05, điều này chỉ ra rằng các biến này không có ý nghĩa thống kê ở mức 5%.
Theo kết quả hồi quy, các giá trị p-value của các biến độc lập lsales, lmktval, ceoten và comten đều nhỏ hơn mức ý nghĩa α = 0,05, cho thấy các biến này có ý nghĩa thống kê tại mức ý nghĩa này.
5% b Kiểm định sự phù hợp của mô hình
- Phương pháp kiểm định: Kiểm định bằng phương pháp p-value
Giả thuyết này tương đương với: { 𝐻 0 : 𝑅 2 = 𝑂
Trong đó: k là số biến độc lập, k = 6 n: là số quan sát, n = 177
- Quy tắc kiểm định: Nếu giá trị p-value nhỏ hơn mức ý nghĩa 𝛼 = 0.05 thì bác bỏ H 0 , chấp nhận
Dùng lệnh "test", kết quả thu được:
test lsales lmktval ceoten age comten grad
Kết quả trả về cho thấy giá trị P-value = (Prob > F) = 0.0000 < 0.05 nên có cơ sở bác bỏ
Kết luận: Mô hình hồi quy phù hợp c Kiểm định đa ràng buộc tuyến tính
Sau khi thực hiện hồi quy mẫu, giá trị ước lượng 𝛽̂ 4 được phát hiện là rất nhỏ (0.000148), điều này đặt ra câu hỏi liệu có thể loại bỏ biến tuổi (age) khỏi mô hình hay không.
- Ta xây dựng giả thuyết: { H 0 : β 4 = 0
- Phương pháp kiểm định: sử dụng giá trị p-value
- Quy tắc kiểm định: nếu giá trị p-value nhỏ hơn mức ý nghĩa 𝛼 = 0.05 thì bác bỏ H 0 , chấp nhận H 1
Ta sử dụng lệnh "test" như trên nhưng chỉ với biến sales
Vì giá trị P-value = 0.9775 >0.05 nên chấp nhận H 0
Kết luận: Bỏ biến age ra khỏi mô hình vì yếu tố age không ảnh hưởng đến biến tiền lương của CEO
=> Vậy các biến độc lập của mô hình là lsales, lmktval, ceoten, comten, grad
3 PHÂN TÍCH MÔ HÌNH a Kiểm định đa cộng tuyến Để kiểm định mô hình có mắc phải lỗi đa cộng tuyến hay không, nhóm đã sử dụng 3 cách khác nhau được trình bày dưới đây:
• Cách 1: R 2 cao nhưng tỉ số t thấp
- Nguyên tắc kiểm định: Trong trường hợp R 2 cao (thường R 2 >0.8) mà tỉ số t thấp
(thường |t|< 1) thì mô hình có dấu hiệu của đa cộng tuyến
- Kết quả chạy hồi quy:
reg lsalary lsales lmktval ceoten age comten grad
Source | SS df MS Number of obs = 177
- lsalary | Coef Std Err t P>|t| [95% Conf Interval]
-+ - lsales | 1927726 0399535 4.82 0.000 1139037 2716415 lmktval | 1006935 0492993 2.04 0.043 003376 1980111 ceoten | 01676 0057118 2.93 0.004 0054849 0280351 age | 000148 0052337 0.03 0.977 -.0101834 0104794 comten | -.0104312 0036879 -2.83 0.005 -.0177112 -.0031512 grad | -.0979702 0779818 -1.26 0.211 -.2519076 0559672
- Từ kết quả hồi quy mô hình ở trên, ta xác định được R 2 = 0.3544< 0.8 vàphần lớncác tỉ số
Kết luận: không phát hiện ra lỗi đa cộng tuyến trong mô hình hồi quy
• Cách 2: tương quan cặp giữa các biến độc lập cao
- Nguyên tắc kiểm định: nếu hệ số tương quan cặp giữa các biến độc lập cao (r > 0.8) thì có khả năng tồn tại đa cộng tuyến
- Kết quả bảng tương quan giữa các biến độc lập:
corr lsales lmktval ceoten age comten grad
| lsales lmktval ceoten age comten grad
-+ - lsales | 1.0000 lmktval | 0.7359 1.0000 ceoten | -0.0377 -0.0435 1.0000 age | 0.1939 0.1310 0.3387 1.0000 comten | 0.2378 0.1019 0.3151 0.4794 1.0000 grad | 0.0835 0.1501 -0.1028 -0.1232 -0.2283 1.0000
- Từ bảng tương quan trên, nhận thấy tất cả các giá trị tương quan cặp của các biến độc lập đều < 0.8
Kết luận: Không phát hiện ra lỗi đa cộng tuyến
• Cách 3: Sử dụng nhân tử phóng đại phương sai
Nguyên tắc kiểm định cho thấy nếu giá trị nhân tử phóng đại phương sai (VIF) của từng biến độc lập lớn hơn 10, thì mô hình có khả năng gặp phải lỗi đa cộng tuyến.
- Sử dụng lệnh “vif” ta có kết quả:
-+ - lsales | 2.35 0.426103 lmktval | 2.24 0.446792 comten | 1.47 0.678523 age | 1.39 0.718004 ceoten | 1.20 0.836202 grad | 1.09 0.915917
- Từ kết quả phân tích ở trên, nhận thấy tất cả các giá trị VIF cũng như Mean VIF đều có giá trị nhỏ hơn rất nhiều so với 10
Kết luận: không phát hiện lỗi đa cộng tuyến trong mô hình
Kết luận về lỗi đa cộng tuyến trong mô hình cho thấy cả ba phương pháp kiểm định đều không phát hiện ra lỗi này, cho phép chúng ta xác nhận rằng mô hình không mắc đa cộng tuyến Đối với việc kiểm định phương sai sai số thay đổi, nhóm đã đề xuất ba phương pháp kiểm tra để xác định xem mô hình có gặp phải lỗi này hay không.
• Cách 1: (định tính) Xem xét biểu đồ phần dư của giá trị dự đoán 𝑙𝑠𝑎𝑙𝑎𝑟𝑦 ̂
- Nguyên tắc kiểm định: nếu độ rỗng của biểu đồ rải của phần dư tăng hoặc giảm khi
𝑙𝑠𝑎𝑙𝑎𝑟𝑦 ̂ tăng thì giả thiết về phương sai sai số không đổi có thể không được thỏa mãn
- Sử dụng lệnh “rvfplot, yline (0)” ta thu được đồ thị phần dư của giá trị dự đoán 𝑙𝑠𝑎𝑙𝑎𝑟𝑦 ̂ :
Từ biểu đồ trên, nhận thấy độ rỗng của biểu đồ rải của phần dư có sự thay đổi (độ rộng tăng lên) khi 𝑙𝑠𝑎𝑙𝑎𝑟𝑦 ̂ giảm
Kết luận: mô hình có nhiều khả năng bị lỗi phương sai sai số thay đổi
• Cách 2: sử dụng kiểm định White
- Cặp giả thuyết kiểm định: { 𝐻 0 : 𝑝ℎươ𝑛𝑔 𝑠𝑎𝑖 𝑠𝑎𝑖 𝑠ố 𝑘ℎô𝑛𝑔 đổ𝑖
- Nguyên tắc kiểm định: với mức ý nghĩa 𝛼 = 0.05, nếu giá trị p-value chi2 = 0.0406 < 0.05 => bác bỏ𝐻 0 và chấp nhận 𝐻 1
Kết luận: Mô hình có lỗi phương sai sai số thay đổi
ĐÁNH GIÁ MÔ HÌNH
1 Mô hình hồi quy mẫu :
- Tất cả các biến độc lập đưa vào mô hình đều có ý nghĩa thống kê ở mức ý nghĩa 5%
- Các biến độc lập giải thích được 35.44% sự biến động của tiền lương
- Không có lỗi đa cộng tuyến, không có lỗi thừa biến trong mô hình
- Tuy nhiên mô hình hồi quy mẫu mắc lỗi phương sai sai số thay đổi, và lỗi thiếu biến
Mô hình tương đối tốt
2 Mô hình hồi quy sau khi thực hiện phép biến đổi logarit
- Tất cả các biến độc lập đều có ý nghĩa thống kê ở mức 5%
- Các biến độc lập giải thích được 34.68% sự biến động của tiền lương
- Mô hình không bị mắc các lỗi: đa cộng tuyến, phương sai sai số thay đổi, thừa biến
- Tuy nhiên, mô hình vẫn bị lỗi thiếu biến
Mô hình rất tốt, tương đối hoàn hảo