Giới thiệu chung
Các sai số chuẩn theo OLS chỉ chính xác khi các phần dư có phân phối độc lập và đồng nhất Khi các phần dư giữa các quan sát tương quan, sai số chuẩn OLS sẽ bị chệch và ước lượng không phản ánh đúng biến động thực của tham số Mặc dù dữ liệu bảng ngày càng phổ biến, các nhà nghiên cứu áp dụng nhiều phương pháp khác nhau để điều chỉnh sai số ước lượng bị chệch Trong các nghiên cứu tài chính gần đây, 45% không điều chỉnh sai số chuẩn khi các phần dư phụ thuộc lẫn nhau Trong số các nghiên cứu còn lại, 31% sử dụng biến giả cho từng nhóm, 34% áp dụng phương pháp Fama-Macbeth để ước lượng cả tham số và sai số chuẩn Ngoài ra, 7% sử dụng phương pháp điều chỉnh sai số chuẩn Newey-West, trong khi 22% áp dụng sai số chuẩn Rogers để điều chỉnh cho tương quan trong nhóm.
Sai số chuẩn White được điều chỉnh để tính đến sự tương quan trong nhóm, theo Moulton (1986) Các sai số chuẩn này thường được gọi là sai số chuẩn phân theo nhóm, giúp cải thiện độ chính xác trong các phân tích thống kê.
Mặc dù nhiều nghiên cứu đã đề xuất các phương pháp ước lượng sai số chuẩn trong dữ liệu bảng, nhưng vẫn thiếu hướng dẫn cho các nhà nghiên cứu về tính hợp lý của các phương pháp này Sự khác biệt trong kết quả ước lượng giữa các phương pháp làm nổi bật tầm quan trọng của việc so sánh chúng Các nhà nghiên cứu cần hiểu khi nào các phương pháp này dẫn đến các ước lượng sai số chuẩn khác nhau và lý do cho sự lựa chọn khác nhau này Đây chính là mục tiêu của bài nghiên cứu này.
Trong ứng dụng tài chính, có hai hình thức phụ thuộc phổ biến là hiệu ứng công ty (firm effect) và hiệu ứng thời gian (time effect), đóng vai trò quan trọng trong phân tích Hiệu ứng công ty liên quan đến sự tương quan giữa các đơn vị chéo qua các năm của một công ty, trong khi hiệu ứng thời gian đề cập đến sự tương quan giữa các công ty trong cùng một năm Nghiên cứu sẽ mô phỏng dữ liệu bảng để ước lượng các tham số và độ lệch chuẩn cho cả hai hiệu ứng, thực hiện riêng rẽ trước khi kết hợp cả hai Trong phần II, chúng ta sẽ xem xét các phương pháp ước lượng sai số chuẩn dưới tác động cố định, với các phương pháp OLS và Fama-Macbeth bị chệch, độ chệch tăng khi hiệu ứng công ty gia tăng Sai số chuẩn Rogers không bị chệch nhờ tính đến sự phụ thuộc do hiệu ứng công ty, trong khi sai số chuẩn Newey-West, mặc dù có chệch nhưng ở mức độ rất nhỏ.
Trong phần III, chúng ta sẽ phân tích hiệu ứng thời gian thay vì hiệu ứng công ty, sử dụng phương pháp Fama-Macbeth, vốn được thiết kế để xử lý hiệu ứng thời gian với độ chính xác cao hơn so với ước lượng OLS Các suy đoán từ hai phần trước sẽ được đưa vào phần IV, nơi chúng ta sẽ mô phỏng dữ liệu với cả hai hiệu ứng Mặc dù hiệu ứng công ty được giả định là hằng số, thực tế cho thấy nó có thể suy giảm theo thời gian, dẫn đến sự giảm tương quan giữa các phần dư khi khoảng cách tăng lên Phần V sẽ phân tích kết quả mô phỏng với cấu trúc tương quan tổng quát hơn, cho phép so sánh sai số ước lượng giữa các phương pháp OLS, phân nhóm và Fama-Macbeth, đồng thời xác định lợi ích tương đối của phương pháp hiệu ứng cố định-FE với các biến giả công ty trong việc ước lượng tham số Tuy nhiên, hầu hết các nghiên cứu hiện tại không báo cáo sai số chuẩn ước lượng theo các phương pháp khác nhau.
Chúng ta đã phân tích kết quả áp dụng các kỹ thuật ước lượng sai số chuẩn cho hai bộ dữ liệu thực và so sánh các kết quả một cách tương đối Phân tích này giúp chúng ta hiểu rõ hơn về cách sử dụng kỹ thuật ước lượng trong những tình huống cụ thể, đồng thời chỉ ra sự khác biệt giữa các phương pháp ước lượng Qua đó, chúng ta có thể nhận diện những thông tin còn thiếu trong mô hình và định hướng cải thiện mô hình một cách hiệu quả hơn.
Ước lượng mô hình trong điều kiện hiệu ứng công ty cố định
Sai số chuẩn theo phương pháp Fama-Macbeth
Phương pháp Fama-Macbeth, được phát triển bởi Fama và MacBeth vào năm 1973, là một kỹ thuật ước lượng các hệ số hồi quy và sai số chuẩn khi các phần dư không độc lập Trong phương pháp này, các nhà nghiên cứu thực hiện T lần hồi quy dữ liệu chéo, và giá trị trung bình của T lần ước lượng sẽ cho ra giá trị hệ số ước lượng cuối cùng.
Và giá trị phương sai ước lượng theo phương pháp Fama-Macbeth được tính toán theo công thức:
Trong công thức tính phương sai, các hệ số hồi quy theo năm (β t ) được giả định là độc lập, tuy nhiên, điều này chỉ đúng khi Xitɛit và X is ɛis không tương quan với nhau Khi có hiệu ứng công ty trong dữ liệu, giả định này không còn chính xác, dẫn đến phương sai ước lượng theo Fama-Macbeth trở nên rất nhỏ Do đó, trong trường hợp có hiệu ứng công ty, giá trị thực của phương sai theo ước lượng Fama-Macbeth cần được xem xét lại.
Dựa trên cấu trúc dữ liệu trong phương trình (4) và (5), hiệp phương sai của các hệ số ước lượng giữa các năm khác nhau là độc lập với khoảng cách thời gian t-s, và có thể được xác định bằng công thức sau:
Kết hợp phương trình (10) và (11) ta được phương trình diễn đạt giá trị đúng của phương sai ước lượng theo Fama-Macbeth:
Phương trình (12) tương tự như phương trình thể hiện phương sai tham số ước lượng bằng phương pháp OLS (xem phương trình 7), dẫn đến sai số chuẩn ước lượng theo phương pháp Fama-Macbeth cũng nhỏ như sai số chuẩn ước lượng bằng OLS Trong mọi trường hợp này, mức độ ước lượng thấp phụ thuộc vào hệ số tương quan giữa các biến độc lập và phần dư, cùng với số lượng thời kỳ trên mỗi công ty.
2.4 Mô phỏng ước lượng sai số chuẩn Fama-Macbeth Để nghiên cứu mức độ chệch của ước lượng sai số chuẩn theo phương pháp Fama-Macbeth, bài nghiên cứu này phân tích việc tính toán các giá trị ƣớc lƣợng của hệ số chặn và sai số chuẩn Fama-Macbeth với mỗi bộ dữ liệu mô phỏng gồm 5000 quan sát nhƣ đã đƣợc sử dụng ở bảng 1 ở trên Kết quả mô phỏng đƣợc báo cáo trong bảng 2 Ước lượng Fama-Macbeth cũng có đặc tính vững và hiệu quả như OLS (mức tương quan của hai phương pháp này ở mức cao trên 0.99) Độ lệch chuẩn của hệ số ước lượng của hai phương pháp này cũng giống nhau (so sánh giá trị thứ hai trong mỗi ô ở bảng 2.2.1, trang 9 và bảng 2.4.1, trang 15) Giống nhƣ các ƣớc lƣợng sai số chuẩn OLS, sai số chuẩn Fama-Macbeth có khuynh hướng chệch thấp xuống phía dưới (xem bảng 2.4.1, trang 15)
Mức độ chệch thực tế trong sai số chuẩn OLS và Fama-Macbeth cho thấy sự khác biệt rõ rệt Cụ thể, sai số chuẩn OLS bị chệch 60%, trong khi sai số chuẩn Fama-Macbeth chệch tới 74% Khi xem xét tam giác dưới trong bảng 2, giá trị đúng của sai số chuẩn tăng lên, nhưng sai số chuẩn ước lượng theo Fama-Macbeth lại có xu hướng bị chững lại Đặc biệt, khi hiệu ứng công ty gia tăng, độ chệch trong sai số chuẩn theo Fama-Macbeth tăng nhanh hơn so với OLS Điều này cho thấy mức độ chệch trong ước lượng sai số chuẩn của Fama-Macbeth gia tăng mạnh mẽ do phương pháp tính toán phương sai ước lượng của nó.
Bảng 2.4.1: Kết quả mô phỏng ước lượng sai số chuẩn theo Fama-Macbeth với hiệu ứng công ty trong dữ liệu
Avg(βFM) Std(βFM) Avg(SEFM)
Tỷ lệ biến động do hiệu ứng công ty trong biến độc lập
Tỷ lệ biến động do hiệu ứng công ty trong phần dư
Bảng kết quả ước lượng tham số và sai số chuẩn được xây dựng dựa trên mô phỏng 5000 dữ liệu trong 10 năm với 500 công ty mỗi năm Hệ số góc được thiết lập là 1, với độ lệch chuẩn của biến độc lập là 1 và sai số là 2 Tỷ lệ sai số chuẩn của phần dư do yếu tố công ty thay đổi trong các dòng dao động từ 0% đến 75%, trong khi tỷ lệ sai số chuẩn của biến độc lập do yếu tố công ty thay đổi trong các cột cũng nằm trong khoảng từ 0% đến 75% Giá trị đầu tiên trong mỗi ô là hệ số ước lượng bình quân theo phương pháp Fama-Macbeth, được tính bằng cách ước lượng cho mỗi năm và lấy trung bình trong 10 năm Giá trị thứ hai là độ lệch chuẩn của hệ số ước lượng theo phương pháp này, trong khi giá trị thứ ba là sai số chuẩn ước lượng Để làm rõ, chúng ta sẽ diễn giải mở rộng phương trình (9).
Giá trị phương sai đúng của các hệ số theo Fama-Macbeth được xác định qua sự chênh lệch giữa giá trị ước lượng hàng năm và giá trị thực của hệ số, trong khi giá trị phương sai ước lượng đo lường sự chênh lệch giữa giá trị ước lượng hàng năm và giá trị trung bình mẫu Hiệu ứng công ty ảnh hưởng đến cả hai loại giá trị này; khi hiệu ứng công ty gia tăng, sai số chuẩn ước lượng sẽ giảm, trong khi sai số chuẩn đúng của các hệ số lại tăng Cụ thể, trong trường hợp ρx và ρɛ bằng 1, sai số chuẩn theo OLS thấp hơn giá trị đúng, dẫn đến sai số chuẩn ước lượng theo Fama-Macbeth bằng 0 Sự chệch này sẽ giảm khi số năm nghiên cứu tăng lên, giúp giá trị ước lượng của hệ số góc hội tụ về giá trị đúng của nó.
Hiệu ứng công ty có thể kém quan trọng hơn khi biến phụ thuộc là tỷ suất sinh lợi, đặc biệt trong các ứng dụng tài chính doanh nghiệp, nơi hiệu ứng công ty không quan sát được lại rất quan trọng Phương pháp Fama-Macbeth được thiết kế để tính toán sự tương quan giữa các quan sát của các công ty khác nhau trong cùng một năm, không tính đến sự tương quan giữa các quan sát của cùng một công ty qua các năm Fama và Macbeth đã kiểm tra mức độ tương quan trong phần dư và phát hiện gần như bằng 0, tuy nhiên, các ứng dụng của họ không phải lúc nào cũng phù hợp với lý thuyết Phương pháp này chủ yếu xử lý hiệu ứng thời gian trong dữ liệu bảng, không phải hiệu ứng công ty.
2.5 Các sai số chuẩn Newey-West
Phương pháp Newey-West, được giới thiệu bởi Newey và West vào năm 1987, là một công cụ phổ biến để xử lý tương quan chuỗi trong các phần dư khi không biết dạng hàm của chúng Phương pháp này có thể được điều chỉnh cho dữ liệu bảng bằng cách ước lượng tương quan giữa các phần dư trễ trong cùng một nhóm, như đã được chỉ ra bởi các nghiên cứu của Bertrand, Duflo và Mullainathan (2004), Doidge (2004), MacKay (2003), và Brockman và Chung (2001) Việc chọn độ dài của trễ trong dữ liệu bảng tương đối đơn giản, vì độ trễ tối đa trong mô hình thường nhỏ hơn một năm so với số năm tối đa cho mỗi công ty Để so sánh hiệu quả của Newey-West với các phương pháp khác, chúng tôi sẽ tiến hành phân tích 5000 bộ dữ liệu mô phỏng, mỗi bộ gồm 5000 quan sát từ 500 công ty trong 10 năm, với giả định rằng hiệu ứng công ty chiếm 25% mức độ biến động của cả biến độc lập và phần dư.
Sai số chuẩn ước lượng bởi Newey-West tăng theo độ dài của trễ trong mô phỏng Khi độ dài trễ bằng 0, sai số chuẩn ước lượng tương đương với sai số chuẩn White, hiệu quả trong việc xử lý phương sai thay đổi Sai số chuẩn này cũng giống với sai số chuẩn OLS do phần dư có phương sai không đổi, và thường bị ước lượng thấp hơn so với sai số chuẩn đúng Khi độ dài trễ tăng từ 0 đến 9, sai số chuẩn ước lượng theo phương pháp Newey-West tăng từ 0.0283 lên 0.0328 Sự hiện diện của hiệu ứng công ty cố định khiến các quan sát của một công ty tương quan với nhau, không phụ thuộc vào khoảng cách thời gian Do đó, khi độ dài trễ tối đa không vượt quá T-1, sai số chuẩn Newey-West sẽ bị ước lượng thấp hơn so với sai số chuẩn đúng khi hiệu ứng công ty được cố định Ngay cả khi độ dài trễ tối đa là 9, các ước lượng theo Newey-West vẫn bị chệch khoảng 8% so với giá trị sai số chuẩn đúng, và sai số chuẩn vững ước lượng thấp hơn sai số chuẩn đúng gần 2%.
Quá trình mô phỏng cho thấy rằng việc áp dụng phương pháp Newey-West để ước lượng sai số chuẩn trong dữ liệu bảng sẽ dẫn đến kết quả khác biệt so với sai số chuẩn Rogers Sự khác biệt này xuất phát từ công thức trọng số mà Newey-West sử dụng Cụ thể, khi ước lượng sai số chuẩn, Newey-West nhân phần hiệp phương sai giữa các phần dư có độ trễ j (ɛ t ,ɛ t-j) với trọng số [1-j/(M+1)], trong đó M là độ trễ tối ưu Nếu M được đặt bằng T-1, ma trận trung tâm trong công thức hiệp phương sai của phương pháp Newey-West sẽ có dạng cụ thể.
Các sai số chuẩn Newey-West
Phương pháp Newey-West (Newey và West, 1987) được sử dụng để giải quyết vấn đề tương quan giữa các phần dư trong chuỗi thời gian, đặc biệt khi không biết dạng hàm của phần dư Phương pháp này phổ biến trong việc xử lý tương quan chuỗi và được điều chỉnh cho dữ liệu bảng bằng cách ước lượng tương quan giữa các phần dư trễ trong cùng một nhóm (xem Bertrand, Duflo và Mullainathan, 2004; Doidge, 2004; MacKay, 2003; Brockman và Chung, 2001) Việc chọn độ dài của trễ trong dữ liệu bảng khá đơn giản, vì độ trễ tối đa trong mô hình thường nhỏ hơn 1 năm so với số năm tối đa cho mỗi công ty Để đánh giá hiệu quả tương đối của Newey-West so với các phương pháp khác, chúng tôi tiến hành phân tích 5000 bộ dữ liệu, mỗi bộ gồm 5000 quan sát, với 500 công ty và 10 năm cho mỗi công ty, trong đó giả định rằng hiệu ứng công ty chiếm 25% mức độ biến động của cả biến độc lập và phần dư.
Sai số chuẩn ước lượng bởi Newey-West tăng theo độ dài của trễ trong mô phỏng Khi độ dài trễ bằng 0, sai số chuẩn này tương đương với sai số chuẩn White, hiệu quả trong xử lý phương sai thay đổi Sai số chuẩn ước lượng này cũng giống với sai số chuẩn OLS do phần dư có phương sai không đổi, dẫn đến việc ước lượng thấp hơn so với sai số chuẩn đúng Khi độ dài trễ tăng từ 0 đến 9, sai số chuẩn Newey-West tăng từ 0.0283 lên 0.0328 Sự hiện diện của hiệu ứng công ty cố định làm cho các quan sát của cùng một công ty tương quan với nhau, không phụ thuộc vào khoảng cách thời gian Do đó, khi độ dài trễ tối đa không vượt quá T-1, sai số chuẩn Newey-West ước lượng thấp hơn sai số chuẩn đúng khi hiệu ứng công ty được cố định Ngay cả khi độ dài trễ tối đa là 9, ước lượng Newey-West vẫn bị chệch khoảng 8% so với sai số chuẩn đúng Sai số chuẩn vững ước lượng thấp hơn sai số chuẩn đúng gần 2%.
Quá trình mô phỏng cho thấy rằng việc áp dụng phương pháp Newey-West để ước lượng sai số chuẩn trong dữ liệu bảng sẽ dẫn đến kết quả khác biệt so với sai số chuẩn Rogers Sự khác biệt này xuất phát từ công thức trọng số mà Newey-West sử dụng, trong đó phần hiệp phương sai giữa các phần dư có độ trễ j (ɛ t ,ɛ t-j) được nhân với trọng số [1-j/(M+1)], với M là độ trễ tối ưu cụ thể Nếu chọn M=T-1, ma trận trung tâm trong công thức hiệp phương sai của phương pháp Newey-West sẽ được xác định.
Công thức xác định sai số chuẩn của Rogers tương tự như công thức trên, chỉ khác ở phần trọng số [w(j)], trong khi Rogers áp dụng một hàm trọng số cho tất cả các hiệp phương sai Phương pháp Newey-West được phát triển cho chuỗi thời gian đơn và sử dụng hàm trọng số để đảm bảo ma trận ước lượng là ma trận xác định dương Khi giá trị độ trễ tối đa (M) tăng lên, trọng số w(j) cũng tăng, và nếu M được tăng đến giá trị cỡ mẫu T lớn, ước lượng sẽ trở nên vững (consistent) Tuy nhiên, trong cấu trúc dữ liệu bảng, số kỳ thường ngắn, và tính vững của ước lượng Rogers phụ thuộc vào số nhóm, trong khi phương pháp Newey-West lại phụ thuộc vào số lượng thời kỳ, dẫn đến sai số chuẩn ước lượng thường thấp hơn giá trị thực.
Ước lượng sai số chuẩn trong điều kiện hiệu ứng thời gian
Các ƣớc lƣợng Fama-Macbeth
Mặc dù các nghiên cứu trước đây cung cấp thông tin hữu ích, nhưng chúng chưa mô tả đầy đủ dữ liệu thực tế trong nghiên cứu tài chính thực nghiệm Hầu hết dữ liệu bảng đều bao gồm cả hiệu ứng công ty và hiệu ứng thời gian, vì vậy cần đánh giá mức độ hiệu quả tương đối của các phương pháp trong điều kiện có cả hai hiệu ứng này Trong phần này, chúng ta sẽ phân tích kết quả mô phỏng dữ liệu với cả biến độc lập và phần dư bao gồm hiệu ứng công ty và thời gian.
Ước lượng sai số chuẩn trong điều kiện cả hiệu ứng công ty và hiệu ứng thời gian
Ƣớc lƣợng Fama-Macbeth
Các phân tích trước đây thường giả định rằng hiệu ứng công ty là cố định, tuy nhiên, giả định này không phải lúc nào cũng đúng Mức độ phụ thuộc của các phần dư có thể giảm khi khoảng cách thời gian giữa chúng tăng lên Trong các dữ liệu bảng có thời gian quan sát ngắn, việc phân biệt hiệu ứng công ty thường xuyên và tạm thời là khó khăn Khi số năm quan sát tăng lên, chúng ta có thể xác định rõ hơn mức độ tác động thường xuyên của hiệu ứng công ty trong nghiên cứu thực nghiệm Hơn nữa, việc hiểu rõ mức hiệu quả của từng ước lượng sai số chuẩn cũng rất quan trọng, vì nó phụ thuộc vào tính chất tác động của hiệu ứng công ty.
5.1 Hiệu ứng công ty tạm thời : định dạng cấu trúc dữ liệu Để làm rõ tính hiệu quả của các phương pháp ước lượng khác nhau trong trường hợp tổng quát, chúng ta tiến hành phân tích kết quả mô phỏng với cấu trúc dữ liệu bao gồm cả thành phần thường xuyên (fixed firm effect) và thành phần tạm thời ( non-fixed firm effect), trong đó thành phần tạm thời đƣợc giả định là một tiến trình tự hồi quy bậc một Điều này làm cho hiệu ứng công ty suy giảm dần với tỷ lệ theo tiến trình suy giảm tự hồi quy bậc một hoặc là bằng không sau k thời kỳ Để xây dựng dữ liệu, chúng ta sẽ giả định rằng yếu tố không phải hiệu ứng công ty trong phần dư (η it trong phương trình 4) tuân theo tiến trình tự hồi quy bậc một; it it ς ε nếu t = 1 it
Hệ số tương quan bậc một giữa η it và η it-1 được ký hiệu là φ, trong khi tương quan giữa η it và η it-k là φ k Sự kết hợp với yếu tố hiệu ứng công ty cố định (γ i trong phương trình 4) tạo ra ảnh hưởng đáng kể đến kết quả phân tích.
Ước lượng sai số chuẩn trong điều kiện hiệu ứng công ty tạm thời
Hiệu ứng công ty tạm thời : định dạng cấu trúc dữ liệu
Để đánh giá hiệu quả của các phương pháp ước lượng trong trường hợp tổng quát, chúng ta tiến hành phân tích kết quả mô phỏng với cấu trúc dữ liệu bao gồm cả thành phần cố định và tạm thời Thành phần tạm thời được giả định là một quá trình tự hồi quy bậc một, dẫn đến hiệu ứng công ty giảm dần theo tỷ lệ của quá trình này hoặc bằng không sau k thời kỳ Trong quá trình xây dựng dữ liệu, giả định rằng yếu tố không phải hiệu ứng công ty trong phần dư tuân theo quá trình tự hồi quy bậc một là cần thiết.
Hệ số tương quan bậc một φ giữa η it và η it-1, cùng với tương quan giữa η it và η it-k được thể hiện qua φ k Sự kết hợp với hiệu ứng công ty cố định (γ i) trong phương trình 4 làm giảm tương quan chuỗi thời gian của các phần dư theo thời gian, nhưng quá trình này diễn ra chậm hơn so với tự tương quan bậc một và tiệm cận với ρƐ (trong phương trình 6) Dựa vào độ lớn tương đối của hiệu ứng công ty cố định (ρ Ɛ) và mức độ tự tương quan bậc một (φ), tôi có thể thay thế mẫu hình tương quan trong phần dư, với tương quan độ trễ k được biểu diễn một cách rõ ràng.
Cấu trúc của biến độc lập được xác định qua tương quan với các độ trễ từ 1 đến 9, với bốn dạng dữ liệu được thể hiện trong hình 5.1.1.
Hình 5.1.1: Hệ số tương quan giữa phần dư khi thay đổi hiệu ứng công ty cố định
(ρ) và hệ số tự tương quan bậc 1 (ϕ)
Các mức tương quan được xem xét từ hiệu ứng công ty cố định chuẩn (ρ=0.25 và φ=0.00) đến quá trình AR1 chuẩn (ρ=0.00 và φ=0.75) Giả định này áp dụng cho cả biến độc lập và phần dư, vì như đã nêu trong phần II, nếu không có sự phụ thuộc trong nhóm các biến độc lập, thì các sai số chuẩn theo OLS sẽ có giá trị chính xác.
Hiệu ứng cố định- biến giả công ty (Fixed Effects-Firm Dummies)
Một phương pháp khác để giải quyết sự phụ thuộc giữa các phần dư trong cùng một nhóm là sử dụng mô hình hiệu ứng cố định hoặc biến giả công ty Qua phân tích kết quả mô phỏng, chúng ta có thể so sánh tính hiệu quả tương đối của sai số chuẩn OLS và Rogers trong cả hai trường hợp có và không có biến giả, với kết quả được trình bày trong bảng 5.2.1, trang 34, cột I.
Bảng 5.2.1: Ước lượng sai số chuẩn với hiệu ứng công ty không cố định
Sai số chuẩn OLS và Rogers
1.0007 0.0587 0.0283 0.0578 OLS với biến giả công ty
Bảng kết quả ước lượng tham số và sai số chuẩn được xây dựng dựa trên mô phỏng 5000 dữ liệu từ 10 năm và 500 công ty mỗi năm Hệ số góc được thiết lập bằng 1, trong khi độ lệch chuẩn của biến độc lập là 1 và sai số là 2 Độ lớn của hiệu ứng công ty cố định (ρ) và tự tương quan bậc 1 (φ) sẽ có sự thay đổi giữa các cột trong bảng Phần phương sai của biến độc lập do yếu tố hiệu ứng công ty cố định gây ra được biểu diễn bởi ρ X (ρ ε), trong khi hệ số tự tương quan bậc 1 thể hiện phần hiệu ứng công ty không cố định trong biến độc lập được biểu diễn bởi φ X (φ ε) Qua việc kết hợp phương trình (6) với các phương trình (15) và (16), chúng ta có thể xác định cấu trúc của phần dư.
1 t if ςit μit εit γi εit
Biến độc lập cũng được định dạng tương tự như phần dư
Bảng 5.2.1 trình bày các tham số ước lượng theo phương pháp OLS, trong đó dòng đầu tiên chỉ bao gồm biến độc lập X, còn dòng thứ hai bao gồm 499 biến giả công ty, đại diện cho tác động của 500 công ty Mỗi ô trong bảng chứa bốn giá trị: giá trị thứ nhất là trung bình của tham số ước lượng, giá trị thứ hai là độ lệch chuẩn, giá trị thứ ba là sai số chuẩn ước lượng theo phương pháp OLS, và giá trị thứ tư là sai số chuẩn ước lượng theo phương pháp Rogers, được phân nhóm theo công ty nhằm xác định mức độ tương quan giữa các quan sát trong cùng một công ty qua các năm khác nhau.
Các ước lượng dựa trên mô hình hiệu ứng cố định cho thấy hiệu quả cao hơn (0.0299 so với 0.0355), tuy nhiên, điều này không phải lúc nào cũng đúng Tính hiệu quả của các ước lượng này phụ thuộc vào tác động bù trừ lẫn nhau Việc sử dụng biến giả công ty yêu cầu thêm N-1 bậc tự do, dẫn đến sai số chuẩn của các ước lượng bị giảm Mặc dù vậy, các biến giả cũng loại bỏ sự phụ thuộc trong nhóm của biến độc lập, giúp giảm độ lệch chuẩn của ước lượng Trong trường hợp này, tác động giảm độ lệch chuẩn vượt trội hơn, do đó các ước lượng theo mô hình hiệu ứng cố định là hiệu quả hơn.
Khi tích hợp yếu tố hiệu ứng công ty vào mô hình, sai số chuẩn theo phương pháp OLS trở nên chính xác, do đó không cần thiết phải sử dụng sai số chuẩn theo phương pháp Rogers.
Sai số chuẩn theo Rogers được coi là chính xác khi không có hiệu ứng cố định, nhưng khi đưa hiệu ứng này vào mô hình, sai số chuẩn có thể lớn hơn khoảng 5% so với giá trị đúng, như đã chỉ ra trong nghiên cứu của Kezdi (2002) Việc cố định hiệu ứng công ty trong nghiên cứu rất nhạy cảm; nếu hiệu ứng công ty giảm theo thời gian, các biến giả công ty sẽ không phản ánh đầy đủ sự phụ thuộc trong nhóm công ty, dẫn đến sai số chuẩn theo OLS bị chệch Qua ba mô phỏng bổ sung, kết quả cho thấy hiệu ứng công ty thực sự giảm theo thời gian, với 92% hiệu ứng biến mất sau 9 năm Khi hiệu ứng công ty chỉ mang tính tạm thời, sai số chuẩn theo OLS ước lượng thấp hơn so với sai số chuẩn đúng, ngay cả khi có biến giả công ty trong mô hình Mức độ ước lượng thấp này phụ thuộc vào thành phần tạm thời trong hiệu ứng công ty, với mức chệch tăng từ 17% khi φ=0.5 lên 33% khi φ=0.75 Mặc dù sai số chuẩn theo Rogers gần đúng với giá trị đúng, nhưng vẫn ước lượng cao hơn khoảng 5% trong tất cả các mô phỏng.
Sai số chuẩn Fama-Macbeth hiệu chỉnh
Sai số chuẩn Fama-Macbeth bị chệch do hiệu ứng công ty, dẫn đến sự tương quan giữa các tham số ước lượng hàng năm Một số tác giả đã đề xuất điều chỉnh sai số chuẩn bằng cách ước lượng tương quan giữa các hệ số ước lượng theo năm và điều chỉnh phương sai ước lượng Cách tiếp cận này có thể chính xác bởi hiệu ứng công ty làm cho các ước lượng hàng năm có sự tương quan chuỗi Để kiểm tra ý tưởng này, chúng tôi phân tích kết quả mô phỏng với hiệu ứng công ty cố định chiếm 25% phương sai Qua mỗi lần mô phỏng, chúng tôi ước lượng 10 hệ số chặn và tính toán mức tự tương quan của chúng Kết quả cho thấy sai số chuẩn gốc và sai số chuẩn điều chỉnh của Fama-Macbeth khác nhau trong các trường hợp độ trễ vô hạn và hữu hạn Mức tương quan ước lượng không giống như dự đoán của Fama và French, với 90% khoảng tin cậy từ -0.60 đến 0.41 và giá trị trung bình là -0.1134.
Bảng 5.3.1: Ước lượng sai số chuẩn với hiệu ứng công ty không cố định
Sai số chuẩn Fama-Macbeth
Avg(tự tương quan bậc 1) -0.1134 0.2793 0.3250 0.1759
Bảng kết quả ước lượng tham số và sai số chuẩn được xây dựng từ mô phỏng 5000 dữ liệu trong 10 năm với 500 công ty mỗi năm Hệ số góc là 1, độ lệch chuẩn của biến độc lập là 1 và của sai số là 2 Hiệu ứng công ty cố định (ρ) và tự tương quan bậc 1 (φ) thay đổi giữa các cột trong bảng Phần phương sai của biến độc lập do yếu tố hiệu ứng công ty cố định gây ra được thể hiện qua ρ X (ρ ε), trong khi φ X (φ ε) đại diện cho hệ số tự tương quan bậc 1, phản ánh phần hiệu ứng công ty không cố định trong biến độc lập Bằng cách kết hợp các phương trình (6), (15) và (16), chúng ta có thể xác định cấu trúc của phần dư.
1 t if ςit μit εit γi εit
Biến độc lập được định dạng giống như phần dư, với Panel B trình bày hệ số và sai số chuẩn ước lượng theo phương pháp Fama-Macbeth Hai giá trị đầu tiên trong mỗi ô là giá trị trung bình tham số ước lượng và độ lệch chuẩn của sai số Giá trị thứ ba là trung bình sai số chuẩn với giả định tham số độc lập qua các năm Hai giá trị cuối cùng là sai số chuẩn Fama-Macbeth điều chỉnh theo tiến trình tự tương quan bậc 1, với giá trị thứ tư giả định độ trễ vô hạn và giá trị thứ năm giả định độ trễ bằng 9 Cuối cùng, dòng cuối cùng thể hiện giá trị trung bình hệ số tương quan của β t và β t-1 qua mô phỏng 5000 lần với mẫu 5000 quan sát.
Giá trị tự tương quan bậc một trung bình âm dẫn đến các sai số chuẩn Fama-Macbeth điều chỉnh nhỏ hơn và bị chệch nhiều hơn so với giá trị chưa điều chỉnh Nguyên nhân cho sự không hiệu quả của phương pháp điều chỉnh này khó nhận diện, do hệ số tương quan ước lượng gây ra sai số chuẩn bị chệch Hệ số tự tương quan giữa các beta và hiệp phương sai cũng góp phần làm sai số chuẩn bị chệch, được ước lượng thông qua 5000 mô phỏng.
Để hiểu cách hiệu ứng công ty cố định ảnh hưởng đến hiệp phương sai, chúng ta xem xét trường hợp mà giá trị đặc trưng của mỗi công ty i là giá trị μ i γ i dương Giá trị dương này dẫn đến hệ số ước lượng năm t cao hơn giá trị trung bình, và do hiệu ứng công ty được cố định, hệ số ước lượng năm t-1 cũng cao hơn trung bình Các giá trị đặc trưng của hiệu ứng công ty trong mô phỏng không làm thay đổi giá trị β trung bình qua các mẫu, mà giá trị β trung bình này vẫn giữ nguyên là 1 Khi ước lượng mối tương quan giữa β t và β t-1, hiệu ứng công ty sẽ tạo ra mối tương quan dương và làm sai số chuẩn Fama-Macbeth bị chệch dưới.
Các nhà nghiên cứu chỉ có một bộ dữ liệu duy nhất và cần tính toán tương quan của chuỗi các hệ số β từ mẫu quan sát Hệ số phương sai- hiệp phương sai được tính toán theo phương pháp cụ thể.
E β ) , Cov(β t t 1 t Within_sa mple t 1 Within_sam ple (19)
Hệ số tương quan mẫu đo lường xu hướng của hệ số β t lớn hơn giá trị trung bình mẫu khi hệ số β t-1 lớn hơn giá trị trung bình mẫu Hiệu ứng công ty cố định ảnh hưởng đến hiệp phương sai, với giá trị μiγi dương làm tăng giá trị ước lượng từ β 1 đến β T và giá trị trung bình của các hệ số β Tuy nhiên, hiệu ứng này không làm thay đổi độ lệch của bất kỳ giá trị β t nào so với giá trị trung bình Độ lệch này ảnh hưởng đến giá trị tương quan mẫu được ước lượng, do đó, chúng ta có thể kỳ vọng rằng giá trị tương quan chuỗi từ mẫu sẽ có giá trị trung bình bằng 0 Nếu tương quan mẫu tiệm cận 0, việc điều chỉnh sai số chuẩn dựa trên hệ số tương quan ước lượng vẫn có thể dẫn đến các ước lượng sai số chuẩn bị chệch.
Sai số chuẩn Fama-Macbeth được điều chỉnh cho thấy hiệu quả cao hơn khi có yếu tố tự hồi quy trong phần dư (φ>0) Trong ba quá trình mô phỏng tại bảng 5.3.1, hệ số tự tương quan mẫu ước lượng có giá trị dương nhưng sai số chuẩn Fama-Macbeth điều chỉnh vẫn bị chệch dưới Việc điều chỉnh này giúp các ước lượng sai số chuẩn gần đúng với giá trị thực tế khi hiệu ứng công ty không cố định (ρ=0) Trong trường hợp này, sai số chuẩn điều chỉnh ước lượng thấp hơn giá trị sai số chuẩn đúng 23% Khi độ lớn của hiệu ứng công ty tăng, độ chệch trong sai số chuẩn ước lượng cũng tăng theo Do đó, sai số chuẩn Fama-Macbeth điều chỉnh yếu tố tương quan chuỗi hiệu quả hơn so với sai số chuẩn không được điều chỉnh, đặc biệt khi hiệu ứng công ty giảm dần theo thời gian, nhưng cả hai vẫn ước lượng thấp hơn đáng kể so với giá trị sai số chuẩn đúng.
Ứng dụng thực nghiệm
Ứng dụng trong định giá tài sản
Trong bài nghiên cứu của Daniel và Titman (2004), các tác giả đã sử dụng mô hình hồi quy tỷ suất sinh lợi (TSSL) để phân tích tác động của các biến như giá trị sổ sách, giá thị trường và việc phát hành cổ phần đến tỷ suất sinh lợi của chứng khoán Dữ liệu được xây dựng từ các biến độ trễ hàng năm, dẫn đến hệ số tự tương quan lớn cho các biến độc lập Để đánh giá mức độ ảnh hưởng của hiệu ứng công ty và thời gian, các sai số chuẩn của White và Rogers đã được so sánh Kết quả cho thấy sai số chuẩn của Rogers gần như không thay đổi khi phân nhóm theo công ty, do giá trị tự tương quan trong phần dư bằng 0, trong khi hệ số tự tương quan của các biến độc lập vẫn cao và ổn định Hệ số tự tương quan này ảnh hưởng đến sai số chuẩn, khiến sai số chuẩn Rogers tương tự như sai số White.
Bảng 6.1.1 : Ứng dụng định giá tài sản
I II III IV V VI VII VIII
Estimates OLS OLS OLS FM WFM
Standard Errors White Rogers(F) Rogers(T) FM FM White Rogers(F) Rogers(T)
Kết quả sai số chuẩn khi phân nhóm theo thời gian (theo tháng) cho thấy độ lớn gấp hai đến bốn lần so với sai số chuẩn White Cụ thể, hệ số t đối với biến trễ tỷ số giá sổ sách trên giá thị trường là 7.2 với sai số chuẩn White, trong khi chỉ còn 1.9 khi sử dụng sai số chuẩn phân nhóm theo tháng Điều này chỉ ra rằng có hiệu ứng thời gian đáng kể trong dữ liệu Tuy nhiên, mô hình đã bao gồm các biến giả thời gian, do đó các yếu tố hiệu ứng cố định đã được loại bỏ khỏi dữ liệu và không ảnh hưởng đến sai số chuẩn Kết quả là phần tương quan còn lại theo thời gian phải biến động giữa các quan sát.
Hiểu rõ tác động của hiệu ứng công ty tạm thời là điều cần thiết để giải thích vấn đề này Hiệu ứng công ty có xu hướng giảm dần theo thời gian; cụ thể, phần dư của công ty A trong năm 1980 có mối tương quan mạnh mẽ với phần dư trong năm 1981 hơn so với phần dư trong năm 1990 Điều này lý giải cho việc chúng ta tiến hành phân tích kết quả mô phỏng dữ liệu trong phần V (xem bảng 5.3.1, trang).
Việc hình dung một yếu tố hiệu ứng thời gian không cố định là một thách thức lớn Hiệu ứng thời gian tạm thời có thể được hiểu như một cú sốc xảy ra trong một năm nhất định.
Năm 1980 đã ảnh hưởng mạnh mẽ đến công ty A và B, nhưng tác động đối với công ty Z lại thấp hơn nhiều Nếu hiệu ứng thời gian tác động đồng đều lên các công ty trong một năm trước đó, các biến giả thời gian sẽ hấp thụ hoàn toàn tác động này, và việc phân nhóm theo thời gian sẽ không làm thay đổi sai số chuẩn đã báo cáo Tuy nhiên, thực tế cho thấy rằng việc phân nhóm theo thời gian đã thay đổi giá trị các sai số chuẩn, cho thấy có tồn tại hiệu ứng thời gian trong dữ liệu.
Nắm bắt dữ liệu cho phép chúng ta hiểu rõ sự phụ thuộc trong một nhóm Chẳng hạn, với bộ dữ liệu TSSL theo tháng, chúng ta có thể phân tích tác động của cú sốc thị trường đến các công ty khác nhau Khi có sự bùng nổ kinh tế trong một tháng, các công ty trong ngành hàng hóa lâu bền thường tăng trưởng mạnh hơn so với các công ty trong ngành hàng hóa không lâu bền Điều này dẫn đến sự tương quan cao giữa các công ty cùng ngành trong tháng đó, nhưng tương quan thấp hơn với các công ty khác ngành Khi sắp xếp dữ liệu theo tháng và theo công ty bốn chữ số, chúng ta thấy bằng chứng về sự tự tương quan trong phần dư và biến độc lập mỗi tháng Hệ số tự tương quan cao hơn khi sắp xếp theo công ty trước rồi đến tháng, và giảm dần khi khoảng cách giữa các ngành gia tăng.
Khi tính toán sai số chuẩn Rogers theo thời gian, không cần giả định cách sắp xếp dữ liệu Tuy nhiên, để hiểu rõ hơn về cấu trúc dữ liệu, các nhà nghiên cứu cần xem xét nguồn gốc của sự phụ thuộc trong phần dư Bằng cách phân tích sai số chuẩn trong các trường hợp không phân nhóm, phân nhóm theo thời gian và theo công ty, chúng ta có thể xác định bản chất của sự phụ thuộc trong phần dư, từ đó cải thiện mô hình một cách hiệu quả hơn.
Theo kết quả từ phần II và III, sai số chuẩn Fama-Macbeth cho thấy hiệu quả cao hơn trong trường hợp có hiệu ứng thời gian so với hiệu ứng công ty Do đó, kết quả này có tính chính xác với bộ dữ liệu hiện tại Hệ số ước lượng và sai số chuẩn Fama-Macbeth được trình bày trong cột.
IV Kết quả này hoàn toàn giống với kết quả của Daniel và Titman (xem bảng 3, dòng
Kết quả từ 8 bài nghiên cứu cho thấy hệ số ước lượng tương tự như hệ số ước lượng OLS, tuy nhiên, sai số chuẩn lớn hơn nhiều so với sai số chuẩn White (từ 2 đến 3.4 lần) do có hiệu ứng thời gian Sai số chuẩn Fama-Macbeth gần bằng với sai số chuẩn Rogers khi phân nhóm theo thời gian, vì cả hai phương pháp đều được thiết kế để giải quyết vấn đề phụ thuộc theo chiều thời gian Dù sai số chuẩn Fama-Macbeth nhỏ hơn một cách nhất quán so với sai số chuẩn Rogers, nhưng độ chênh lệch không đáng kể (từ 12% đến 18%, so sánh cột III và IV trong bảng 6.1.1, trang 42).
Hồi quy dữ liệu chéo và chuỗi thời gian trên dữ liệu bảng xem xét các quan sát tương đồng Phương pháp Fama-Macbeth tính toán các hệ số ước lượng tháng với trọng số bằng nhau cho mỗi tháng, nhưng không đồng nhất cho từng quan sát Trong trường hợp dữ liệu bảng không cân đối, Fama-Macbeth thực hiện trọng số cho mỗi quan sát bằng 1/Nt, trong đó Nt là số lượng công ty trong tháng t Số lượng công ty trong mẫu đã tăng từ 1000 mỗi tháng ban đầu lên gần
Mô hình hồi quy Fama-Macbeth thường sử dụng trọng số thấp đối với các quan sát ở cuối mẫu dữ liệu, dẫn đến cần hiệu chỉnh Để khắc phục điều này, các hệ số ước lượng được tính với trọng số bình quân tỷ lệ N t Kết quả cho thấy hệ số ước lượng có và không có trọng số cùng với sai số chuẩn gần như tương đương (xem cột IV và V trong bảng 6.1.1, trang 42) Điều này chỉ ra rằng trọng số không ảnh hưởng đến kết quả vì chúng không tương quan với các biến.
Phương pháp hồi quy cuối cùng sử dụng hồi quy OLS với các biến giả cho cả thời gian và công ty, ước lượng theo phương pháp within Sai số chuẩn của mô hình được ước lượng bằng phương pháp White và Rogers, phân nhóm theo công ty hoặc tháng Kết quả hồi quy cho thấy rằng phân nhóm theo công ty không làm thay đổi sai số chuẩn, trong khi phân nhóm theo thời gian, mặc dù chỉ tăng nhẹ, nhưng thực sự đã làm gia tăng sai số chuẩn từ 52% đến 229%.
Ứng dụng trong Tài Chính Doanh Nghiệp
Trong bài viết này, chúng tôi phân tích mô hình hồi quy cấu trúc vốn trong tài chính doanh nghiệp, sử dụng các biến độc lập phổ biến như quy mô công ty, tuổi thọ công ty, tính thanh khoản tài sản và lợi nhuận công ty Mô hình nghiên cứu áp dụng các biến độc lập trễ một năm so với biến phụ thuộc, dựa trên mẫu dữ liệu dài từ năm 1965 đến 2003, đồng thời loại bỏ các công ty không chi trả cổ tức theo phương pháp của Fama và French (2002) Kết quả hồi quy OLS và Fama-Macbeth được trình bày trong Bảng 6.1.2, trang 47.
Mức độ quan trọng giữa hiệu ứng công ty và hiệu ứng thời gian được thể hiện qua việc so sánh sai số chuẩn giữa hai phương pháp Sai số chuẩn Rogers khi phân nhóm theo công ty cao hơn nhiều so với sai số chuẩn White, với tỷ lệ 181% đến 232% Cụ thể, hệ số t đối với biến quảng cáo/doanh thu là -1.9 với sai số chuẩn White, trong khi với sai số chuẩn Rogers, giá trị này giảm xuống còn -0.7 Chi tiêu R&D cao dẫn đến hệ số tự tương quan cao và ổn định, trong khi hệ số tự tương quan ở phần dư cũng rất cao, vẫn duy trì trên 40% ngay cả sau 12 năm.
Bảng 6.2.1: Ứng dụng tài chính doanh nghiệp
Hồi quy cấu trúc vốn
I II III IV V VI VII VIII
Coefficient Estimates OLS OLS OLS FM WFM OLS OLS OLS
Standard Errors White Rogers(F) Rogers(T) FM FM White Rogers(F) Rogers(T)
Mức độ quan trọng của hiệu ứng thời gian trong bộ dữ liệu này thấp hơn nhiều so với bộ dữ liệu trước Sai số chuẩn Rogers theo thời gian lớn hơn sai số chuẩn White, nhưng sự khác biệt không quá lớn, trừ biến giá thị trường/giá sổ sách Nguyên nhân là do hệ số tự tương quan trong phần dư tương đối nhỏ Khi dữ liệu được sắp xếp theo năm, ngành và công ty, hệ số tự tương quan bậc một trong phần dư chỉ dưới 12% Sai số chuẩn của biến giá thị trường/giá sổ sách là yếu tố duy nhất tăng mạnh, do hiệu ứng thời gian tạm thời lớn mà đã được đề cập.
Kết quả cho thấy sự điều chỉnh trong sai số chuẩn có sự khác biệt rõ rệt giữa các biến, cả về dấu và độ lớn Cụ thể, giá trị sai số chuẩn của biến giả “giá trị R&D là dương” theo phương pháp White cao hơn 12% so với sai số chuẩn của Rogers khi phân nhóm theo năm, trong khi biến giá sổ sách/giá thị trường lại thấp hơn 64% Sai số chuẩn White được coi là chính xác khi hệ số tự tương quan trong phần dư bằng 0 Tuy nhiên, khi hệ số tự tương quan khác 0, mức chệch trong các sai số chuẩn sẽ phụ thuộc vào mối tương quan giữa mẫu hình thời gian của sự tự tương quan trong các phần dư và biến độc lập.
Sai số chuẩn Fama-Macbeth tương tự như sai số chuẩn Rogers khi phân nhóm theo thời gian, với giá trị gần giống nhau trong hầu hết các trường hợp Sự phụ thuộc trong phần dư chủ yếu do hiệu ứng công ty, dẫn đến hiện tượng chệch tương tự như trong sai số chuẩn OLS Biến duy nhất có ước lượng sai số chuẩn khác nhau là biến quảng cáo/doanh thu, với hệ số là -0.0977 khi ước lượng bằng OLS và 0.0747 khi ước lượng bằng Fama-Macbeth Khi ước lượng bằng Fama-Macbeth có trọng số, giá trị là -0.0002 Sự bất ổn trong hệ số này tương tự như trong các ước lượng trước đó, và khi sai số chuẩn được điều chỉnh bởi yếu tố hiệu ứng công ty, biến quảng cáo/doanh thu không còn khác không về mặt thống kê.
Mô hình định giá tài sản dựa trên dữ liệu Việt Nam
Phân tích so sánh tổng quát giữa sai số chuẩn ước lượng theo phương pháp
Trong bài viết này, tôi sẽ phân tích sự khác biệt giữa sai số chuẩn ước lượng theo phương pháp White và Rogers trong mô hình đa biến Phân tích này sẽ cung cấp cơ sở để hiểu rõ hơn về kết quả của mô hình hồi quy khi áp dụng cho dữ liệu thực của các công ty niêm yết trên sàn giao dịch chứng khoán thành phố Hồ Chí Minh.
Giả sử chúng ta có một mô hình hồi quy với dữ liệu bảng (panel data) bao gồm N công ty và T thời kỳ cho mỗi công ty, với k biến quan sát Mô hình này có thể được biểu diễn dưới dạng: ε = βX.
Y it it it hoặc ở dạng ma trận: Y βX ε (1’)
Y là ma trận NTx1 của biến phụ thuộc
X là ma trận NTxk các biến giải thích ɛ là ma trận NTx1 của phần dƣ
Khi đó tham số ƣớc lƣợng và sai số chuẩn đƣợc xác định nhƣ sau:
Chúng ta sẽ tập trung vào phân tích vào các giả định của ma trận Ω cũng nhƣ ma trận trung tâm X’ΩX
Theo White (1980), ma trận Ω thể hiện sự tương quan giữa các phần dư dưới dạng ma trận đường chéo, trong đó các phần tử trên đường chéo biểu thị phương sai của các phần dư Khác với giả định của mô hình OLS, phương sai trong ma trận này thay đổi theo từng quan sát Ma trận ước lượng của Ω được xây dựng theo dạng diag (e11², e12², , eNT²) và được điều chỉnh để phù hợp với dạng bảng, như được minh họa trong hình 7.1.1 White đã chứng minh rằng ma trận ước lượng này đảm bảo các thuộc tính của mẫu giới hạn và thuộc tính tiệm cận, từ đó giá trị sai số chuẩn ước lượng trở thành một thước đo hợp lý để kiểm định các giả thuyết về tham số ước lượng trong điều kiện phương sai thay đổi.
Hình 7.1.1: Ma trận phương sai - hiệp phương sai ước lượng theo phương pháp
Theo giả định này, các quan sát phân dư trong cùng một công ty cũng như giữa các công ty khác nhau sẽ không có sự tương quan, tức là corr(e_ij, e_mn) = 0 khi i khác j hoặc m khác n.
Do đó phương sai của các hệ số ước lượng theo phương pháp được tính toán bằng:
Với e it là dòng thứ it của ma trận phần dƣ ƣớc lƣợng e (e=Y-X.β ^ ), X it là dòng thứ it của ma trận biến giả thích X
Giả định rằng hệ số tương quan giữa phần dư trong nhóm và phần dư khác nhóm theo cấu trúc đã nêu, ma trận trung tâm sẽ không bao gồm hệ số tương tác giữa các quan sát khác nhau Điều này dẫn đến việc phương sai của các tham số ước lượng chính xác bằng tổng các bình phương của phần dư và biến giải thích Thông thường, các nhà nghiên cứu thường tính toán sai số chuẩn ước lượng White, nhưng cần điều chỉnh bậc tự do bằng cách nhân công thức phương sai với tỷ số NT/NT-k để nâng cao giá trị ước lượng, giúp sai số chuẩn ước lượng gần đúng với giá trị sai số chuẩn chính xác.
Mở rộng giả định của White, phương pháp phân nhóm giả định rằng ma trận tương quan phần dư trong cùng một nhóm sẽ khác 0, với dữ liệu được phân nhóm theo công ty Do đó, ma trận phương sai-hiệp phương sai của phần dư sẽ được thể hiện như hình 7.1.2, trang 53.
Hình 7.1.2: Ma trận phương sai- hiệp phương sai ước lượng theo phương pháp
Rogers phân nhóm theo công ty
Với ma trận phương sai-hiệp phương sai của phần dư đã được ước lượng, giá trị phương sai của các hệ số ước lượng có thể được tính toán một cách chính xác.
Sai số chuẩn ước lượng theo phương pháp của Rogers khác biệt với phương pháp của White ở chỗ ông sử dụng bình phương tổng e i X it trong các nhóm, thay vì tổng các giá trị e i X it Điều này dẫn đến sự tương tác giữa các quan sát trong cùng một nhóm, thể hiện mức độ tương quan của các phần dư Trong thực tế, các nhà nghiên cứu thường điều chỉnh bậc tự do của công thức để sai số chuẩn ước lượng gần đúng với sai số chuẩn thực tế theo tỷ lệ NT/NT-k* M/M-1, trong đó M là số nhóm, bằng N khi phân nhóm theo công ty và bằng T khi phân nhóm theo thời gian Việc so sánh sai số chuẩn theo hai phương pháp này cung cấp những nhận định ban đầu về cấu trúc dữ liệu.
Nếu sai số chuẩn ước lượng Rogers lớn hơn đáng kể so với sai số chuẩn ước lượng White, điều này cho thấy dữ liệu chứa hiệu ứng công ty Hệ số tương quan của phần dư được giả định khác 0 và dương, dẫn đến nhận định này Ngược lại, nếu sai số chuẩn Rogers nhỏ hơn sai số chuẩn White, điều này chỉ ra rằng hiệu ứng công ty tồn tại ở các nhóm khác nhau với mẫu hình khác nhau Một số nhóm có tương quan âm và một số nhóm có tương quan dương; nếu giá trị tương quan của các nhóm âm lớn hơn, điều này sẽ làm giảm sai số chuẩn ước lượng khi phân nhóm so với sai số chuẩn White Nếu sai số chuẩn của hai phương pháp này gần như tương đương, sẽ không có hiệu ứng công ty và dường như không có sự tương quan trong phần dư khi phân nhóm.
Các so sánh ban đầu về cấu trúc dữ liệu chỉ mang tính chất khái quát Để có cái nhìn rõ ràng hơn, các nhà nghiên cứu cần tổ chức dữ liệu một cách hợp lý nhằm xác định mức độ tương quan, từ đó đưa ra kết luận về tầm quan trọng của hiệu ứng công ty và hiệu ứng thời gian Chẳng hạn, để phân tích hiệu ứng công ty ở phần dư, cần sắp xếp dữ liệu theo công ty, tiếp theo là theo năm và tính hệ số tương quan với các độ trễ tăng dần Phương pháp này cũng áp dụng tương tự cho hiệu ứng thời gian.
Mô hình hồi quy trên dữ liệu thực
Trong bài viết này, tôi tiến hành nghiên cứu của Daniel và Titman (2004) dựa trên dữ liệu của các công ty niêm yết trên sàn giao dịch chứng khoán thành phố Hồ Chí Minh (Hose).
Mục tiêu của nghiên cứu này là đánh giá khả năng của chỉ số giá trị sổ sách trên giá thị trường (BE/PE) trong việc giải thích biến động giá chứng khoán Nghiên cứu sẽ phân tích chỉ số này thành hai yếu tố: thông tin hữu hình, thể hiện sự tăng trưởng trên giá trị sổ sách, và thông tin vô hình, đại diện cho các yếu tố không được phản ánh trong sổ sách.
Mô hình nghiên cứu sử dụng dữ liệu từ 254 công ty trong giai đoạn 2005-2013, với tổng cộng 11,468 quan sát, thuộc loại dữ liệu bảng không cân xứng Một hạn chế trong nghiên cứu là thời gian quan sát ngắn, chỉ 9 năm, dẫn đến việc không thể tính toán các biến độc lập như TSSL thị trường, TSSL trên sổ sách và phát hành cổ phần theo khung thời gian 5 năm, mà chỉ có thể sử dụng khung 2 năm Biến tỷ số giá sổ sách trên giá thị trường (b/m) cũng chỉ được lấy trễ 2 năm Dữ liệu lịch sử giao dịch cổ phiếu được thu thập từ sở giao dịch chứng khoán thành phố Hồ Chí Minh, với giá cổ phiếu tính toán TSSL là giá đóng cửa cuối tháng Số lượng cổ phiếu hiện hành được thu thập qua phần mềm Vietstock và tất cả số liệu đã được điều chỉnh theo các sự kiện như chia tách, mua lại và chia cổ tức Dữ liệu nghiên cứu được trình bày trong bảng 7.2.1.
Bảng 7.2.1: Thống kê mô tả dữ liệu nghiên cứu
Biến Số quan sát Trung bình Độ lệch chuẩn
Tôi đã thực hiện hồi quy mô hình và điều chỉnh sai số chuẩn của các hệ số ước lượng bằng các phương pháp White, Rogers và Fama-Macbeth Kết quả hồi quy được trình bày chi tiết trong bảng 7.2.2 ở trang 57.
Cột I-III là các hệ số ước lượng thu được theo phương pháp OLS kèm với sai số chuẩn đƣợc báo cáo trong ngoặc đơn Biến giả thời gian đƣợc đƣa vào trong các mô hình nhằm so sánh giữa các hệ số ƣớc lƣợng theo OLS và theo Fama-Macth ở cột IV Cột V-VII là hệ số ước lượng theo phương pháp OLS nhưng đưa vào đồng thời cả biến giả thời gian và biến giả công ty
I II III IV V VI VII
Estimates OLS OLS OLS FM OLS OLS OLS
Errors White Rogers(F) Rogers(T) FM White Rogers(F) Rogers(T)
Để xác định cấu trúc dữ liệu và tầm quan trọng của hiệu ứng công ty cũng như hiệu ứng thời gian, tôi đã so sánh sai số chuẩn giữa các cột Kết quả cho thấy, sai số chuẩn trong cột II gần như không có sự chênh lệch đáng kể so với cột I, thậm chí còn có xu hướng nhỏ hơn Điều này chỉ ra rằng không có hiệu ứng công ty rõ rệt trong dữ liệu, với hệ số tương quan gần bằng 0 và có xu hướng âm Tôi đã sắp xếp dữ liệu theo công ty và theo thời gian để tính toán hệ số tương quan trong phần dư Đồ thị cho thấy hệ số tương quan giữa các quan sát trong phần dư gần như bằng 0, dẫn đến sai số chuẩn ước lượng điều chỉnh khi phân nhóm theo công ty chỉ giảm nhẹ Hệ số điều chỉnh, là tích số giữa tương quan trong phần dư và tương quan giữa các quan sát của biến độc lập, gần bằng 0, củng cố khẳng định rằng không tồn tại hiệu ứng công ty trong dữ liệu.
0 2 4 6 8 10 with in firm residual correlation with in firm residual correlation
Kết quả so sánh giữa cột I và III cho thấy sự khác biệt rõ rệt Mặc dù sai số chuẩn của các hệ số ước lượng giữa hai phương pháp điều chỉnh không lớn, nhưng có sự khác nhau, với 3 trong 4 sai số chuẩn lớn hơn, chỉ có sai số chuẩn của hệ số Log(book return) là bằng nhau Điều này chỉ ra rằng hiệu ứng thời gian tồn tại trong dữ liệu nghiên cứu.
So sánh giữa cột III và cột IV làm nổi bật nhận định rằng cả hai phương pháp phân nhóm theo thời gian của Rogers và Fama-Macbeth đều có sai số chuẩn tương đương, lớn hơn sai số chuẩn White Tôi đã phân tích tương quan giữa phần dư và các biến độc lập, thực hiện sắp xếp dữ liệu theo tháng để tính toán hệ số tương quan này Tuy nhiên, việc sắp xếp gặp khó khăn do các mã chứng khoán trên sàn Hose không được tổ chức theo tiêu chí đáng tin cậy Tôi đã tính toán hệ số tương quan giữa tỷ suất sinh lợi chứng khoán và tỷ suất sinh lợi thị trường (Vn-index), sau đó sắp xếp các công ty theo hệ số tương quan giảm dần Mặc dù còn nhiều bất cập, nhưng phương pháp này hợp lý để xem xét hiệu ứng thời gian trong mô hình, nhằm hiểu rõ phản ứng của các ngành và công ty khác nhau trước cú sốc kinh tế Cuối cùng, tôi đã tính toán hệ số tương quan của phần dư và các biến độc lập khi thay đổi khoảng cách giữa các quan sát, thể hiện qua đồ thị dưới đây.
Ngoại trừ hệ số tương quan của biến book return thấp (khoảng 0), các hệ số tương quan của phần dư với các biến độc lập khác đều cao (từ 0.2 đến 0.6) Do đó, hệ số điều chỉnh sai số chuẩn sẽ có giá trị dương, dẫn đến sai số chuẩn ước lượng điều chỉnh theo thời gian lớn hơn so với sai số chuẩn White Kết quả này phù hợp với mô hình So sánh giữa cột I và cột III cho thấy, trong khi sai số chuẩn của biến book return không thay đổi (vẫn là 0.007), thì sai số chuẩn của các biến khác đều tăng đáng kể, ví dụ như biến market return tăng từ 0.003.
Kết quả nghiên cứu cho thấy có hiệu ứng thời gian trong dữ liệu, với biến B/M dao động từ 0.002 đến 0.004 và biến phát hành cổ phiếu từ 0.006 đến 0.007 Điều này chỉ ra rằng các công ty phản ứng khác nhau trước những cú sốc xảy ra ở các thời điểm khác nhau Hai điểm quan trọng cần lưu ý từ kết quả nghiên cứu này là sự khác biệt trong phản ứng của các công ty và tác động của thời gian lên các biến số nghiên cứu.
0 2 4 6 8 10 12 residuals book return market return share issuance lagged log(B/M)
Sai số chuẩn của các biến ở cột III tăng lên so với cột I, mặc dù mô hình hồi quy trong cột III đã đưa biến giả thời gian vào Việc đưa biến giả thời gian vào mô hình giúp so sánh dễ dàng hơn khi áp dụng phương pháp Fama-Macbeth Kết quả hệ số ước lượng theo OLS khi có biến giả thời gian và hệ số ước lượng theo Fama-Macbeth là tương đương (so sánh cột I, II, III với cột IV) Sự khác biệt trong sai số chuẩn giữa cột III và cột I có thể được lý giải bởi hiệu ứng thời gian tạm thời, như đã trình bày trong chương 5 của nghiên cứu Hiệu ứng này tương tự như phản ứng khác nhau của các công ty khi nền kinh tế gặp cú sốc, với các công ty thuộc nhóm ngành thuận chu kỳ phản ứng khác so với nhóm nghịch chu kỳ, cả về chiều hướng lẫn quy mô Do đó, khi dữ liệu có hiệu ứng công ty tạm thời, điều này sẽ giải thích tốt hơn phản ứng của các công ty trước biến động kinh tế Phân tích tương quan giữa phần dư và các biến độc lập cho thấy sự giải thích này là hợp lý.
Sự thay đổi khoảng cách giữa các quan sát, đặc biệt là khi số lượng công ty tăng lên 10, dẫn đến sự biến động đáng kể trong hệ số tương quan phần dư, giảm từ khoảng 0.29 xuống còn 0.13 Hệ số điều chỉnh sai số chuẩn phụ thuộc vào tích số của hệ số tương quan phần dư và hệ số tương quan biến lập, do đó, khi hệ số tương quan phần dư thay đổi theo cấu trúc hiệu ứng thời gian tạm thời, sai số chuẩn điều chỉnh của các biến độc lập cũng sẽ thay đổi theo.
Giá trị p-value giảm đáng kể khi đưa biến giả công ty vào mô hình, làm cho các biến có ý nghĩa thống kê mạnh hơn Điều này có thể do tác động bù trừ giữa việc giảm bậc tự do và tổng bình phương các sai số chuẩn giảm Trong nghiên cứu này, tác động giảm sai số chuẩn mạnh hơn, dẫn đến các hệ số ước lượng có ý nghĩa thống kê cao hơn Tuy nhiên, kiểm định F cho thấy việc đưa biến giả công ty vào không cải thiện đáng kể mô hình Do đó, việc sử dụng mô hình trong cột III là hợp lý.