GIỚI THIỆU
Lý do chọn đề tài
Thị trường chứng khoán Việt Nam chính thức giao dịch lần đầu vào ngày 28 tháng 7 năm 2000, và giai đoạn 2000 - 2007 đánh dấu một mốc quan trọng khi chỉ số HOSE đạt đỉnh hơn 1.170 điểm vào ngày 12/3/2007 Sự tăng trưởng liên tục của chỉ số đã mang lại lợi nhuận kỷ lục lên đến 600% cho các nhà đầu tư, khiến chủ đề đầu tư chứng khoán trở thành đề tài nóng hổi trong mọi cuộc trò chuyện, từ quán trà đá vỉa hè đến công sở Giá cổ phiếu tăng từng ngày, chủ yếu do thông tin và tin đồn lan truyền, thu hút một lượng lớn nhà đầu tư tham gia vào thị trường.
Từ cuối năm 2007 đến cuối năm 2009, kinh tế toàn cầu và Việt Nam đã trải qua khủng hoảng, khiến thị trường chứng khoán non trẻ của Việt Nam biến động mạnh và chạm đáy 235 điểm vào tháng 2 năm 2009 Đến nay, chỉ số HOSE đã phục hồi lên 624,1 điểm Giai đoạn 2008-2012 chứng kiến nhiều nhà đầu tư mất toàn bộ lợi nhuận tích lũy trước đó, trong khi những người sử dụng đòn bẩy tài chính phải chịu thua lỗ nghiêm trọng Sau những thất bại, nhà đầu tư hiện đang tìm kiếm cách tạo ra lợi nhuận bền vững, chú trọng vào khả năng phân tích xu hướng, tình hình tài chính doanh nghiệp, và các yếu tố vĩ mô lẫn vi mô của nền kinh tế Mục tiêu cuối cùng là tìm ra phương pháp dự đoán lợi nhuận chứng khoán hiệu quả nhất.
Dự đoán lợi nhuận chứng khoán là một chủ đề nghiên cứu quan trọng trong lĩnh vực tài chính, nhưng các nhà nghiên cứu vẫn chưa đạt được sự đồng thuận về khả năng dự đoán biến động thị trường và tác động của những dự đoán đó Các nghiên cứu ban đầu dựa trên giả thuyết thị trường hiệu quả cho rằng giá cổ phiếu bị ảnh hưởng bởi thông tin mới và di chuyển theo một con đường ngẫu nhiên Tuy nhiên, các nghiên cứu sau này đã chỉ ra rằng những bất hợp lý trong thị trường và các yếu tố như lãi suất ngắn hạn có thể giúp dự đoán tỷ suất sinh lợi chứng khoán trong ngắn hạn Gần đây, các nhà nghiên cứu đã chú trọng đến ảnh hưởng của cảm xúc đầu tư và tài chính hành vi trong việc dự đoán lợi nhuận Đồng thời, với sự phát triển của công nghệ Internet, họ ngày càng sử dụng dữ liệu từ các nguồn như bài báo, Twitter, Wikipedia và Google Trends để nâng cao độ chính xác trong dự đoán.
Google ghi lại dữ liệu tìm kiếm cho các thuật ngữ đạt lượng tìm kiếm nhất định và cho phép tải về chỉ số tìm kiếm lịch sử qua Google Trends Là công cụ tìm kiếm phổ biến nhất, dữ liệu từ Google Trends được xem là hữu ích cho các nhà đầu tư trong việc xây dựng danh mục đầu tư sinh lợi Một số nghiên cứu trước đây đã cố gắng dự đoán thị trường tài chính dựa trên dữ liệu từ Google Trends, nhưng kết quả thường không nhất quán Nghiên cứu của Preis và cộng sự (2010) đã xem xét mối tương quan giữa lợi nhuận và khối lượng tìm kiếm tên công ty, nhưng không tìm thấy mối liên hệ rõ ràng nào có thể sử dụng để dự đoán khối lượng giao dịch.
Nghiên cứu năm 2013 đã xem xét khả năng dự đoán biến động thị trường từ các mục tìm kiếm liên quan đến tài chính Laurens Bijl và cộng sự (2016) đã đo lường mối quan hệ giữa khối lượng tìm kiếm trên Google và tỷ suất sinh lợi của các công ty chứng khoán Mỹ trong giai đoạn 2008-2013 Kết quả cho thấy rằng khối lượng tìm kiếm cao có thể dự đoán lợi nhuận thấp trong tương lai, mặc dù mối quan hệ này yếu nhưng vẫn vững và có ý nghĩa thống kê Tuy nhiên, hiệu ứng này không đủ mạnh để trở thành một chiến lược kinh doanh có lợi nhuận do chi phí giao dịch cao.
Để đo lường mối quan hệ giữa khối lượng tìm kiếm trên Google và tỷ suất sinh lợi chứng khoán tại thị trường Việt Nam, tác giả sẽ tham khảo nghiên cứu của Laurens Bijl và cộng sự (2016) Từ đó, tác giả sẽ xây dựng một danh mục đầu tư nhằm đạt được lợi nhuận vượt trội so với chỉ số Vn-Index.
Mục tiêu nghiên cứu
Nghiên cứu đã xác định mối quan hệ giữa khối lượng tìm kiếm Google (GSV) và tỷ suất sinh lợi vượt trội của 36 công ty trong chỉ số Vn-Index Kết quả cho thấy GSV có ảnh hưởng đáng kể đến hiệu suất chứng khoán, mở ra hướng đi mới cho các nhà đầu tư trong việc phân tích và dự đoán xu hướng thị trường.
- Kiểm định sức mạnh dự đoán của GSV và tỷ suất sinh lợi vượt trội trong giai đoạn khủng hoảng và giai đoạn điều kiện thị trường bình thường
- Xác định chiến lược phân bổ danh mục năng động tạo ra kết quả tích cực hơn so với chỉ số danh mục thị trường Vn-Index.
Đối tượng nghiên cứu
Đề tài nghiên cứu mối quan hệ giữa khối lượng tìm kiếm trên Google và tỷ suất sinh lợi vượt trội của chứng khoán trong chỉ số VN-Index Nghiên cứu này nhằm khám phá cách mà sự quan tâm của nhà đầu tư thể hiện qua tìm kiếm trực tuyến có thể ảnh hưởng đến hiệu suất đầu tư trên thị trường chứng khoán Việt Nam.
Phạm vi nghiên cứu
Dữ liệu là tập hợp giá chứng khoán, khối lượng giao dịch, GSV của 36 công ty niêm yết trên sàn Hose trong 256 tuần giao dịch giai đoạn từ 1/1/2008 đến 31/12/2012.
Phương pháp nghiên cứu
Luận văn sử dụng phương pháp nghiên cứu định lượng, phương pháp hồi quy dữ liệu bảng Random Effects được thực hiên trong phần mềm Stata 12.
Tính mới của luận văn
Sử dụng mô hình hồi quy dữ bảng Random Effects, nghiên cứu đã chỉ ra rằng khối lượng tìm kiếm trên Google có ảnh hưởng tích cực đến tỷ suất sinh lợi vượt trội của chứng khoán Kết quả này cho phép xây dựng một danh mục chứng khoán với tỷ suất sinh lợi cao hơn so với danh mục thị trường VnIndex.
Cấu trúc luận văn
Chương 1: Giới thiệu đề tài
Chương 2: Tổng quan các nghiên cứu trước đây
Chương 3: Phương pháp nghiên cứu
Chương 4: Nội dung và kết quả nghiên cứu
Chương 5: Chiến lược phân bổ danh mục đầu tư
TỔNG QUÁT CÁC NGHIÊN CỨU TRƯỚC ĐÂY
Các nhà nghiên cứu chưa đạt được sự đồng thuận về khả năng dự đoán biến động thị trường chứng khoán và các yếu tố ảnh hưởng đến thị trường tài chính Nghiên cứu ban đầu dựa trên giả thuyết thị trường hiệu quả cho rằng giá cổ phiếu được điều khiển bởi thông tin mới, phản ánh một con đường ngẫu nhiên (Fama, 1965) Fama định nghĩa thị trường hiệu quả là nơi có nhiều cá nhân lý trí tối đa hóa lợi nhuận thông qua cạnh tranh, dẫn đến việc giá cổ phiếu phản ánh đầy đủ thông tin hiện tại và dự đoán tương lai Giả thuyết này ngụ ý rằng các nhà đầu tư thường giả định cổ phiếu họ mua có giá trị cao hơn giá thị trường và cổ phiếu họ bán có giá trị thấp hơn giá bán, tuy nhiên, trong một thị trường hiệu quả, giá cổ phiếu đã phản ánh tất cả thông tin, khiến việc mua bán cổ phiếu nhằm vượt qua thị trường trở nên vô nghĩa Fama (1970) phân loại mức độ hiệu quả của thị trường thành ba dạng: yếu, trung bình và mạnh, dựa trên mức độ thông tin có sẵn.
Giả thuyết thị trường hiệu quả dạng yếu cho rằng giá cổ phiếu đã phản ánh toàn bộ thông tin từ dữ liệu giao dịch như giá lịch sử và khối lượng giao dịch Nếu thị trường tuân theo giả thuyết này, thì phân tích kỹ thuật sẽ trở nên vô nghĩa, vì việc dự đoán xu hướng và biến động giá cổ phiếu trong tương lai dựa trên dữ liệu quá khứ sẽ không hiệu quả Trong trường hợp này, giá cả chỉ di chuyển theo những bước đi ngẫu nhiên.
Giả thuyết thị trường hiệu quả dạng trung bình khẳng định rằng mọi thông tin công khai về các công ty và triển vọng của họ đã được phản ánh đầy đủ trong giá cổ phiếu Thông tin này bao gồm dữ liệu giao dịch thị trường, cũng như các yếu tố cơ bản như tình hình kinh doanh, sản phẩm, sản xuất, phân phối, quản lý, kế toán, tài chính và dự báo lợi nhuận Nếu thị trường tuân theo giả thuyết này, thì các phương pháp phân tích cơ bản nhằm xác định giá trị nội tại của doanh nghiệp để mua cổ phiếu định giá thấp và bán cổ phiếu định giá cao sẽ không mang lại lợi nhuận cho nhà đầu tư.
Giả thuyết thị trường hiệu quả dạng mạnh cho rằng giá cổ phiếu đã phản ánh toàn bộ thông tin liên quan đến công ty, bao gồm cả thông tin công khai và thông tin nội bộ Điều này có nghĩa là ngay cả những nhà đầu tư sử dụng thông tin nội bộ cũng không thể đạt được lợi nhuận vượt trội Nếu thị trường thực sự tuân theo giả thuyết này, thì thông tin nội bộ sẽ không có giá trị trong việc tạo ra lợi nhuận.
Một số nghiên cứu đã phản biện giả thuyết thị trường hiệu quả, trong đó Lo và Mackinlay (1988) đã kiểm tra lý thuyết bước đi ngẫu nhiên cho lợi nhuận thị trường chứng khoán hàng tuần Họ so sánh ước lượng phương sai từ dữ liệu được lấy mẫu ở các tuần khác nhau và đã bác bỏ mạnh mẽ mô hình bước đi ngẫu nhiên cho toàn bộ tuần mẫu từ năm 1962.
Nghiên cứu của Lo và Mackinlay (1988) đã bác bỏ giả thuyết bước đi ngẫu nhiên trong lợi nhuận chứng khoán hàng tuần, chỉ ra rằng các mô hình kinh tế hợp lý về định giá tài sản cần phải dựa vào chuỗi thời gian dữ liệu hàng tuần Họ cũng đã phát triển kiểm định đặc tính biến động đơn giản, giúp dự đoán sự hình thành giá trong tương lai Ang và Bekaert (2007) đã chứng minh rằng tỷ suất cổ tức có khả năng dự đoán lợi suất vượt trội trong ngắn hạn, nhưng không có sức mạnh dự đoán trong dài hạn, với lãi suất ngắn hạn cao dự báo lợi nhuận tiêu cực Campbell và Yogo (2006) đã chỉ ra rằng mặc dù có bằng chứng cho khả năng dự đoán lợi nhuận cổ phiếu, nhưng việc phát hiện là khó khăn hơn so với các nghiên cứu trước đó Họ phát triển một pretest để xác định tính chính xác của t-test trong việc dự đoán lợi suất, cho thấy rằng các biến lãi suất có thể dự đoán lợi nhuận, trong khi tỷ lệ giá-cổ tức và tỷ lệ giá-thu nhập cần được kiểm tra kỹ lưỡng hơn để tránh kết luận sai.
Vào năm 1952, các bằng chứng về khả năng dự báo vẫn còn yếu, tuy nhiên, tỷ lệ cổ tức-giá có thể dự đoán lợi nhuận nếu loại bỏ yếu tố tự hồi quy.
1 số nghiên cứu thực nghiệm khác đã thách thức tới tính đúng đắn của thị trường hiệu quả như Burton (2003) và Cochrane (2008)
Gần đây, các nhà nghiên cứu đã chú trọng đến tác động của cảm xúc đầu tư trong lĩnh vực tài chính Hai qui luật phổ biến đã được phát hiện: phản ứng dưới mức đối với giá cổ phiếu khi có thông tin như thông báo thu nhập, và phản ứng thái quá đối với giá cổ phiếu trước các tin tốt hoặc xấu Barberis và cộng sự (1998) đã phát triển một mô hình về tâm lý nhà đầu tư, giải thích cách mà nhà đầu tư hình thành kỳ vọng thu nhập tương lai Họ chỉ ra rằng mọi người thường chú ý quá mức đến bằng chứng mà họ có, trong khi lại ít quan tâm đến trọng số của các số liệu thống kê Các tác giả cũng giả định rằng doanh nghiệp thường thông báo thông tin quan trọng.
Giá cổ phiếu thường phản ứng dưới mức đối với thông báo thu nhập và các sự kiện tương tự, với giả định rằng thông tin tích cực, như hàng loạt thông báo thu nhập tốt, có trọng số thấp Điều này dẫn đến dự đoán rằng giá chứng khoán có thể phản ứng thái quá với các tin tức tốt hay xấu Nghiên cứu của Barberis và cộng sự (1998) đã cung cấp các giả định hợp lý về mức độ và trọng lượng của các yếu tố này, nhấn mạnh tầm quan trọng của việc phân loại các sự kiện để đưa ra dự đoán chính xác hơn Ví dụ, sau vụ hoảng loạn năm 1987, giá chứng khoán đã phục hồi mạnh mẽ, cho thấy nhà đầu tư có thể phản ứng thái quá với thông tin Baker và Wurgler (2006) đã chỉ ra rằng tâm lý nhà đầu tư ảnh hưởng không cân xứng đến các cổ phiếu có giá trị chủ quan, dẫn đến lợi nhuận cao hơn khi tâm lý thấp, đặc biệt ở các cổ phiếu nhỏ và biến động cao Khi tâm lý tăng cao, các mô hình này có thể bị giảm bớt hoặc đảo ngược, phù hợp với các dự đoán ban đầu mà không phản ánh phần bù rủi ro hệ thống.
Các nghiên cứu gần đây đã khai thác dữ liệu từ nhiều nguồn như bài báo, Twitter, Wikipedia và Google Trends để phân tích tác động đến lợi nhuận chứng khoán Trong nghiên cứu của Tetlock (2007), tác giả đã áp dụng phương pháp định lượng để khảo sát mối quan hệ giữa truyền thông và thị trường chứng khoán thông qua nội dung từ Wall Street Journal Kết quả cho thấy sự bi quan cao trong truyền thông có thể dự đoán sự giảm giá trong tương lai, trong khi mức độ bi quan bất thường lại liên quan đến khối lượng giao dịch cao Những phát hiện này phù hợp với các mô hình lý thuyết về tiếng ồn và giao dịch thanh khoản, đồng thời không ủng hộ lý thuyết rằng nội dung truyền thông phản ánh thông tin mới về giá trị tài sản cơ bản hay biến động thị trường.
Nghiên cứu gần đây đã chỉ ra rằng sự tương tác với các công cụ tìm kiếm như Wikipedia và Twitter có thể ảnh hưởng đến hành vi và quyết định kinh tế của cá nhân cũng như xã hội Bollen và cộng sự (2011) đã phân tích mối quan hệ giữa tâm trạng tập thể từ phản hồi trên Twitter và chỉ số Dow Jones Industrial Average (DJIA), cho thấy rằng việc đo lường tâm trạng có thể cải thiện độ chính xác trong dự đoán giá trị DJIA Kết quả cho thấy độ chính xác đạt 87,6% trong việc dự đoán biến động hàng ngày của chỉ số này Đồng thời, Moat và cộng sự (2013) đã phát hiện ra rằng sự thay đổi trong lượt truy cập các trang Wikipedia liên quan đến tài chính có thể dự đoán được biến động của thị trường chứng khoán Nghiên cứu của họ đã chứng minh rằng một chiến lược giao dịch dựa trên lượt xem trang của các thành phần chỉ số Dow Jones có thể vượt trội hơn so với chỉ số thị trường, mở ra những cái nhìn mới về hành vi thị trường tài chính.
Google là công cụ tìm kiếm hàng đầu trên Web, cung cấp dữ liệu tìm kiếm cho nhiều thuật ngữ thông qua Google Trends Nghiên cứu của Carneiro và Mylonakis (2009) cho thấy Google Trends có thể phát hiện sự bùng phát cúm sớm hơn 7-10 ngày so với cảnh báo của Trung tâm kiểm soát dịch bệnh Công cụ này hứa hẹn cho việc giám sát dịch bệnh, đặc biệt ở các nước phát triển, và cần hợp tác với các chuyên gia y tế để phát triển các công cụ chuyên dụng Ngoài y tế, Google Trends cũng hữu ích trong lĩnh vực tài chính; nghiên cứu của Preis và cộng sự (2010) cho thấy mối quan hệ giữa khối lượng tìm kiếm và biến động thị trường Các từ khóa liên quan đến kinh doanh và chính trị có thể dự đoán sự giảm giá cổ phiếu, với nghiên cứu của Preis và cộng sự (2013) cho thấy khối lượng tìm kiếm tăng trước khi giá chứng khoán giảm Chiến lược đầu tư dựa trên khối lượng tìm kiếm có thể tạo ra lợi nhuận vượt trội so với chỉ số thị trường Nghiên cứu của Laurens Bijl và cộng sự (2016) cho thấy GSV cao dự đoán lợi nhuận thấp trong tương lai, nhưng hiệu ứng này không đủ mạnh để trở thành chiến lược kinh doanh có lợi nhuận.
Tại Việt Nam, một số nghiên cứu đã tập trung vào mối quan hệ giữa tài chính hành vi và lợi nhuận thị trường chứng khoán Ngô Thanh Tuyền (2014) đã phân tích dữ liệu từ thị trường chứng khoán Việt Nam, với mẫu dữ liệu thu thập từ ngày 1/3/2002 đến 30/4/2010 của chỉ số VN-Index Nghiên cứu sử dụng mô hình của Hwang & Salmon (2004) để chứng minh sự tồn tại và đo lường mức độ hành vi bầy đàn trên thị trường chứng khoán Việt Nam, cho thấy rằng hành vi bầy đàn có mối liên hệ chặt chẽ với tỷ suất sinh lợi chứng khoán.
Tác giả nhận thấy chưa có nghiên cứu chuyên sâu nào về mối quan hệ giữa công cụ tìm kiếm trên Internet và lợi nhuận chứng khoán Chỉ có một bài viết liên quan trên cafef.vn, có thể tham khảo tại đường link: http://cafef.vn/thi-truong-chung-khoan/dung-google-du-bao-chung-khoan-.
201305100844485176.chn Nội dung của bài báo là tóm tắt lại những kết quả đạt được trong Preis và cộng sự (2013) (đã được tác giả trình bày ở trên).
PHƯƠNG PHÁP NGHIÊN CỨU
Dữ liệu nghiên cứu
Dữ liệu nghiên cứu bao gồm 36 công ty niêm yết trên sàn HOSE trong giai đoạn từ năm 2007 đến tháng 12 năm 2013, với tổng cộng 256 tuần giao dịch Lý do chọn mẫu 36 công ty này là vì tất cả đều được niêm yết trên sàn HOSE trước năm 2007.
Vào năm 2007, do GSV chỉ được báo cáo hàng tháng cho các từ tìm kiếm có khối lượng thấp, một số công ty đã bị loại khỏi bộ dữ liệu của tác giả để đảm bảo tính nhất quán Những công ty được chọn phải có chỉ số khối lượng tìm kiếm Google dễ dàng xác định, không bị ảnh hưởng bởi tên tìm kiếm và có lượng truy cập ổn định trên Google Trend hàng tháng Tất cả dữ liệu được tác giả thu thập từ trang web tài chính cafef.vn, trong khi chỉ số tìm kiếm Google (GSV) được lấy từ công cụ Google Trend.
Dữ liệu từ cafef.vn bao gồm giá đóng cửa và khối lượng giao dịch của các công ty niêm yết trên sàn Hose từ ngày 01 tháng 1 năm 2007 đến 31 tháng 12 năm 2013 Tác giả cần sử dụng dữ liệu này để tính toán beta trung bình động 52 tuần cho các cổ phiếu trong năm 2007.
Tác giả phân tích dữ liệu GSV từ năm 2008 đến 2012 do thiếu độ tin cậy trước năm 2008 Dữ liệu GSV được sử dụng là chỉ số từ 0-100 phản ánh khối lượng tìm kiếm tên công ty trong chỉ số VN-Index trong khoảng thời gian từ 1/1/2008 đến 31/12/2012 Khung thời gian này được chọn vì Google Trend chỉ cho phép trích xuất dữ liệu theo tuần trong vòng 5 năm Tác giả chia giai đoạn 2008-2012 thành hai phần: 2008-2009 và 2010-2012 để phân tích tác động trong bối cảnh khủng hoảng tài chính Ngoài ra, dữ liệu từ năm 2010 đến 2013 cũng được sử dụng để kiểm định tính vững của mô hình nghiên cứu.
Tác giả chỉ bao gồm các công ty trong chỉ số VN-Index vào cuối năm 2012, tạo ra một bộ dữ liệu hoàn chỉnh với 36 công ty Mặc dù có thể lập luận rằng việc loại bỏ các công ty trong chỉ số này có thể dẫn đến sự chệch lạc, nhưng tổng hiệu ứng từ các công ty bị loại bỏ là không đáng kể Hơn nữa, bất kỳ sự chệch nào trong chọn mẫu đều không ảnh hưởng quan trọng đến chiến lược kinh doanh mà tác giả giả định, vì tác giả có thể so sánh hiệu quả của nó với hiệu quả trung bình của mẫu Danh sách 36 công ty trong nghiên cứu được trình bày trong bảng 3.1.
Bảng 3.1 Danh sách 36 công ty trên sàn Hose được đưa vào nghiên cứu
Mã CP Tên tìm kiếm Tên Công ty
BHS BHS Công ty Cổ phần Đường Biên Hòa
MINH Tổng Công ty Cổ phần Bảo Minh
MINH Công ty Cổ phần Nhựa Bình Minh
CII CII Công ty Cổ phần Đầu tư Hạ tầng Kỹ thuật
CLC CÁT LỢI Công ty Cổ phần Cát Lợi
COM COMECO Công ty Cổ phần Vật tư Xăng dầu
DIC DIC Công ty Cổ phần Đầu tư và Thương mại DIC
DMC DOMESCO Công ty Cổ phần Xuất nhập khẩu Y tế
NẴNG Công ty Cổ phần Cao su Đà Nẵng FPT TẬP ĐOÀN FPT Công ty Cổ phần FPT
GMD GEMADEPT Công ty Cổ phần Gemadept
HAP HAPACO Công ty Cổ phần Tập Đoàn Hapaco
Công ty Cổ phần Xây dựng và Kinh doanh Địa ốc Hòa Bình
IMP IMEXPHARM Công ty Cổ phần Dược phẩm IMEXPHARM
TẠO Công ty Cổ phần Đầu tư và Công nghiệp Tân Tạo
KDC KDC Công ty Cổ phần Kinh Đô
KHP KHP Công ty Cổ phần Điện lực Khánh Hòa
PHẦN NAM VIỆT Công ty Cổ phần Nam Việt
PJT PJT Công ty Cổ phần Vận tải Xăng dầu đường thủy
CÔNG TY CỔ PHẦN NHIỆT ĐIỆN PHẢ LẠI
Công ty Cổ phần Nhiệt điện Phả Lại
PVD PVD Tổng Công ty Cổ phần Khoan và Dịch vụ khoan
RAL RAL Công ty Cổ phần Bóng đèn Phích nước Rạng Đông
REE REE Công ty Cổ phần Cơ điện Lạnh
SAM CÔNG TY SAM Công ty Cổ phần Đầu tư và Phát triển SACOM
SAV SAVIMEX Công ty Cổ phần Hợp tác Kinh tế và Xuất nhập khẩu Savimex SFI SAFI Công ty Cổ phần Đại lý Vận tải Safi
SSI SSI Công ty Cổ phần Chứng khoán Sài Gòn
Ngân hàng Thương mại Cổ phần Sài Gòn Thương Tín
TAC TƯỜNG AN Công ty Cổ phần Dầu Thực vật Tường An
TCR TAICERA Công ty Cổ phần Công nghiệp Gốm sứ
TAICERA TDH TDH Công ty Cổ phần Phát triển Nhà Thủ Đức TTP NHỰA TÂN TIẾN Công ty Cổ phần Bao bì Nhựa Tân Tiến
TYA TYA Công ty Cổ phần Dây và Cáp điện Taya Việt
Nam VIP VIPCO Công ty Cổ phần Vận tải Xăng dầu VIPCO
VNM VNM Công ty Cổ phần Sữa Việt Nam
VSH VHS Công ty Cổ phần Thủy điện Vĩnh Sơn - Sông
Mô hình và các biến trong mô hình
Lựa chọn mô hình phù hợp
Mô hình tác động của công cụ Google đến tỷ suất sinh lợi chứng khoán trên thị trường chứng khoán Việt Nam được ước tính thông qua phương pháp hồi quy theo Laurens Bijl và cộng sự (2016) Nghiên cứu này nhằm phân tích mối quan hệ giữa thông tin tìm kiếm trên Google và hiệu suất đầu tư chứng khoán, từ đó cung cấp cái nhìn sâu sắc về cách mà dữ liệu trực tuyến ảnh hưởng đến quyết định đầu tư và biến động của thị trường.
: Tỷ suất lợi nhuận vượt trội của một loại chứng khoán trong thời điểm t
: Toán tử có độ trễ thứ i
: Khối lượng tìm kiếm Google của một loại chứng khoán trong thời điểm t
: Khối lượng giao dịch của một loại chứng khoán đã được hiệu chỉnh theo khối lượng giao dịch 12 tuần kế trước
: Biến động theo tuần của tỷ suất sinh lợi vượt trội chứng khoán
: Biến động theo tháng (hiệu chỉnh theo biến động 5 tuần trước đó) của tỷ suất sinh lợi vượt trội chứng khoán
Tác giả đã mở rộng mô hình nghiên cứu bằng cách thêm biến giả tháng Giêng (Jan) để xem xét hiệu ứng tháng Giêng, được Wachtel (1942) ghi nhận lần đầu Bên cạnh đó, tác giả cũng đưa vào biến giả khủng hoảng để phân tích sự khác biệt trong tác động của GSV trong hai giai đoạn: trong và sau cuộc khủng hoảng Nghiên cứu này nhằm làm rõ vai trò của khủng hoảng tài chính đối với ảnh hưởng của khối lượng tìm kiếm Google đến tỷ suất lợi nhuận chứng khoán.
Tác giả đã đưa ra ba biến tương tác quan trọng (Vlm*R, R*SGSV, Vlm*SGSV) để phân tích mối liên hệ giữa khối lượng giao dịch và tìm kiếm trên Google, cho thấy rằng giá trị dự đoán có thể phụ thuộc vào tính chất tích cực hoặc tiêu cực của tin tức về công ty trong ngày Điều này dẫn đến khả năng tạo ra lợi nhuận tích cực hoặc tiêu cực Ngoài ra, Laurens Bijl và cộng sự (2016) cũng chỉ ra rằng khối lượng giao dịch cao có thể đi kèm với sự biến động trong tìm kiếm trên Google trong cùng một ngày Mô hình nghiên cứu của tác giả vì vậy đã được mở rộng để phản ánh những yếu tố này.
Với chữ cái Hy Lạp là các hệ số hội quy
Tỷ suất sinh lợi cổ phiếu
Trong mô hình hồi quy, tác giả sử dụng tỷ suất sinh lợi vượt trội làm biến phụ thuộc, tập trung vào các công ty niêm yết trên sàn Hose Tỷ suất sinh lợi vượt trội được tính bằng cách lấy tỷ suất sinh lợi cổ phiếu hàng ngày trừ đi beta của cổ phiếu nhân với tỷ suất sinh lợi thị trường, theo phương trình (5) Tỷ suất sinh lợi cổ phiếu hàng ngày được xác định bằng tổng lợi nhuận đã điều chỉnh cho cổ tức và chia tách cổ phiếu.
Trong phân tích của tác giả, S là giá cổ phiếu lúc mở cửa, D là cổ tức, N là số lượng cổ phiếu đang lưu hành, t là thời gian ngày, và R là tổng lợi nhuận Tác giả tính toán tỷ suất sinh lợi vượt trội hàng tuần từ giá mở cửa đầu tiên của một tuần đến giá mở cửa đầu tiên của tuần tiếp theo, với n là số ngày giao dịch trong tuần và beta (β) là beta trung bình động 52 tuần của công ty với chỉ số VN-Index Giá mở cửa đầu tiên của tuần được chọn vì chúng phản ánh cơ hội đầu tiên để hành động trên thông tin mới sau khi tách GSV hàng tuần vào chủ nhật Tác giả sử dụng dữ liệu hàng tuần do tính khả dụng, mặc dù dữ liệu hàng ngày có thể tải về nhưng chỉ trong thời gian ngắn, trong khi số liệu hàng tuần có sẵn cho nhiều năm.
Khối lượng tìm kiếm Google (GSV)
GSV được coi là chỉ số quan trọng để đo lường tổng lượng tìm kiếm cho một công ty cụ thể, đặc biệt là tại Việt Nam, nơi dữ liệu trên Google Trend có thể phản ánh chính xác hơn biến động thị trường chứng khoán Nhiều doanh nghiệp Việt Nam đang xem xét niêm yết trên các sàn giao dịch quốc tế như Sở Giao dịch Chứng khoán London và Hong Kong, nhằm nâng cao hình ảnh và khả năng huy động vốn Tuy nhiên, các tiêu chuẩn niêm yết cao và yêu cầu nghiêm ngặt về công bố thông tin, kế toán và quản trị doanh nghiệp đã khiến nhiều doanh nghiệp ngần ngại tham gia Điều này dẫn đến việc tập trung lớn vào các cổ phiếu trong chỉ số VN-Index Hơn nữa, người tìm kiếm thông tin công ty tại Việt Nam chủ yếu quan tâm đến các công ty nội địa, dẫn đến sự nhầm lẫn trong dữ liệu tìm kiếm, đặc biệt trong ngành bán lẻ, nơi nhiều công ty có tên giống nhau Mặc dù GSV có thể giúp giải quyết vấn đề này, nhưng nhiều mã tìm kiếm vẫn còn chung chung.
Tác giả đã khởi đầu bằng cách sử dụng tên chính thức của các công ty để tải về GSV, nhưng đã điều chỉnh một số tên cho phù hợp với thực tế sử dụng, ví dụ như loại bỏ các từ như “công ty” Tất cả tên công ty và mã tương ứng được trình bày trong bảng 1 (Phụ lục 1) Để hỗ trợ việc tham khảo dữ liệu GSV từ Google Trend, tác giả đã minh họa giao diện trang Google Trend mà mình đã sử dụng để tìm kiếm dữ liệu GSV của các công ty trong hình 3.1.
Hình 3.1 trình bày giao diện trang Google Trend cùng các ghi chú liên quan đến việc tải số liệu GSV Tác giả đã nhập tên công ty vào ô "Cụm từ tìm kiếm" và xác định vùng tìm kiếm là Việt Nam, vì dữ liệu sẽ không được tìm thấy nếu phạm vi tìm kiếm là bất kỳ nước nào khác hoặc toàn cầu, làm giảm giá trị của Google Trend Khung thời gian dữ liệu tìm kiếm được thiết lập từ 1/1/2008 đến 31/12/2012, có thể điều chỉnh theo nhu cầu Dữ liệu trong khoảng thời gian ngắn hơn hoặc bằng 5 năm sẽ được phân bổ theo tuần, trong khi dữ liệu dài hơn sẽ được phân bổ theo tháng hoặc theo khoảng thời gian khác.
Từ năm 2010 đến 2013, nghiên cứu đã chỉ ra rằng mức độ tìm kiếm GSV có ảnh hưởng đến tỷ suất sinh lợi chứng khoán, không chỉ trong thời kỳ khủng hoảng mà còn trong giai đoạn bình thường gần đây.
Các chỉ số từ Google Trends được sử dụng để tính toán GSV chuẩn hóa, giúp so sánh hiệu quả giữa các công ty Theo Laurens Bijl và cộng sự (2016), công thức tính GSV chuẩn hóa (SGSV) được trình bày trong phương trình (6), trong đó n là số tuần quan sát GSV, và là độ lệch chuẩn mẫu của chuỗi thời gian GSV.
Tính biến động tỷ suất chứng khoán
Mức biến động tỷ suất sinh lợi chứng khoán phản ánh độ thay đổi của tỷ suất sinh lợi Tác giả tính toán sự biến động hàng tuần bằng căn bậc hai của tổng bình phương lợi nhuận hàng ngày, với n là số ngày giao dịch trong tuần Poon và Granger (2003) khẳng định rằng giả định này giúp cải thiện độ chính xác của các ước tính về biến động.
Dựa trên nghiên cứu của Corsi (2009), mô hình của tác giả phân tích hai loại biến động: biến động trung hạn (hàng tuần) và biến động dài hạn (hàng tháng) Đối với biến động dài hạn, tác giả áp dụng mức trung bình của các biến động hàng tuần trong năm tuần trước đó.
Khối lượng giao dịch là số lượng đơn vị được giao dịch trong một khoảng thời gian nhất định, thường là trong một ngày, và khi kết hợp với diễn biến giá, nó cho biết xu hướng giá hiện tại có mạnh hay yếu Khối lượng giúp đo lường áp lực mua bán ẩn sau sự di chuyển của giá, đặc biệt là khối lượng cổ phiếu phổ thông giao dịch hàng ngày trên thị trường chứng khoán Đối với phân tích dài hạn, khối lượng thường được theo dõi theo tuần Tác giả sử dụng khối lượng giao dịch chứng khoán hàng tuần đã được điều chỉnh logarit (ký hiệu là VLM) để giảm khuynh hướng và làm trơn dữ liệu, bằng cách tính trung bình động 12 tuần của khối lượng giao dịch điều chỉnh Phương pháp này dựa trên nghiên cứu của Campbell và cộng sự (1993), và các nghiên cứu trước đó như của Conrad và cộng sự (1994), Cooper (1999), và Glosten và cộng sự (1993) đã tìm thấy mối liên hệ mạnh mẽ giữa khối lượng và lợi nhuận.
KẾT QUẢ NGHIÊN CỨU TẠI CÁC CÔNG TY NIÊM YẾT TRÊN SÀN CHỨNG KHOÁN GIAO DỊCH TPHCM
Phương pháp hồi quy
Để xác định phương pháp hồi quy phù hợp nhất trong ba phương pháp Pooled OLS, Random Effect (RE) và Fixed Effect (FE), tác giả đã lần lượt áp dụng mô hình Pooled OLS và RE Sau đó, tác giả sử dụng kiểm định Breusch-Pagan LM (1979) để đánh giá sự phù hợp của hai mô hình này, kết quả cho thấy mô hình RE là lựa chọn tốt hơn Tiếp theo, tác giả tiến hành chạy mô hình FE và áp dụng kiểm định Hausman (1978) để so sánh xem mô hình RE hay FE là phù hợp nhất cho mô hình hồi quy đã cho.
Lựa chọn phương pháp hồi quy RE hay Pooled OLS
Tác giả đã kiểm định mô hình (1) với các biến độc lập trễ 1 kỳ bằng kiểm định Breusch-Pagan Lagrange Multiplier (1979) để xác định mô hình hồi quy phù hợp hơn giữa tác động ngẫu nhiên (RE) và Pooled OLS Đối với ước lượng tác động ngẫu nhiên, phương pháp nhân tử Lagrange (LM) cùng với kiểm định Breusch-Pagan được áp dụng để kiểm tra tính phù hợp của ước lượng (Baltagi, 2008) Giả thuyết Ho cho rằng sai số của ước lượng thô không có sai lệch giữa các đối tượng, tức là var(vi) = 0 Việc bác bỏ giả thuyết Ho cho thấy mô hình phù hợp với ước lượng tác động ngẫu nhiên Tác giả đã thực hiện chạy mô hình hồi quy Pooled OLS và kết quả được trình bày trong bảng 4.1.
Bảng 4.1: Kết quả hồi quy theo phương pháp Pooled OLS
Nguồn: Tổng hợp từ dữ liệu nghiên cứu dựa trên phần mềm Stata
Tác giả đã thực hiện kiểm định Breusch-Pagan LM để xác định phương pháp hồi quy tối ưu cho mô hình (1), so sánh giữa Breusch-Pagan LM và phương pháp hồi quy ngẫu nhiên (RE) Kết quả của kiểm định này được trình bày trong bảng 4.2.
Bảng 4.2: Kết quả hồi quy Breusch-Pagan LM cho mô hình (1)
Nguồn: Tổng hợp từ dữ liệu nghiên cứu dựa trên phần mềm Stata
Variables: rt_l1 vowt_l1 volt_l1 sgsvt_l1 vlmt_l1
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
hettest rt_l1 vowt_l1 volt_l1 sgsvt_l1 vlmt_l1
Kết quả phân tích cho thấy P-value < 0.001, do đó tác giả đã lựa chọn mô hình hồi quy Random Effect (RE) Khi chạy mô hình (1) với hai biến trễ, P-value vẫn giữ giá trị rất nhỏ, cụ thể là P-value < 0.001, như được trình bày trong bảng 2 (Phụ lục).
Tác giả sẽ tiếp tục kiểm định hiệu quả của mô hình phương pháp ước lượng tác động cố định (FE) và tác động ngẫu nhiên (RE) cho mô hình (1) thông qua kiểm định Hausman.
Kiểm định Hausman, được đề xuất vào năm 1978, sẽ được áp dụng để xác định phương pháp ước lượng tối ưu giữa hai phương pháp tác động cố định và tác động ngẫu nhiên, như đã chỉ ra trong các nghiên cứu của Baltagi (2008) và Gujarati (2004).
Khi lựa chọn giữa phương pháp hồi quy mô hình RE và FE, tác giả đã bắt đầu bằng việc áp dụng phương pháp FE cho mô hình (1) với các biến độc lập trễ 1 tuần Kết quả hồi quy được trình bày chi tiết trong bảng 4.3.
Bảng 4.3: Mô hình hồi quy theo phương pháp FE
Rt Coef Std Err T P>t [95% Conf Interval]
Nguồn: Tổng hợp từ dữ liệu nghiên cứu dựa trên phần mềm Stata
Kết quả từ bảng 4.3 chỉ ra rằng biến Sgsvt_L1 có ý nghĩa thống kê với mức ý nghĩa 1%, tuy nhiên hệ số của nó lại thấp Các biến khác đều có ý nghĩa thống kê, ngoại trừ biến Volt_L1 không có ý nghĩa thống kê Điều này tương đồng với mô hình hồi quy sử dụng phương pháp Pooled OLS mà tác giả đã thực hiện trong bảng 4.2.
Tiếp theo, tác giả trình bày kết quả hồi quy biến theo phương pháp RE từ mô hình (1) với các biến độc lập trễ 1 tuần
Kết quả hồi quy được tác giả trình này trong bảng 4.4
Bảng 4.4: Mô hình hồi quy theo phương pháp RE
Rt Coef Std Err Z P>z [95% Conf Interval]
Nguồn: Tổng hợp từ dữ liệu nghiên cứu dựa trên phần mềm Stata
Tác giả áp dụng kiểm định Hausman (1978) để xác định mô hình phù hợp giữa mô hình hiệu ứng cố định (FE) và mô hình hiệu ứng ngẫu nhiên (RE) cho mô hình (1) Kết quả cho thấy ước lượng RE hợp lý theo giả thuyết Ho nhưng không phù hợp với giả thuyết thay thế Ngược lại, ước lượng FE được chứng minh là hợp lý cho cả hai giả thuyết Ho và giả thuyết thay thế.
Khi giả thuyết Ho bị bác bỏ, ước lượng tác động cố định trở nên phù hợp hơn so với ước lượng tác động ngẫu nhiên Ngược lại, nếu chưa có đủ bằng chứng để bác bỏ Ho, tức là không thể xác định được sự tương quan giữa sai số và các biến giải thích, thì ước lượng tác động cố định sẽ không còn phù hợp và ước lượng tác động ngẫu nhiên sẽ được ưu tiên sử dụng.
Dưới đây, tác giả trinh bày kết quả kiểm định Hausman được trình bày trong bảng 4.5
Bảng 4.5: Kết quả hồi quy từ kiểm định Hausman
Nguồn: Tổng hợp từ dữ liệu nghiên cứu dựa trên phần mềm Stata
Với P-value = 0,7598 >0.1, theo Hausman (1978) thì mô hình (1) phù hợp với phương pháp hồi quy RE
Test: Ho: difference in coefficients not systematic
B = inconsistent under Ha, efficient under Ho; obtained from xtreg b = consistent under Ho and Ha; obtained from xtreg vlmt_l1 -.0175175 -.016227 -.0012905 0009879 sgsvt_l1 0091035 0090897 0000138 0000692 volt_l1 -.0064814 -.0069074 000426 0012874 vowt_l1 -.1425636 -.142331 -.0002326 0004778 rt_l1 1048377 1058982 -.0010605 0007541 fe re Difference S.E.
Tác giả áp dụng phương pháp hồi quy ngẫu nhiên (RE) để kiểm định ảnh hưởng của khối lượng tìm kiếm trên Google đến tỷ suất sinh lợi vượt trội của chứng khoán trong mô hình (1) và mô hình mở rộng (2).
Ngoài ra, để tìm được độ trễ tối ưu của mô hình theo phương pháp hồi quy
Tác giả đã sử dụng kiểm định F để đánh giá số độ trễ tối ưu và phát hiện ra rằng có hai tuần trễ tối ưu cho GSV chuẩn hóa có ý nghĩa.
Bảng 4.6 Mức ý nghĩa thống kê của kiểm định F-test cho các độ trễ khác nhau trong mô hình (1) và (2)
Nguồn: Tổng hợp từ dữ liệu nghiên cứu dựa trên phần mềm Stata
Tác giả phát hiện rằng mô hình có độ trễ 1 tuần và 2 tuần đều đạt mức ý nghĩa 1%, cho thấy tính chính xác cao Do đó, các biến độc lập được lựa chọn có độ trễ phù hợp với kết quả nghiên cứu.
Thống kê dữ liệu
Tác giả trình bày bảng thống kê các biến độc lập của mô hình (1) trong bảng 4.7 như bên dưới
Bảng 4.7 Bảng thống kê các biến độc lập của mô hình (1)
Variable Obs Mean Std Dev Min Max
Nguồn: Tổng hợp từ dữ liệu nghiên cứu dựa trên phần mềm Stata
Theo bảng thống kê mô tả, số lượng quan sát dữ liệu đạt 9216, tuy nhiên vẫn thấp hơn nhiều so với 134903 quan sát trong nghiên cứu của Laurens Bijl và cộng sự (2016) Nguyên nhân một phần là do dữ liệu tại Việt Nam chưa được thống nhất và thị trường chứng khoán Việt Nam, được hình thành từ tháng 7 năm 2000, vẫn còn non trẻ, cách biệt gần 200 năm so với thị trường chứng khoán Mỹ.
Sự khác biệt giữa giá trị nhỏ nhất và giá trị lớn nhất trong biến SGSV phản ánh sự thay đổi đáng kể của các nhà đầu tư theo thời gian trong việc hiểu biết về công ty để đưa ra quyết định đầu tư Độ lệch chuẩn cao của khối lượng tìm kiếm trên Google (khoảng 0.98) cho thấy sự thay đổi nhanh chóng và tức thời trong sự quan tâm của các nhà đầu tư đối với cổ phiếu.
Tỷ suất sinh lợi có độ lệch chuẩn thấp khoảng 0.1, cho thấy sự ổn định cao trong lợi nhuận vượt trội Đồng thời, biến động của tỷ suất sinh lợi vượt trội theo tuần cũng cao hơn so với tháng, với độ lệch chuẩn là 0.14 so với 0.08, điều này thể hiện mức độ biến động lớn hơn của tỷ suất sinh lợi vượt trội theo tuần.
Kết quả ước lượng
Tác giả sẽ hồi quy mô hình (1) với phương pháp RE Sau đó, tác giả tiếp tục hồi quy mô hình mở rộng (2) cũng bằng phương pháp RE
Sau khi xác định các biến độc lập có ý nghĩa thống kê, tác giả chia giai đoạn nghiên cứu 2008-2012 thành hai giai đoạn: 2008-2009 (trong khủng hoảng) và 2010-2012 (sau khủng hoảng) để so sánh kết quả hồi quy của hai mô hình (1) và (2) trong bối cảnh có và không có khủng hoảng tài chính Tiếp theo, tác giả áp dụng giá trị R² để đánh giá sự phù hợp của mô hình (1) và (2) với và không có biến SGSV.
Chính vì vậy, đầu tiên, tác giả hồi quy mô hình (1) bằng phương pháp RE được kết quả như trong bảng 4.8
Bảng 4.8: Mô hình hồi quy (1) với phương pháp RE
Rt Coef Std Err Z P>z [95% Conf Interval]
Nguồn: Tổng hợp từ dữ liệu nghiên cứu dựa trên phần mềm Stata
Trong bảng 4.8, hai biến giải thích (Sgsvt_L1 và Sgsvt_L2) với giá trị P-value lần lượt là