1. Trang chủ
  2. » Luận Văn - Báo Cáo

886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam

68 74 7

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Mô Hình Học Sâu LSTM Trong Bài Toán Dự Báo Giá Cổ Phiếu Ở Thời Điểm Đóng Cửa Cho Một Số Mã Cổ Phiếu Ở Thị Trường Chứng Khoán Việt Nam
Tác giả Nguyễn Thị Hậu
Người hướng dẫn ThS. Vũ Duy Hiến
Trường học Học viện Ngân hàng
Chuyên ngành Hệ thống thông tin quản lý
Thể loại khóa luận tốt nghiệp
Năm xuất bản 2021
Thành phố Hà Nội
Định dạng
Số trang 68
Dung lượng 2,96 MB

Cấu trúc

  • LỜI CAM ĐOAN

  • DANH MỤC BẢNG BIỂU HÌNH VẼ

  • MỤC LỤC

  • LỜI MỞ ĐẦU

  • CHƯƠNG 1: TỔNG QUAN VỀ THỊ TRƯỜNG CHỨNG KHOÁN VÀ VẤN ĐỀ DỰ BÁO GIÁ CỔ PHIẾU

    • 1.1. Khái quát về thị trường chứng khoán và các phương pháp dự báo giá cổ phiếu trên thế giới

      • 1.1.1. Sơ lược về thị trường chứng khoán

        • 1.1.1.1. Sơ lược lịch sử ra đời chứng khoán nước ngoài

        • 1.1.1.2. Tổng vốn hóa thị trường chứng khoán

      • 1.1.2. Các phương pháp dự báo giá cổ phiếu trên thế giới

        • 1.1.2.1. Các phương pháp dự báo giá cổ phiếu

        • 1.2.2.2. Phân tích kỹ thuật

        • 1.2.2.3. Học máy (Machine learning)

      • 1.1.3. Các nghiên cứu liên quan trên thế giới

    • 1.2. Khái quát về thị trường chứng khoán và các phương pháp dự báo giá cổ phiếu tại Việt Nam

      • 1.2.1. Khái quát về thị trường chứng khoán Việt Nam

        • 1.2.1.1. Lịch sử ra đời

        • 1.2.1.2. Tổng vốn hóa thị trường chứng khoán

      • 1.2.2. Phương pháp dự báo chứng khoán trong nước

        • 1.2.2.1. Phương pháp phân tích kỹ thuật và phương pháp định tính

        • 1.2.2.2. Phương pháp P/E

        • 1.2.2.3. Phương pháp P/B

      • 1.2.3. Các nghiên cứu liên quan tại Việt Nam

    • 1.3. Lựa chọn phương pháp

  • CHƯƠNG 2: CƠ SỞ LÝ THUYẾT CỦA PHƯƠNG PHÁP Dự BÁO GIÁ CỔ PHIẾU DỰA TRÊN KỸ THUẬT HỌC SÂU LSTM

    • 2.1. Sơ lược về mạng nơron

      • 2.1.1. Khái niệm

      • 2.1.2. Mô hình mạng nơron

    • 2.2. Tổng quan về thuật toán LSTM

      • 2.2.1. Lịch sử ra đời của LSTM

      • 2.2.2. Cơ chế hoạt động

        • 2.2.2.1. Các ký hiệu trong mô hình

        • 2.2.2.2. Ý tưởng cốt lõi đằng sau LSTM

        • 2.2.2.3. Quá trình thực hiện

        • 2.2.2.4. Các biến thể của LSTM

    • 2.3. Môi trường sử dụng để huấn luyện mô hình học sâu

  • CHƯƠNG 3: XÂY DỰNG MÔ HÌNH Dự BÁO GIÁ ĐÓNG CỬA CỦA MỘT SỐ MÃ CỔ PHIẾU SỬ DỤNG PHƯƠNG PHÁP LSTM

    • 3.1. Xây dựng mô hình dự báo LSTM

      • 3.1.1. Chuẩn bị dữ liệu và tiền xử lý dữ liệu

      • 3.1.2. Xây dựng mô hình

        • 3.1.2.1. Chọn thư viện

        • 3.1.2.2. Lựa chọn các tham số phù hợp

      • 3.1.3. Huấn luyện mô hình

    • 3.2. Đánh giá mô hình

  • KẾT LUẬN

  • TÀI LIỆU THAM KHẢO

Nội dung

TỔNG QUAN VỀ THỊ TRƯỜNG CHỨNG KHOÁN VÀ VẤN ĐỀ DỰ BÁO GIÁ CỔ PHIẾU

Khái quát về thị trường chứng khoán và các phương pháp dự báo giá cổ phiếu trên thế giới

1.1.1 Sơ lược về thị trường chứng khoán

1.1.1.1 Sơ lược lịch sử ra đời chứng khoán nước ngoài

Vào giữa thế kỷ 13, các ngân hàng ở Venice bắt đầu kinh doanh cổ phiếu của chính phủ, đánh dấu sự khởi đầu của thị trường chứng khoán ở Ý Đến thế kỷ 14, các ngân hàng khác tại Ý cũng tham gia phát hành cổ phiếu, trong khi các công ty Anh và các nước thấp hơn tiếp nối vào thế kỷ 16 Tại các thành phố Ý, trái phiếu chính phủ có thể chuyển nhượng ra đời, nhưng chưa đủ để hình thành một thị trường vốn hoàn chỉnh Vào đầu thế kỷ 17, Công ty Đông Ấn Hà Lan (VOC) trở thành công ty đầu tiên phát hành trái phiếu và cổ phiếu ra công chúng Thời điểm đó, giao dịch chứng khoán được thực hiện thủ công và cần nhiều nhà phân tích để theo dõi và định giá cổ phiếu Tuy nhiên, đến cuối thế kỷ 20, sự phát triển của công nghệ đã thay đổi hoàn toàn cách thức giao dịch này.

Năm 1971, NASDAQ trở thành sàn giao dịch đầu tiên trên thế giới áp dụng giao dịch điện tử, thay thế vai trò của người môi giới trong việc xác định giá cổ phiếu Sàn giao dịch này giới thiệu bảng điện tử lớn hiển thị giá cả và biến động theo thời gian thực Sau đó, nhiều sàn giao dịch lớn khác cũng đã triển khai công nghệ 'khớp lệnh' điện tử để kết nối người mua và người bán Hiện nay, giao dịch điện tử chiếm phần lớn hoạt động giao dịch tại nhiều quốc gia phát triển, nhờ vào việc nâng cấp hệ thống máy tính tại các sàn giao dịch chứng khoán để xử lý khối lượng giao dịch lớn một cách chính xác và hiệu quả hơn.

1.1.1.2 Tổng vốn hóa thị trường chứng khoán

Thị trường chứng khoán toàn cầu đã ghi nhận sự tăng trưởng mạnh mẽ với hơn 60 sàn giao dịch, trong đó có 10 chỉ số hàng đầu như S&P 500, DJIA, NASDAQ của Mỹ, FTSE 100 của Anh, CAC 40 của Pháp, Hang Seng của Hồng Kông và Nikkei của Nhật Bản Năm 2019, Mỹ dẫn đầu thị trường chứng khoán thế giới, chiếm 44.33% tổng vốn hóa toàn cầu với 30.44 nghìn tỷ USD, trong khi nhiều thị trường châu Âu chỉ chiếm từ 1-3% giá trị vốn hóa Tiềm năng phát triển mới của thị trường chứng khoán toàn cầu hiện đang tập trung tại châu Á, đặc biệt là các quốc gia Đông Á, với Trung Quốc nổi lên như một thị trường chứng khoán mới đầy triển vọng.

Thị trường vốn hóa toàn cầu đạt 6,32 nghìn tỷ USD, tương đương 9,21% tổng giá trị Trong đó, giá trị thị trường chứng khoán Hong Kong (Trung Quốc) chiếm 50% giá trị vốn chủ sở hữu của Trung Quốc Các quốc gia như Nhật Bản, Ý, Hàn Quốc, Pháp và Đức cũng đóng góp một phần đáng kể vào tổng vốn hóa thế giới.

1.1.2 Các phương pháp dự báo giá cổ phiếu trên thế giới

Xu hướng giá cổ phiếu luôn là mối quan tâm hàng đầu của các nhà đầu tư chứng khoán, với câu hỏi liệu giá sẽ tăng hay giảm Chứng khoán được xem là sản phẩm tài chính có rủi ro cao nhưng cũng mang lại lợi nhuận hấp dẫn, thu hút sự chú ý của nhiều nhà đầu tư Để đạt được lợi nhuận, việc ước lượng xu hướng giá cổ phiếu là rất quan trọng, tuy nhiên, giá cổ phiếu chịu ảnh hưởng từ nhiều yếu tố như tình hình kinh tế vĩ mô, điều kiện thị trường, và các sự kiện kinh tế xã hội lớn Cuộc tranh luận về khả năng dự đoán thị trường chứng khoán vẫn tiếp diễn, bởi việc này liên quan đến việc xác định giá trị tương lai của cổ phiếu và các công cụ tài chính khác.

Khi thị trường chứng khoán ra đời, các nhà đầu tư nhận thấy rằng tin tức có ảnh hưởng lớn đến biến động giá cổ phiếu Họ sử dụng các phương pháp như mô hình bag-of-words và trích xuất thực thể để dự đoán xu hướng thị trường dựa trên dữ liệu tin tức Mặc dù phương pháp này dễ áp dụng và luôn được cập nhật, nhưng nó không thể nắm bắt thông tin có cấu trúc, dẫn đến việc không phản ánh chính xác các sự kiện quan trọng Hơn nữa, công nghệ khai thác văn bản hiện tại chưa xem xét được ngữ nghĩa và các yếu tố xã hội khác, ảnh hưởng đến hiệu suất của các mô hình dự đoán.

Các mô hình thống kê và kinh tế lượng thường được áp dụng để dự đoán giá cổ phiếu truyền thống; tuy nhiên, những phương pháp này không đủ khả năng để xử lý sự năng động và phức tạp của thị trường chứng khoán.

Vào những năm 1930-1950, các nhà nghiên cứu đã bắt đầu khám phá thuộc tính chuỗi thời gian để dự báo biến động giá cổ phiếu Nghiên cứu này cho thấy giá cổ phiếu Hoa Kỳ tuân theo mô hình bước đi ngẫu nhiên trong ngắn hạn, nơi mà giá biến động theo quy tắc ngẫu nhiên Mô hình này mô tả sự tăng giảm của giá cổ phiếu như một quá trình ngẫu nhiên, tương tự như quá trình sinh và chết trong sinh học Tuy nhiên, vào năm 1973, Burton đã chỉ ra rằng giá cổ phiếu không thể được dự đoán chính xác chỉ bằng cách xem xét lịch sử giá, trong khi Malkiel khẳng định rằng giá cổ phiếu được mô tả bằng một quá trình thống kê.

“Bước đi ngẫu nhiên” có nghĩa là độ lệch của mỗi ngày so với giá là ngẫu nhiên là không thể đoán trước.

Kể từ năm 1970, sự phát triển nhanh chóng của công nghệ máy tính đã thúc đẩy các nhà nghiên cứu áp dụng máy học để dự đoán giá cổ phiếu và biến động thị trường, từ đó giúp nhà đầu tư xác định chiến lược đầu tư hiệu quả nhằm giảm rủi ro và tối đa hóa lợi nhuận Vào năm 1990, Benoit Mandelbrot đã nhắc đến lý thuyết thị trường hiệu quả (EMH), lần đầu tiên được đề xuất bởi Louis Bachelier trong luận án “The theory of Speculation”, mô tả cách giá cả hàng hóa và cổ phiếu biến đổi trên thị trường EMH khẳng định rằng giá tài sản phản ánh tất cả thông tin có sẵn, cho thấy rằng giá cổ phiếu phụ thuộc vào thông tin và kỳ vọng hợp lý, với triển vọng công ty được phản ánh trong giá cổ phiếu hiện tại Điều này có nghĩa là tất cả thông tin công khai về một công ty, bao gồm lịch sử giá, sẽ được phản ánh trong giá cổ phiếu hiện tại, và những thay đổi trong giá cổ phiếu thường phản ánh sự phát hành thông tin mới hoặc biến động ngẫu nhiên trong thị trường.

Vào những năm 2040, các nhà phân tích đã bắt đầu áp dụng các phương pháp cấu trúc và mô hình tuyến tính, phi tuyến tính để dự báo, đạt được độ chính xác nhất định với dự đoán của chỉ số S&P 500 lên đến 60% và cổ phiếu riêng lẻ có thể đạt trên 70% Hiện nay, nhiều mô hình dự báo giá cổ phiếu như mô hình ARIMA (trung bình động tích hợp tự hồi quy) được sử dụng phổ biến trong dự báo chứng khoán và chuỗi thời gian Với sự phát triển của AI, các phương pháp học máy như Máy vectơ hỗ trợ (SVM), mạng nơron tích chập (CNN), bộ nhớ ngắn hạn dài (LSTM), mạng nơron sâu (DNN) và RNN đã trở nên phổ biến trong việc dự đoán giá cổ phiếu.

Tóm lại, các phương pháp dự đoán có thể được phân loại thành ba nhóm chính, bao gồm phân tích cơ bản, phân tích kỹ thuật (biểu đồ) và phương pháp công nghệ (Machine learning), và chúng có thể được kết hợp với nhau để nâng cao độ chính xác trong dự đoán.

1.1.2.1 Các phương pháp dự báo giá cổ phiếu

Các nhà phân tích cơ bản quan tâm đến công ty tạo nền tảng cho chính cổ phiếu.

Các nhà phân tích đánh giá hoạt động quá khứ và độ tin cậy của tài sản nợ, tài sản có, cũng như bản ngân sách kế toán của công ty Họ sử dụng tỷ lệ P/E và xem xét tổng vốn hóa thị trường so với GDP để xác định giá trị tương đối của thị trường chứng khoán Mục tiêu của phân tích cơ bản là xác định giá trị thực của cổ phiếu, từ đó so sánh với giá trị giao dịch trên thị trường để phát hiện cổ phiếu bị định giá thấp Khác với phân tích kỹ thuật, phân tích cơ bản là chiến lược dài hạn và được các nhà quản lý ưa chuộng nhờ tính hợp lý, khách quan và dựa trên thông tin công khai từ báo cáo tài chính.

Các nhà phân tích kỹ thuật, hay còn gọi là nhà lập biểu đồ, không chú trọng đến các nguyên tắc cơ bản của công ty Họ tập trung vào việc dự đoán giá cổ phiếu trong tương lai chỉ dựa vào xu hướng giá trong quá khứ, coi đây như một hình thức phân tích chuỗi thời gian.

Các kỹ thuật phân tích thị trường chứng khoán bao gồm đường trung bình động hàm mũ (EMA) và mô hình ARIMA, với ARMA là một phần của ARIMA, kết hợp các mô hình tự động hồi quy để giải thích động lượng và hiệu ứng đảo chiều trung bình Tuy nhiên, mô hình ARMA không xem xét phân nhóm biến động, điều này hạn chế khả năng phân tích ARIMA giúp chuyển đổi các chuỗi không cố định thành chuỗi tĩnh và được sử dụng để dự báo các điểm trong tương lai Phân tích kỹ thuật thường áp dụng cho các chiến lược ngắn hạn, trong khi giá cổ phiếu bị ảnh hưởng bởi xu hướng và lịch sử giá lặp lại Nghiên cứu về xu hướng giá chứng khoán Thượng Hải cho thấy SVM có khả năng dự đoán cao.

Sự phát triển của máy tính kỹ thuật số đã chuyển đổi dự đoán thị trường sang lĩnh vực công nghệ, đặc biệt là thông qua ứng dụng học máy Học máy, đặc biệt là mạng nơron nhân tạo (ANN) và giải thuật di truyền (GA), đang được sử dụng rộng rãi trong dự báo giá cổ phiếu Nhiều quốc gia đã áp dụng ANN để nắm bắt mối quan hệ phức tạp giữa đầu vào và đầu ra của dữ liệu Mô hình RNN đã được triển khai trên dữ liệu thị trường chứng khoán của Canada, Hong Kong, Nhật Bản, Anh và Hoa Kỳ để dự đoán xu hướng lợi nhuận cổ phiếu Đặc biệt, vào năm 20Λ404004614, ANN đã được áp dụng trên sàn NASDAQ của Hoa Kỳ để dự đoán giá đóng cửa cổ phiếu Ngoài ra, mô hình ANN cũng được sử dụng để phân tích kỹ thuật trên dữ liệu TOPIX tại Nhật Bản nhằm dự đoán thời điểm mua và bán Tại Ấn Độ, Sở giao dịch chứng khoán NSE đã áp dụng các phương pháp học sâu như RNN, LSTM và CNN dựa trên dữ liệu giá đóng cửa.

1.1.3 Các nghiên cứu liên quan trên thế giới

Khái quát về thị trường chứng khoán và các phương pháp dự báo giá cổ phiếu tại Việt Nam

1.2.1 Khái quát về thị trường chứng khoán Việt Nam

Ủy ban Chứng khoán Nhà nước Việt Nam được thành lập vào ngày 28/11/1996 theo Nghị định số 75/CP, đánh dấu sự khởi đầu của thị trường chứng khoán Việt Nam Vào ngày 11/04/1998, thị trường chứng khoán chính thức ra đời theo Nghị định số 48/CP, cùng với sự thành lập Trung tâm Giao dịch Chứng khoán tại Hà Nội và TP Hồ Chí Minh Trung tâm Giao dịch Chứng khoán TP Hồ Chí Minh bắt đầu hoạt động vào ngày 28/07/2000 với hai mã cổ phiếu REE và SAM Sau 20 năm phát triển, thị trường chứng khoán Việt Nam đã vượt qua nhiều thách thức và hiện có ba sàn giao dịch lớn: HOSE, HNX và UPCOM, cùng với 1647 mã cổ phiếu và 493 mã trái phiếu niêm yết Sự phát triển của thị trường đặt ra yêu cầu về phân tích dự đoán giá cổ phiếu, nhằm tối đa hóa lợi nhuận cho nhà đầu tư và thu hút khách hàng cho các công ty chứng khoán.

1.2.1.2 Tổng vốn hóa thị trường chứng khoán

Tính đến ngày 30/11/2022, tổng vốn hóa thị trường cổ phiếu niêm yết trên hai sàn HOSE và HNX đạt 3,86 triệu tỷ đồng, tương đương gần 64% GDP, với 29 doanh nghiệp có giá trị vốn hóa trên 1 tỷ USD Đến cuối tháng 11/2022, sàn HOSE ghi nhận 388 cổ phiếu, 3 chứng chỉ quỹ đóng, 6 chứng chỉ quỹ ETF, 128 chứng quyền và 39 trái phiếu Theo báo Nhân Dân, đến tháng 2/2023, vốn hóa thị trường chứng khoán đã tăng lên 5,6 triệu tỷ đồng, tăng 7,3% so với cuối năm 2022, tương đương gần 90,3% GDP Sau hơn 20 năm phát triển, thị trường chứng khoán Việt Nam đã có những bước tiến lớn, đặc biệt là trong bối cảnh phục hồi sau dịch Covid-19.

(Tinhdenthang 0Λ40400463/20Λ404004621) Đơn Vi tính: Tài khoán Nguòìì:

Tronj nước Nước ngoài Tãng/giăm (%)

Cá nhàn Tổ chức Cá nhàn K chức Tồng cộng So vói tháng trước

630Λ4040046 32.391 _ 3.983 3.0Λ404004629.40Λ40400467 3.91% 9.31% tượng ở mức 6,5-6,8% trong năm 20Λ404004621 và được cho rằng là nước trong top đầu thế giới kiểm soát bệnh dịch nhanh chóng [19]. số LƯỢNG TỪ KHOẢN NHÀ ĐẲU Tư

Hình 3 Hình thể hiện số tượng tài khoản nhà đầu tư chứng khoán

(Nguồn: Uỷ ban chứng khoán nhà nước)

Vào ngày 30/04/2021, Trung tâm Lưu ký Chứng khoán Việt Nam (VSD) đã thông báo về số lượng tài khoản giao dịch chứng khoán được mở, bao gồm cá nhân trong nước, nước ngoài và tổ chức Trong bốn tháng đầu năm, đã có 366.816 tài khoản mới cho nhà đầu tư trong nước, đánh dấu mức tăng 93% so với cả năm 2020 Tính đến ngày 30/04/2021, tổng số tài khoản giao dịch trong nước đã đạt 3.154 Trong tháng 4, có 9.998 tài khoản cá nhân mới được mở và 123 tài khoản của các tổ chức.

Hình 4 Biểu đồ thể hiện số lượng tài khoản chứng khoán nhà đầu tư trong nước mới mở

1.2.2 Phương pháp dự báo chứng khoán trong nước

Theo truyền thống, có hai phương pháp chính để dự đoán giá cổ phiếu của một tổ chức là phân tích kỹ thuật và phân tích định tính Bên cạnh đó, các chỉ số P/E và P/B cũng được áp dụng để làm căn cứ trong việc dự báo giá cổ phiếu.

1.2.2.1 Phương pháp phân tích kỹ thuật và phương pháp định tính

Phân tích kỹ thuật là công cụ hữu ích giúp dự đoán giá cổ phiếu trong tương lai dựa trên giá lịch sử như giá mở cửa, giá đóng cửa và khối lượng giao dịch Các công ty chứng khoán tại Việt Nam như VNDIRECT và VIETSTOCK, cũng như kênh tin tức CafeF, cung cấp phân tích kỹ thuật để đánh giá cổ phiếu vào cuối phiên giao dịch Những phân tích này bao gồm các mô hình và nhận xét về biến động giá của các mã cổ phiếu, từ đó đưa ra đánh giá về xu hướng tăng, giảm và mức ổn định trong tương lai Việc nắm vững biểu đồ phân tích giúp nhà đầu tư xác định ngưỡng an toàn và đưa ra quyết định mua bán cổ phiếu chính xác hơn.

I-Jur 1 ∣ Ju ∣ ∣ Aug ]sep ∣ 0ct ∣ N QV ∣ DSC ∣ 2021 ∣ Feb ∣ Mar ∣ Apr ∣ M

Hình 5 Đồ thị thể hiện đường phân tích kỹ thuật

(Nguồn: Cafef) Ưu điểm của phương pháp này:

■ Phân tích kỹ thuật đưa ra diễn biến của giá cổ phiếu trong quá khứ tới hiện tại.

Phân tích kỹ thuật cung cấp nhiều công cụ đa dạng như mô hình nến và mô hình giá lá cờ, giúp các nhà phân tích và nhà đầu tư dễ dàng chọn lựa công cụ phù hợp cho việc phân tích của mình.

Nhược điểm của phương pháp này:

■ Tuy nhiên không phải lúc nào các mô hình cũng chỉ báo đúng bởi nó còn tác

Phân tích kỹ thuật là một quá trình tương đối, vì cùng một đồ thị có thể dẫn đến những dự đoán khác nhau về xu hướng giá cổ phiếu từ hai nhà phân tích Điều này chủ yếu phụ thuộc vào cảm nhận và tâm lý của các nhà đầu tư cũng như các nhà phân tích.

Phân tích định tính dựa trên các yếu tố bên ngoài như hồ sơ công ty, tình hình thị trường, và các yếu tố chính trị, kinh tế, bao gồm thông tin từ bài báo tài chính, phương tiện truyền thông xã hội và blog của các nhà phân tích Các nhà phân tích thường áp dụng phương pháp SWOT để đánh giá điểm mạnh, điểm yếu, cơ hội và thách thức Dự đoán giá cổ phiếu đã trở thành một lĩnh vực nghiên cứu quan trọng, với những người ủng hộ giả thuyết thị trường hiệu quả cho rằng việc dự đoán chính xác là không khả thi Tuy nhiên, có những bằng chứng cho thấy việc lập mô hình chính xác và thiết kế các biến thích hợp có thể giúp dự đoán xu hướng giá cổ phiếu một cách chính xác hơn.

Ngoài ra, các công ty chứng khoán đã khuyến nghị các nhà đầu tư tìm hiểu các phương pháp định giá như:

Chỉ số P/E, viết tắt của Price to Earning Ratio, là một phương pháp đánh giá giá trị tương đối của thị trường chứng khoán bằng cách so sánh tổng vốn hóa thị trường với GDP Công thức tính chỉ số này giúp nhà đầu tư có cái nhìn tổng quan về tình hình thị trường.

P/E = Giá thị trường / EPS Hay P/E = Vốn hóa công ty / Lợi nhuận sau thuế

P - Price : Đây là giá cả thị trường chứng khoán tại phiên giao dịch.

EPS (Earning Per Share) là chỉ số phản ánh lợi nhuận ròng của một cổ phiếu, được tính theo công thức: EPS = (Lợi nhuận sau thuế - Cổ tức cổ phiếu ưu đãi) / Tổng số cổ phiếu thường đang lưu hành Chỉ số P/E cho biết mức định giá của cổ phiếu; P/E thấp cho thấy cổ phiếu có thể bị định giá thấp do công ty gặp khó khăn tài chính hoặc lợi nhuận bất thường, trong khi P/E cao cho thấy cổ phiếu được định giá cao và công ty có triển vọng phát triển tốt Mặc dù phương pháp tính toán EPS đơn giản, nhưng do sự biến động của thị trường Việt Nam, tỷ lệ này có thể bị sai lệch đáng kể.

Tỷ lệ P/B (Price to Book) thể hiện mối quan hệ giữa giá cổ phiếu và giá trị ghi sổ của nó, được tính bằng cách chia giá đóng cửa cổ phiếu cho tổng giá trị tài sản trừ giá trị tài sản vô hình và nợ Một P/B nhỏ hơn 1 cho thấy cổ phiếu đang được bán dưới giá trị tài sản ghi sổ, có thể do giá trị tài sản bị phóng đại, khiến nhà đầu tư nên tránh mua Ngược lại, P/B lớn hơn 1 cho thấy công ty hoạt động hiệu quả với thu nhập tài sản cao Chỉ số P/B hữu ích nhất cho các nhà đầu tư khi phân tích doanh nghiệp có vốn lớn hoặc công ty tài chính với giá trị tài sản lớn.

1.2.3 Các nghiên cứu liên quan tại Việt Nam

Tại Việt Nam, vấn đề dự báo giá cổ phiếu đã thu hút sự quan tâm đáng kể từ cộng đồng nghiên cứu, thể hiện qua số lượng luận văn thạc sĩ, luận án tiến sĩ và các bài báo phân tích, nghiên cứu chuyên sâu về các mô hình dự báo giá cổ phiếu.

Trong tạp chí khoa học và công nghệ của Đại học Đà Nẵng, các nhà nghiên cứu đã đề xuất mô hình kết hợp ARIMA - GARCH để dự báo chỉ số VN-Index dựa trên chuỗi dữ liệu thời gian Mô hình này kết hợp ARIMA, chuyên dùng cho dự đoán tương lai, với GARCH để mô phỏng hành vi quá khứ, tạo nền tảng cho dự báo ARIMA-GARCH là một công cụ dự báo mạnh mẽ, phổ biến trên thế giới, nhưng chỉ phù hợp với dự báo ngắn hạn gần thời điểm cuối cùng của chuỗi dữ liệu Việc định dạng mô hình ARIMA trong ARIMA-GARCH có ảnh hưởng lớn đến kết quả dự báo, do đó người dùng cần linh hoạt để không bỏ sót các mô hình có ý nghĩa khác Ngoài ra, việc sử dụng máy vectơ hỗ trợ (SVM) cũng giúp phân tích chính xác xu hướng giá trong tương lai.

Hồ Thủy Tiên, Hồ Thu Hoài và Ngô Văn Toàn đã công bố bài nghiên cứu mang tên “Mô hình hóa biến động thị trường chứng khoán: Thực nghiệm từ Việt Nam” trên tạp chí chuyên ngành Bài nghiên cứu này tập trung vào việc phân tích và mô phỏng sự biến động của thị trường chứng khoán Việt Nam, cung cấp những thông tin quý giá cho các nhà đầu tư và nhà nghiên cứu trong lĩnh vực tài chính.

Nghiên cứu của Khoa học ĐHQGHN về Kinh tế và Kinh doanh tập trung vào mô hình hóa biến động của thị trường chứng khoán Việt Nam, sử dụng dữ liệu giá đóng cửa hàng ngày của chỉ số VN-Index trong giai đoạn 2004-2016 Phân tích được thực hiện bằng mô hình GARCH, cho thấy GARCH và EGARCH là những mô hình phù hợp nhất để đo lường các dao động đối xứng và bất đối xứng của VN-Index Nghiên cứu cung cấp cho nhà đầu tư công cụ dự báo tỷ suất lợi tức thị trường, giúp họ đánh giá mức lợi nhuận và sự thay đổi trên thị trường chứng khoán, từ đó đưa ra quyết định đầu tư sáng suốt hơn.

CƠ SỞ LÝ THUYẾT CỦA PHƯƠNG PHÁP DỰ BÁO GIÁ CỔ PHIẾU DỰA TRÊN K Ỹ THUẬT HỌC SÂU LSTM

Sơ lược về mạng nơron

Mạng nơ-ron nhân tạo (ANN) là hệ thống tính toán mô phỏng cấu trúc não bộ con người, bao gồm các đơn vị hay nút được kết nối như tế bào thần kinh Các tế bào này truyền tín hiệu tương tự như các đường dây thần kinh trong não, với khả năng kích hoạt và biến đổi thông tin trước khi truyền tới tế bào khác Thông tin được xử lý qua các hàm tuyến tính, giúp tín hiệu dễ dàng di chuyển trong mạng lưới.

Hình 6 Hình thể hiện cấu trúc của một mạng nơron

Mạng nơron bao gồm ba lớp chính: lớp đầu vào (input layer), các lớp ẩn (có thể có một hoặc nhiều) và lớp đầu ra (output layer) Mỗi lớp chứa các nút được kết nối với nhau thông qua các đường nối gọi là cạnh Mỗi cạnh có một hệ số w, đóng vai trò quan trọng trong hàm tuyến tính để xử lý thông tin truyền giữa các nút.

Trong một mạng nơ-ron cơ bản, có ba lớp chính, trong đó các điểm kết nối được gọi là node Theo quy ước, tổng số lớp trong mô hình được tính bằng số lớp trừ đi một (không tính lớp đầu vào).

Hình 7 Hình thể hiện các tham số để liên kết mạng

Ví dụ như hình trên có 2 lớp: lớp đầu vào và 1 lớp ẩn Mỗi node thể hiện trong mạng được hiểu như sau:

• Các node được liên kết với nhau thông qua các trọng số w riêng.

• Mỗi điểm node có 1 trọng số hay chính là bias b riêng.

Các giá trị truyền trong mạng nơ-ron được xử lý bằng cách tính tổng tất cả các giá trị từ các node của lớp trước, nhân với trọng số w tại các điểm kết nối và cộng với giá trị bias Kết quả của quá trình này được gọi là tổng linear Sau đó, mô hình sẽ áp dụng hàm kích hoạt để chuyển đổi các tổng linear này.

Khi xác định lớp đầu trong mạng nơ-ron, trọng số được quy định để xác định mức độ ưu tiên của các biến đầu vào Trọng số lớn hơn sẽ có mức độ đóng góp cao hơn vào đầu ra Tất cả giá trị được xử lý thông qua tổng tuyến tính, và nếu giá trị đầu ra lớn hơn một ngưỡng nhất định, nó sẽ tiếp tục xử lý hàm và truyền thông tin đến lớp kế tiếp Quá trình này cho phép giá trị đầu ra di chuyển từ nút này sang nút khác, tạo thành đầu vào cho các nút tiếp theo, và được coi là một mạng chuyển tiếp.

Tổng quan về thuật toán LSTM .20Λ4040046 1 Lịch sử ra đời của LSTM 20Λ4040046 2 Cơ chế hoạt động

2.2.1 Lịch sử ra đời của LSTM

Khái niệm ban đầu về học máy đã xuất hiện trong những năm 1950Λ4040046 (Samuel,

1959), Thuật ngữ ML (Machine learning) được đặt ra bởi Arthur Samuel vào năm

Vào năm 1959, một nhà tiên phong người Mỹ trong lĩnh vực trò chơi máy tính và trí tuệ nhân tạo đã tuyên bố rằng máy học mang lại khả năng cho máy tính học hỏi mà không cần lập trình rõ ràng Máy học, một nhánh của trí tuệ nhân tạo, sử dụng máy tính để mô phỏng quá trình học tập của con người và xây dựng các thuật toán dựa trên dữ liệu Các thuật toán máy học đa dạng, trong đó mạng nơron nhân tạo, SVM, rừng ngẫu nhiên (RF) và học sâu là những loại quan trọng nhất Trong bối cảnh thị trường chứng khoán, nơi mà các hệ thống thường phi tuyến và hỗn loạn, các thuật toán phi tuyến được ưa chuộng hơn để dự đoán hành vi chứng khoán Gần đây, các mô hình phi tuyến, đặc biệt là mạng nơron nhân tạo, đã được áp dụng rộng rãi trong thị trường tài chính và đạt được kết quả mong muốn.

LSTM, viết tắt của Long-short term memory, là một mô hình cho dữ liệu tuần tự, phát triển từ RNN để giải quyết vấn đề gradient biến mất Bộ nhớ dài hạn của LSTM lưu trữ trọng lượng đã học, trong khi bộ nhớ ngắn hạn lưu giữ trạng thái bên trong của tế bào Khối LSTM, được phát triển bởi Hochreiter và Schmidhuber vào năm 1997, thay thế lớp giữa trong RNN, giúp cải thiện khả năng học của mô hình Gradient, đạo hàm của hàm số, thể hiện tỷ lệ thay đổi của hàm tại một điểm.

LSTM được thiết kế để giải quyết các vấn đề liên quan đến sự phụ thuộc trong dữ liệu Nó có khả năng tự học và ghi nhớ thông tin trong một khoảng thời gian nhất định Tất cả các mạng nơ-ron hồi tiếp (RNN) đều bao gồm chuỗi các mô-đun kết nối với nhau Trong khi đó, các mạng RNN cơ bản thường có cấu trúc đơn giản, chẳng hạn như sử dụng hàm kích hoạt tanh trong các nơ-ron.

Hình 8 Hình thể hiện kiến trúc mạng RNN cơ bản

LSTM (Long Short-Term Memory) có khả năng học các liên kết lâu dài, điều mà RNN (Recurrent Neural Network) không thể thực hiện Để dự đoán bước thời gian tiếp theo, LSTM cần cập nhật các giá trị trọng số trong mạng, duy trì dữ liệu từ các bước thời gian trước đó Trong khi RNN chỉ có thể học một số lượng ngắn hạn giới hạn, LSTM có thể xử lý chuỗi thời gian dài hạn, cho phép học các mối liên kết phức tạp Cấu trúc của LSTM bao gồm các khối bộ nhớ với nhiều ô nhớ tự động hồi quy và ba đơn vị đầu vào, đầu ra và phần quên, giúp quản lý quá trình ghi, đọc và điều chỉnh chức năng của tế bào Có nhiều loại LSTM khác nhau như LSTM xếp chồng, LSTM bộ mã hóa - giải mã, CNN LSTM và LSTM chung Nhờ vào khả năng học tập mạnh mẽ, LSTM được áp dụng rộng rãi trong các lĩnh vực như nhận dạng giọng nói, mô hình âm thanh và dự đoán quỹ đạo.

Khác với các mạng nơ-ron truyền thống, mạng LSTM có bốn lớp kết nối và truyền dữ liệu theo cách đặc biệt Các chuỗi mô-đun của LSTM được thiết kế với cấu trúc khác biệt và cải tiến hơn so với mạng RNN, giúp nâng cao hiệu quả trong việc xử lý dữ liệu chuỗi.

Hình 9 Hình thể hiện kiến trúc mạng LSTM

2.2.2.1 Các ký hiệu trong mô hình

Mô hình LSTM bao gồm ba cổng: cổng quên f(t), cổng vào i(t) và cổng ra o(t), với X t là giá trị đầu vào và t là thời gian Giá trị c(t) xác định các giá trị cần lấy từ đầu vào, trong khi cổng ra (input gate) quyết định giá trị nào từ lớp ẩn trước đó sẽ được sử dụng Đồng thời, ht cũng xem xét các giá trị đầu vào để truyền tới các giá trị ẩn tiếp theo và được sử dụng để tính giá trị tại thời điểm t.

Các hàm kích hoạt (activation function) sigmoid và tanh giúp biến đổi các giá trị vào.

Hình 10 Hình thể hiện mô hình mạng LSTM

Trong đó, các ký hiệu khác được giải thích dưới đây:

Layer Đây là các lớp ẩn hay chính là hidden layer của mạng nơron

Toán tử Pointwise sử dụng để thể hiện công hay nhn các vector của các cạnh kết nối

Vector truyền từ node này sang node khác

Thể hiện song song thực hiện các tính toán

Thể hiện việc sao chép giá trị từ node này sang node khác

Bảng 2.1 Bảng mô tả ký hiệu trong mô hình LSTM 2.2.2.2 Ý tưởng cốt lõi đằng sau LSTM

Chìa khóa của LSTM là các ô ghi nhớ, cho phép thông tin chạy xuyên suốt chuỗi thông qua các cổng Trạng thái tế bào này duy trì liên tục và cần tương tác với hàm tuyến tính đơn giản, giúp thông tin dễ dàng được bảo toàn mà không bị thay đổi.

Hình 11 Hình thể hiện đường chạy của ô trạng thái trong mạng LSTM

Một trong những ưu điểm nổi bật của LSTM là khả năng loại bỏ hoặc truyền tín hiệu tới các node của tế bào một cách hiệu quả Mỗi giá trị tín hiệu được xử lý cẩn thận thông qua các hàm tuyến tính tại các cổng của LSTM Mỗi cổng đảm nhận một nhiệm vụ riêng biệt, giúp thông tin được truyền đi một cách mạch lạc Cấu trúc của các cổng được xây dựng từ một lớp mạng thần kinh với hàm kích hoạt sigmoid và thực hiện phép nhân theo chiều quy định.

Hình 12 Hình thể hiện cổng của hàm sigmoid trong LSTM

Hàm kích hoạt sigmoid chuyển đổi tổng tuyến tính về giá trị trong khoảng [0; 1], thể hiện mức độ truyền thông tin của từng thành phần Kết quả bằng 0 có nghĩa là "không có gì thông qua", trong khi kết quả bằng 1 có nghĩa là "để mọi thứ thông qua" Mô hình LSTM có ba cổng, mỗi cổng có nhiệm vụ xử lý và kiểm soát thông tin đầu vào.

Mạng LSTM được cấu tạo từ nhiều ô LSTM kết nối, với sự cải tiến đáng kể nhờ vào trạng thái ô bên trong St và ba cổng: cổng quên f(t), cổng vào i(t) và cổng ra o(t) Tại mỗi thời điểm t, các cổng nhận giá trị đầu vào x(t) và giá trị h(t-1) từ ô nhớ trước đó Cổng quên xác định thông tin nào cần bị quên để không ảnh hưởng đến nơron tiếp theo, trong khi cổng vào quyết định thông tin nào được phép thêm vào Đầu ra của nơron trước và đầu vào của nơron cục bộ được xử lý qua hàm sigmoid và hàm tanh để tạo ra hai kết quả, từ đó xác định thông tin cần cập nhật Cuối cùng, cổng ra sẽ xác định kết quả từ cổng đầu vào có thể được tạo ra, hoàn tất quá trình xử lý thông tin trong mạng LSTM.

2.2.2.3 Quá trình thực hiện Đầu tiên, khi các giá trị của các node tại lớp đầu vào được đưa vào, tế bào mạng LSTM sẽ xem xét tất cả những giá trị ấy, lọc bỏ chúng tại thời gian trước đó s(t-1). Cổng quên đại diện cho f t nhận giá trị được đưa vào X t và giá trị truyền là h t ι từ node LSTM ở lớp trước đó và độ lệch (bias) b f của cổng quên tại thời điểm t Đồng thời hàm kích hoạt sigmoid tiến hành xử lý tất cả các giá trị đưa vào để kích hoạt lại (activation value), sau đó nó sẽ trả ra giá trị đầu ra nằm trong khoảng [0Λ4040046;1], con số này sẽ cho biết số thông tin được thông qua cổng này Đối với giá trị trả ra 0Λ4040046 tức là không cho phép bất kỳ thông tin nào được thông qua, ngược lại với giá trị trả ra số 1 có nghĩa toàn bộ thông tin được sẽ đường truyền [23].

Hình 13 Hình thể hiện tầng cổng quên của LSTM f t = σ (W f ∙ [h t-1 , X t ] + b f ) f t = σ (W f

Cổng quên sẽ cung cấp thông tin mới để ghi nhớ trong ô trạng thái, bao gồm hai bước chính Bước 1, hàm kích hoạt sigmoid tại "lớp cổng đầu vào" xác định thông tin nào sẽ được lấy, trong khi hàm kích hoạt tanh tạo ra vectơ giá trị mới C 1t để truyền tới node lớp tiếp theo Bước 2, kết hợp hai yếu tố trên để tạo bản đã được xử lý cho trạng thái, trong đó cổng đầu vào xác định lượng đầu vào mạng thời gian hiện tại x t được lưu trữ vào ô trạng thái mới C 1t, giúp loại bỏ thông tin không quan trọng Cổng đầu vào bao gồm ba thành phần: cập nhật trạng thái ô, tạo trạng thái ô mới và cập nhật trạng thái ô thành trạng thái hiện tại, với giá trị ĩ t tại thời điểm t được sử dụng trong phép toán tính toán.

Hình 14 Hình thể hiện giá trị được xử lý thông qua hàm tanh i t = σ(W i X t + w ɪ ⅛1 + ⅛ i )

Cuối cùng, giá trị mới của C t tại bên trong tế bào được xây dựng phép toán từ các giá trị đã được tính ở 2 ô nhớ trước đó:

Hình 15 Hình thể hiện ô trạng thái mới trong LSTM

Cổng đầu ra kiểm soát trạng thái ô mới sẽ bị loại bỏ, với đầu ra thông tin đầu tiên được xác định bởi lớp sigmoid Sau đó, trạng thái tế bào mới sẽ được xử lý bởi hàm tanh, kết hợp với đầu ra sigmoid để xác định đầu ra cuối cùng.

Hình 16 Hình thể hiện thông tin đầu ra được xử lý bằng hàm tanh

W f , w i , ,w c , ,W o là các giá trọng số của các cạnh kết nối các node trong mang LSTM bf , bs, bi, bo là các vector bias.

Trong mô hình LSTM, ma trận trọng số (w) là tham số có thể đào tạo, cho phép xác định mức độ quan trọng của thông tin cần nhấn mạnh Trọng số kết quả (α t) được sử dụng để tính trọng số đầu vào, giúp thay thế đầu vào ban đầu bằng đầu vào mới có trọng số, từ đó cập nhật sự chú ý Quá trình này cho phép mô hình chú ý nhiều hơn đến các chuỗi tính năng cụ thể, hiệu quả trong việc trích xuất các đặc điểm quan trọng và loại bỏ những tính năng dư thừa LSTM sử dụng các kỹ thuật học sâu, lấy cảm hứng từ cách con người xử lý thông tin, nơi không phải tất cả thông tin đều có tầm quan trọng như nhau Việc xác định các cổng ra và cổng quên là rất quan trọng, vì việc loại bỏ chúng có thể làm giảm khả năng học của mạng Hơn nữa, việc sửa đổi đầu vào và cổng quên có thể giảm số lượng tham số cần học mà không ảnh hưởng đến hiệu suất học tập của mạng Với những ưu điểm này, LSTM đã trở thành một phần quan trọng trong học sâu và được áp dụng rộng rãi cho nhiều nhiệm vụ khác nhau.

2.2.2.4 Các biến thể của LSTM

Một biến thể phổ biến của LSTM, được giới thiệu bởi Gers và Schmidhuber vào năm 2000, là việc thêm "kết nối lỗ nhìn trộm" Điều này cho phép các lớp cổng xem xét trạng thái tế bào, cải thiện khả năng học và dự đoán của mô hình.

Hình 17 Hình thể hiện biến thể kết nối lỗ nhìn trộm LSTM f t = σ (W f ∙ [C t-I ,h t-1 , X t ] + b f ) i t = σ(W i [C t-1 ,h t-1 , X t ] + b i )

Sơ đồ trên thêm lỗ nhỏ cho tất cả các cổng, nhưng nhiều giấy tờ sẽ cho một số lỗ nhỏ chứ không phải các cửa khác.

XÂY DỰNG MÔ HÌNH Dự BÁO GIÁ ĐÓNG CỬA CỦA MỘT SỐ MÃ CỔ PHIẾU SỬ DỤNG PHƯƠNG PHÁP LSTM

Xây dựng mô hình dự báo LSTM

Để xây dựng một mô hình LSTM, chúng ta cần tiến hành thực hiện lần lượt bốn bước cơ bản sau:

Tiền xử lý dữ liệu: tại bước này chúng ta tiến hành chia các tập dữ liệu để đào tạo, để thử nghiệm theo tỷ lệ phù hợp.

Xây dựng mạng nơron: Chọn ra các phép toán phù hợp để xử lý dữ liệu như chon hàm mất mát - loss function, hàm tối ưu - optimizer.

Huấn luyện mô hình: Tiến hành xây dựng mô hình để dự báo.

Biểu diễn kết quả và đánh giá mô hình

Hình 21 Hình thê hiện quy trình xây dựng mô hình dự báo LSTM

3.1.1 Chuẩn bị dữ liệu và tiền xử lý dữ liệu

Chứng khoán bị ảnh hưởng bởi nhiều yếu tố, bao gồm cả yếu tố tuyến tính và phi tuyến tính Các thuộc tính cơ bản của một mã cổ phiếu như giá đóng cửa, giá mở cửa, giá cao nhất, giá thấp nhất, giá điều chỉnh, số lượng giao dịch và số lượng khớp là những yếu tố quan trọng mà các nhà đầu tư và nhà phân tích cần chú ý, vì chúng quyết định lãi suất từ giao dịch chứng khoán Trong khóa luận này, tôi đã thu thập dữ liệu của 5 mã cổ phiếu ACB, FPT, MBB, SSI và VNM với các thuộc tính nêu trên, từ năm 20Λ404004619 đến nay.

Nguồn: cafef Hình 22 Hình thể hiện giá trị của các thuộc tính cơ bản của chứng khoán

Giá đóng cửa (closing price) là mức giá khớp lệnh cuối cùng trong một phiên giao dịch, thể hiện sự đồng thuận giữa người mua và người bán Nó không chỉ là giá tham chiếu cho ngày hôm sau mà còn ảnh hưởng đến các thuộc tính khác của chứng khoán Với khả năng dự đoán giá tương lai cao hơn các thuộc tính khác, giá đóng cửa sẽ được sử dụng trong bài khóa luận này để dự báo xu hướng giá cổ phiếu.

Hình 23 Hình thể hiện dữ liệu dự báo

Với khoảng 576 dòng dữ liệu cho mỗi mã cổ phiếu, tôi đã phân chia bộ dữ liệu thành hai phần: 80% cho tập dữ liệu đào tạo và 20% cho tập dữ liệu kiểm tra.

The dataset is split with 80% allocated for training and 20% for testing The provided Python code processes the dataset by separating the features (X) and labels (y) into training and testing sets It calculates the respective shapes of these sets, confirming the dimensions of the training and testing data Additionally, a graph is presented, illustrating the stock prices of ACB, FPT, SSI, VNM, and MBB over time, with the x-axis representing time and the y-axis representing price.

Hình 24 Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu ACB

Hình 25 Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu FPT

Hình 26 Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu MBB

Hình 27 Đồ thị thể hiện đường giá đóng cử của mã cổ phiếu SSI

Hình 28 Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu VNM

Giá cổ phiếu tại Việt Nam trong hai năm qua cho thấy sự biến động mạnh mẽ, với độ dốc của đồ thị không ổn định.

Thư viện, hay còn gọi là modules, bao gồm các hàm và lớp được viết sẵn với nhiều chức năng khác nhau, giúp chúng ta tính toán và xử lý dữ liệu một cách hiệu quả Một số thư viện nổi bật thường được sử dụng trong việc xây dựng mô hình bằng thuật toán Python bao gồm numpy cho xử lý dữ liệu và matplotlib để tạo đồ thị Ngoài ra, còn có các thư viện chính hỗ trợ xây dựng mô hình học sâu như TensorFlow, Keras, Caffe, Theano, Torch, PyTorch, Chainer, MXNet, CNTK và Caffe2.

Để xây dựng mô hình LSTM hiệu quả, việc lựa chọn thư viện học sâu phù hợp là rất quan trọng Trong nghiên cứu này, tôi đã chọn thư viện Keras do sự phổ biến và những ưu điểm nổi bật của nó.

• Keras là sự lựa chọn hàng đầu với những người lập trình muốn trải nghiệm ngôn ngữ python

• Keras - một thư viện được áp dụng cũng là lựa chọn trong nhiều bài nghiên cứu.

Keras hỗ trợ huấn luyện mô hình máy học trên nhiều GPU phân tán, cho phép thực hiện các phép toán song song Việc sử dụng nhiều nhân GPU tăng cường sức mạnh tính toán, giúp tối ưu hóa quá trình xử lý và kết hợp ma trận thống kê hiệu quả hơn.

3.1.2.2 Lựa chọn các tham số phù hợp a Trình tự - Sequential

Sequential (a) có chức năng truyền các giá trị của các node từ lớp này sang lớp khác theo đúng trình tự đã được thiết lập Nó thể hiện sự kết nối từ lớp đầu vào đến lớp ẩn, theo thứ tự các lớp đã được tạo ra, bao gồm lớp đầu vào, lớp ẩn 1 và lớp ẩn 2.

Hình 30 Hình thể hiện các lớp (layer) trong một mạng nơron b Lớp kết nối - Dense:

The Dense layer, also known as the fully connected layer, plays a crucial role in enabling the network to understand that all nodes must be interconnected according to the rules of linking the previous layer to the next In the provided code snippet, a Sequential model is created, where an LSTM layer with 256 units is added, followed by a Dense layer with 25 units using the ReLU activation function Finally, another Dense layer with a single output and a linear activation function is included The model is compiled with the Adam optimizer and mean squared error as the loss function, along with mean squared error as a metric for evaluation.

Hàm kích hoạt (activation function) trong mạng nơ-ron mô phỏng tỷ lệ truyền xung qua axon, có nhiệm vụ biến đổi các giá trị đầu vào thành các giá trị đầu ra nhất định Một số loại hàm kích hoạt phổ biến bao gồm sigmoid, tanh, ReLU và hàm tuyến tính (linear).

Hàm sigmoid là một hàm phi tuyến nhận giá trị thực và cho ra kết quả trong khoảng [0, 1] Do giá trị đầu ra của hàm sigmoid được giới hạn trong một khoảng nhỏ, nên sự thay đổi của nó không đáng kể Tuy nhiên, nhược điểm lớn của hàm này là gây ra hiện tượng Vanishing Gradient.

Hàm Tanh, giống như hàm Sigmoid, xử lý dữ liệu nhưng cho ra giá trị trong khoảng rộng hơn từ -1 đến 1 Điều này giúp khắc phục nhược điểm về sự thay đổi nhỏ trong hàm Sigmoid, tuy nhiên nó vẫn gặp phải hiện tượng bão hòa ở hai đầu, dẫn đến vấn đề Vanishing Gradient.

ReLU (Rectified Linear Unit) là hàm kích hoạt phổ biến nhất cho các lớp ẩn trong mạng nơ-ron Sự phổ biến của ReLU đến từ tính đơn giản trong việc triển khai và khả năng khắc phục những hạn chế của các hàm kích hoạt truyền thống như Sigmoid và Tanh.

Mạng nơron tuyến tính không hiệu quả trong việc giảm thiểu lỗi, vì chúng không thể học tốt và nhận diện các mẫu phức tạp trong dữ liệu Vì vậy, hàm tuyến tính chỉ phù hợp cho những nhiệm vụ đơn giản, nơi mà sự diễn giải được ưu tiên cao.

Đánh giá mô hình

Khóa luận này so sánh hiệu quả của mô hình LSTM với mô hình truyền thống ARIMA trong dự báo giá cổ phiếu Kết quả thực nghiệm được thể hiện qua bảng chỉ số MSE, cho thấy sự khác biệt giữa hai phương pháp.

Bảng 1 So sánh chỉ số MSE giữa LSTM và ARIMA

Khi so sánh chỉ số MSE giữa mô hình LSTM và mô hình ARIMA, ta nhận thấy rằng MSE của ARIMA cao hơn nhiều so với LSTM, cho thấy độ sai trong dự báo của ARIMA lớn hơn Điều này chứng minh rằng kỹ thuật học sâu LSTM cung cấp giá trị dự báo gần sát với giá thực tế hơn Với bộ dữ liệu chứng khoán tại Việt Nam, việc áp dụng kỹ thuật học sâu LSTM trong dự báo tài chính, đặc biệt là chứng khoán, là hoàn toàn khả thi Hơn nữa, mô hình LSTM cũng tương đối dễ sử dụng và dễ hiểu.

Sự kết hợp giữa các mô hình kỹ thuật học sâu và các mô hình khác mang lại lợi ích lớn cho các nhà phân tích và công ty chứng khoán, giúp nâng cao hiệu quả trong việc dự đoán và phân tích thị trường.

Để đầu tư chứng khoán hiệu quả, các nhà đầu tư cần dự báo chính xác tình hình thị trường trong tương lai Ngay cả một cải tiến nhỏ trong khả năng dự đoán cũng có thể mang lại lợi nhuận cao Hệ thống dự đoán tốt giúp nhà đầu tư ra quyết định chính xác và sinh lợi hơn bằng cách cung cấp thông tin về xu hướng giá cổ phiếu Nghiên cứu này đã phân tích và so sánh các thuật toán và kỹ thuật deep learning, đặc biệt là LSTM, trong việc dự đoán giá cổ phiếu, cho thấy kết quả khả quan Bài toán được nghiên cứu không chỉ hỗ trợ việc áp dụng các phương pháp học sâu vào dữ liệu tài chính mà còn mở ra khả năng dự đoán cho nhiều vấn đề khác trong lĩnh vực kinh tế.

Ngày đăng: 07/04/2022, 13:06

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Duc Huu Dat Nguyen, Loc Phuoc Tran and Vu Nguyen, "Predicting Stock Prices Using Dynamic LSTM Models," in International Conference on Communications in Computer and Information Science, Madrid, 20Λ404004619 Sách, tạp chí
Tiêu đề: Predicting Stock PricesUsing Dynamic LSTM Models
[2] Xuan Ji, Jiachen Wang and Zhijun Yan, "A stock price prediction method based on deep learning technology," International Journal of Crowd Science, 20Λ404004620Λ4040046 Sách, tạp chí
Tiêu đề: A stock price prediction method basedon deep learning technology
[3] David M. Q. Nelson, Adriano C. M. Pereira, Renato A. de Oliveira, "Stock market’s price movement prediction with LSTM neural networks," in 2017 International Joint Conference on Neural Networks, 20Λ404004617 Sách, tạp chí
Tiêu đề: Stockmarket’s price movement prediction with LSTM neural networks
[4] Sreelekshmy Selvin, Vinayakumar R, Gopalakrishnan E.A, Vijay Krishna Menon, Soman K.P, "Stock price prediction using LSTM, RNN and CNN-sliding window model," in 2017 International Conference on Advances in Computing, Communications and Informatics, 20Λ404004617 Sách, tạp chí
Tiêu đề: Stock price prediction using LSTM, RNN and CNN-sliding windowmodel
[5] Kai Chen, Yi Zhou and Fangyan Dai, "A LSTM-based method for stock returns prediction: a case," in IEEE International Conference on Big Data (Big Data), 20Λ404004615 Sách, tạp chí
Tiêu đề: A LSTM-based method for stock returnsprediction: a case
[6] Yujin Baek, Ha Young Kim, "ModAugNet: A new forecasting framework for stock market index value with an overfitting prevention LSTM module and a prediction LSTM module," Expert Systems with Applications, pp. 457-480Λ4040046, 20Λ404004618 Sách, tạp chí
Tiêu đề: ModAugNet: A new forecasting framework forstock market index value with an overfitting prevention LSTM module and aprediction LSTM module
[7] Zexin Hu, Yiqi Zhao and Matloob Khushi, "A Survey of Forex and Stock Price Prediction Using Deep Learning," Applied System Innovation, 20Λ404004621 Sách, tạp chí
Tiêu đề: A Survey of Forex and Stock PricePrediction Using Deep Learning
[8] M. Tuấn, "Lịch sử thị trường chứng khoán thế giới," 0Λ40400467 0Λ40400468 20Λ40400460Λ40400469. [Online].Available: https://cafef.vn/tai-chinh-quoc-te/lich-su-thi-truong-chung-khoan-the-gioi-20Λ40400460Λ404004690Λ404004680Λ404004670Λ404004632914113.chn Sách, tạp chí
Tiêu đề: Lịch sử thị trường chứng khoán thế giới
[9] B. Linh, "Các thị trường chứng khoán trên thế giới có quy mô như thế nào?," 0Λ40400462 12 20Λ404004619. [Online]. Available: https://cafef.vn/cac-thi-truong-chung-khoan-tren-the-gioi-co-quy-mo-nhu-the-nao-20Λ404004619120Λ4040046210Λ404004655395.chn Sách, tạp chí
Tiêu đề: Các thị trường chứng khoán trên thế giới có quy mô như thế nào
[11] S. Lahmiri, "A Comparison of PNN and SVM for Stock Market Trend Prediction using Economic and Technical Information," International Journal of Computer Applications, pp. 24-30Λ4040046, 20Λ404004611 Sách, tạp chí
Tiêu đề: A Comparison of PNN and SVM for Stock Market Trend Predictionusing Economic and Technical Information
[12] Weiling Chen, Chai Kiat Yeo, Chiew Tong Lau, Bu Sung Lee, "Leveraging social media news to predict stock index movement using RNN-boost," Data &Knowledge Engineering, pp. 14-24, 20Λ404004618 Sách, tạp chí
Tiêu đề: Leveraging socialmedia news to predict stock index movement using RNN-boost
[13] P. N. H. J. S. S. A. M. Mojtaba Nabipour, "Predicting Stock Market Trends Using Machine Learning and Deep Learning Algorithms Via Continuous and Binary Data; a Comparative Analysis”," IEEE Access, pp. 150Λ4040046199-150Λ4040046212, 12 0Λ40400468 20Λ404004620Λ4040046 Sách, tạp chí
Tiêu đề: Predicting Stock Market Trends UsingMachine Learning and Deep Learning Algorithms Via Continuous and BinaryData; a Comparative Analysis”
[14] Mahla Nikou, Gholamreza Mansourfar, Jamshid Bagherzadeh, "Stock price prediction using DEEP learning algorithm and its comparison with machine learning algorithms," Intelligent system in Accounting, Finance and Management, pp. 1-11, 20Λ404004619 Sách, tạp chí
Tiêu đề: Stock priceprediction using DEEP learning algorithm and its comparison with machinelearning algorithms
[15] M. M. Y. A. A. S. M. Maqsood, "A local and global event sentiment based efficient stock exchange forecasting using deep learning," International Journal of Information Management, pp. 432-451, 20Λ404004620Λ4040046 Sách, tạp chí
Tiêu đề: A local and global event sentiment basedefficient stock exchange forecasting using deep learning
[16] Ehsan Hoseinzade, Saman Haratizadeh, "CNNpred: CNN-based stock market prediction using a diverse set of variables," Expert Systems with Applications, pp.273-285, 20Λ404004619 Sách, tạp chí
Tiêu đề: CNNpred: CNN-based stock marketprediction using a diverse set of variables
[17] Zhichao Zou, Zihao Qu, "Using LSTM in Stock prediction and Quantitative,"Standford university, 20Λ404004620Λ4040046 Sách, tạp chí
Tiêu đề: Using LSTM in Stock prediction and Quantitative
[18] K. GIANG, "Chứng khoán Việt Nam - Hành trình 20Λ4040046 năm," 15 0Λ40400467 20Λ404004620Λ4040046.[Online].Available: https://nhandan.vn/chungkhoan-thitruong/chung-khoan-viet-nam-hanh-trinh-20Λ4040046-nam--60Λ40400468695/ Sách, tạp chí
Tiêu đề: Chứng khoán Việt Nam - Hành trình 20Λ4040046 năm
[21] Nguyễn Thanh Hương, Bùi Quang Trung, " Ứng dụng mô hình kết hợp ARIMA- GARCH để dự báo chỉ số VN-Index," Tạp chí Khoa học Công nghệ Đại học Đà Nang, 20Λ404004615 Sách, tạp chí
Tiêu đề: Ứng dụng mô hình kết hợp ARIMA-GARCH để dự báo chỉ số VN-Index
[22] Hồ Thủy Tiên, Hồ Thu Hoài, Ngô Văn Toàn, "Mô hình hóa biến động thị trường chứng khoán Thực nghiệm từ Việt Nam," Tạp chí Khoa học ĐHQGHN: Kinh tế và Kinh doanh, pp. 21-31, 22 0Λ40400469 20Λ404004617 Sách, tạp chí
Tiêu đề: Mô hình hóa biến động thị trườngchứng khoán Thực nghiệm từ Việt Nam
[23] P. Đ. Khanh, "Lý thuyết về mạng LSTM," 22 0Λ40400463 20Λ404004619. [Online]. Available:https://phamdinhkhanh.github.io/20Λ404004619/0Λ40400464/22/Ly_thuyet_ve_mang_L STM.html Sách, tạp chí
Tiêu đề: Lý thuyết về mạng LSTM

HÌNH ẢNH LIÊN QUAN

Hình 1. Biểu đồ thể hiện số lượng bài nghiên cứu kỹ thuật học sâu từ năm 2015- - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 1. Biểu đồ thể hiện số lượng bài nghiên cứu kỹ thuật học sâu từ năm 2015- (Trang 19)
Hình 4. Biểu đồ thể hiện số lượng tài khoản chứng khoán nhà đầu tư trong nước mới mở - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 4. Biểu đồ thể hiện số lượng tài khoản chứng khoán nhà đầu tư trong nước mới mở (Trang 25)
Hình 6. Hình thể hiện cấu trúc của một mạng nơron - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 6. Hình thể hiện cấu trúc của một mạng nơron (Trang 30)
2.1.2. Mô hình mạng nơron - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
2.1.2. Mô hình mạng nơron (Trang 31)
Hình 8. Hình thể hiện kiến trúc mạng RNN cơ bản - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 8. Hình thể hiện kiến trúc mạng RNN cơ bản (Trang 33)
2.2.2.1. Các ký hiệu trong mô hình - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
2.2.2.1. Các ký hiệu trong mô hình (Trang 34)
Hình 9. Hình thể hiện kiến trúc mạng LSTM - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 9. Hình thể hiện kiến trúc mạng LSTM (Trang 34)
Hình 14. Hình thể hiện giá trị được xử lý thông qua hàm tanh - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 14. Hình thể hiện giá trị được xử lý thông qua hàm tanh (Trang 39)
Hình 16. Hình thể hiện thông tin đầu ra được xử lý bằng hàm tanh - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 16. Hình thể hiện thông tin đầu ra được xử lý bằng hàm tanh (Trang 40)
Hình 19. Hình thể hiện cấu trúc LSTM có thêm cổng cập nhật - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 19. Hình thể hiện cấu trúc LSTM có thêm cổng cập nhật (Trang 42)
Để xây dựng một mô hình học sâu, có các hàm tính toán gồm hàm kích hoạt (activation), hàm mất mát (Loss), hàm tối ưu (optimizers),... - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
x ây dựng một mô hình học sâu, có các hàm tính toán gồm hàm kích hoạt (activation), hàm mất mát (Loss), hàm tối ưu (optimizers), (Trang 43)
CHƯƠNG 3: XÂY DỰNG MÔ HÌNH Dự BÁO GIÁ ĐÓNG CỬA CỦA MỘT SỐ MÃ CỔ PHIẾU SỬ DỤNG PHƯƠNG PHÁP LSTM - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
3 XÂY DỰNG MÔ HÌNH Dự BÁO GIÁ ĐÓNG CỬA CỦA MỘT SỐ MÃ CỔ PHIẾU SỬ DỤNG PHƯƠNG PHÁP LSTM (Trang 44)
Hình 24. Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu ACB - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 24. Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu ACB (Trang 47)
Hình 25. Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu FPT - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 25. Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu FPT (Trang 47)
Hình 28. Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu VNM - 886 ứng dụng mô hình học sâu LSTM trong bài toán dự báo giá cổ phiếu ở thời điểm đóng cửa cho một số mã cổ phiếu ở thị trường chứng khoán việt nam
Hình 28. Đồ thị thể hiện đường giá đóng cửa của mã cổ phiếu VNM (Trang 48)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w