Lí do chọn đề tài
Năm 2020, thị trường chứng khoán Việt Nam nổi bật với khả năng chống chịu và phục hồi tốt trong đại dịch, giúp nhà đầu tư trải qua một năm “thăng hoa” với sự gia tăng đáng kể giá trị danh mục đầu tư Tổng giá trị huy động vốn qua thị trường chứng khoán đạt 413.700 tỷ đồng, tăng 30% so với năm 2019 Quy mô vốn hóa thị trường cổ phiếu đạt 84,1% GDP, vượt mục tiêu 70% GDP đã đề ra Đến cuối tháng 12 năm 2020, tổng dư nợ trên thị trường trái phiếu đạt khoảng 45% GDP, tăng 17,6% so với năm trước, trong đó dư nợ trái phiếu chính phủ chiếm 27,7% GDP và dư nợ trái phiếu doanh nghiệp đạt 15,1% GDP.
Bà Tạ Thanh Bình, Vụ trưởng Vụ Phát triển thị trường của Ủy ban Chứng khoán Nhà nước, nhận định rằng thị trường chứng khoán năm 2021 sẽ được hỗ trợ bởi nhiều yếu tố tích cực Nền kinh tế Việt Nam có cơ hội phục hồi cao hơn so với nhiều quốc gia khác nhờ vào quản lý hiệu quả đại dịch COVID-19 và tham gia các hiệp định thương mại Việt Nam cũng có khả năng hưởng lợi từ sự dịch chuyển chuỗi cung ứng sang các quốc gia có chi phí sản xuất thấp Bên cạnh đó, thị trường chứng khoán trong nước sẽ chứng kiến nhiều thay đổi tích cực và nội tại của các doanh nghiệp niêm yết cũng tương đối khả quan.
Theo báo cáo tài chính quý IV/2020 (chưa kiểm toán), 82% doanh nghiệp niêm yết ghi nhận có lãi, tương đương với quý IV/2019 Việt Nam đã vươn lên chiếm thị phần số 1 trong nhóm thị trường cận biên của MSCI sau khi Kuwait được nâng hạng lên nhóm “mới nổi” Điều này khiến thị trường chứng khoán Việt Nam được kỳ vọng sẽ thu hút đầu tư từ các quỹ đầu tư vào thị trường cận biên Ông Nhữ Đình Hòa, Tổng giám đốc Công ty Cổ phần Chứng khoán Bảo Việt (BVSC), cũng nhấn mạnh rằng với nền tảng kinh tế và chính trị ổn định, kỳ vọng về tăng trưởng hồi phục là khả thi.
7 phục mạnh, các doanh nghiệp kinh doanh thuận lợi sẽ củng có thêm cho niềm tin về xu hướng tích cực
Việt Nam, một nền kinh tế mới nổi, được dự báo sẽ trở thành điểm thu hút dòng vốn ngoại trong năm 2021, theo ông Nhữ Đình Hòa Ông cũng cho rằng Việt Nam có khả năng thu hút thêm vốn ngoại nhằm đón đầu xu thế nâng hạng thị trường chứng khoán từ thị trường cận biên lên thị trường mới nổi.
Sự phát triển của thị trường chứng khoán Việt Nam đã thúc đẩy quá trình cơ cấu lại nền kinh tế thông qua cải cách doanh nghiệp nhà nước, tái cơ cấu đầu tư công và hỗ trợ tái cơ cấu các tổ chức tín dụng Cụ thể, cổ phần hóa doanh nghiệp nhà nước gắn liền với đăng ký giao dịch trên thị trường chứng khoán, cùng với việc huy động vốn cho ngân sách nhà nước, đã tạo ra một kênh đầu tư quan trọng Điều này cung cấp thông tin rõ ràng cho nhà quản lý doanh nghiệp và nhà đầu tư, giúp họ đưa ra quyết định giao dịch hiệu quả, từ đó nâng cao lòng tin vào thị trường và đảm bảo lợi nhuận bền vững cho các nhà đầu tư.
Dự đoán thị trường chứng khoán là nhu cầu cấp thiết và có ý nghĩa thực tiễn, thu hút sự quan tâm của nhiều nhà nghiên cứu trong và ngoài nước Các giải pháp được đề xuất đều có những ưu nhược điểm riêng, nhưng việc sử dụng học máy đã chứng minh là giải pháp hiệu quả nhất Vì lý do này, chúng tôi đã chọn đề tài “Dự đoán giá cổ phiếu” cho môn đồ án 1.
Phương pháp nghiên cứu
Phương pháp nghiên cứu lý thuyết trong lĩnh vực cổ phiếu chứng khoán bao gồm việc tổng hợp và phân tích tài liệu liên quan, nghiên cứu các thuật toán và phương pháp dự đoán giá cổ phiếu, cũng như áp dụng các kỹ thuật học sâu vào thị trường chứng khoán Bên cạnh đó, việc tìm hiểu các kiến thức liên quan như thị trường chứng khoán, học máy và kỹ thuật lập trình máy tính cũng là rất cần thiết để nâng cao hiệu quả nghiên cứu.
- Phương pháp so sánh và đánh giá: phân tích đánh giá mô hình đề xuất với các mô hình nghiên cứu trước bằng các độ đo khác nhau
Những vấn đề cơ bản về chứng khoán
Chứng khoán là các chứng chỉ có giá trị, có thể chuyển nhượng và xác định khoản đầu tư dài hạn, đồng thời xác nhận quyền lợi hợp pháp của người sở hữu đối với tài sản hoặc vốn của tổ chức phát hành Mỗi loại chứng khoán đều mang những đặc điểm riêng biệt.
• Thứ nhất, tính thanh khoản:
Tính lỏng của tài sản là khả năng chuyển đổi tài sản thành tiền mặt, phụ thuộc vào thời gian, chi phí chuyển đổi và rủi ro giảm giá trị Chứng khoán thường có tính lỏng cao hơn so với các loại tài sản khác, nhờ vào khả năng chuyển nhượng dễ dàng trên thị trường Tuy nhiên, mức độ chuyển nhượng của các loại chứng khoán khác nhau cũng có sự khác biệt.
• Thứ hai, tính rủi ro
Chứng khoán là tài sản tài chính chịu ảnh hưởng lớn từ rủi ro, bao gồm rủi ro có hệ thống và không có hệ thống Rủi ro có hệ thống tác động đến toàn bộ hoặc hầu hết các tài sản, thường do các yếu tố kinh tế như lạm phát, tỷ giá hối đoái và lãi suất Ngược lại, rủi ro không hệ thống chỉ ảnh hưởng đến một tài sản hoặc nhóm tài sản nhỏ, thường liên quan đến tình hình của nhà phát hành Các nhà đầu tư cần đánh giá các rủi ro này để đưa ra quyết định hợp lý trong việc lựa chọn, nắm giữ hoặc bán chứng khoán, phản ánh mối quan hệ giữa lợi tức và rủi ro Họ sẽ không chấp nhận rủi ro cao hơn trừ khi có kỳ vọng nhận được lợi tức cao hơn.
• Thứ ba, tính sinh lợi
Chứng khoán là tài sản tài chính mà nhà đầu tư kỳ vọng mang lại thu nhập lớn hơn trong tương lai, thông qua lợi tức hàng năm và sự tăng giá trên thị trường Mối quan hệ giữa khả năng sinh lợi và rủi ro của tài sản rất chặt chẽ, thể hiện qua nguyên lý rằng mức độ chấp nhận rủi ro càng cao thì lợi nhuận kỳ vọng càng lớn.
Cổ phiếu là chứng khoán xác nhận quyền sở hữu và lợi ích hợp pháp đối với thu nhập và tài sản của công ty cổ phần, với vốn góp được chia thành nhiều phần nhỏ gọi là cổ phần Người mua cổ phần được gọi là cổ đông, và cổ phiếu có thể phát hành dưới dạng chứng chỉ vật chất hoặc bút toán ghi sổ, chỉ có công ty cổ phần mới có cổ phiếu Giá trị ban đầu ghi trên cổ phiếu được gọi là mệnh giá, trong khi số tiền nhận được từ khoản góp vốn được gọi là cổ tức Giá cổ phiếu biến động qua các phiên giao dịch trên thị trường chứng khoán và tách rời so với mệnh giá Cổ phiếu được chia thành hai loại.
Cổ phiếu thường là loại cổ phiếu không có kỳ hạn, đồng hành cùng sự tồn tại của công ty phát hành Loại cổ phiếu này không có lãi suất cố định, và lợi nhuận được phân chia vào cuối mỗi niên độ quyết toán.
Cổ đông nắm giữ cổ phiếu này có quyền bỏ phiếu, mua cổ phiếu mới, tham gia vào đại hội cổ đông
- Cổ phiếu ưu đãi: Gồm 2 loại
Cổ phiếu ưu đãi biểu quyết là loại cổ phiếu đặc biệt dành riêng cho các cổ đông sáng lập, yêu cầu họ phải giữ cổ phiếu trong một khoảng thời gian nhất định mà không được phép chuyển nhượng hay trao đổi.
Cổ phiếu ưu đãi tài chính là loại cổ phiếu tương tự như cổ phiếu thường, nhưng có một số hạn chế nhất định Cổ đông sở hữu cổ phiếu này không có quyền bầu cử hay ứng cử vào hội đồng quản trị và ban kiểm soát của công ty Tuy nhiên, họ được hưởng ưu đãi tài chính với mức cổ tức cố định hàng năm, và có quyền ưu tiên nhận cổ tức cũng như phân chia tài sản còn lại của công ty sau khi thanh lý, giải thể trước cổ đông nắm giữ cổ phiếu thường.
Trái phiếu là một loại chứng khoán nợ, yêu cầu người phát hành phải thanh toán một khoản tiền cụ thể cho người nắm giữ vào những thời điểm nhất định và theo các điều kiện đã định Chúng có thể được phát hành dưới dạng chứng chỉ vật chất hoặc bút toán ghi sổ Các loại trái phiếu rất đa dạng và đóng vai trò quan trọng trong thị trường tài chính.
Trái phiếu vô danh là loại trái phiếu không ghi tên trái chủ trên chứng chỉ và sổ sách của tổ chức phát hành, cho phép việc chuyển nhượng diễn ra dễ dàng Nhờ vào tính linh hoạt này, trái phiếu vô danh thường được giao dịch sôi nổi trên thị trường chứng khoán.
Trái phiếu ghi danh là loại trái phiếu mà tên và địa chỉ của trái chủ được ghi rõ trên chứng chỉ và sổ sách của tổ chức phát hành Do đặc điểm này, trái phiếu ghi danh thường ít được giao dịch trên thị trường.
Trái phiếu chính phủ là loại trái phiếu được phát hành bởi chính phủ để bù đắp thâm hụt ngân sách Đây là một lựa chọn đầu tư phổ biến cho những nhà đầu tư ưa thích sự an toàn, vì chúng gần như không có rủi ro về khả năng thanh toán.
Trái phiếu công trình là công cụ tài chính được phát hành nhằm huy động vốn cho việc xây dựng các công trình cơ sở hạ tầng và các dự án phúc lợi công cộng.
Trái phiếu công ty là công cụ tài chính do các công ty phát hành nhằm vay vốn trung và dài hạn Khi công ty bán trái phiếu, họ trở thành người vay và người mua trái phiếu trở thành chủ nợ Công ty có trách nhiệm trả cả lãi và gốc cho trái chủ theo thỏa thuận trong hợp đồng Các loại trái phiếu công ty bao gồm trái phiếu có đảm bảo, trái phiếu không có bảo đảm và trái phiếu có thể mua lại.
Chứng chỉ quỹ đầu tư là loại chứng khoán do công ty quản lý quỹ phát hành nhằm huy động vốn từ các nhà đầu tư Vốn này được sử dụng để mua bán các loại chứng khoán khác nhằm tạo ra lợi nhuận, sau đó chia sẻ lợi nhuận đó cho các nhà đầu tư Chứng chỉ quỹ đầu tư có thể được phân loại thành nhiều loại khác nhau.
- Quỹ đầu tư chung: Đây là loại quỹ mà tất cả mọi người đều có thể tham gia
- Quỹ đầu tư riêng: Chỉ giới hạn ở một nhóm người nhất định
Tổng quan về thị trường chứng khoán
2.2.1 Khái niệm thị trường chứng khoán
Thị trường chứng khoán là một thị trường mà ở đó người ta mua bán, chuyển nhượng, trao đổi chứng khoán nhằm mục đích kiếm lời
Thị trường chứng khoán hiện đại là nơi diễn ra các giao dịch mua bán chứng khoán trung và dài hạn Giao dịch này được thực hiện ở thị trường sơ cấp, nơi người mua mua chứng khoán lần đầu từ nhà phát hành, và ở thị trường thứ cấp, nơi có sự mua đi bán lại các chứng khoán đã được phát hành Như vậy, thị trường chứng khoán chủ yếu là nơi trao đổi, mua bán và chuyển nhượng các loại chứng khoán, từ đó thay đổi chủ sở hữu của chúng.
2.2.2 Chức năng của thị trường chứng khoán
• Huy động vốn đầu tư cho nền kinh tế
• Cung cấp môi trường đầu tư cho công chúng
• Tạo tính thanh khoản cho các chứng khoán
• Đánh giá hoạt động của doanh nghiệp
• Tạo môi trường giúp Chính phủ thực hiện các chính sách kinh tế vĩ mô
2.2.3 Các chủ thể tham gia thị trường chứng khoán
Nhà phát hành là các tổ chức huy động vốn qua thị trường chứng khoán, bao gồm Chính phủ, chính quyền địa phương và các công ty Chính phủ phát hành trái phiếu chính phủ để bù đắp thâm hụt ngân sách hoặc thực hiện các công trình quốc gia lớn Chính quyền địa phương phát hành trái phiếu địa phương nhằm huy động vốn cho các dự án kinh tế, xã hội tại địa phương Các công ty, để phát triển sản xuất, cũng phát hành trái phiếu công ty hoặc cổ phiếu.
Nhà đầu tư được chia thành hai nhóm chính: nhà đầu tư cá nhân, bao gồm những người chấp nhận rủi ro và những người không thích rủi ro; và nhà đầu tư tổ chức, bao gồm các công ty đầu tư, công ty bảo hiểm, quỹ bảo hiểm xã hội, công ty tài chính và ngân hàng thương mại.
Các tổ chức kinh doanh trên thị trường chứng khoán: o Công ty chứng khoán o Quỹ đầu tư chứng khoán o Các trung gian tài chính
Các tổ chức liên quan đến chứng khoán bao gồm: cơ quan quản lý Nhà nước, sở giao dịch chứng khoán, hiệp hội các nhà kinh doanh chứng khoán, tổ chức lưu ký và thanh toán bù trừ chứng khoán, công ty dịch vụ máy tính chứng khoán, các tổ chức tài trợ chứng khoán, và công ty đánh giá hệ số tín nhiệm Những tổ chức này đóng vai trò quan trọng trong việc quản lý, giao dịch, và đảm bảo tính thanh khoản của thị trường chứng khoán.
2.2.4 Các nguyên tắc hoạt động trên thị trường chứng khoán
2.2.5 Cấu trúc và phân loại cơ bản của thị trường chứng khoán
Căn cứ vào sự luân chuyển các nguồn vốn
Thị trường sơ cấp Thị trường thứ cấp
Thị trường chứng khoán sơ cấp là nơi duy nhất mà chứng khoán đem lại vốn cho người phát hành
Thị trường thứ cấp không trực tiếp mang lại vốn cho người đầu tư sản xuất kinh doanh
Giá chứng khoán trên thị trường sơ cấp (giá phát hành) do tổ chức phát hành quyết định
Giao dịch trên thị trường thứ cấp phản ánh nguyên tắc tự do, cạnh tranh tự do
Những người bán trên thị trường sơ cấp thường là kho bạc, ngân hàng nhà nước, công ty phát hành, tập đoàn bảo lãnh phát hành,
Chứng khoán trên thị trường thứ cấp có thể được mua bán nhiều lần
Căn cứ vào hàng hóa trên thị trường
Thị trường cổ phiếu Thị trường trái phiếu Thị trường các công cụ chứng khoán phái sinh
Thị trường giao dịch và mua bán các loại cổ phiếu, bao gồm cổ phiếu thường, cổ phiếu ưu đãi
Thị trường giao dịch trái phiếu đã phát hành bao gồm các loại trái phiếu công ty, trái phiếu đô thị và trái phiếu chính phủ, cho phép nhà đầu tư thực hiện mua bán linh hoạt.
Thị trường phát hành và mua đi bán lại các chứng từ tài chính khác như: quyền mua cổ phiếu, chứng quyền, hợp đồng quyền chọn
Căn cứ vào phương thức hoạt động của thị trường
Thị trường giao dịch tập trung
(Sở giao dịch chứng khoán)
Thị trường phi tập trung
Hình 2 1: Mô hình phân loại thị trường chứng khoán
Thị trường tập trung là nơi thực hiện giao dịch, trao đổi và mua bán chứng khoán thông qua sở giao dịch chứng khoán, hay còn gọi là sàn giao dịch.
Thị trường phi tập trung, hay còn gọi là thị trường OTC, là nơi diễn ra các hoạt động mua bán và trao đổi chứng khoán mà không bị giới hạn bởi vị trí địa lý.
Thị trường giao ngay là nơi diễn ra mua bán chứng khoán với giá thỏa thuận tại thời điểm ký hợp đồng, tuy nhiên việc thanh toán và giao chứng khoán sẽ được thực hiện sau một khoảng thời gian quy định Chức năng chính của thị trường này là huy động và gia tăng nguồn vốn cho các nhà đầu tư.
Thị trường giao dịch kỳ hạn là nơi mua bán chứng khoán theo giá thỏa thuận trong hợp đồng, với việc thanh toán và giao nhận chứng khoán diễn ra sau một khoảng thời gian nhất định, thường là 30 hoặc 60 ngày kể từ ngày ký kết hợp đồng.
Thị trường giao dịch tương lai tương tự như thị trường giao dịch chứng khoán kỳ hạn, nhưng có sự khác biệt ở chỗ các hợp đồng mua bán được tiêu chuẩn hóa về nội dung và điều kiện thực hiện Ngoài ra, để đảm bảo hợp đồng, các bên tham gia phải đặt cọc thông qua quy chế ký quỹ.
Học máy (Machine Learning) và Thị trường chứng khoán
Cách mạng Công nghiệp 4.0 đang tạo ra những thay đổi toàn diện trong mọi lĩnh vực của cuộc sống, với công nghệ trở thành yếu tố then chốt Xu hướng "thế giới vận hành bằng công nghệ" đang trở thành mục tiêu cạnh tranh cho các nền kinh tế và doanh nghiệp Trong bối cảnh này, Trí tuệ nhân tạo (A.I) và Học máy (Machine Learning) đóng vai trò quan trọng, được nghiên cứu và ứng dụng rộng rãi, đặc biệt trong ngành ngân hàng và công nghệ tài chính (FinTech).
14 riêng, tạo ra những bứt phá mạnh mẽ về tính hiệu quả, kịp thời, chính xác trong công tác giám sát, dự báo và hỗ trợ ra quyết định
Học máy, hay machine learning, là một nhánh của trí tuệ nhân tạo, tập trung vào việc phát triển các kỹ thuật giúp hệ thống tự động học hỏi từ dữ liệu để giải quyết các vấn đề cụ thể Chẳng hạn, máy có khả năng "học" để phân loại thư điện tử thành thư rác hay không và tự động sắp xếp vào thư mục phù hợp Mặc dù học máy có nhiều điểm tương đồng với suy diễn thống kê, nhưng chúng vẫn khác nhau về mặt thuật ngữ.
Học máy và thống kê đều nghiên cứu phân tích dữ liệu, nhưng học máy chú trọng vào sự phức tạp của các thuật toán tính toán Nhiều bài toán suy luận thuộc loại NP-khó, do đó, một phần quan trọng của học máy là phát triển các thuật toán suy luận xấp xỉ có khả năng xử lý hiệu quả các bài toán này.
Việc áp dụng chính xác phương pháp Machine Learning trong vận hành hệ thống trí tuệ nhân tạo đã giúp các tập đoàn lớn như Facebook, Amazon và Google đạt được sự phát triển vượt bậc chỉ trong vòng chưa đầy 10 năm.
Với sự phát triển mạnh mẽ của Học máy trong nhiều lĩnh vực, ứng dụng của nó trong tài chính đang ngày càng thu hút sự chú ý Việc sử dụng Học máy để dự báo chứng khoán và cổ phiếu đã trở nên phổ biến trên toàn cầu, không chỉ trong nghiên cứu mà còn trong thực tiễn Các nghiên cứu trước đây thường dựa vào dữ liệu lịch sử của chuỗi thời gian để ước lượng giá trị tương lai Gần đây, các nhà nghiên cứu đã chuyển sang phát triển các kỹ thuật Học máy tương tự như quá trình sinh học và tiến hóa để giải quyết các vấn đề phức tạp và phi tuyến, khác với các phương pháp thống kê cổ điển Một ví dụ tiêu biểu về kỹ thuật Học máy là Mạng thần kinh nhân tạo.
Artificial Neural Networks (ANN), Support Vector Machines (SVM), Genetic Programming (GP), K-nearest neighbors (KNN), Logistic Regression, Linear Discriminant Analysis (LDA), and Quadratic Discriminant Analysis (QDA) are essential algorithms in the field of machine learning These techniques are widely used for classification and regression tasks, offering diverse approaches to data analysis and pattern recognition Each algorithm has unique strengths and applications, making them valuable tools for data scientists and researchers aiming to extract insights from complex datasets.
Trong lĩnh vực tài chính và ngân hàng, việc kết hợp Machine Learning với các mô hình phân tích định lượng mang lại hiệu quả cao trong việc tìm kiếm mẫu dữ liệu và đưa ra dự đoán, từ đó hỗ trợ quyết định và kiểm soát rủi ro hiệu quả Cuộc cạnh tranh trong ngành ngân hàng và thị trường chứng khoán đang diễn ra sôi động, với sự tham gia của các công ty công nghệ mới như Feedzai và Shift Technology, cùng các tập đoàn lớn như IBM, Google, và Alibaba Những công ty này đang tận dụng công nghệ để mở rộng sang lĩnh vực tài chính, ngân hàng và chứng khoán.
Machine Learning đang được ứng dụng hiệu quả trong lĩnh vực tài chính và ngân hàng, với nhiều ví dụ điển hình Một trong số đó là Monzo, ngân hàng khởi nghiệp tại Anh, đã phát triển mô hình phân tích và dự báo nhanh chóng, giúp phát hiện và ngăn chặn kịp thời các hành vi lừa đảo.
15 mạo trong quá trình hoàn tất giao dịch, giúp giảm tỷ lệ lừa đảo trên thẻ trả trước từ 0,85% vào tháng 6/2016 xuống dưới 0,1% vào tháng 1/2017
Trong thị trường chứng khoán (TTCK), học máy được áp dụng rộng rãi nhờ khả năng xử lý dữ liệu mạnh mẽ, giúp dự đoán thị trường cổ phiếu, tối ưu hóa đầu tư, xử lý thông tin tài chính và thực hiện các chiến lược giao dịch hiệu quả Vì vậy, TTCK trở thành một trong những lĩnh vực phổ biến và quý giá nhất trong tài chính, đóng vai trò quan trọng trong nghiên cứu và phát triển của học máy.
Học sâu – Deep learning
Học sâu (Deep learning) là một kỹ thuật trong trí tuệ nhân tạo, sử dụng mạng lưới nơ ron thần kinh dạng lớp, mô phỏng cấu trúc và hoạt động của bộ não con người.
Hình 2 2: Minh họa học sâu (Deep learning)
Nó thuộc về một nhóm lớn hơn các kỹ thuật học máy, nhằm mục đích hướng dẫn máy tính phân tích dữ liệu, thay vì chỉ sử dụng các thuật toán cố định được thiết kế cho một nhiệm vụ cụ thể.
Học sâu dựa trên tân vỏ não (neocortex) của não, tổ chức các nút phân tích theo nhiều đường dẫn để dữ liệu lưu thông, tạo ra một mạng lưới kết nối tương tự như các nút trong lớp phân tầng.
Phương pháp này cung cấp sức mạnh phân tích mạnh mẽ, hỗ trợ công nghệ tương lai như xe không người lái, giúp nhận biết các dấu hiệu giao thông và phân biệt giữa các vật cản trên đường, bao gồm xe cộ và người đi bộ.
Mô hình học sâu có khả năng đạt độ chính xác cao, thậm chí vượt qua hiệu suất con người Chúng thường được đào tạo với tập dữ liệu lớn có nhãn và sử dụng kiến trúc mạng nơron nhiều lớp.
Deep Learning là một phương pháp sử dụng các lớp đơn vị xử lý phi tuyến để trích xuất và chuyển đổi các tính năng của dữ liệu Đầu ra từ mỗi lớp sẽ là đầu vào cho lớp tiếp theo, giúp cải thiện khả năng giải quyết các vấn đề liên quan đến mạng thần kinh nhân tạo Công nghệ này đang được áp dụng rộng rãi trong các lĩnh vực như nhận diện giọng nói, dịch tự động và xử lý ngôn ngữ tự nhiên.
Hình 2 3: Lược sử học sâu Deep learning
Học sâu là một trong những thuật toán học máy nổi bật, thu hút lượng dữ liệu lớn và có khả năng vượt trội hơn con người trong một số nhiệm vụ nhận thức Với những đặc điểm này, học sâu đã chứng tỏ tiềm năng to lớn trong lĩnh vực trí tuệ nhân tạo.
Học sâu có thể chia thành 3 nhóm chính:
- Học sâu không giám sát
- Học sâu có giám sát
Mạng nơ-ron hồi quy RNN (Recurrent Neural Network)
RNN (Recurrent Neural Network) sử dụng chuỗi thông tin, khác với các mạng nơ-ron truyền thống mà các đầu vào và đầu ra độc lập Điều này khiến RNN trở thành lựa chọn lý tưởng cho nhiều bài toán, như dự đoán từ tiếp theo trong một câu, vì nó cần xem xét các từ đã xuất hiện trước đó RNN thực hiện cùng một tác vụ cho tất cả các phần tử trong chuỗi, với đầu ra phụ thuộc vào các phép tính trước đó, cho phép nó ghi nhớ thông tin đã được tính toán.
Khi phân biệt các sự kiện trong một đoạn phim, ta có thể sử dụng toàn bộ chi tiết của phim như một vector tín hiệu lớn và áp dụng mạng nơ-ron nhân tạo (ANN) Tuy nhiên, mạng hồi quy không xử lý như vậy, mà thay vào đó chia nhỏ phim thành từng khung hình khác nhau Tín hiệu đầu vào của mạng hồi quy sẽ là một chuỗi các vector tương ứng với từng khung hình từ đầu đến cuối phim Mạng hồi quy sẽ tận dụng thông tin dự đoán từ các khung hình trước để tiếp tục dự đoán các khung hình sau.
Mạng nơ-ron nhân tạo này hoạt động bằng cách giữ lại dữ liệu đầu ra tại một thời điểm cụ thể thông qua quá trình truyền vòng ngược Điều này cho phép thông tin được duy trì từ thời điểm này đến thời điểm khác, tạo ra sự liên kết giữa các điểm dữ liệu trong quá trình xử lý.
Hình 2 4: Mô hình mạng hồi qui đơn giản
Mạng neural hồi quy A trong hình trên nhận đầu vào xt, xử lý và tạo ra đầu ra ht Đặc điểm nổi bật của A là khả năng lưu trữ giá trị ht để sử dụng cho đầu vào tiếp theo Mạng neural hồi quy có thể được xem như một chuỗi các mạng con giống hệt nhau, mỗi mạng sẽ truyền tiếp thông tin.
Nếu tách từng vòng lặp xử lý trong A thành các mạng con, ta sẽ hình thành một mạng với kiến trúc mới Mạng này sẽ có khả năng xử lý 18 thông tin một cách hiệu quả cho mạng phía sau.
Hình 2 5: Kiến trúc mạng hồi qui đơn giản
Chuỗi các đầu vào x0, x1, , xt đại diện cho các sự kiện theo thứ tự thời gian, tương ứng với tín hiệu đầu vào tại thời điểm t Mạng neural hồi quy không chỉ cung cấp các kết quả ẩn mà còn lưu giữ thông tin giữa các sự kiện để xử lý tiếp theo Nhờ vào đặc tính này, mạng neural hồi quy rất thích hợp cho các bài toán với dữ liệu đầu vào dạng chuỗi, nơi các sự kiện có mối liên hệ với nhau Do đó, mạng neural hồi quy có vai trò quan trọng trong các ứng dụng xử lý ngôn ngữ tự nhiên như dịch máy, phân loại ngữ nghĩa và nhận dạng giọng nói.
Mạng hồi quy nhận tín hiệu đầu vào kết hợp với kết quả ẩn, gộp chúng theo ma trận tham số để tính kết quả ẩn Quá trình này tiếp tục cho đến khi đọc hết dữ liệu theo thứ tự Công thức cơ bản để tính các vector tín hiệu ẩn là ht = φ(WXt + Uht-1), trong đó ma trận tương đương với trọng số của mạng nơ-ron Ma trận U biểu thị trọng số để tham chiếu tín hiệu cũ, và hàm φ “ép” giá trị của vector ht về không gian giá trị log, thường sử dụng hàm tanh để giải quyết.
Vấn đề phụ thuộc vào thông tin từ quá khứ trong mạng hồi quy có thể gặp khó khăn, đặc biệt là hiện tượng "mức độ phụ thuộc bị mất" (vanishing gradient problem) Khi thực hiện tính lan truyền ngược, chuỗi các tích của mức độ phụ thuộc sẽ dẫn đến việc nếu giá trị tuyệt đối của các mức độ phụ thuộc nhỏ hơn 1, thì sẽ xảy ra những vấn đề nghiêm trọng trong quá trình học.
E là sai số bình phương t là thời điểm đầu ra cho huấn luyện mẫu w: ma trận trọng số
Khi thời gian lưu giữ thông tin kéo dài, đến một thời điểm nhất định, mạng nơ-ron sẽ không còn khả năng học tập hiệu quả Hiện tượng này tương tự như việc mạng nơ-ron bị bão hòa do học quá nhiều.
Ví dụ đơn giản về việc dự đoán từ tiếp theo có thể được minh họa qua câu “Chim bay trên …”, trong đó thông tin từ “chim” gần gũi với từ “trời”, giúp ta dễ dàng đoán được từ tiếp theo Ngược lại, trong câu “Tôi sống ở Việt Nam từ nhỏ, cho nên tôi có thể nói tiếng Việt”, khoảng cách giữa thông tin “sống ở Việt Nam” và “nói tiếng Việt” xa hơn, đòi hỏi mạng hồi quy phải nhớ những thông tin lâu hơn để đưa ra dự đoán chính xác.
Theo lý thuyết, việc mở rộng số lượng thông tin cần nhớ và tăng tốc độ học có thể giúp giải quyết vấn đề Tuy nhiên, trên thực tế, mạng hồi quy gặp khó khăn trong việc học thông tin xa do vấn đề "mức độ phụ thuộc bị mất".
Mạng RNN gặp khó khăn trong việc nhớ thông tin quá khứ quan trọng, như x0 và x1, khi khoảng cách giữa chúng quá xa Điều này dẫn đến việc mạng không thể sử dụng những thông tin này để dự đoán giá trị ht+1, vì mức độ phụ thuộc có thể giảm gần về 0 Kết quả là, từ thời điểm t+1 trở đi, mạng sẽ không còn khả năng học hỏi hiệu quả.
Vấn đề phụ thuộc xa
RNN nổi bật với khả năng kết nối thông tin từ quá khứ để dự đoán hiện tại, tương tự như việc sử dụng các cảnh trước trong một bộ phim để hiểu rõ hơn về cảnh hiện tại.
RNN có thể rất hữu ích nếu chúng có khả năng xử lý thông tin hiệu quả Tuy nhiên, khả năng này còn phụ thuộc vào từng trường hợp cụ thể Đôi khi, chỉ cần xem lại thông tin gần nhất là đủ để hiểu tình huống hiện tại Chẳng hạn, khi gặp câu “các đám may trên bầu trời”, chỉ cần đọc đến “các đám may trên bầu” là có thể đoán được từ tiếp theo là “trời” Trong những tình huống như vậy, khoảng cách đến thông tin cần thiết để dự đoán là nhỏ, do đó RNN có khả năng học hỏi tốt.
Trong nhiều tình huống, việc suy luận cần nhiều ngữ cảnh hơn Chẳng hạn, để đoán chữ cuối cùng trong câu “I grew up in France… I speak fluent French”, thông tin gần nhất chỉ cho biết rằng đó là một ngôn ngữ, nhưng không thể xác định được ngôn ngữ cụ thể Để biết được ngôn ngữ đó, cần thêm ngữ cảnh “I grew up in France” Như vậy, khoảng cách thông tin có thể khá xa.
Thật không may là với khoảng cách càng lớn dần thì RNN bắt đầu không thể nhớ và học được nữa
Mặc dù lý thuyết cho thấy RNN có khả năng xử lý các phụ thuộc xa (long-term dependencies), thực tế cho thấy chúng gặp khó khăn trong việc học các tham số cần thiết Hochreiter (1991) và Bengio cùng các cộng sự (1994) đã nghiên cứu sâu về vấn đề này và chỉ ra những lý do cơ bản khiến RNN không thể học được hiệu quả.
2.7 LSTM (Bộ nhớ dài ngắn)
LSTM, hay mạng nơron trí nhớ ngắn dài, là giải pháp hiệu quả để khắc phục vấn đề phụ thuộc vào thông tin quá khứ xa Do mạng hồi quy không thể học được thông tin từ quá khứ xa, LSTM đã được phát triển để cải thiện khả năng ghi nhớ và xử lý dữ liệu theo thời gian.
Nó được giới thiệu bởi Hochreiter và Schmidhuber (1997), và được nhiều người khác cải tiến tiếp
Do kiến trúc đơn giản của RNN, khả năng liên kết các lớp có khoảng cách xa không hiệu quả, dẫn đến việc nó không thể ghi nhớ thông tin từ dữ liệu xa Kết quả là, các phần tử đầu tiên trong chuỗi đầu vào thường ít ảnh hưởng đến dự đoán của chuỗi đầu ra sau này Vấn đề này xuất phát từ hiện tượng biến mất đạo hàm (vanishing gradient) trong quá trình học Để khắc phục tình trạng này, mạng LSTM được thiết kế với cơ chế ghi nhớ chỉ những thông tin quan trọng cho dự đoán, trong khi loại bỏ các thông tin không cần thiết.
Mạng LSTM khác biệt với mạng hồi quy thông thường ở chỗ nó có đến 4 tầng khác nhau trong hệ thống lặp lại, thay vì chỉ một tầng đơn giản.
Hình 2 6: Mô hình của một tế bào LSTM
Một tế bào LSTM bao gồm bốn tầng khác nhau, với ht thể hiện kết quả Xt ẩn tại thời điểm t, là đầu ra của mạng LSTM Mạng LSTM phức tạp hơn so với mạng nơ-ron nhân tạo cơ bản nhờ vào sự kết hợp của các cổng Mỗi thời điểm t, trạng thái của ô LSTM (cell) được xác định, với thông tin được truyền từ trạng thái trước Ct-1 đến trạng thái sau Ct Tuy nhiên, không phải toàn bộ thông tin đều được truyền đi mà không bị ảnh hưởng Các cổng, được thể hiện qua các hàm kích hoạt sigmoid (σ) và hàm tanh, cùng với các phép toán trên ma trận, giúp điều chỉnh thông tin này.
Bước đầu tiên trong LSTM là xác định thông tin nào cần loại bỏ khỏi trạng thái tế bào, được thực hiện bởi tầng cổng quên (forget gate layer) thông qua hàm sigmoid Tầng này nhận đầu vào là ht-1 và xt, sau đó cho ra một số trong khoảng [0,1] cho mỗi thành phần trong trạng thái tế bào Ct-1 Nếu đầu ra là 1, thông tin sẽ được giữ lại hoàn toàn, trong khi đầu ra là 0 có nghĩa là toàn bộ thông tin sẽ bị loại bỏ.
Khi áp dụng mô hình ngôn ngữ dự đoán từ tiếp theo dựa trên các từ trước đó, trạng thái tế bào có thể chứa thông tin về giới tính của nhân vật, giúp chúng ta sử dụng đại từ nhân xưng chính xác Tuy nhiên, khi đề cập đến một nhân vật khác, thông tin về giới tính không còn cần thiết, vì nó không ảnh hưởng đến chủ thể mới này.
Hình 2 7: Mô hình cổng quên
Cổng đầu vào (input gate – i t ):
Bước tiếp theo là xác định thông tin mới nào sẽ được lưu vào trạng thái tế bào, bao gồm hai phần Đầu tiên, một tầng sigmoid gọi là “tầng cổng vào” sẽ quyết định giá trị cần cập nhật Tiếp theo, một tầng tanh sẽ tạo ra một véc-tơ cho giá trị mới để thêm vào trạng thái Cuối cùng, hai giá trị này sẽ được kết hợp để tạo ra một cập nhật cho trạng thái.
Trong mô hình ngôn ngữ của chúng ta, cần cập nhật giới tính của nhân vật mới vào trạng thái tế bào và đồng thời thay thế giới tính của nhân vật trước đó.
Hình 2 8: Mô hình cổng đầu vào
Bây giờ là thời điểm cập nhật trạng thái tế bào cũ Ct-1 thành trạng thái mới Ct Sau khi đã quyết định các bước cần thực hiện ở những giai đoạn trước, chúng ta chỉ cần tiến hành thực hiện để hoàn tất quá trình.
Chúng ta sẽ nhân trạng thái cũ với ft để loại bỏ những thông tin đã quyết định quên Tiếp theo, chúng ta sẽ cộng thêm it Trạng thái mới thu được sẽ phụ thuộc vào cách chúng ta quyết định cập nhật từng giá trị trạng thái.
Trong mô hình ngôn ngữ, chúng ta loại bỏ thông tin về giới tính của nhân vật cũ và thay thế bằng thông tin về giới tính của nhân vật mới, theo những quyết định đã được đưa ra ở các bước trước.
Cổng kết quả (output gate – o t ):
Dự đoán giá cổ phiếu
Trên toàn cầu, nhiều nghiên cứu tập trung vào việc dự đoán giá cổ phiếu, chủ yếu sử dụng các thuật toán học máy và lý thuyết đầu tư Dự đoán thị trường cổ phiếu, một thách thức lớn, được coi là vấn đề dự báo chuỗi thời gian, trong đó thuật toán Autoregressive Integrated Moving Average (ARIMA) được áp dụng Mặc dù ARIMA hoạt động hiệu quả trên chuỗi thời gian tuyến tính, nhưng lại gặp khó khăn với dữ liệu phi tuyến tính và biến động của thị trường cổ phiếu Do đó, các nhà nghiên cứu ngày càng chuyển hướng sang phát triển các phương pháp kết hợp thuật toán để tối ưu hóa dự đoán giá cổ phiếu hiện nay.
2.9.2 Hướng đề xuất nghiên cứu
Nếu LSTM có khả năng trích xuất thông tin từ dữ liệu cổ phiếu trong quá khứ và xử lý hiệu quả khoảng cách dài ngắn, thì BiLSTM cải thiện khả năng này bằng cách sử dụng hai vòng LSTM (Forward - Backward) để xác nhận các đặc trưng của dữ liệu, từ đó tối ưu hóa việc kiểm chứng dữ liệu.
Trong nghiên cứu này, chúng tôi đề xuất áp dụng mạng hồi quy RNN kết hợp với hai mô hình LSTM và BI-LSTM để dự đoán giá cổ phiếu Phương pháp này mang lại những đóng góp đáng kể so với các phương pháp trước đây, nhờ vào khả năng xử lý dữ liệu theo chuỗi thời gian hiệu quả.
Chúng tôi đã thử nghiệm nhiều tham số của mô hình như số nơron, số tầng, số lớp và các tham số khác Các tham số được trình bày trong báo cáo là những tham số cho kết quả tốt nhất, do đó chúng tôi đã lựa chọn chúng cho mô hình cuối cùng nhằm xây dựng ứng dụng trực quan hóa kết quả.
Thu thập dữ liệu
Nhóm đã sử dụng dữ liệu từ trang … để hỗ trợ quá trình huấn luyện mô hình Dữ liệu cần thiết bao gồm thông tin về thời gian và giá đóng cửa hàng ngày cho mỗi phiên giao dịch.
Sau khi có dữ liệu Sử dụng thư viện pandas để đọc dữ liệu từ file csv thu thập được
Tiền xử lý dữ liệu
Nhóm sử dụng dữ liệu để dự đoán tỷ giá trước 30 ngày nên cần chia dữ liệu thành 2 nhóm là train_data và test_data
Scale dữ liệu của cột này bằng sklearn.preprocessing.MinMaxScaler
Chuyển thành dữ liệu mà LSTM có thể đọc được (dữ liệu ở dạng 3D)
• sequence: tổng số dữ liệu đầu vào
• time_step: số dữ liệu input cần cho 1 lần dữ đoán
• feature: số mẫu dữ liệu của 1 output (được tính từ time_step dữ liệu input bên trên)
Xây dựng model
Sử dụng LSTM của thư viện keras
Mô hình bao gồm một lớp LSTM và sử dụng optimizer Adam để tối ưu hóa quá trình khởi tạo Đồng thời, thêm chỉ số sai số trung bình bình phương (MSE) giúp ước lượng và đánh giá hiệu quả của mô hình hiện tại.
Dự đoán dựa trên model
Trong nghiên cứu này, chúng tôi đã áp dụng mạng hồi quy RNN với LSTM để dự đoán giá trị liên tục Thực nghiệm được thực hiện trên bộ dữ liệu thực tế và kết quả đánh giá cho thấy mô hình đạt hiệu suất tốt.
Chúng tôi sẽ tiến hành thử nghiệm trên nhiều mô hình học sâu khác nhau để so sánh và đánh giá, nhằm tìm ra mô hình tối ưu nhất cho việc dự báo giá cổ phiếu.
Một hướng đi hứa hẹn cho tương lai là áp dụng phương pháp học sâu để trích xuất các đặc trưng quan trọng và tối ưu hóa mô hình, giúp cải thiện khả năng học dữ liệu phân phối một cách chính xác Điều này sẽ cho phép chúng tôi đạt được kết quả dự đoán tốt hơn với phương pháp đề xuất Bên cạnh đó, sự phát triển nhanh chóng của mạng internet sẽ giúp cập nhật mô hình và xử lý dữ liệu theo thời gian thực, từ đó nâng cao độ chính xác trong dự đoán giá cổ phiếu trong tương lai.