Mục tiêu và nhiệm vụ nghiên cứu
Mục tiêu của đề tài là ứng dụng học máy để xây dựng hệ thống trả lời tự động, nhằm nâng cao hiệu quả tư vấn tuyển sinh tại Trường Cao đẳng Bình Định Để đạt được mục tiêu này, cần thực hiện các nội dung cần thiết.
Nghiên cứu tổng quát về hệ thống hỏi-đáp tự động tập trung vào các phương pháp áp dụng cho ngôn ngữ tiếng Việt, dựa trên những thành quả xử lý ngôn ngữ hiện có Mục tiêu là đề xuất giải pháp xây dựng hệ thống tư vấn tự động bằng tiếng Việt trong tuyển sinh đào tạo Những nghiên cứu này sẽ cung cấp cơ sở lý thuyết và thực nghiệm cho việc phát triển các hệ thống trả lời tự động tiếng Việt hiệu quả trong tương lai.
3 Đối tƣợng và phạm vi nghiên cứu
+ Xử lý ngôn ngữ tự nhiên
+ Hệ thống trả lời tự động
Hệ thống trả lời tự động văn bản của Trường Cao đẳng Bình Định cung cấp thông tin chi tiết về tuyển sinh, giúp người dùng dễ dàng tiếp cận các vấn đề liên quan đến quy trình và yêu cầu tuyển sinh.
Nghiên cứu tài liệu, ngôn ngữ lập trình và công nghệ liên quan Tổng hợp các tài liệu, phân tích và xây dựng mô hình hệ thống
Phân tích yêu cầu thực tế của bài toán và đề xuất giải pháp xây dựng hệ thống trả lời tự động hỗ trợ tư vấn tuyển sinh
Xây dựng một hệ thống thông tin và dữ liệu dựa trên các số liệu và thống kê tuyển sinh của Nhà trường là rất quan trọng Việc này không chỉ giúp quản lý thông tin hiệu quả mà còn hỗ trợ trong việc đánh giá kết quả thực nghiệm một cách chính xác.
Công cụ và kỹ thuật sử dụng
+ Ngôn ngữ lập trình: Python
+ Định dạng dữ liệu: JSON
+ Thư viện xử lý ngôn ngữ tự nhiên: NLTK, PYVI
+ Xây dựng mô hình học máy: TFlearn của Tensorflow
Chương 1 TỔNG QUAN VỀ HỆ THỐNG TRẢ LỜI
Chương này cung cấp cái nhìn tổng quan về hệ thống trả lời tự động, đồng thời giới thiệu các kỹ thuật học máy và xử lý ngôn ngữ tự nhiên phổ biến được áp dụng trong các hệ thống này.
1.1 Hệ thống trả lời tự động
1.1.1 Hệ thống trả lời tự động là gì?
Hệ thống trả lời tự động là công nghệ tìm kiếm câu trả lời từ nguồn tài liệu lớn một cách chính xác, bắt đầu phát triển từ những năm 1960 với các hệ thống hỏi đáp đầu tiên Những hệ thống này thường sử dụng cơ sở dữ liệu do các chuyên gia tạo ra Trong giai đoạn 1970-1980, nhiều dự án lớn đã tập trung vào việc "hiểu văn bản" và phát triển hệ thống hỏi đáp dựa trên mô hình ngôn ngữ thống kê Hội nghị TREC, diễn ra hàng năm từ cuối những năm 1990, đã thu hút nhiều nhóm nghiên cứu và đóng góp đáng kể vào sự phát triển của các hệ thống hỏi đáp.
Vào năm 1990, World Wide Web ra đời và nhanh chóng phát triển thành một kho dữ liệu khổng lồ Các nhà nghiên cứu hệ thống hỏi đáp đã bắt đầu khai thác web như một nguồn tìm kiếm câu trả lời Hiện nay, các kỹ thuật mới yêu cầu tốc độ cao và khả năng xử lý lượng dữ liệu web lớn đang được chú trọng.
Hình 1.1 : Lĩnh vực trả lời tự động
1.1.2 Lịch sử phát triển các hệ thống trả lời tự động
Trả lời câu hỏi tự động đã được nghiên cứu và phát triển từ những ngày đầu của ứng dụng AI Sự gia tăng sức mạnh máy tính đã dẫn đến sự chuyển đổi từ việc sử dụng cơ sở kiến thức mã hóa thủ công trong các lĩnh vực đơn giản sang việc áp dụng các tập hợp văn bản làm nguồn tri thức chính cho các lĩnh vực phức tạp hơn.
Thuật ngữ "Chatbot" đã trở nên phổ biến trong những năm gần đây, với dự đoán rằng 80% doanh nghiệp toàn cầu sẽ áp dụng công nghệ này vào năm 2020 Tuy nhiên, ít ai biết rằng Chatbot có một lịch sử phát triển lâu dài, bắt đầu từ những thập niên 50 của thế kỷ trước.
Hình 1.2: Lịch sử hình thành và phát triển của Chatbot (Nguồn: congdongchatbot.com)
Trong bối cảnh cách mạng công nghiệp 4.0 diễn ra mạnh mẽ, trí thông minh nhân tạo (AI) đang được ứng dụng rộng rãi qua các hình thức như hình ảnh, âm thanh và giọng nói Các bots ngày càng có khả năng thực hiện nhiều nhiệm vụ giống như con người, từ bán hàng và thanh toán hóa đơn đến chẩn đoán bệnh tật và quản lý tài chính, thậm chí có thể hiểu được cảm xúc của con người.
1.1.3 Một số hệ thống trả lời tự động tiêu biểu
Các chatbot giải trí trực tuyến tốt nhất dựa trên AI như Mitsuku, Rose và Insomno Bot có khả năng tương tác hiệu quả với người dùng Những bot này không chỉ hiểu tâm trạng của người dùng mà còn sử dụng ngôn ngữ đa dạng để tạo ra trải nghiệm thú vị và hấp dẫn.
Poncho, Siri và Cortana là những ChatBot được phát triển nhằm cung cấp thông tin thời tiết chuyên sâu Ngoài việc dự báo thời tiết, chúng còn gửi cảnh báo về điều kiện thời tiết xấu, nhưng chỉ khi có sự chấp thuận từ người dùng.
Yeshi là một ChatBot được thiết kế để nâng cao nhận thức về cuộc khủng hoảng nước ở Ethiopia, mang đến cho người dùng trải nghiệm sâu sắc về cuộc sống khắc nghiệt tại đây.
Nhà hàng và các ngành bán lẻ hiện nay đang chú trọng đến việc sở hữu các kênh bán lẻ online, bên cạnh chuỗi cửa hàng truyền thống Việc sử dụng các hình thức tiếp thị online như Email, SMS và xây dựng chat bot trên Fanpage Facebook sẽ giúp thúc đẩy doanh thu, nâng cao thương hiệu và tiết kiệm chi phí hiệu quả.
Mua sắm online đang trở thành xu hướng phổ biến do cuộc sống bận rộn khiến người dùng không có nhiều thời gian Việc giao dịch và đặt chỗ qua chatbot, như BizFly Chat của VCCorp, ngày càng được ưa chuộng Trước đây, thông tin về thực đơn và giá cả của các nhà hàng thường được tìm kiếm qua website, nhưng giờ đây, sự phát triển của thiết bị di động và nền tảng nhắn tin trên mạng xã hội đã thay đổi hành vi tiêu dùng của người dùng.