1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu nguyễn thị hiệp thuận tp hồ chí minh đại học bách khoa, 2021 b

61 12 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tóm Tắt Văn Bản Tiếng Việt Sử Dụng Hệ Thống Học Sâu
Tác giả Nguyễn Thị Hiệp Thuận
Người hướng dẫn PGS.TS. Quản Thành Thơ
Trường học Đại học Bách Khoa
Chuyên ngành Khoa học máy tính
Thể loại luận văn thạc sĩ
Năm xuất bản 2021
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 61
Dung lượng 1,27 MB

Nội dung

Ngày đăng: 12/05/2022, 11:18

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] V. Gupta and G. Lehal, “A survey of text summarization extractive techniques,” Jour- nal of Emerging Technologies in Web Intelligence, vol. 2, no. 3, 2010 Sách, tạp chí
Tiêu đề: A survey of text summarization extractive techniques
[2] S. Yeasmin, P. B. Tumpa, A. M. Nitu, M. P. Uddin, E. Ali, and M. I. Afjal, “Study of abstractive text summarization techniques,” American Journal of Engineering Re- search (AJER), vol. 6, no. 8, pp. 253–260, 2017 Sách, tạp chí
Tiêu đề: Study of abstractive text summarization techniques
Tác giả: S. Yeasmin, P. B. Tumpa, A. M. Nitu, M. P. Uddin, E. Ali, M. I. Afjal
Nhà XB: American Journal of Engineering Research (AJER)
Năm: 2017
[3] H. Luhn, “The automatic creation of literature abstracts,” IBM Journal of Research and Development, vol. 2, pp. 159 – 165, 1958 Sách, tạp chí
Tiêu đề: The automatic creation of literature abstracts
[4] M. Allahyari, S. Pouriyeh, M. Assef, S. Safaei, E. D. Trippe, J. B. Gutierrez, and K. Kochut, “Text summarization techniques: A brief survey,” arXiv:1707.02268v3, vol. 3, 2017 Sách, tạp chí
Tiêu đề: Text summarization techniques: A brief survey
Tác giả: M. Allahyari, S. Pouriyeh, M. Assef, S. Safaei, E. D. Trippe, J. B. Gutierrez, K. Kochut
Nhà XB: arXiv
Năm: 2017
[5] K. S. Jones, “Automatic summarizing: the state of the art,” Information Processing and Management, Elsevier, vol. 6, no. 43, 2007 Sách, tạp chí
Tiêu đề: Automatic summarizing: the state of the art
[6] H. Edmundson, “New methods in automatic abstracting,” Journal of ACM, vol. 16, no. 2, p. 264–285, 1969 Sách, tạp chí
Tiêu đề: New methods in automatic abstracting
Tác giả: H. Edmundson
Nhà XB: Journal of ACM
Năm: 1969
[7] K. J. Jan O. Pendersen and F. Chenn, “A trainable document summarizer,” in Research and Development in Information Retrieval, vol. 1, p. 68–73, 1995 Sách, tạp chí
Tiêu đề: A trainable document summarizer
[8] C.-Y. Lin and E. Hovy, “Identifying topics by position,” in Fifth Conference on Applied Natural Language Processing, vol. 1, pp. 283–290, 1997 Sách, tạp chí
Tiêu đề: Identifying topics by position
[9] R. Barzilay and M. Elhadad, “Using lexical chains for textsummarization,” in Advances in Automatic Text Summarization, vol. 1, p. 111–121, 2009 Sách, tạp chí
Tiêu đề: Advances in Automatic Text Summarization
Tác giả: R. Barzilay, M. Elhadad
Năm: 2009
[10] A. K. Yadav, M. Kumar, and A. Pathre, “Implemented text rank based automatic text summarization using keyword extraction,” International Research Journal of In- novations in Engineering and Technology (IRJIET), vol. 4, no. 11, pp. 20–25, 2020 Sách, tạp chí
Tiêu đề: Implemented text rank based automatic text summarization using keyword extraction
Tác giả: A. K. Yadav, M. Kumar, A. Pathre
Nhà XB: International Research Journal of Innovations in Engineering and Technology (IRJIET)
Năm: 2020
[11] K. U. Manjari, S. Rousha, D. Sumanth, and J. S. Devi, “Extractive text summarization from web pages using selenium and tf-idf algorithm,” 2020 4th International Confer- ence on Trends in Electronics and Informatics (ICOEI)(48184), vol. 1, pp. 648 – 652, 2020 Sách, tạp chí
Tiêu đề: Extractive text summarization from web pages using selenium and tf-idf algorithm
Tác giả: K. U. Manjari, S. Rousha, D. Sumanth, J. S. Devi
Nhà XB: 2020 4th International Conference on Trends in Electronics and Informatics (ICOEI)
Năm: 2020
[12] C. Khatri, G. Singh, and N. Parikh, “Abstractive and extractive text summarization using document context vector and recurrent neural networks,” arXiv:1807.08000, vol. 1, 2018 Sách, tạp chí
Tiêu đề: Abstractive and extractive text summarization using document context vector and recurrent neural networks
Tác giả: C. Khatri, G. Singh, N. Parikh
Nhà XB: arXiv
Năm: 2018
[13] P. Li, W. Lam, L. Bing, , and Z. Wang, “Deep recurrent generative decoder for ab- stractive text summarization,” arXiv preprint arXiv:1708.00625, vol. 1, 2017 Sách, tạp chí
Tiêu đề: Deep recurrent generative decoder for ab- stractive text summarization
Tác giả: P. Li, W. Lam, L. Bing, Z. Wang
Nhà XB: arXiv
Năm: 2017
[14] K. Lopyrev, “Generating news headlines with recurrent neural networks,” arX- ivpreprint arXiv:1512.01712, vol. 1, 2015 Sách, tạp chí
Tiêu đề: Generating news headlines with recurrent neural networks
[15] A. Galassi, M. Lippi, and P. Torroni, “Attention in natural language processing,”arXiv:1902.02181, vol. 32, no. 10, 2019 Sách, tạp chí
Tiêu đề: Attention in natural language processing
[16] A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, L. Kaiser, and I. Polosukhin, “Attention is all you need,” arXiv:1706.03762, vol. 30, 2017 Sách, tạp chí
Tiêu đề: Attention is all you need
[17] I. Sutskever, O. Vinyals, and Q. V. Le, “Sequence to sequence learning with neural networks,” arXiv:1409.3215, vol. 27, 2014 Sách, tạp chí
Tiêu đề: Sequence to sequence learning with neural networks
Tác giả: I. Sutskever, O. Vinyals, Q. V. Le
Nhà XB: arXiv
Năm: 2014
[18] S. Qaiser and R. Ali, “Text mining: Use of tf-idf to examine the relevance of words to documents,” International Journal of Computer Applications (0975 – 8887), vol. 181, 2018 Sách, tạp chí
Tiêu đề: Text mining: Use of tf-idf to examine the relevance of words to documents
Tác giả: S. Qaiser, R. Ali
Nhà XB: International Journal of Computer Applications
Năm: 2018
[19] A. Jalilifard, V. F. Caridá, A. F. Mansano, R. S. Cristo, and F. P. C. da Fonseca, “Se- mantic sensitive tf-idf to determine word relevance in documents,” arXiv:2001.09896, vol. 1, 2021 Sách, tạp chí
Tiêu đề: Semantic sensitive tf-idf to determine word relevance in documents
Tác giả: A. Jalilifard, V. F. Caridá, A. F. Mansano, R. S. Cristo, F. P. C. da Fonseca
Nhà XB: arXiv
Năm: 2021
[20] A. Goyal, A. Lamb, Y. Zhang, S. Zhang, A. Courville, and Y. Bengio, “Professor forcing: A new algorithm for training recurrent networks,” NeurIPS, vol. 29, 2016 Sách, tạp chí
Tiêu đề: Professorforcing: A new algorithm for training recurrent networks

HÌNH ẢNH LIÊN QUAN

Hình 1: Ví dụ minh hoạ giao diện trang chủ báo điện tử - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
Hình 1 Ví dụ minh hoạ giao diện trang chủ báo điện tử (Trang 12)
Hình 2 miêu tả tổng quan các bước thực hiện tóm tắt văn bản theo phương pháp trích xuất. - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
Hình 2 miêu tả tổng quan các bước thực hiện tóm tắt văn bản theo phương pháp trích xuất (Trang 16)
Hình 4: Cấu trúc mạng encoder - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
Hình 4 Cấu trúc mạng encoder (Trang 20)
Decoder: Cấu trúc mạng Decoder được mô tả trong hình 5. - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
ecoder Cấu trúc mạng Decoder được mô tả trong hình 5 (Trang 20)
• Với mô hình không sử dụng Teacher Forcing, kết quả đầu ra tại mỗi bước hoàn toàn phụ thuộc vào kết quả đầu ra tại bước trước đó. - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
i mô hình không sử dụng Teacher Forcing, kết quả đầu ra tại mỗi bước hoàn toàn phụ thuộc vào kết quả đầu ra tại bước trước đó (Trang 24)
2.2 Mô hình Seq2Seq cơ chế attention - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
2.2 Mô hình Seq2Seq cơ chế attention (Trang 28)
trong Hình 9 và đã được giải thích chi tiết trong chương 2. - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
trong Hình 9 và đã được giải thích chi tiết trong chương 2 (Trang 29)
Hình 10: Sử dụng mô hình ngôn ngữ sửa lỗi ngữ pháp - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
Hình 10 Sử dụng mô hình ngôn ngữ sửa lỗi ngữ pháp (Trang 30)
< start > ). Phương pháp mà tôi thực hiện được thể hiện trong Hình 11. - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
lt ; start > ). Phương pháp mà tôi thực hiện được thể hiện trong Hình 11 (Trang 31)
Hình 12 thể hiện 1 phần bảng đánh giá kết quả mô hình đề xuất của 11 tình nguyện viên tham gia khảo sát. - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
Hình 12 thể hiện 1 phần bảng đánh giá kết quả mô hình đề xuất của 11 tình nguyện viên tham gia khảo sát (Trang 33)
sử dụng mô hình Seq2Seq với cơ chế Atention để tạo câu tiêu đề tương ứng bằng cách sử dụng cơ chế Teacher-Forcing - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
s ử dụng mô hình Seq2Seq với cơ chế Atention để tạo câu tiêu đề tương ứng bằng cách sử dụng cơ chế Teacher-Forcing (Trang 35)
Hình 14: Mô hình TF-IDF xác định từ quan trọng nhất trong văn bản gốc - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
Hình 14 Mô hình TF-IDF xác định từ quan trọng nhất trong văn bản gốc (Trang 35)
Bảng 1: Các tiêu đề tự động tạo ra từ mô hình đề xuất - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
Bảng 1 Các tiêu đề tự động tạo ra từ mô hình đề xuất (Trang 36)
Bảng 3: Kết quả đánh giá bằng con ngườ i- Điểm hợp lý - Tóm tắt văn bản tiếng việt sử dụng hệ thống học sâu  nguyễn thị hiệp thuận    tp  hồ chí minh   đại học bách khoa,  2021  b
Bảng 3 Kết quả đánh giá bằng con ngườ i- Điểm hợp lý (Trang 38)