1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền

158 10 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 158
Dung lượng 2,93 MB

Nội dung

Ngày đăng: 03/07/2021, 09:35

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Đinh Điền, Lý Ngọc Minh (2015), “Ứng dụng Ngữ liệu Song ngữ Anh-Việt trong Giảng dạy Ngôn ngữ”, Hội thảo Liên ngành NNH Ứng dụng và Giảng dạy Ngôn ngữ, tr.559-567.Tiếng Anh Sách, tạp chí
Tiêu đề: Ứng dụng Ngữ liệu Song ngữ Anh-Việt trong Giảng dạy Ngôn ngữ
Tác giả: Đinh Điền, Lý Ngọc Minh
Nhà XB: Hội thảo Liên ngành NNH Ứng dụng và Giảng dạy Ngôn ngữ
Năm: 2015
[2] Ahmet Aker, Fang Feng, and Rob Gaizauskas (2012), “Automatic bilin- gual phrase extraction from comparable corpora”, Proceedings of The 24th International Conference on Computational Linguistics (COLING 2012) Sách, tạp chí
Tiêu đề: Automatic bilin-gual phrase extraction from comparable corpora
Tác giả: Ahmet Aker, Fang Feng, and Rob Gaizauskas
Năm: 2012
[3] Ajay Dubey and Vasudeva Varma (2013), “Generation of bilingual dic- tionaries using structural properties”, Computacion y Sistemas, Vol.17, pp. 161–168 Sách, tạp chí
Tiêu đề: Generation of bilingual dictionaries using structural properties
Tác giả: Ajay Dubey, Vasudeva Varma
Nhà XB: Computacion y Sistemas
Năm: 2013
[4] Alberto Simões and Xavier Gómez Guinovart (2009), “Parallel corpus- based bilingual terminology extraction”, Proceedings of the TIA Sách, tạp chí
Tiêu đề: Parallel corpus- based bilingual terminology extraction
Tác giả: Alberto Simões, Xavier Gómez Guinovart
Nhà XB: Proceedings of the TIA
Năm: 2009
[5] Alexander Patrick Mathews and Lexing Xie and Xuming He (2018), “Sem- Style: Learning to Generate Stylised Image Captions using Unaligned Text”, CoRR, abs/1805.07030, arXiv: 1805 . 07030, url : http : / / arxiv . org / abs/1805.07030 Sách, tạp chí
Tiêu đề: Sem-Style: Learning to Generate Stylised Image Captions using Unaligned Text
Tác giả: Alexander Patrick Mathews, Lexing Xie, Xuming He
Nhà XB: CoRR
Năm: 2018
[6] Ali Farhadi and Mohsen Hejrati and Sadeghi, Mohammad Amin and Pe- ter Young and Cyrus Rashtchian and Hockenmaier, Julia Constanze and Forsyth, David Alexander (2010), “Every picture tells a story: Generat- ing sentences from images”, English (US), Computer Vision, ECCV 2010 - 11th European Conference on Computer Vision, Proceedings, (PART 4), pp. 15–29, doi : 10.1007/978-3-642-15561-1_2 Sách, tạp chí
Tiêu đề: Every picture tells a story: Generating sentences from images
Tác giả: Ali Farhadi, Mohsen Hejrati, Sadeghi, Mohammad Amin, Peter Young, Cyrus Rashtchian, Hockenmaier, Julia Constanze, Forsyth, David Alexander
Nhà XB: Computer Vision, ECCV 2010 - 11th European Conference on Computer Vision, Proceedings
Năm: 2010
[7] Anna Fariha (2016), “Automatic image captioning using multitask learn- ing”, 29th Conference on Neural Information Processing Systems (NIPS 2016) Sách, tạp chí
Tiêu đề: Automatic image captioning using multitask learning
Tác giả: Anna Fariha
Nhà XB: 29th Conference on Neural Information Processing Systems (NIPS 2016)
Năm: 2016
[8] Anna Currey and Kenneth Heafield (2019), “Incorporating Source Syntax into Transformer-Based Neural Machine Translation”, Proceedings of the Fourth Conference on Machine Translation (Volume 1: Research Papers), pp. 24–33, url : http://www.aclweb.org/anthology/W19-5203 Sách, tạp chí
Tiêu đề: Incorporating Source Syntax into Transformer-Based Neural Machine Translation
Tác giả: Anna Currey, Kenneth Heafield
Nhà XB: Proceedings of the Fourth Conference on Machine Translation (Volume 1: Research Papers)
Năm: 2019
[9] Antonio Lagarda et al. (2009), “Statistical Post-Editing of a Rule-Based Machine Translation System”, Proceedings of HLT/NAACL, pp. 217–220, doi : 10.3115/1620853.1620913 Sách, tạp chí
Tiêu đề: Statistical Post-Editing of a Rule-BasedMachine Translation System
Tác giả: Antonio Lagarda et al
Năm: 2009
[10] Baobao Chang (2004), “Chinese-English Parallel Corpus Construction and its Application”, Proceedings of the 18th Pacific Asia Conference on Lan- guage, Information and Computation, pp. 283–290, doi : http : / / hdl . handle.net/2065/583, url : https://www.aclweb.org/anthology/Y04-1030 Sách, tạp chí
Tiêu đề: Chinese-English Parallel Corpus Construction and its Application
Tác giả: Baobao Chang
Nhà XB: Proceedings of the 18th Pacific Asia Conference on Language, Information and Computation
Năm: 2004
[11] Baosheng Yin and Junjun Zuo and Na Ye (2012), “Long sentence parti- tioning using top-down analysis for machine translation”, 2012 IEEE 2nd International Conference on Cloud Computing and Intelligence Systems, 03, pp. 1425–1429 Sách, tạp chí
Tiêu đề: Long sentence parti-tioning using top-down analysis for machine translation
Tác giả: Baosheng Yin and Junjun Zuo and Na Ye
Năm: 2012
[12] Beáta Bandmann Megyesi, Anna S˚ agvall Hein, and Éva Csató Johan- son ((2006)), “Building a Swedish-Turkish Parallel Corpus”, Proceedings Sách, tạp chí
Tiêu đề: Building a Swedish-Turkish Parallel Corpus
Tác giả: Beáta Bandmann Megyesi, Anna S˚ agvall Hein, Éva Csató Johan- son
Nhà XB: Proceedings
Năm: 2006
[13] Bernard Vauquois (1968), “A survey of formal grammars and algorithms for recognition and transformation in mechanical translation”, IFIP Congress (2), pp. 1114–1122, url : http://dblp.uni- trier.de/db/conf/ifip/ifip1968-2.html#Vauquois68 Sách, tạp chí
Tiêu đề: A survey of formal grammars and algorithms forrecognition and transformation in mechanical translation
Tác giả: Bernard Vauquois
Năm: 1968
[14] Caroline Lavecchia, Kamel Sma¨ili, and David Langlois (2007), “Building a bilingual dictionary from movie subtitles based on inter-lingual triggers”, Translating and the Computer, url : https : / / hal . inria . fr / inria - 00184421 Sách, tạp chí
Tiêu đề: Building a bilingual dictionary from movie subtitles based on inter-lingual triggers
Tác giả: Caroline Lavecchia, Kamel Sma¨ili, David Langlois
Nhà XB: Translating and the Computer
Năm: 2007
[15] Chooi-Ling Goh and Eiichiro Sumita (2011), “Splitting Long Input Sen- tences for Phrase-based Statistical Machine Translation”, Proceedings of The Association for Natural Language Processing Sách, tạp chí
Tiêu đề: Splitting Long Input Sentences for Phrase-based Statistical Machine Translation
Tác giả: Chooi-Ling Goh, Eiichiro Sumita
Nhà XB: Proceedings of The Association for Natural Language Processing
Năm: 2011
[16] Chris Callison-Burch, Miles Osborne, and Philipp Koehn (2006), “Re- evaluating the Role of Bleu in Machine Translation Research”, 11th Con- ference of the European Chapter of the Association for Computational Lin- guistics, url : https://www.aclweb.org/anthology/E06-1032 Sách, tạp chí
Tiêu đề: Re-evaluating the Role of Bleu in Machine Translation Research
Tác giả: Chris Callison-Burch, Miles Osborne, Philipp Koehn
Nhà XB: Association for Computational Linguistics
Năm: 2006
[17] Chenhui Chu and Rui Wang (2018), “A Survey of Domain Adaptation for Neural Machine Translation”, Proceedings of the 27th International Con- ference on Computational Linguistics, pp. 1304–1319, url : https://www.aclweb.org/anthology/C18-1111 Sách, tạp chí
Tiêu đề: A Survey of Domain Adaptation for Neural Machine Translation
Tác giả: Chenhui Chu, Rui Wang
Nhà XB: Proceedings of the 27th International Conference on Computational Linguistics
Năm: 2018
[18] Daniel Marcu and Daniel Wong (2002), “A Phrase-Based, Joint Probability Model for Statistical Machine Translation”, Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP), pp. 133–139 Sách, tạp chí
Tiêu đề: A Phrase-Based, Joint Probability Model for Statistical Machine Translation
Tác giả: Daniel Marcu, Daniel Wong
Nhà XB: Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP)
Năm: 2002
[19] Dániel Varga and Péter Halácsy and András Kornai and Nagy Viktor and Nagy László and Németh László and Tron Viktor (2007), “Parallel corpora for medium density languages”, Recent Advances in Natural Language Pro- cessing IV, pp. 247–258 Sách, tạp chí
Tiêu đề: Recent Advances in Natural Language Processing IV
Tác giả: Dániel Varga, Péter Halácsy, András Kornai, Nagy Viktor, Nagy László, Németh László, Tron Viktor
Năm: 2007
[20] David Chiang (2005), “A Hierarchical Phrase-Based Model for Statisti- cal Machine Translation”, Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics (ACL’05), pp. 263–270, doi : 10.3115/1219840.1219873, url : https://www.aclweb.org/anthology/P05-1033 Sách, tạp chí
Tiêu đề: A Hierarchical Phrase-Based Model for Statistical Machine Translation
Tác giả: David Chiang
Nhà XB: Association for Computational Linguistics
Năm: 2005

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Tam giác Vauquois - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 1.1 Tam giác Vauquois (Trang 24)
Hình 1.2: Mô hình dịch trực tiếp - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 1.2 Mô hình dịch trực tiếp (Trang 25)
Hình 1.3: Mô hình dịch qua ngôn ngữ trung gian - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 1.3 Mô hình dịch qua ngôn ngữ trung gian (Trang 26)
Hình 1.4: Mô hình dịch máy thống kê - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 1.4 Mô hình dịch máy thống kê (Trang 28)
Hình 1.5: Cấu trúc của hệ thống dịch máy dựa trên mạng nơ-ron - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 1.5 Cấu trúc của hệ thống dịch máy dựa trên mạng nơ-ron (Trang 31)
Hình 1.6: Cấu trúc của hệ thống dịch máy MOSES - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 1.6 Cấu trúc của hệ thống dịch máy MOSES (Trang 34)
Bảng 2.1: Kích thước kho ngữ liệu song ngữ Việt-Anh miền du lịch thu thập được - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 2.1 Kích thước kho ngữ liệu song ngữ Việt-Anh miền du lịch thu thập được (Trang 55)
so với hệ thống 1 như trong Bảng 2.5. Trung bình trong 6 lần thực nghiệm tăng - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
so với hệ thống 1 như trong Bảng 2.5. Trung bình trong 6 lần thực nghiệm tăng (Trang 71)
Bảng 2.6: Điểm BLEU của 17 Hệ thống dịch máy khi dịch các tệp kiểm tra gồm 10.000 câu tiếng Việt sang tiếng Anh, so với Hệ thống dịch máy Google Translate năm 2017 - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 2.6 Điểm BLEU của 17 Hệ thống dịch máy khi dịch các tệp kiểm tra gồm 10.000 câu tiếng Việt sang tiếng Anh, so với Hệ thống dịch máy Google Translate năm 2017 (Trang 73)
Hình 3.1: Phương pháp xây dựng tự động từ vựng Việt-Anh - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 3.1 Phương pháp xây dựng tự động từ vựng Việt-Anh (Trang 81)
Hình 3.2: Phương pháp xây dựng tự động từ điển Việt-Anh miền du lịch - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 3.2 Phương pháp xây dựng tự động từ điển Việt-Anh miền du lịch (Trang 86)
Bảng 3.3 minh họa một số kết quả trong từ điển thu được sử dụng phương pháp đề xuât. - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 3.3 minh họa một số kết quả trong từ điển thu được sử dụng phương pháp đề xuât (Trang 91)
Bảng 3.3: Kết quả tra một số từ trong từ điển được xây dựng bằng phương pháp đề xuất - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 3.3 Kết quả tra một số từ trong từ điển được xây dựng bằng phương pháp đề xuất (Trang 91)
Hình 3.3: Mô hình trích rút thuật ngữ song ngữ Việt-Anh từ văn bản tiếng Việt - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 3.3 Mô hình trích rút thuật ngữ song ngữ Việt-Anh từ văn bản tiếng Việt (Trang 98)
Hình 3.4: Mô hình áp dụng các luật để lựa chọn các ứng viên là thuật ngữ song ngữ Việt-Anh - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 3.4 Mô hình áp dụng các luật để lựa chọn các ứng viên là thuật ngữ song ngữ Việt-Anh (Trang 102)
Bảng 3.4 cho biết số liệu thống kê của các ứng viên thuật ngữ tiếng Anh xuất hiện trong ngoặc đơn - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 3.4 cho biết số liệu thống kê của các ứng viên thuật ngữ tiếng Anh xuất hiện trong ngoặc đơn (Trang 108)
Bảng 3.6: Số lần áp dụng luật trên dữ liệu Wikipedia - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 3.6 Số lần áp dụng luật trên dữ liệu Wikipedia (Trang 109)
Bảng 3.5: Số ứng viên thỏa mãn từng luật trên kho ngữ liệ uy tế - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 3.5 Số ứng viên thỏa mãn từng luật trên kho ngữ liệ uy tế (Trang 109)
Hình 4.1: Mô hình chú ý toàn cục - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 4.1 Mô hình chú ý toàn cục (Trang 115)
Hình 4.2: Mô hình chú ý cục bộ. - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 4.2 Mô hình chú ý cục bộ (Trang 115)
Hình 4.3: Mô hình tiền xử lý câu dài hơn 30 từ trong huấn luyện hệ thống dịch máy. - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 4.3 Mô hình tiền xử lý câu dài hơn 30 từ trong huấn luyện hệ thống dịch máy (Trang 117)
Bảng 4.1: Thống kê kho ngữ liệu song ngữ - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 4.1 Thống kê kho ngữ liệu song ngữ (Trang 120)
thống dịch máy nơ-ron như là một cách để cái tiến mô hình dóng hàng đối với NMT. Đây chính là lý do mà chúng tôi thu được cải tiến điểm BLEU trong thực nghiệm. - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
th ống dịch máy nơ-ron như là một cách để cái tiến mô hình dóng hàng đối với NMT. Đây chính là lý do mà chúng tôi thu được cải tiến điểm BLEU trong thực nghiệm (Trang 122)
Hình 4.5: Mô hình chú giải tiếng Việt cho ảnh - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Hình 4.5 Mô hình chú giải tiếng Việt cho ảnh (Trang 127)
Bảng 4.5: Điểm BLEU của các hệ thống khi dịch 500 câu chú giải ảnh từ tiếng Anh sang tiếng Việt - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 4.5 Điểm BLEU của các hệ thống khi dịch 500 câu chú giải ảnh từ tiếng Anh sang tiếng Việt (Trang 129)
Kết quả thu được sau Bước 3 là 500 câu tiếng Việt chú giải cho 500 hình ảnh đầu vào. - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
t quả thu được sau Bước 3 là 500 câu tiếng Việt chú giải cho 500 hình ảnh đầu vào (Trang 131)
Bảng 4.6: Điểm BLEU của hệ thống dịch 500 câu chú giải ảnh từ tiếng Anh sang tiếng Việt sử dụng kỹ thuật xử lý từ mới - Nghiên cứu xây dựng tài nguyên song ngữ anh việt ứng dụng cho dịch máy theo miền
Bảng 4.6 Điểm BLEU của hệ thống dịch 500 câu chú giải ảnh từ tiếng Anh sang tiếng Việt sử dụng kỹ thuật xử lý từ mới (Trang 132)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w