1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định

83 27 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Mô Hình Nhận Dạng Chữ Viết Tay Trong Các Biểu Mẫu Có Bố Cục Cố Định
Tác giả Nguyễn Thị Trúc Ly
Người hướng dẫn TS. Trần Tuấn Anh, ThS. Trần Văn Nhàn, KS. Phạm Văn Lĩnh
Trường học Đại Học Bách Khoa
Chuyên ngành Khoa Học Máy Tính
Thể loại Luận Văn Tốt Nghiệp
Năm xuất bản 2021
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 83
Dung lượng 2,9 MB

Nội dung

Ngày đăng: 12/05/2022, 12:34

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Dzmitry Bahdanau, Kyunghyun Cho, and Yoshua Bengio. “Neural Machine Translation by Jointly Learning to Align and Translate”. In: CoRR abs/1409.0473 (2015) Sách, tạp chí
Tiêu đề: Neural Machine Translation by Jointly Learning to Align and Translate
Tác giả: Dzmitry Bahdanau, Kyunghyun Cho, Yoshua Bengio
Nhà XB: CoRR
Năm: 2015
[2] Akanksh Basavaraju et al. “A Machine Learning Approach to Road Surface Anomaly Assessment Using Smartphone Sensors”. In: IEEE Sensors Journal 20 (2020), pp. 2635–2647 Sách, tạp chí
Tiêu đề: A Machine Learning Approach to Road SurfaceAnomaly Assessment Using Smartphone Sensors
Tác giả: Akanksh Basavaraju et al. “A Machine Learning Approach to Road Surface Anomaly Assessment Using Smartphone Sensors”. In: IEEE Sensors Journal 20
Năm: 2020
[3] Théodore Bluche. “Deep neural networks for large vocabulary handwritten text recognition”. PhD thesis. Paris 11, 2015 Sách, tạp chí
Tiêu đề: Deep neural networks for large vocabulary handwritten text recognition
Tác giả: Théodore Bluche
Nhà XB: Paris 11
Năm: 2015
[4] Walter A. Burkhard and Robert M. Keller. “Some approaches to best-match file searching”. In: Communications of the ACM 16.4 (1973), pp. 230–236 Sách, tạp chí
Tiêu đề: Some approaches to best-match filesearching
Tác giả: Walter A. Burkhard and Robert M. Keller. “Some approaches to best-match file searching”. In: Communications of the ACM 16.4
Năm: 1973
[5] Jeffrey L Elman. “Finding structure in time”. In: Cognitive science 14.2 (1990), pp. 179–211 Sách, tạp chí
Tiêu đề: Finding structure in time
Tác giả: Jeffrey L Elman
Nhà XB: Cognitive science
Năm: 1990
[6] Ian Goodfellow, Yoshua Bengio, and Aaron Courville. “Deep learning. Book in preparation for MIT Press”. In: http: // www. deeplearningbook. org (2016) Sách, tạp chí
Tiêu đề: Deep learning
Tác giả: Ian Goodfellow, Yoshua Bengio, Aaron Courville
Nhà XB: MIT Press
Năm: 2016
[7] Ian G Goodfellow, Yoshua Bengio, and Aaron C. Courville. “Deep Learning”. In Sách, tạp chí
Tiêu đề: Deep Learning
Tác giả: Ian G Goodfellow, Yoshua Bengio, Aaron C. Courville
[8] Alex Graves et al. “A novel connectionist system for unconstrained handwriting recognition”. In: IEEE transactions on pattern analysis and machine intelligence 31.5 (2008), pp. 855–868 Sách, tạp chí
Tiêu đề: A novel connectionist system for unconstrained handwriting recognition
Tác giả: Alex Graves, et al
Nhà XB: IEEE transactions on pattern analysis and machine intelligence
Năm: 2008
[9] Alex Graves et al. “Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks”. In: Proceedings of the 23rd in- ternational conference on Machine learning. ACM. 2006, pp. 369–376 Sách, tạp chí
Tiêu đề: Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks
Tác giả: Alex Graves, et al
Nhà XB: ACM
Năm: 2006
[10] Diederik P. Kingma and Jimmy Ba. “Adam: A Method for Stochastic Optimiza- tion”. In: CoRR abs/1412.6980 (2015) Sách, tạp chí
Tiêu đề: Adam: A Method for Stochastic Optimiza-tion
[11] Johannes Michael et al. “Evaluating Sequence-to-Sequence Models for Handwrit- ten Text Recognition”. In: 2019 International Conference on Document Analysis and Recognition (ICDAR) (2019), pp. 1286–1293 Sách, tạp chí
Tiêu đề: Evaluating Sequence-to-Sequence Models for Handwritten Text Recognition
Tác giả: Johannes Michael et al
Nhà XB: 2019 International Conference on Document Analysis and Recognition (ICDAR)
Năm: 2019
[12] Hung Tuan Nguyen, Cuong Tuan Nguyen, and Masaki Nakagawa. “ICFHR 2018 – Competition on Vietnamese Online Handwritten Text Recognition us- ing HANDS-VNOnDB (VOHTR2018)”. In: 2018 16th International Conference on Frontiers in Handwriting Recognition (ICFHR) (2018), pp. 494–499. doi:10.1109/icfhr-2018.2018.00092 Sách, tạp chí
Tiêu đề: ICFHR 2018 – Competition on Vietnamese Online Handwritten Text Recognition us- ing HANDS-VNOnDB (VOHTR2018)
Tác giả: Hung Tuan Nguyen, Cuong Tuan Nguyen, Masaki Nakagawa
Nhà XB: 2018 16th International Conference on Frontiers in Handwriting Recognition (ICFHR)
Năm: 2018
[13] Lawrence Rabiner and Biinghwang Juang. “An introduction to hidden Markov models”. In: ieee assp magazine 3.1 (1986), pp. 4–16 Sách, tạp chí
Tiêu đề: An introduction to hidden Markov models
Tác giả: Lawrence Rabiner, Biinghwang Juang
Nhà XB: ieee assp magazine
Năm: 1986
[14] Baoguang Shi, Xiang Bai, and Cong Yao. “An end-to-end trainable neural net- work for image-based sequence recognition and its application to scene text recognition”. In: IEEE transactions on pattern analysis and machine intelligence 39.11 (2016), pp. 2298–2304 Sách, tạp chí
Tiêu đề: An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition
Tác giả: Baoguang Shi, Xiang Bai, Cong Yao
Nhà XB: IEEE transactions on pattern analysis and machine intelligence
Năm: 2016
[15] Ilya Sutskever, Oriol Vinyals, and Quoc V Le. “Sequence to sequence learning with neural networks”. In: arXiv preprint arXiv:1409.3215 (2014) Sách, tạp chí
Tiêu đề: Sequence to sequence learningwith neural networks
[16] Ashish Vaswani et al. “Attention Is All You Need”. In: Advances in neural in- formation processing systems. 2017, pp. 5998–6008 Sách, tạp chí
Tiêu đề: Advances in neural information processing systems
Tác giả: Ashish Vaswani, et al
Năm: 2017
[17] Paul Voigtlaender, Patrick Doetsch, and Hermann Ney. “Handwriting recog- nition with large multidimensional long short-term memory recurrent neural networks”. In: 2016 15th International Conference on Frontiers in Handwriting Recognition (ICFHR). IEEE. 2016, pp. 228–233 Sách, tạp chí
Tiêu đề: Handwriting recognition with large multidimensional long short-term memory recurrent neural networks
Tác giả: Paul Voigtlaender, Patrick Doetsch, Hermann Ney
Nhà XB: IEEE
Năm: 2016
[18] Minz Won, Sanghyuk Chun, and X. Serra. “Toward Interpretable Music Tagging with Self-Attention”. In: ArXiv abs/1906.04972 (2019) Sách, tạp chí
Tiêu đề: Toward Interpretable Music Tagging with Self-Attention
Tác giả: Minz Won, Sanghyuk Chun, X. Serra
Nhà XB: ArXiv
Năm: 2019

HÌNH ẢNH LIÊN QUAN

Về nguyên tắc, nhận dạng văn bản viết tay khác với nhận dạng đối tượng từ hình ảnh hay nhận dạng hành động từ video: - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
nguy ên tắc, nhận dạng văn bản viết tay khác với nhận dạng đối tượng từ hình ảnh hay nhận dạng hành động từ video: (Trang 16)
Hình 1.4: Minh họa nhận dạng ở mức độ dòng - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 1.4 Minh họa nhận dạng ở mức độ dòng (Trang 19)
Hình 1.6: Từ “người” bằng chữ viết tay (trái) và chữ in (phải) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 1.6 Từ “người” bằng chữ viết tay (trái) và chữ in (phải) (Trang 20)
Hình 2.1: Cấu tạo của một neuron thần kinh1 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.1 Cấu tạo của một neuron thần kinh1 (Trang 25)
Hình 2.4: Các hàm kích hoạt thông dụng (nguồn [2]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.4 Các hàm kích hoạt thông dụng (nguồn [2]) (Trang 28)
Hình 2.6: Mô hình tổng quát của mạng neuron tích chập (CNN)4 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.6 Mô hình tổng quát của mạng neuron tích chập (CNN)4 (Trang 30)
Hình 2.7: Trực quan hóa phép toán tích chập - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.7 Trực quan hóa phép toán tích chập (Trang 31)
Hình 2.9: Ví dụ minh họa gộp cực đại và gộp trung bình5 - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.9 Ví dụ minh họa gộp cực đại và gộp trung bình5 (Trang 32)
Hình 2.13: Một cell LSTM - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 2.13 Một cell LSTM (Trang 37)
Hình 3.1: Mô hình Markov ẩn (nguồn [3]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 3.1 Mô hình Markov ẩn (nguồn [3]) (Trang 41)
Hình 3.4: Diagonal-wise MDRNN (nguồn [17]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 3.4 Diagonal-wise MDRNN (nguồn [17]) (Trang 44)
Hình 3.7: (a) Cấu trúc của một đơn vị LSTM cơ bản. (b) Cấu trúc của deep birectional LSTM được tác giả sử dụng - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 3.7 (a) Cấu trúc của một đơn vị LSTM cơ bản. (b) Cấu trúc của deep birectional LSTM được tác giả sử dụng (Trang 46)
Mô hình chuỗi sang chuỗi (Sequence to Sequence- Seq2Seq) là một mô hình học sâu với mục đích tạo ra một chuỗi đầu ra từ một chuỗi đầu vào mà độ dài của hai chuỗi này không cần phải giống nhau - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
h ình chuỗi sang chuỗi (Sequence to Sequence- Seq2Seq) là một mô hình học sâu với mục đích tạo ra một chuỗi đầu ra từ một chuỗi đầu vào mà độ dài của hai chuỗi này không cần phải giống nhau (Trang 48)
Hình 3.9: Kiến trúc chung của mô hình Attention-based Seq2Seq (nguồn [11]) - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 3.9 Kiến trúc chung của mô hình Attention-based Seq2Seq (nguồn [11]) (Trang 50)
Hình 4.1: So sánh mô hình Transformer và LSTM. - Xây dựng mô hình nhận dạng chữ viết tay trong các biểu mẫu có bố cục cố định
Hình 4.1 So sánh mô hình Transformer và LSTM (Trang 54)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w