MƠ HÌNH MẠNG PIXELLINK CHO PHÁT HIỆN VĂN BẢN

Một phần của tài liệu Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu. (Trang 28)

Có rất nhiều phương pháp cũng như thuật tốn để xác định văn bản như SSD [3], CRAFT [1], Pixellink [5]. vv

Nhưng khi thử một số phương pháp như CRAFT [1] thì cho kết quả khơng tốt trên bộ trọng số có sẵn của họ, và phương pháp này sử dụng character Map nên làm dữ liệu tốn nhiều thời gian, dữ liệu phải gán nhãn ở mức độ kí tự. Nhưng Pixellink gán nhãn ở mức độ cụm nên việc gán nhãn dễ dàng và mất ít thời gian hơn. Trong khn khổ thời gian luận văn, tôi chỉ mới kịp gán nhãn và thử nghiệm theo Pixellink.

Những năm gần đây, áp dụng DL vào phát hiện văn bản đã đạt được nhiều thành công lớn, đa số các phương pháp đều sử dụng ít nhất hai phương thức đó là:

• Phân loại mỗi điểm ảnh. • Hồi quy hộp.

Trong đó phân loại điểm ảnh là xác đinh mỗi giá trị điểm ảnh là văn bản hay khơng (text/non - text).

Hồi quy viền xung quanh, là tìm ra các hình chữ nhật bao quanh văn bản đó. Những phương pháp trước đề xuất dùng ít nhất hai phương thức ở trên, nhưng nhận thấy sự không cần thiết của phương thức hồi quy hộp, bởi vì từ các điểm ảnh đã phân loại đã có thể suy ra các hộp chứa các văn bản đó.

Pixellink sử dụng hai cơ chế đó là phân loại các điểm ảnh và tính điểm số liên kết giữa các điểm ảnh kề nó, mỗi điểm ảnh có tối đa tám điểm ảnh kề nó.

Việc phát hiện văn bản qua instance Segmentation là dự đoán các điểm ảnh thuộc văn bản và kết hợp các điểm ảnh đó vào các nhóm khác nhau, mỗi nhóm như thế gọi là một instance.

Một phần của tài liệu Nghiên cứu bài toán bóc tác thông tin trong chứng minh thư sử dụng học sâu. (Trang 28)

Tải bản đầy đủ (DOCX)

(74 trang)
w