Trong Hội nghị quốc tế lần thứ 14 về nhận dạng mẫu Pattern Recognition, Connell và Jain đã sử dụng phương pháp gom nhóm Clustering để nhận dạng những từ vị lexemes trên văn bản viết tay
Trang 1GVHD: PGS-TS Đỗ Phúc
SVTH: Phạm Quang Diệu MSSV: CH1101077
Trang 2Trong Hội nghị quốc tế lần thứ 14 về nhận dạng mẫu (Pattern Recognition), Connell và Jain đã sử dụng phương pháp gom nhóm (Clustering) để nhận dạng những từ vị (lexemes) trên văn bản viết tay với mục đích nhận dạng chữ viết độc lập với người viết
Trang 3Hệ thống phụ thuộc người viết cho độ chính xác nhận dạng cao hơn so với hệ thống độc lập người viếthệ thống độc lập người viết, nhưng nó cũng đòi hỏi một lượng lớn dữ liệu training (training data)
Mặt khác, một hệ thống độc lập người viếthệ thống độc lập người viết phải có khả năng nhận dạng nhiều phong cách viết
Do sự thay đổi gia tăng của phong cách viết phải được ghi lại bởi hệ thống, thật sự càng khó hơn để phân biệt giữa những lớp khác nhau bởi số lượng trùng lặp trong không gian đặc trưng
Trang 4Một giải pháp đối với vấn đề này là chia dữ liệu thành các lớp
Mỗi lớp chứa các phong cách viết khác hẳn nhau Những lớp này gọi là các từ vị (lexemes).từ vị (lexemes)
Trong hệ thống này, chữ viết tay được ghi lại bằng cách lưu trữ vị trí (x, y) của viết và tình trạng của đầu bút (lên hay xuống) với tốc độ lấy mẫu cố định
Trang 5Sau một số lần lấy mẫu lặp lại và làm trơn, mỗi nét bút được biểu diễn như một chuỗi có chiều dài thay đổi của các điểm
Tính toán khoảng cách giữa hai nét bút, một ma trận
độ gần được xây dựng cho mỗi lớp chữ số (0 → 9)
Mỗi ma trận đo các khoảng cách bên trong lớp đối với mỗi lớp chữ số cụ thể
Những chữ số trong một lớp riêng biệt được gom nhóm với nỗ lực tìm một lượng nhỏ các khuôn mẫu (prototypes)
Trang 6Việc gom nhóm được thực hiện dùng các thuật toán clustering, trong đó vector đặc trưng cho một chữ số
là N độ gần của nó đến các chữ số trong cùng một lớp
Khi biểu diễn một nhóm các chữ số bằng một khuôn mẫu, kết quả nhận dạng tốt nhất đạt được bằng cách dùng chữ số gần với tâm của nhóm đó
Sử dụng mô hình này, tốc độ nhận dạng chính xác đạt được là 99,33%
Trang 7Chương trình: Nhận dạng các ký tự số
Địa chỉ download:
http://www.mathworks.com/matlabcentral/fileexchang e/loadFile.do?objectId=18901&objectType=file
Tính năng bổ sung: Dùng Microsoft speech API để đọc các chữ số
Input: Bộ mẫu các chữ số từ 0 → 9 và ảnh có các chữ
số cần nhận dạng
Output: Nhận dạng các chữ số xuất hiện trên ảnh và đọc chúng
Ứng dụng: Nếu được nâng cấp thì chương trình này
có thể dùng để đọc sách điện tử cho người mù
Trang 8Mẫu các chữ số từ 0 → 9
Ảnh có các chữ số cần nhận dạng
Trang 9Các số xuất hiện trong ảnh sẽ được đánh dấu bằng các khung đỏ bao quanh và sau đó sẽ được đọc lên