Giới thiệu tổng quan về hệ thống nhận dạng
Cơ sở lý thuyết tiền xử lý ảnh
Sơ l-ợc về mạng nơ-ron
Mạng nơ-ron mô phỏng trực tiếp bộ não con ng-ời
Ph-ơng pháp học cho mạng nơ-ron truyền thẳng nhiều lớp
Đối với vấn đề nhận dạng mẫu
2.6 Mạng nơ-ron truyền thẳng nhiều lớp
2.6.1 Các khái niệm khởi đầu
2.6.3 Biểu diễn đầu ra và qui tắc quyết định cho bài toán phân loại mẫu Ch-ơng 3 Xây dựng ch-ơng trình thử nghiệm nhận dạng ký tự chữ số và chữ cái
3.1 Phân tích bài toán nhận dạng ký tự chữ số và chữ cái
3.2 Các b-ớc chính trong quá trình thiết kế và xây dựng mô hình mạng nơ-ron truyền thẳng nhiều lớp cho bài toán nhận dạng chữ số và chữ cái
3.3 Giao diện chính của ch-ơng trình
3.4 Các kết quả và đánh giá thu đ-ợc từ ch-ơng trình
Ch-ơng 1 Giới thiệu tổng quan về hệ thống nhận dạng và cơ sở lý thuyết tiền xử lý ảnh
1.1 Giới thiệu tổng quan về hệ thống nhận dạng
Nhận dạng đối tượng (pattern recognition) là quá trình phân loại các đối tượng dựa trên mô hình và gán chúng vào lớp theo quy luật và mẫu chuẩn Nó cũng được coi là phương tiện xây dựng hệ thống tin học có khả năng "cảm nhận, nhận thức, nhận biết" các đối tượng vật lý tương tự như con người Lĩnh vực này liên quan đến xử lý tín hiệu trong không gian nhiều chiều, mô hình hóa bài toán, lý thuyết xử lý ảnh, cơ sở dữ liệu và phương pháp ra quyết định Một hệ thống nhận dạng hoàn chỉnh cần thể hiện quá trình nhận thức của con người qua nhiều mức độ khác nhau.
Mức cảm nhận trong hệ thống nhận dạng đề cập đến khả năng nhận biết sự tồn tại của các đối tượng quan sát mà hệ thống cần phân tích Quá trình này bao gồm việc thu thập dữ liệu thông qua các bộ cảm biến, như trong hệ thống nhận dạng xử lý ảnh, nơi các đối tượng được lưu trữ dưới dạng file ảnh số và được tiếp nhận qua scanner hoặc các file ảnh khác.
- Mức nhận thức: ở đây biểu diễn quá trình học, mô hình hoá đối t-ợng để tiến tới hình thành sự phân lớp (classification)
Mức nhận biết là quá trình xác định đối tượng quan sát, cho phép trả lời câu hỏi đối tượng đó là gì và thuộc lớp nào trong các lớp đã biết Đây là bước quan trọng trong quá trình ra quyết định.
1.1.1 Đối t-ợng nhận dạng Đối t-ợng nhận dạng (pattern object) đ-ợc coi nh- là một thực thể vật lý tồn tại mà con ng-ời có thể cảm nhận đ-ợc bằng sự miêu tả hoặc đo l-ờng…, ví dụ nh- hình ảnh, âm thanh đ-ợc cảm nhận bằng mắt và tai, và nó có thể đ-ợc thu nhận qua các bộ cảm biến nh- máy quay phim, máy ảnh số Có hai loại đối t-ợng chính:
- Đối t-ợng đ-ợc biểu diễn định l-ợng: Là những đối t-ợng mà đặc tính của nó đ-ợc đo l-ờng và biểu diễn bởi các con số
Đối tượng được biểu diễn định tính là những đối tượng có đặc tính được mô tả bằng các dạng miêu tả hoặc ký hiệu Trong nghiên cứu, khi xác định được tập hợp các đối tượng có chung một hoặc nhiều đặc trưng, tập hợp đó được gọi là một lớp đối tượng (class).
Quá trình phân lớp bao gồm việc xác định và phân biệt các lớp của đối tượng, giúp hệ thống nhận diện và phân loại đối tượng đầu vào Nhờ vào quá trình này, hệ thống có khả năng ra quyết định về lớp mà đối tượng thuộc về, và đây là một yếu tố cơ bản trong nhận dạng.
Quá trình trích chọn đặc trưng bắt đầu từ việc biểu diễn và quan sát đối tượng để nhận diện các đặc tính nổi bật của nó Quá trình này thay đổi tùy theo loại đối tượng cần nhận dạng Trong lĩnh vực nhận dạng, chúng ta chú trọng vào việc xác định những đặc trưng quan trọng nhất để phân loại và hiểu rõ hơn về đối tượng.
- Không gian biểu diễn: Là tập hợp các ký hiệu, số liệu miêu tả đối t-ợng sau quá trình cảm nhận
- Không gian đặc tr-ng: Là tập hợp các miêu tả đặc tr-ng sau quá trình trích chọn đặc tr-ng
Không gian diễn dịch là một tập hợp các tên đối tượng hoặc tên lớp đối tượng, giúp xác định đối tượng quan sát thuộc về lớp nào.
1.1.2 Mô hình hoá bài toán nhận dạng
Gọi X là đối t-ợng nhận dạng, X= (x 1 ,x 2 ,…,x n ), các x i R (thuộc tập số )
Gọi Y là không gian biểu biểu diễn đối t-ợng: Y={X 1 ,X 2 , ,X m }
Gọi là không gian diễn dịch, hay là tập các tên gọi của các lớp C 1 , C 2 ,
Quá trình nhận dạng đối t-ợng là tìm ra quy luật ánh xạ từ không gian biểu diễn Y sang không gian diễn dịch :
Trong hệ thống nhận dạng, các đối tượng X đã biết thuộc lớp C k, trong khi không gian diễn dịch và quy luật có thể được xác định từ cơ sở tri thức hoặc chưa biết Vấn đề đặt ra là xây dựng một hệ thống tự cấu trúc, yêu cầu một quá trình học từ các đối tượng quan sát để xác định không gian và tìm ra quy luật để đưa ra quyết định.
1.1.3 Các vấn đề cơ bản của hệ thống nhận dạng
Quá trình nhận dạng bao gồm ba giai đoạn chính:
- Lựa chọn mô hình biểu diễn đối t-ợng
- Lựa chọn luật ra quyết định (ph-ơng pháp nhận dạng) và suy diễn quá trình học
Khi mô hình biểu diễn đối tượng đã được xác định, quá trình nhận dạng sẽ chuyển sang giai đoạn học Đây là giai đoạn quan trọng nhằm cải thiện và điều chỉnh việc phân loại các đối tượng thành các lớp.
Nhận dạng là quá trình tìm ra quy luật và thuật toán để gán đối tượng vào một lớp, hay nói cách khác là đặt tên cho đối tượng Khi số lớp và quy luật đã được xác định trước, chúng ta gọi đó là học có mẫu; ngược lại, nếu không có sự chỉ định trước, đó là học không có mẫu hay tự học.
Học có mẫu (Supervised learning) là quá trình học dựa trên các mẫu đã được phân lớp cho các đối tượng, hoặc đã biết đặc trưng của các lớp đối tượng Ví dụ, trong bài toán nhận dạng chữ viết, chúng ta đã biết trước tập quy luật và tên của các đối tượng nhận dạng, với các lớp từ ký tự A đến Z và các số 0 đến 9 Mục tiêu của học có mẫu là định nghĩa các lớp trong không gian đối tượng tổng quát, tức là xác định phương trình biên giới giữa các lớp để phân biệt đối tượng thuộc về lớp nào.
Học không có mẫu (Unsupervised learning) là quá trình học bắt đầu khi chưa có sự phân lớp và không có mẫu cụ thể Quá trình này tập trung vào việc nhóm các đối tượng quan sát có độ tương tụ gần nhau, từ đó hình thành sự phân lớp (clustering → class).