Ngược lại, dữ liệu nhận dạng trực tiếp là một số các nét hút mà chúng được ghi lại khi đang viết với một thiết bị riêng biệt nào đó như màn hình cảm ứng cùa các thiết bị cầm tay.. Những
Trang 1ĐẠI HỌC QUÓC GIA HÀ NỘI
NHẶN DẠNG TIÉNG VIỆT TRÊN CÁC THIẾT BỊ CẦM TAY
( Báo cáo tổ n g h ợ p đề tài n g h iê n c ứ ',1 k hoa học cấp Đại h ọ c OUOC oi.a
Trang 2MỤC LỤC
Danh sách những nguòi tham gia đề tà i 1
Danh mục bảng biểu, hình v ẽ 2
Tóm tất kết quà nghiên cứu chính của đề t à i 3
Tóm tắt kết quả nghiên cứu chinh của đề tài (tiếng A n h ) 4
Báo cảo tổng h ọ p 5
1 Giới th iệ u 5
2 Hệ thống nhập dữ liệu cùa các Thiết bị số hỗ trợ cá n h â n 7
3 Thể hiện Cosin cùa dữ Ịịệu chừ viết tay trực tu y ể n 9
3.1 Thẻ hiện cosin của một nét trong dữ liệu viết tay trực t u y ể n 9
3.2 Thề hiện cosin của nhiều n é t 11
4 Hệ thống nhận d ạng 14
5 Thực nghiệm và kết q u à ] 5
6 Kết lu ậ n 17
P h ụ l ụ c 21
Trang 3DANH SÁCH NHỮNG NGƯỜI THAM GIA ĐỀ TÀI
■5
Trang 4DANH MỤC BẢNG BIÊU, HÌNH VẼ
[ linh 1 Nét vẽ gốc của chừ số 0 với 49 điểm lấy mẫu (trái) và nét xấp xi thu dược bởi quá trình biến đồi DCT ngược 16 điểm từ hiểu diễn cosin của nó (phải) Biển diễn cosin của nét vẽ gốc được chỉ ra ở bảng phía dưới 11 Hình 2 Mai nét bút gốc cùa ký tự 4 với 34 và 16 điểm lấy mẫu (trái) và nét bút xấp
xi thu được bởi quá trinh bicn đổi DCT ngược 16 điểm từ biểu điền cosin cùa chúng (phái) Biển diễn cosin cùa nét vẽ tiổc dược chi ra ở bảng phía d ư ớ i 13 Hình 3 Chừ “à” với 2 nét bút (trái) và hai nét bút xấp xi thu dược bởi quá trình biến dổi DCT ngược 64 đicm từ biểu diễn cosin của chúng (phủi) 14 Minh 4 I lệ thống nhận cỉạng gồm n-bộ phân biệt, mồi hộ phân biệt cho một ký tự 14 Mình 5 Mỗi bộ phân biệt là một mạng Perception da tầng 15 Hình 6 Một sổ mầu nhận sai bởi hộ thống cùa chúng tỏi Từ trái sang phái: Mầu của
số 5, 0 và 8 được nhận thanh 3, 2 và 0 16
Bảng I Kèt quà nhận dạng trên tập kiểm tra (5317 mẫu) chửa một phần ba cúa phần la ( c h ữ s ố rời rạc) cùa tập dữ liệu Unipen 16
2
Trang 5BÁO CÁO TỐNG HỢP
1 Giới thiệ u
Khái niệm các Thiết bị sổ hỗ trợ cá nhân (Personal Digital Assistants - PDAs), hay các thiêt bị cầm tay bat đâu xuất hiện từ những năm 1970, và thuật ngữ này ngày câng trớ nên phò biên trong lĩnh vực công nghệ Đen nay, sau hơn 3 thập kỷ, công nuhộ cho PDA đã phát triển rất cao về tốc độ, đồ hoạ, diao diện sứ dụng, các công nghệ ket noi, v.v và PDA đã trờ thành một thiết bị mạnh có khả năng ứng dụng ngày càng lớn và rộng rãi.
PDA được phát triển dựa trên V tướng “tối da hoá việc hồ trợ tính toán và tối thiểu hoá không gian” Cho đến nay PDA vẫn lủ loại máy tính nhỏ nhát trên thế giới PDA là mội lliiếl bị kỳ thuật số có kích thước thiết kế cỡ khoảng bàn lay, có thể hoại dộng một cách dộc lập mà không cần đến phích cắm diện hay thiết bị phụ trợ nguồn điện vật lý cồng kềnh Kích thước màn hình không lớn, sổ lượng phím cứng
ít và tài nguyên không dược dồi dào nhu máy tính để bàn hay máy tính xách tay.
loé nhập dữ liệu vào các Thiết bị số hồ trợ cá nhàn, bên cạnh các sứ dụng bàn phím
ào trên màn hình, ihi cách tự nhiên bàng chữ viết tay vẫn được ưu chuộng hơn Chữ viết tay là cách thức nhập dừ liệu hiệu quà nhất bởi vỉ các Thiết bị so hỗ trợ cá nhân quá nhỏ đê có thể chứa cá bàn phím với tất cả các kí tự Một ví dự khác là sẽ dễ dàng hơn nhiều khi nhập dữ liệu bàng chữ viết tay trong một sổ ngôn ngữ mà có rât nhiều kí tự như tiếng Trung Quốc, Nhật Bản, A-rập, Trong những trường hợp này, sử dụna, bàn phím còn phức tạp hơn rất nhiều.
Tuy nhiên, nhân dạng chữ viết tay không phải là một công việc đơn giản với máy tính Rât nhiều loại vấn de trono nhận đạnạ, chữ viết tay được đira ra cho cộng đông nghiên cứu dựa trên hình thức dừ liệu được biểu diễn như thế nào trong hệ thong nhận dạng, hay việc nhận dạna có phụ thuộc vào người viết không Thay vi cô găng giải quyết tất cà các vấn dề, một hệ thống nhận dạng chữ viết tay thường tập trung vào một tập con cùa tập các kí tự [6, 16, i 7],
Trang 6Dựa vào sự biêu diễn cua dữ liệu, nhận dạng chữ viết lay chia làm hai loại: trực tuyến (online) và ngoại tuyến (offline) [15] Dữ liệu nhận dạng ngoại tuyến là dừ liệu ckrợc thê hiện dưới dạng các điếm ảnh dược chiếu chụp hay quét từ văn bản Ngược lại, dữ liệu nhận dạng trực tiếp là một số các nét hút mà chúng được ghi lại khi đang viết với một thiết bị riêng biệt nào đó như màn hình cảm ứng cùa các thiết
bị cầm tay Mồi nét bút một dãy các diêm được lấy mẫu và lưu lại cách nhau các khoảng thời gian hang nhau Những nét bút cùa dữ liệu viết tay trực tuyến dược có thê dược sứ dụng dể xây dựng dừ liệu của ảnh được dùng trong nhận dạng chữ viếi lay ngoại tuyến f 17 1 Tuy nhiên, điểm thuận lợi chính cùa dữ liệu trực tuyên là biết đươc nhữnu nét bút và thứ tự viết thay vi chi biết các điếm ảnh như trong dữ liệu ngoại tuycn Nêu tận dụng dưực thông tin này có thể đạt được ti lệ nhận dạng đúng cao hơn [2,3,111.
Một hướng tiếp cận tận dụng các nét bút là sứ dụng biếu diễn hình học rnừ (fuzzy ueometric) cho nhận dạng các kí tự dơn Ic [9,12] Sự biểu diễn dó dạt được nhờ sự phân tích nét bút được xấp xi bởi một dãy các cung tròn, như dược miêu lả (rong [10| Sự biểu diễn này được dưa ra bởi Gagne và Pari/eau với thuật toán lập trình tiên hóa (Genetic Programming) để thu được kết quà nhận dạng cao [6] Một cách tiếp cận khác là sừ dụng biến đổi thông tin dộng cùa dữ liệu viết tay thành một tập íỉiển hình cùa những đặc trưng độc lập tương hồ nhau Polyakov và Ryleev 113] đã kết hợp hiếu diễn Cosin (Cosine Descriptors) với sự tham số hỏa biến đổi lặp lại dể
Cling cấp một cách biêu diễn hiệu quá đối một nét bút đơn cùa dữ liệu chữ viêl tay
bang một vector gồm các đặc trưng cùa nó Biểu diễu này được gọi là biêu diễn cosin thu gọn (Optimized Cosine Descriptor), thể hiện một tập các đặc trưng hữu hiệu cho việc nhận dạng Tuy nhicn, một số ki tự trên thực tế không được viết bời một nét mà banụ nhiêu nét Hơn nữa một nét không đù dể nhận biết một ki lự Và người ta đã cố gang nhận dạng một kí tự thông qua một nét bằng nối các net dược nhận dạng đó thành kí tự hoàn chinh [4, 5], Đây là không phái một hirớnạ, tiếp cận hiệu quá khi những lồi nhận dạng xual hiện hai lần hay tích tụ.
6
Trang 7Trong đê tài nàv, chúng tôi mờ rộng phương pháp được đưa ra trona, [13] dê biểu diễn nhiêu nét cùa một kí tự thông qua một tập tính chất đặc trưng bang biến dồi cosin Sử dụng biêu diễn này, chúng tôi đã phát triên một hệ thống nhận dạng kí tự trực tuyến dộc lập với người viết với các bộ phân biệt sử dụng mạng Nơ-ron da tầng (M uhiLayer Perception classifiers), mỗi bộ phân biệt cho một kí tự Chúng tôi dã thủ nghiệm hệ thống trên một số tập dừ liệu, trong đó có tập dữ liệu Unipen và đã dạt được kết qua rất đáng chú ý so với các phương pháp khác Ngoài ra chúng tôi cũng tiến hành thừ nghiệm với dữ liệu tieng Việt nhò và đạt được kết quà tương đối kha quan.
Nội dung chính cùa báo cáo đề tài được bố trí như sau: Phần 2 trinh bày vổ hệ thôim nhập dữ liệu của các thiết bị cẩm tay Phần 3 miêu lã cách thức thu ctưực biểu diễn cosin cùa một dữ liệu thô của chừ viết tay trực luyến Sau đỏ, chúng tôi miêu tả hệ tliốns nhận dạng 0 Phần 4 Một số thử nghiệm và kết quà được nói đen trong Phân 5.
2 Hệ t h ố n g n h ậ p d ữ liệu c ủ a c á c Thiết bị s ố h ỗ trợ cá
n h ản
Việc nhập dữ liệu là một vấn đề đối với Thiết bị số hỗ trợ cá nhàn bởi kích thước cùa chúng không đủ lớn đẻ thiết kế gắn kèm máy nhữnạ, hệ thống nhập dử liệu dạng bàn phím hay con chuột máy lính Thay vào dó, người ta thường sử dụng phương thức nhập dừ liệu trực tiếp trên màn hình cám ứng hoặc lừ một sỏ phím cứng được thiết kế sẵn trên máy.
1 lầu hếi các Thiết bị số hỗ trợ cá nhân sir dụng màn hình tinh the lònu (LCD) Màn hình này dược cấu thành bởi 3 lớp I.ứp trên cùng thường là lớp kính với một lớp bao phú dặc biệt bôn dưới Lớp kính này thực sự là một phẩn cùa màn hình khi ta chạm vào Dưới lớp kính này là mánh kính đặc chuyên biệt, không dẫn điện Lớp cuối cùng là lớp uron« tự như lớp đầu licn Mỗi khi màn hình dược nhàn, lớp kính
di chuyển xuyên qua lóp không dẫn điện và tiếp xúc với lớp dưới cùiìỉi Dây là
7
Trang 8nguyên nhân cùa các trường diện lừ đã dược tạo ra giữa các lớp kinh bị ngắt quãng trong một khoảng thời gian rất ngan Điểm này dược chương trình điểu khiển nhận biết và quyết định vị trí nào trên màn hình đã được nhấn, từ đó gửi các thông tin cho
hộ diều hành xử lý Các thông tin này tương tự như thông lin vị tri cùa chuột khi dang di chuyên Lưu trữ các thông tin sẽ tạo ra các nét bút trong dữ liệu viết lay trực luyến đế phục vụ cho công việc nhận dạng.
Các thiết bị số hỗ trợ cá nhân thường có số lượng giới hạn các phím cứng trên máy Các phím cứng này tỏ ra rất hữu dụng dối với một số chương trình cân kích (hước màn hình tối da khi mà sự hiển thị cùa bàn phím mềm trên màn hình sẽ làm khuât một số dổi tượng cùa chương trinh, hoặc sử dụng các phím này (tê thao tác nhanh như gợi điện thoại, iruy cập hòm ilnr điện tử, trinh duvệt, chụp tinh hav dóng các ứng dụng Thực tế, các thiết bị số hồ trợ cá nhân hiện nay thường có 6 phím; 4 phím cửne, đồ kích hoạt các chươnẹ trình thao tác mặc định như: lịch biểu, danh bạ điện thoại, danh sách công việc (To do list) và bàng ghi nhớ Hai phim còn lại là phím cuộn màn hình lèn hoặc xuống.
Trong tươne lai ngoài sự phát triển của nhập liệu bang chừ viết tay, hệ thônu nhập
dừ liệu thòng qua giọni> sẽ được phát triển cho các thiết bị sỏ hồ trợ cá nhân Lúc dó
Trang 9việc nhập dữ liệu ihône qua bíu cảm ứng chưa chắc dã là hình thức nhập liệu thích hợp nhất Ngoài ra, đối với một sổ chươne trinh trò chai, sự phát triển joystick không chi dừng lại cho các máy tính, nó phát triển cho cà các thiếl bị số hồ trợ cá nhân và kêt nòi với các thiêt bị này thông qua cổng serial.
3 Th ể h iệ n C o s i n c ủ a d ữ liệu c h ữ v i ế t tay trự c t u y ế n
3.1 Thể hiện cosin của một nét trong dữ liệu viết tay trực tuyến
Một dicu dã dược biết đen một cách rộng rãi rang việc nhận dạng có che thu dược hiệu quà với việc sừ dụng chi một tập nhò các đặc trima tương hồ độc lập Polyakov
và Ryleev [13] dà kết nối biêu diễn cosin (Cosine Descriptors) với sự tham sô hóa biến đổi lặp lại để dưa ra một cách biều diễn hiệu quà của một nót bíu đơu cùa dữ liệu chừ viòt tay trực tuyến bằng một vec-tơ là một tập các tính chát đặc trưng Vec tor dó được gọi lá một biếu diễn cosin thu gọn (Optimized Cosine Descriptor), the hiện một lập các tlậc trung rắt hữu dụng trong nhận dạng Quá trình dó bao gồm hai bước chính, ờ bước dầu tiên, thổ hiện thô ban dầu (vcc-tơ iliểin) dược biến dồi thành một tập hệ so với biến đổi Cosin rời rạc (Discrete Cosine Transformation II])
Ớ bước ihử hai, tập các hệ số đó được xử lý để thu dược sự chuẩn hóa không thay dôi đôi theo đơn vị do, sự di chuyển, sự xoay vòng, và cà doi với vị trí cùa điếm bắt đầu khi viết.
Một nét bút cùa dữ liệu chữ viết tay là một dãy các dicm được lay theo thời uian Sự chuvên dôi của nét này bất đầu với một tham so khởi nhận dược hăng sụ lây mầu lại với những diêm mẫu cùa dừ liệu han đầu và theo những khoảng cách bang nhau:
Trang 10biếu diễn tập cosin dược cắt bỏ dựa theo thứ tự xác định trước của phép xấp xỉ và
trờ thanh đầu vào mô tá dừ liệu ban đầu dùng cho nhận dạng Hình 1 cho thấy một
10
Trang 11nét cùa chữ số 0 và xấp xi cùa nó bằng 16 điểm DCT nmrợc của thê hiện cosin cuối cùng.
1 - ' í 4 s 6 ' -Ị
1 Ỉ-<J» O O í HH hi | | ( I Ì 7 Ì ' Ì > -0 541 í.X'' ị -íi.an ụ iiu 1' 0.05:62 IS II » 5 s / i V I ' ( MHI I 2<i2í\7
j ( i» t 1 0 iHHKKHt ■IMIiỉXIKI 0 M ')><•>? (1(154.55' -0 155S5I .(1 d ' 4 1N4 -II O M I ' H ' X
H ìn h I N ét vẻ gốc c ù a c h ữ số 0 với 4 9 đ iế m lấy m ẫ u ( t r á i ) v à n ét x ấ p xi th u đ irụ c l)òi q u á I r ìn h b iế n
đ ố i D C T n g ư ợ c 16 cliểin lù' b iề u d iễ n c o sin c ủ a n ó (p h ả i) B iền d iễ n c o sin c ù a n é t vê gốc d irợ c c h ỉ r a ừ
b à n g p ltín d ư ớ i
Cách biểu diễn này được đề xướng bởi Polyakov và Ryleev [13], tuy nhiên, vẫn chưa thực sự đủ dể dùng cho nhận dạng Trên thực tế, rất nhiều kí tự được viết bời nhiều nét Khi đó, bất ki một nét nào các nét đó cũng không đù đề thê hiện dược kí
tự đó Hơn thế nữa, nhận dạng mồi nét rồi sau đó toàn bộ kí tự bằng việc sơ khớp những nét được nhân dạng với những khuôn dạne cho trước có thể không phải là hướnu tiếp cận hiệu quả khi những lỗi nhận dạng bị tích lũy.
3.2 Thể hiện cosin của nhiều nét
Sau đây, chúng tôi sỗ trình bày plurơny, pháp của chúng tôi để thu được biểu diễn cosin cùa lất cả các nét bút hợp nhất cùa một kí tự chi trong một tập các thuộc tính đặc trưng Thay vì xử lý mỗi một nét bút riêng biệt, chúng tôi cùng một lúc xem xét tất cả những nét bút của một kí tự theo thứ tự viết như một dãy các điểm Toàn bộ dày các điểm bây giờ xử lý giống như miêu tả ờ trên, ngoại trừ một luật được thêm vào đó là cà điềm bắt đầu và điểm kết thúc cùa nét bút sẽ đều phái dược giữ lại.
Trang 12Quá trinh xử lý tham số hỏa lại cần được thực hiện theo quy trình sau Những điểm dược lây làm mầu cùa những nét trong suốt quá trinh sự tham số hỏa bày giờ sẽ là:
Trong đó, M là số các nét và:
\ = 0
•V,.I = ‘-Ml với i = 1 M - 1
Điểm (.V,, V,) trùng với điểm bắt đầu của cùa nét thứ i với / = 0 A / - I ; và điềm
khoảng cách cách đều.
Hỉnh 2 thế hiện một mẫu của chữ số 4 với 2 nét và xấp xi những nét của chúng thu dược bởi quá trình biến đồi DCT ngược 16 điềm từ biểu diễn cosin của chúng Khi nhin vào hình vẽ, những nét bút xấp xì này vẫn thể hiện đúng kí tự đó Hình 3 thể hiện một mầu của chữ “ ả” với 2 nét và xấp xi cùa những nét cùa chúng thu được bới quá trình biến đổi DCT ngược 64 điểm từ biểu diễn cosin cùa chúng Hình nàv cho chúng ta thấy với chừ tiếng Việt có dấu, chúng ta phải dùng nhiều điểm lấy mẫu hon dề có thê thê hiện được đúng các dấu ở phía trên các ký tự vi độ dài các dấu này thường ngắn so với ký tự.
Trang 13H inh 2 Hai n é t b ú t g ố c cùa ký tự 4 với 34 và 16 đ iề m lấy m ẫu (trá i) và n ét b ú t xấp xỉ thu
đ ư ợ c bờ i q uả trin h b iế n đồi D C T n g ư ợ c 16 đ iể m t ừ b iể u d iể n c o s in củ a c h ú n g (p h à i) Biển
d iển co sin cú a n é t vẽ g ố c du’O’c ch i ra ờ b àn g p h ía d ư ớ i.
13
Trang 14Hình 3 Chủ “ á” vói 2 net bút (trá i) và hai n é t b ú t xếp xỉ thu đưọ'C bớ i q uá trin h biên đổi D C T ngư ợ c 64 đ iể m tử biểu d iề n c o s in củ a ch ú n g (p h ả i).
4 Hệ t h ố n g n h ậ n d ạ n g
Hệ thống nhận dạng cùa chúng tôi bao gồm nhiều bộ phân biệt, mỗi bộ phân biệt đế nhận dạng một kí tự (xem ỉ lình 6) Mồi một bộ phân biệt cùa hệ thống được thiết kế cho xác định một kí tự bang cách đưa ra kết quả thích hợp cao hơn và loại trừ các kí
tự khác bang cách đưa ra kết quả thấp hơn Khi một mẫu ký tự được lấy từ các thiết
bị cầm tay hay các thiết bị đặc biệt khác dưới dạng dữ liệu chữ viết tay trực luyến,
dừ liệu này được biến đồi cosin theo cách đã nói ớ trên và sau dó dưa vào các bộ phân biệt Mỗi bộ phân biệt sẽ trả về một giá trị tương ứng với mức độ mẫu ký tự thuộc về bộ phân biệt đó Ỉ3Ộ phân biệt trà về giá trị lớn nhất sẽ đirợc coi !à nhận được mầu ký tự đó, và ký tự lương ứng được đưa ra.
Hình 4 Hệ thống Iihận dạng gồm n-bộ phân biệt, mỗi bộ phân biệt cho một ký tự
14
Trang 15Mỗi bộ phân biệt là một mạng Perceptron đa tầng (Multi-Layer Perceptron Network) và được huấn luyện với phươno pháp lan truyền ngược (back- propagation) có momentum (Xem Hình 5) Chúng tôi đã thử xây dựng hệ thống nhận dạng chi gồm một bộ phân biệt với nhiều nút kết quả nhưng khône, tốt bằng sừ dụng nhiều bộ phân biệt như trên.
Hình 5 Mỗi bộ phân biệt là một mạng Pcrceptron đa tầng
5 T h ự c n g h i ệ m v à kết q u ả
Chúng tôi đã tiến hành thực nghiệm với một số dữ liệu trong đó có phần dừ liệu 1 a (gồm các chữ số) của tập dừ liệu Ưnipen (ưnipen data set [7]) Phần dữ liệu này bao gồm 15953 mẫu Đây là dữ liệu khó với nhiều mẫu dữ liệu xấu Hình 6 chỉ ra một
số dữ liệu xấu mà không được nhận dạng bởi hệ thống Những mẫu này khó nhận biết ngay cả đối với con người.
15
Trang 16n h ậ n th a n h 3 , 2 v ả 0.
Chúng tôi chia ngẫu nhiên tập dữ liệu đó thành ba tập: 1 tập để huyến luyện gồm
7000 mẫu, 1 tập dể thẩm định gồm 3000 mẫu và 1 tập đẻ kiểm tra gồm 5300 mẫu Chúng tôi đã huấn luyện mỗi phân biệt với toàn bộ dữ liệu dùng dể huấn luyện, với mục tiêu đạt đến 0.99 đối những mẫu huấn luyện này cho chữ số cần nhận biết, và 0.01 cho những chừ sổ không cần loại trừ Giá trị của tỉ lộ học (learning rate) và momentum được gán cố định bằng 0.1 và 0.2 Chúng tôi cũng sử dụng kỹ thuật dừng sớm khi thấy kết quả thầm định không tốt hơn.
Sau nhiều lần thực nghiệm, chúng tôi nhận thấy ràng một tang ân gôm 20 na-ron cho những phân biệt nhiều tầng cho ra kết quà tốt nhất Đồng thời, hệ thong cho ket quả tốt nhất đối với bậc cùa DTC là 8 và kích thước lấy mẫu là 16 trong biến đôi cosin.
Divỉii Maximum Recognition Rale ( (A ) Average Recognition Rale ('/< 1
Bàng 1 Kết quá nhận tiạng trên tập kiếm tra (5317 mẩu) chứa một phần ba của phân
la (chử số ròi rạc) của tập dữ liệu Ưnipen.
Bảng 1 tóm tắt kết quả mà chúng tôi đã đạt được Chúng tôi đạt dược cao nhât với ti
lệ là 96.01%, và ti lệ trung bình là 95.77% cho toàn bộ chữ số Đây là kết quà rất tốt
16
Trang 17so với các phương pháp khác, vì vậy nó minh chứng tính hiệu quà cùa biểu diễn cosin trong nhận dạniĩ chừ viết tay trực tuyến.
Chúng tôi cũng tiến hành lấy mẫu đề thừ nghiệm phươna; pháp của chúng tôi với một số chừ cái tiếng Việt có dấu Cụ thế chúng tôi thứ nghiệm với 5 chừ cái “ a”,
“á ”, “ả”, “â ' \ và ‘‘à" và thư được kết quả nhận dạng trung bình là 88% Đây là kết quà tương đối tốt khi sổ lượng mẫu để học mà chủng tôi tiến hành lấy chưa nhiều Thêm vào, không giống như phân biệt các chữ trong bảng chừ cái tiếng Anh, hay phân biệt các chừ số, 5 chừ cái tiếng Việt mà chủng tôi thử nghiệm rất giống nhau, phần khác biệt chỉ ờ các dấu Bản thân các dấu cũng không khác biệt nhau nhiều, dặc biệt khi vicí iay Đe có thể tăng tỉ lệ nhận dạng, trong tương lai, chúng tôi dự định sẽ tách riêng phần dấu để tiến hành nhận dạng.
6 Kết luận
Đề tài đà tập trung nghiên cứu một số vấn đề như sau:
o Hệ thống hóa những vấn đề lý về nhận dạng chữ viết tay trực tuyến.
o Đưa ra một phươne pháp biểu diễn của một kí tự viết tay trực tuyến đành cho các thiết bị cầm tay gồm nhiều nét trong một tập đơn những đặc trưng bằng, việc sừ dụng biến đôi cosin.
o Phát triển hệ thống nhận dạng chừ viết tay trực tuyến không phụ thuộc vào người viết với bộ phân biệt nơ-ron đa tầng (MultiLayer Perceptron) Việc thực hiện đề tài đã thu được một số kết quả:
• Kết quà khoa học: 02 báo cáo khoa học tại các hội nghị quốc tế (trong đó có 1 báo cáo đãn£ tại kỷ yếu xuất bàn bởi IEEE Computer Society).
Trang 18• Kẻt quà đào tạo
o 02 cử nhân
Trong tương lai, chúng tôi sẽ tiến hành thu thập dữ liệu chữ viết tay trực tuyến dầy
đù cho tiếng Việt và tiến hành thừ nghiệm và đánh giá Ngoài ra, chúng tôi cũng sẽ
cố gang thừ biêu diễn cosin với các phươne pháp phân biệt khác như lập trình tiến hóa (Genetic programming).
1 8
Trang 19TÀI LIỆU THAM KHẢO
[I] N Ahmed T Natarajan, and K R Rao Discrete cosine transform ỈEEE Trans
C om puters, C -23(l) January 1974 [2] p w Becker and K A Nielsen Pattern recognition
using dynamic pictorial information IEEE Transaction in System, Man, Cybernetics,
SMC-2, July 1972.
[3J J R Bellegarda, D Nahamoo, and K s Nathan Automatic handwriting recognition
using both static and dynamic parameters United States Patent num ber 5,491,758, February
1996.
[4] S Connell and A Jain Template-based online character recognition Pattern
Recognition, 34(1), January 2001.
[5 1 S D Connell and A K Jain Learning prototypes for online handwritten digits In
Proceedings o f the I4lh International Conference on Pattern Recognition-Volume I, 1998
[6Ị c Gagne andM Parizeau Genetic engineering o f hierarchical fuzzy regional
representations for handwritten character recognition International Journal o f Document
Analysis and Recognition, 8(4):223“ 231, September 2006.
[7J I Guyon, L Schomaker, R Pỉamondon, M Liberman, and s Janet Unipen project of
on-line data exchange and recognizer benchmarks In Proceedings o f the 14th International
C onference on Pattern Recognition (ICPR), 1994.
[8] M Hagan, H Demuth, and M Beale Neural N etw ork Design PWS Publishing
Company, 1995.
[9 j J F Hebert, M Parizeau, and N Ghazzali A new fuzzy geometric representation for
on-line isolated character recognition In Proceedings o f the 14th International Conference
on Pattern Recognition, 1998.
[10] X Li,M Parizeau, and R Plamondon Segmentation and reconstruction o f on-line
handwritten scripts Pattern Recognition, 31(6), 1998.
[ I I ] E Mandler, R Oed, and w Doster Experiments in online script recognition In
Proceedings o f 4th Scandinvian Conference in Image Analysis, June 1985.
[12] M Parizeau, A Lemieux, and c Gagne Character recognition experiments using
unipen data In Proceedings o f 6th International Conference on D ocum ent Analysis and
R ecognition (1CDAR'), 2001.
[13] V G Polyakov and M A Ryleev Method and apparatus for representing image data using polynomial approximation method and iterative transformation-reparametrization
technique U nited Stales Patent num ber 5,473,742, December 1995.
[ 14J c Suen Com putational Studies o f the M ost Frequent Chinese Words and Sounds
Word Scientific Singapore, 1986.
19
Trang 20[15] c c Tappert, c Y Suen, and T.Wakahara The state o f the art in on-line handwriting
recognition I EEE Transaction on Pattern A nalysis a n d M achine Intelligence, 12(8), 1990.
116] A Teredesai and V Govindaraju issues in evolving gp based classifiers for a pattern
recognition task In Congress fo r E volutionary C om putation 04 (CEC 04), 2004.
[17] A Teredesai, E Ratzlaf, J Subrahmonia, and V Govindaraju On-line digit
recognition using off-line features In Proceedings o f Indian C onference on C om puter
Vision, G raphics an d Im age P rocessing, 2002.
20
Trang 21PHỤ LỤC
Đề tài mã số: QC.06.02
Bài báo "Classifying Online H andwriting Characters under Cosine Representation " Bài báo "Towards building up an m -W ord"
Các lúp cùa công cụ tạo biểu diễn cosin cùa dữ liệu trữ viết tay trực tuyến
Mã cùa công cụ ho trợ nhận dạng viết bang M ATLAB
Bìa khoá luận tốt nghiệp của Trần M inh Quăn, Trần M ai Hạnh
Ban sao Hợp đong vù Đe cương nghiên cứu của đề tài QC 06.02
Phiếu đăng ký kết quả nghiên cửu để tài K H C N Q C 06.2I
21
Trang 23Yu De Bi
CfMki, t'N'tJCO WiifU tUnuịt
Luoyang, Henan, China August 22-24, 2007
A L PIT , V o lu m e 6, A u g u s t 2007
Co m p u t e r
SOCIETY
ẠIEEE
Trang 24Classifying Online Handwriting Characters under Cosine Representation
The Duy Bui College of Technology Vietnam National University, Hanoi
duybt@vnu.edu.vn
Abstract
The n a tu r a l w ay o f h a n d w ritin g to e n te r (laid into c o m
p u te r is still p re fera b le in m a n y tasks H ow ever, h a n d w rit
in g c h a r a c te r reco g n itio n is not a trivia l ta sk f o r com puter
B a se d on th e p re se n ta tio n o f the input, h a n d w ritin g reco g
n itio n can be d ivid e d into tw o c la sse s: o ffline a n d online
T he m a in a d v a n ta g e o f o n lin e h a n d w ritte n d ata o v e r of-
(lin e (laid is the a v a ila b ility o f stro k e se g m e n ta tio n Olid o r
d e r o f w ritin g U tilizing th is in fo rm a tio n r a th e r ilian s ia
lic im a g e Drily can o b ta in h ig h e r reco g n itio n rale 1111- In
th is paper, w e e x te n d the m e th o d p ro p o se d in I I 3 Ị 10 re p re
se n t m u ltip le stro kes o f a c h a ra c te r to g e th e r III a sin g le set
o f fe a tu r e s u sin g c o sin e tra n sfo rm a tio n U siniỊ this re p re
sen ta tio n , w e have d e v e lo p e d an o n lin e w riter-in d e p e n d en t
c h a ra c te r reco g n itio n system w ith M u ltiL a y e r P erception
(X1LP) cla ssifiers, o n e c la ssifie r f o r ea ch sin g le character
We h a ve te s te d o u r sy ste m on S ectio n l a (iso la te d d ig its} o f
th e U n ip en d a ta se t / 7 I a n d h a ve o b ta in e d very co m p etitiv e
results.
1 Introduction
In o rd e r to e n te r d a ta into co m p u ter, b e sid es the w ay o f
u sin g the k ey b o ard , ill m any task s, the n atu ral w ay o f hand-
V, ru in g is still p re fe ra b le For e x am p le, h a n d w ritin g is p ro b
ab ly the m o st effe c tiv e d a ta en try m eth o d for Personal D ig
ital A s s is ta n ts (P D A s) b e ca u se th eir sm all size w ould noi
allo w full siz e d k ey b o ard s o r even noi any k ey b o ard at all
A n o th e r e x a m p le is e n te rin g d a ta in so m e n atu ral lan g u a g es
c o n ta in in g a very large n u m b er o f sy m b o ls like C h in ese (3
5 0 0 0 c h a ra c te rs ) [ 14 1, K anji and A rabic K eyboard en iry in
(his c as e is even a m o re difficult task
N e v e rth e le ss , h a n d w ritin g c h a ra c te r reco g n itio n is not
a trivial task fo r c o m p u ter M any types o f p ro b lem s w ith
w ith in h a n d w ritin g reco g n itio n are posed to the research
c o m m u n ity bused on how the d a ta is p resen ted to Ihe re c o g
nitio n s y s te m , w h e th er (he reco g n itio n is w riter-d e p en d e n t
or w rite r-in d e p e n d e n t, and so on Instead o f try in g 10 solve
all the p ro b lem s, a sm art h an d w ritin g reco g n itio n sy stem
w o u ld focus on a su b set o f them (6, 16, 17Ị
B ased on the p resen ta tio n o f (he in p u t, h a n d w ritin g
re co g n itio n can be d iv id ed into Iw o classes: offline and o n lin e [15] T h e input in offline h a n d w ritin g re co g n itio n is
in tile form o f scan n ed im age o f (he p ap er d o cu m en t w hile the input in o n lin e h a n d w ritin g reco g n itio n is a n u m b er o f stro k es w hich are c ap tu red as b ein g w rilten w ith sp ecial
e q u ip m e n t su ch as d ig itizin g tablet E ach stroke is a se
q u e n ce o f sa m p lin g p o in ts at e q u ally sp aced tim e intervals
T h e stro k es o f o n lin e h a n d w ritin g data can be used to build
an input o f scan n ed im ag e (hat can be used w ith offline reco g n itio n te c h n iq u es, e.g I ! 7], H ow ever, the m ain a d v a n tag e o f o n lin e h a n d w ritten d ata o ver offline data is the av ail
a b ility o f stro k e se g m en tatio n and o rd e r o f w riting U tilizing th is in fo rm a tio n ra th e r than static im ag e only can obtain
h ig h er reco g n itio n rale [2, 3, 1 11
An ap p ro ach o f u tilizin g stro k e se g m en tatio n is to use
fu zzy g e o m e tric re p re se n tatio n fo r o n lin e iso lated c h a ra c te r
re co g n itio n [9, 12], T h e re p resen tatio n is o b tain ed w ith a stro k e d e co m p o sitio n ap p ro x im ate d by a seq u en ce o f c irc u
la r a rcs, as d e sc rib e d in [10) T h e re p resen tatio n is then im
p ro v ed by G a g n e and P arizeau w ith G e n etic P ro g ram m in g
to o b tain h ig h er re co g n itio n rate Ị6Ị A n o th e r ap p ro ach is
to tran sfo rm the d y n a m ic in fo rm atio n o f o n lin e h an d w ritin g
d a ta in to a re p re se n tativ e set o f m u tu ally in d ep e n d en t fea
tu res P o ly ak o v and R yleev [ 13 1 have c o m b in e d C o sin e D e
sc rip to rs w ith iterative tran sfo rm a tio n re p ara m e teriza tio n 10
p ro v id e an efficient w ay o f re p re se n tin g a sin g le stro k e o f
o n lin e h an d w ritten d a ta by a v ecto r o f ju s t a sm all n u m b er
o f features T h e v ecto r is called O p tim iz ed C o sin e D e sc rip
to r (O C D ), w hich re p re se n ts one ty p e o f featu re set usab le
fo r reco g n itio n T h is re p re se n tatio n , how ever, is n ot c o m pletely ready fo r re co g n itio n M any c h ara cte rs are actu ally not w ritten in a sin g le stroke but in sev eral o n es O n ly o n e stro k e am o n g several stro k es o f a c h a ra c te r is not en o u g h
to reco g n ize (he ch aracter O n e can try to reco g n ize each stro k e by su p e rv ise d o r u n su p erv ised lea rn in g then to re co g
n ize each c h ara cte r by m atc h in g the re co g n ize d stro k e s w ith
d iffere n t po ssib le c o m b in a tio n s o f strokes m aking up that
Trang 25i 1 0 1 3 4 5 6 7
F(i) ] 0 0 0 0 0 0 0 4 6 5 5 8 6 0 0 3 7 3 2 3 3 -0.5 4 1 6 8 3 -0 0 0 9 0 3 4 1 3 0 0 5 2 6 2 1 8 -0 0 5 8 6 9 1 2 -0 0 0 1 2 0 2 6 7G(i> 0 0 0 0 0 0 0 -0.0338181 0.6 6 9 5 6 7 0 0 5 4 3 5 3 -0.155851 -0 0 3 4 1 8 4 -0 0 6 3 1 9 6 8 0 0 1 5 7 9 7 4
F ig u re 1 T h e o rig in a l s tro k e o f th e d ig it 0 w ith 49 s a m p lin g p o in ts (le ft) a n d its a p p ro x im a te stro ke
by 1 6 -p o in t in v erse D C T of th e fin a l C o s in e re p re s e n ta tio n (rig h t) T h e fin a l C o s in e re p re s e n ta tio n of
th e o rig in a l s tro k e is p re s e n te d in th e ta b le b elo w
c h a ra c te r [4, 5] T h is is not an effectiv e a p p ro ac h as re c o g
n itio n e rro rs a p p ea r iw ice and cum u lativ ely
In this p ap er, w e e x ten d the m eth o d p ro p o sed in [13]
to rep resen t m u ltip le stro k es o f a c h a ra c te r to g e th e r in a
sin g le set o f featu res u sing c o sin e tran sfo rm a tio n U sing
th is re p re se n tatio n , w e have d ev elo p ed an o n lin e w riter-
in d ep en d en t c h a ra c te r reco g n itio n sy stem w ith M u liiL a y er
P e rc ep tio n ( M U ’) c la ssifiers, o n e classifier fo r e ach sin g le
ch aracter W e have tested o u r system on S ectio n la (is o
lated d ig its) o f the U nip en d a ta set |7 ] and have o b tain ed
very c o m p e titiv e resu lts
T h e rest o f the p a p er is siru ctu rcd us follow s S e c
tion 2 d e s c rib e s how to o b tain c o sin e rep re se n tatio n o f o n
lin e h a n d w ritte n data We th en present o u r reco g n itio n s y s
tem in S e c tio n 3 S o m e e x p erim e n ts and resu lts are p re
sen ted in S e c tio n 4
2 Cosine Representation of Online Hand
written Data
It is w id e k now n that reco g n itio n in g en eral can be
ach iev ed effe c tiv e ly w ith the use o f a sm all re p re se n ta
tive set o f m u tu ally in d ep en d en t featu res P o ly ak o v and
R y leev [13] have co m b in e d C o sin e D e sc rip to rs w ith iter
ative tra n s fo rm a tio n re p ara m e teriza tio n to p rovide an effi
cient w av o f re p re se n tin g a sin g le stroke o f o n lin e h a n d
w ritten d a ta b y a v e cto r o f ju s t a sm all n u m b er o f featu res
T he v e cto r is called O p tim iz ed C o sin e D e sc rip to r (O C D ),
w hich re p re s e n ts one lype o f feature set usable for re c o g
nitio n T h e p ro c ess c o n sists o f tw o m ain step s At the first step, the raw re p re se n tatio n o f h an d w ritten c h ara cte rs
is co n v erted into a set o f C o sin e c o efficien ts (O C D s) w ith
D iscrete C o sin e T ran sfo rm a tio n [ I ] A( the seco n d step, the set o f O C D is p ro c essed 10 o b tain inv arian ce 10 scale, tra n slatio n and ro tatio n o f the o b ject, and to p o sitio n o f the point used to start the tracing
A sin g le stro k e o f o n lin e h an d w ritten data is a seq u en ce
o f tim e -sa m p lin g po in ts T h e tran sfo rm a tio n o f this stro k e starts w ith an initial p a ram ete riz atio n w hich is o b tain ed by
re -s a m p lin g the stro k e w ilh a fixed n u m b er o f sam p lin g
p o in ts and eq u iv alen t d istan ces:
Fo = ( i / A ' ) E „ ( * « )
Fk = ( 2 / N ) E n ( * »cos(ktu)),
Go = ( l / V ) £ „ (» n).
Trang 26Í i 0 1 3 4 5 6 7
Ị F(i) 1 0 0 0 0 0 0 ■0.341623 0 0 2 0 1 4 5 7 0 4 5 9 5 0 2 -0 0 4 4 4 7 3 3 -0 0 9 8 4 3 5 9 -0 0 0 2 4 6 1 5 •0 0 4 1 9 6 3 7
1 G (i) I 0 0 0 0 0 0 0 0 4 5 7 6 8 4 -0 0 3 3 7 4 5 2 0.6 1 4 7 1 7 -0 2 1 0 4 0 9 0 0 0 1 6 4 5 5 3 0 0 3 9 0 8 6 7 -0.1 5 4 9 8
F ig u re 2 T h e o rig in a l tw o s tro k e s o f th e d ig it 4 w ith 34 an d 16 s a m p lin g p o in ts re s p e c tiv e ly (le tt) and
th e ir a p p ro x im a te s tro k e s by 16 -p o in t in v erse D C T o f th e fin a l C o s in e re p re s e n ta tio n (rig h t) T h e final
C o s in e re p re s e n ta tio n o f th e o rig in a l tw o s tro k e s to g e th e r is p re s e n te d in th e ta b le below
t„ = n(n + l /2)/A ',
n ~ 0 N - 1.
k = (J, r - 1.
H ig h e r o rd e r c o efficien ts o f the C o sin e rep re se n tatio n arc
a tte n u ated in a cc o rd a n c e w ith a p re d eterm in ed o rd e r o f
a p p ro x im a tio n Inverse tran s fo rm a tio n o f the re su ltin g a t
ten u a ted C o s in e re p re se n tatio n p ro v id es an ap p ro x im atio n
o f the in itial stro k e { x rtlỹ „ } :
T h e a p p ro x im a te d stro k e is then re p a ram ete riz ed , n o rm a l
ized and a p p lie d 10 the o rig in al stro k e 10 o b tain a su c c es
so r p a ra m e tric re p re se n tatio n w hich is co n v erted 10 the fre
qu en cy d o m ain 10 o b tain a su c c ess o r C o sin e d e sc rip to r re p
re sen ta tio n w h ich is a ls o o b ject 10 atten u atio n T h e iteratio n c o n tin u e s u n til ap p ro x im atio n o f ihe so u rc e p o lygon
m eet the p re d eterm in ed g o o d n e ss-o f-lit o r c o n v erg en ce c riterio n T h e final atte n u ated C o sin e set re p resen tatio n is then tru n ca te d in a cc o rd an c e w ith a p re d eterm in ed o rd e r o f a p
p ro x im a tio n and serv es as the d e sc rip to r set fo r reco g n itio n
F ig u re I sh ow s an e x am p le o f a stro k e o f liigil 0 and its a p proxim ate stro k e by 16-point inverse D O T o f the final C o sin e rep re se n tatio n
T h e re p re se n tatio n p ro p o sed by P o lyakov and
R y lecv [13], ho w ev er, is still noi ready for re c o g n itio n A s m any c h a ra c te rs are w ritten in several strokes,
an y stroke a m o n g those c a n n o t rep resen t ihe ch aracter
R e co u n izin g each stroke ihen the w hole c h a ra c te r by
m atch in g [he re co g n ize d stro k es w ith tem p lates m ig h t not
be an effectiv e ap p ro ach as reco g n itio n erro rs a p p ea r tw ice
an d cum u lativ ely
W e now p resen t how w e o b tain the c o sin e re p resen tatio n
o f all stro k e s o f a c h a ra c te r to g eth e r in a sin g le set o f fea
tu res In stead o f d e alin g w ith e ac h stro k e o f a ch aracter,
w e c o n sid er all stro k es o f a c h a ra c te r in th eir w ritten o rd e r
as a single se q u e n ce o f po in ts A ll ihe sa m p lin g p ro c esses
n o w are sim ila r to w h a t are d e sc rib e d above cx ccp t one ad
d itio n a l rule T h at is b oth startin g and en d in g vertices o f all stro k es m ust c o in cid e w ith sa m p lin g po in ts T h e repara-
Trang 27Fig u re 3 S o m e s a m p le s are in c o rre c tly re c o g n iz e d by o u r s y s te m F ro m left to rig h t: th e s a m p le s of
5, 0 and 8 a re re c o g n iz e d as 3, 2 and 0 re s p e c tiv e ly
m otorization p ro cess m ust is also p erfo rm ed fo llo w in g this
rule
The sa m p lin g p o in ts o f m u ltip le stro k es d u rin g p a ra m e
terizatio n now lo o k s like:
(■L (III1 i/.'M ■ • (•* tit' J Co)' (•*■ »1) > -^Sci )> • ■ • ( - I ’ Vein I )
w h ere M is the n u m b er o f stro k es; and
So = 0;
f -M-1 - -V - 1;
S i+1 = a + 1 w ith i = \ A'l - 1;
the point [x„t , y s ) c o in c id e s w ith the sta rtin g v ertex o f !-
Ih stro k e w ith i — 0 M — 1; and the point [ x Ct, y e )
c o in c id e s w ith the e n d in g vertex o f i-th stro k e w ith i =
( Ì M - 1.
F igure 2 sh o w s an e x am p le o f dig it 4 w ritten w ith (wo
stro k e s and th eir a p p ro x im ate stro k es by 16 -p o in t inverse
D C T o f a sin g le c o sin e feature set As can b e seen from the
figure, only a sin g le fe atu re set o f m u ltip le stro k e s to g eth e r
o f it c h ara cte r can still re p re se n t c o rrectly the character
3 O ur recognition system
O u r re co g n itio n sy stem c o n sists o f m u ltip le classifiers,
o n e c la ss ifier fo r e ach single ch aracter T h e p u rp o se o f
this section is n ot to p resen t a co m p re h en s iv e and c o m
p lete re c o g n itio n sy s te m b ut ra ih e r a sy stem fo r e x p e rim e n t
ing (he u se o f co sin e re p re se n tatio n in o n lin e h an d w ritin g
reco g n itio n
E ach c la ss ifier o f the sy stem is d esig n ed to accep t the
a sso c ia te d c h a ra c te r b y p ro d u cin g high o u tp u t and re ject
o th e r c h a ra c te rs b y p ro d u c in g low o u tp u t E ach c lassifier
is a M u lti-L a y er P e rc ep tro n (M L P ) N etw o rk and is train ed
w ith stan d ard o n -lin e b a c k -p ro p a e a tio n and m o m en tu m [8)
T h e d e cisio n strateg y is sim p ly to c la ssify d a ta a cc o rd in g to the m ax im u m o u tp u t from the classifiers
We have also tried to build o u r reco g n itio n w ith only
o n e sin g le c lassifier w ith m u ltip le o u tput nodes, each o u t
p u t node c o rre s p o n d in e to a character H ow ever, the result
is r.ct as g o o d as u sin g m u ltip le classifiers
4 Experiments and Results
We have c o n d u cted e x p erim e n ts on S ectio n la (isolated
d ig its) o f the U nipen data set (7] T h e set c o n ta in s 15953
d ig it sam p le s T h is is a very d ifficu lt set w ith m any bad sam p les F igure 3 sh o w s so m e bad sa m p le s that are mis-
re co g n ize d by o u r sy stem T h e s e sam p les a re even hard for
h u m an b e in e to re co g n ize co rrectly
We ra n d o m ly d ivide the d a ta set in to three sets: a training set co n ta in in g ab o u t 7 0 0 0 sam p les, a v alidation set o f about
3 0 0 0 sam p les and a tes t set o f 5 3 0 0 sam p les We train each
c la ssifier w ith the w h o le train in g set, w ith the target o f 0 9 9
fo r the sa m p le s in ten d ed for the asso c iated d ig it (accep t), and w ith the targ et o f 0.01 for Ihe sam p les in ten d ed fo r o th er
d ig its (reject) T h e learn in g rale and m o m en tu m are fixed
re sp ectiv ely at 0.1 and 0.'20 We use early slop tech n iq u e
w ith v alid atio n set to give the c la ssifier the g en eralizatio n ability
A fte r m an y e x p e rim e n ts, w e fo u n d thal a sin g le h idden
la y e r o f 20 n eu ro n s fo r each M L P c lassifier gives the best result, T he best resu lts are also o b tain ed w ith the D C T o rd er
o f 8 and sa m p lin g siz e o f 16 fo r th e c o sin e tran sfo rm atio n
Trang 28In tills paper, w e have p ro p o sed a m eth o d for re p re s e n t
ing m ultip le stro k es o f an o n lin e h a n d w ritten c h a ra c te r in
a sin g le set o f featu res u sin g c o sin e tran sfo rm a tio n U s
ing this rep re se n tatio n , w e have d ev elo p ed an o n lin e w riter-
in d ep en d en t c h a ra c te r re co g n itio n sy stem w ith M u Id L aver
P ercep tro n (M L P ) c lassifiers We have tested o u r sy stem on
S ectio n la (iso lated d ig its) o f the U nipcn d a ta set [7] and
have ob tain ed an av era g e reco g n itio n rate o f 9 5 7 7 % , w hich
is a very com p etitiv e resu lt T h e resu lt h as sh o w n the effi
c ie n cy o f using c o sin e rep re se n tatio n o f o n lin e h a n d w ritten
d aia in reco g n ilio n
In (he future, we intend to test o u r m eth o d w ith o th e r sets
o f sa m p le such as iso lated c h ara cte rs We also w ant to try
the c o sin e rep re se n tatio n w ith o th e r ty p es o f cla ssifier such
as G en elic P ro g ra m m in g (G P ) classifiers
6 Acknowledgement
T h is w ork is fin an cially su p p o rted by the G ran t o f
R esearch Funds o f V ietnam N ational U niv ersity No
Q G 0 6 0 2
References
[ I ] N Ahmed, T Natarajan, and K R Rao Discrete cosine
transform IEEE Trans C om puterS'C-TS(I), January 1974.
[2] p w Becker and K A Nielsen Pattern recognition using
dynamic pictorial information IEEE Transaction in System,
Man, Cybernetics SMC-2, July 1972.
13] J R Bellegarda D Nahamoo and K s Naihan Automatic
handwriting recognition using both static and dynamic pa
rameters United States Patent number Ỉ , 491.758 February
1996[4] s Conr.ell and A, Jain Templalc-based online ch ap 'd t'r
recognition Pattern Recognition 34( I ) January 2001
{5) S D Connell and A K Jain Learning prototypes for on
line hand written digits In Proceedings o f the I4ih Interna
tional Conference on Pattern Recognition-Volume I, 1998
(6] c Gagne and M Pari/.cau Genclic engineering of hierarchical fuzzy regional representations for handwritten charac
ter recognition International Journal o f Document Analysis
and Recognition, 8(4):223"231 September 2006.
[7] I Guyon L Schomaker, R Plamondon, M l.iberman, and
S Janet Unipen project o f on-line data exchange and recog
nizer benchmarks In Proceedings o f the !4ih International
Conference on Pattern Recognition (ICPR) 1994.
(8] M Hagan H Deimilh and M Beale Neural Network D e
sign p w s Publishing Company, 1995.
[9] J F Hebert, M Parizeau and N Ghazzali A new fuzzy geo
metric representation for on-line isolated character recogni
tion In Proceedings o f the 14th International Conference
on Pailern Recognition 1998.
f 10] X Li M Parizeau, anil R Plamondon Segmentation and re
construction of on-line handwritten scripts Pattern Recog
nition 31(6) 1998
[ l l j E Mandler R Oed and w Dosier Experiments in on
line script recognition In Proceedings o f 4th Scimdim ian
Conference in linage Analysis June 1985.
[12] M Parizeau A Lemieux and c Gagne Character recog
nition experiments using unipcn data In Proceedings o f 6th
International Conference on Document Analysis and Recog nition IICDAR), 2001
113] V G Polyakov and M A Rylecv Meiliod and apparatus lor representing image data using polynomial approximation method and iterative transformation-reparametrizaiion tech
nique United Slates I’alenl number 5,473,742, December
1995
Trang 29nese Words and Sounds Word Scientific Singapore, 1986
i 15) c c Tappert, c Y Sucn, and T Wakahara The slate of the
art in on-line handwriting recognition IEEE Transaction on
Pattern Analysis m id Machine Intelligence, 12(8) 1990
fI6 ) A Teredesai and V Govindaraju Issues in evolving gp
based classifiers for a pattern recognition task In Congress
fo r Evolutionary Computation 04 (CEC 04), 2004
[17) A Teredesai E Ralzlaf, J Subrahmonia and V Govin- duraju On-line digit recognition using off-line features
In Proceedings o f Indian Conference on Computer Vision
Graphics and Image Processing, 2002,
Trang 31C o n te n ts
Invited T a lk s
COE Program “Verifiable and Evolvable e-Society” - Realization of
Trustworthy e-Sociely by Information Science 1
Future Software Development with Components and Modular Verification 21
Nguyen Truong Thang, Takuya Katayama
Checking the Consistency o f ƯML State and Sequence Diagrams using B 32
Ninh-Thuan Truong, Jeanine Souquières
An Assumption Regeneration Approach for Component-Based
Software Verification 43
Pham N goc Hung, Nguven Truong Thang, Takuya Katayama
Applying CBR to Estimate Software Costs 53
Nguyen Ngoc Bao, Le Viet Ha, Nguyen Viet Ha
Trang 32Duration Calculus with Iteration and Software Graph in an Embedded Control Application
Pham Tran Nhu, Nguyen Van Truong
Towards Building up an m-World
The Duy Bui, Le Mirth Ngo
Resource Information Retrieval using SENS - A Scalable and Expressive Naming System
Hoaison Nguyen, Hiroyuki Morikawa, Tomonori Aoyam a
Trang 33Towards building up an m-World
T h e D uy B ui, L e M inh N goCollege of Technology Vietnam National University, Hanoi
Vietnam{ d u y b c , m i n h n l } » v n u e d u v n
A bstracl The rapid development o f mobile computing has dramatically changed the way users view and use computers With mobile computing technologies,
we can acquire, deliver and process informalion at every place Appearing in many forms such as the PalmOS, Pockel PC and Mobile Phone with increasingly diverse functions, and equipped with advanced peripheral devices such as GPS, camera and wireless adaplcr, mobile devices IS becominc a very powerful all-in-one Personal Digital Assistant (PDA) PDAs have increased the effectiveness, brought people closer and made people more dynamic and flexible In this paper, we present our research on setiing lip an m-Worid with various activi-
!ies on PDAs Our research focuses on three categories, education activities (m- Icarnmg), commerce activities (m-commerce) and service activities (m-service)
In the first category, we have built a PDA-based m-learning system which allows the sludcnls to access the learning resources and allows the sludcnts and lecturers
to exchange ideas from anywhere and at any iime In the category o f commerce activities, we have developed experimental svstem which allows the user 10 do his/her shopping with mobile phones There are various o f systems which we have developed in the calcgory o f service activities including tourist assislant and traffic jam warning system Our initial results have shown thal such an m-World
we are looking forward to is not very far from real
1 i n t r o d u c t i o n
T h e rap id d e v elo p m en t o f m o b ile co m p u tin g h as d ra m a tic ally c h an g e d the w ay users view and use c o m p u te rs [ I ], W ith m o b ile co m p u tin g tech n o lo g ies, w e can a c q u irc, d e liver an d p ro c e ss in fo rm atio n at ev ery p lace A p p e arin g in m an y form s such as the P al
m O S , P ocket PC and M o b ile Ph o n e w ith in creasin g ly diverse fu n ctio n s, and eq u ip p ed
w ith a d v an c ed p e rip h e ral d e v ic es su ch as G P S , cam era and w ire le ss adapter, m o b ile d e
v ices is b eco m in g a very po w erfu l all-in -o n e P ersona! D igital A ssistan t (P D A ) PD A s have in cre ased the effe c tiv e n ess, b ro u g h t p eo p le c lo ser and m ad e p eo p le m o re d y n am ic and flexible [2 ,3 )
In th is pap er, w e p re sen t o u r research on se ttin g up an m -W orld w ith v ario u s a c tiv ities on PD A s O u r re sea rc h fo cu ses on th ree categ o ries: ed u ca tio n a ctiv ities (m -
le a m in g ), c o m m e rc e a ctiv ities (m -c o m m e rc e ) and serv ice activ ities (m -se rv ic c) In the first categ o ry , w e have built a P D A -b ased m -!earn in g system w hich allo w s the stu d e n ts
to a cc ess the lea rn in g reso u rces and allo w s the stu d en ts and lectu rers to e x ch a n g e ideas
Trang 34v eloped ex p erim e n tal sy stem w h ic h allo w s ihc u se r to do h is/h e r sh o p p in g w ith m obile
p h o n es There are v ario u s o f sy s te m s w hich w e have d ev elo p ed in the categ o ry o f s e rvice activ ities in clu d in g traffic ja m w a rn in s svstem and to u rist assistan t
S ectio n 2 p resen ts o u r m -learn in g sy stem , w h ich e x p lo its the a d v an tag es o f m obile
co m p u tin g for e d u ca tio n activ ities A p ilo t p ro ject in m -co m m erc e is then d escrib ed
in S ectio n 3 Finally, tw o sv stem in the c ateg o ry o f se rv ice activ ities arc p resen ted in
S ectio n 4 and 5, w hich are traffic ja m w a rn in g system and to u rist a ssista n t respectively
2 M-learning system
In this research p ro ject, w e focus on the co n stru ctio n o f an e -le arn in g sy stem for h a n d held d ev ices th rough Ihe c o m m u n ica tio n o v e r w ireless netw o rk T h is sy stem b rin g s the u se rs the n iosi a d v an tag e c o n d itio n s to a cc es s e -lc a m in g reso u rces and ex ch an g e
k n o w led g e at any tim e, an y w h ere
T he o b jectiv es o f the system are:
- C re atin g a k n o w led g e e x ch a n g in e en v iro n m en t a m o n g u sers w ho jo in the system
w ith h an d -h eld d c v ic es and w ire le ss netw o rk
- A llo w in g u se rs w ith h an d -h eld d ev ices to access learn in g c o n te n ts on e -le am in g servers
- A llo w in g u sers w ith h an d -h eld d e v ic es to access o n lin e Icctures b ro a d ca sted in real-tim e from c la ss ro o m s as v id eo s tre am in g /v id eo co n feren ce
T h is is a p ilo t research p ro jec t w hich in v estig ates the p o ss ib ility o f im p le m e n tin g
e -le arn in g sy stem on h an d -h eld d ev ices S o lu tio n s are stu d ied and im p le m e n ted e x p eri
m entally A s a resu lt, this p ro jec t p ro v id es an e-le arn in g so lu tio n for h an d -h eld devices,
w hich can be d ep lo y ed w idely T h e so lu tio n allo w s u sers at a n y tim e, an y w h ere to access a variety o f e -le a m in g se rv ice s from th eir h an d -h eld d ev ices such as Pocket PC ,
m o b ile p h o n es, etc T h e users can a lso e x ch a n g e ideas an d c -le arn in g c o n te n ts w ith each
o th e r and w ith th eir lectu rers A n o th e r im p o rta n t p a n o f the p ro ject is the d esig n and
im p lem en tatio n o f a v id eo stre am in g /v id eo c o n feren ce system o v er w ire le ss netw ork for luind-hcld d ev ices in o rd e r 10 c o v er re al-tim e lecture b ro ad castin g
T h e m ain benefit b eh in d ihc p ro ject is to pro v id e a v ery flexible, very “ m o b ile” e learn in g so lu tio n T his e lim in a te s any c o n strain o f ihe p h y sical lo catio n o f the users,
e lim in a tes for the need for c o m p u te r labs U n d o u b ted ly , the co n stru ctio n o f co m p u te r labs for e -le arn in g is ex p en siv e and inflexible M oreover, c o m p u te r labs are n ev er en o u g h
fo r a large n u m b er o f stu d e n ts T he idea o f ex ch an g in g ideas and lea rn in g co n ten ts
am o n g people sittin g in the c o m p u te r labs is less m ean in g fu l than b etw een h an d -h eld
d ev ices W ith the d ev elo p m en t o f h an d -h eld d ev ices, esp ecially the d e v elo p m en t o f
sm art m o b ile p h o n es at re aso n a b le p rice, the so lu tio n p ro v id ed in th is p ro ject is b e c o m ing realistic in V ietnam , e sp e cially in the u n iv ersity en v iro n m en t
T h e w idely d ep lo y m e n t o f th is p ro jec t w ill have several seeab le im p acts T h e first
o n e is the p ro m o tio n o f c -le arn in g in o rd e r to p artly rep lace the trad itio n a l ed u catio n style T h e scco n d im pact is the e n d o rse m e n t fo r th e u n iv ersities to b eco m e real "d ig ital
u n iv ers ities” T h e th ird im p act is the red u ctio n in cost fo r b u ild in g e -le a m in g co m p u te r
Trang 35m o re e ffic ie n tly , at a n y tim e and an y w h ere.
rig 1 E-Learning with hand-held deviccs
A n o v e rv ie w o f o u r sy stem can b e seen in F ig u re I O u r system w as b u iii based on the d ie m /s e r v e r m odel T h e se rv e r p lay s (he mail) role in all I he c o m m u n ic a tio n s ami
a d m in is tra tio n s F irst o f all, a u se r lias to sig n in to ihc sy stem T h e serv er v erifies the
u se r a n d let [he u se r 10 jo in ihe sy ste m T h e serv ers also re m e m b e r the m ap betw een the u s e r 's ID an d th e u s e r 's !P address A fter th at, w h en any o th e r u se r re q u este d to
c o m m u n ic a te w ith th is user, th e se rv er w ill pass the IP a d d ress es so that th ey can co m -
m u n ic u te d irec tly F ig u re 2 sh o w s the m odel o f e x ch a n g in g learn in g c o n te n ts betw een
u sers S n a p s h o ts o f o u r sy stem can b e seen in I 'ig u rc 3
The b a s ic featu res o f o u r sy stem arc:
[.e a rn in g c o n te n t e x c h a n g in g a m o n g clients:
• T ext data: T h is featu re p ro v id es (0 a m eth o d fo r e x c h a n g in g text data It is
s im ila r to a sim p le c h at sy stem
• D ra w in g d ata: W hen jo in in g an e -le a rn in g sy stem , it is n ot en o u g h fo r the u ser
to u se o nly texl to e x ch a n g e th eir ideas and lea rn in g co n ten ts In our sy ste m , we
p ro v id e a frien d ly tool to do so - ÍI d ra w in g table T h is d ra w in g table sim u lates the w h ile boat'll in the real life w here so m e peo p le can draw on to d isc u ss their
id eas an d to e x ch a n g e kno w led g e T h is feature o ffers u sers a m ore flexible wa>
to p re sen t their th o u g h t P o ssib le d ra w in g m eth o d s are d ra w in g iinc, circle,
e llip s e , rectan g le , tex t-d raw in g , free-h an d , etc
• M u ltip le -c h o ic c q u e stio n s: O u r sy stem allow s th e users 10 ex ch an g e m u ltip le
c h o ic e q u estio n s T h is feature a llo w s ihe (c a c h e 's to giv e a tcsl for all the stu d e n ts T h is featu re a lso allo w s stu d en ts to ask cach o th e r (he a n sw e r o f a
sp e c ific m iillip le-ch o ice q u estio n T h e q u estio n s call be d o w n lo ad ed from the
se rv er, o r se n t from a clien t to a n o th e r clien t