PHÂN TÍCH BÀI TOÁN
6.2.1 Các modul xử lý tín hiệu tiếng nó
Như đã trình bày ở trên, phạm vi chức năng này có thể được chia thành hai khối chức năng con. Tương ứng với mỗi khối này, ta có thể xây dựng một modul như sau:
Modul các thủ tục xử lý tín hiệu cơ sở
Bất kỳ một ai đã từng nghiên cứu về Lý thuyết xử lý tiếng nói đều biết đến những phép xử lý được coi là không thể thiếu được trong mọi ứng dụng liên quan đến tiếng nói như:
* Cửa số lọc Hamming.
* Tính năng lượng tín hiệu.
* Loại bỏ thành phần một chiều.
* Một số kiểu tính FFT.
Như vậy, một modul được xây dựng như một thư viện các thủ tục đảm nhiệm những nhiệm vụ trên là cần thiết và nó có thể nằm ở cấp độ thứ hai (của sơ đồ theo cấu trúc chương trình).
Modul các thủ tục cài đặt và thực hiện quá trình xử lý filter bank
Xử lý filter bank là một quá trình mà ta đưa liên tiếp các mẫu tín hiệu tiếng nói (mỗi mẫu là một số nguyên) vào vài rồi sau đó lại lấy lần lượt các vector đặc trưng của các frame (tương ứng với một số lượng nhất định các mẫu tín hiệu) ra theo cùng trình tự thời gian. Mặt khác mỗi filter bank bao gồm nhiều nhánh xử lý, mỗi nhánh có một bộ lọc thông dải và một vài bộ lọc phụ trợ khác. Cũng cần nhấn mạnh rằng, trong mỗi lần xử lý thì filter bank làm việc với một
frame. Từ các quan điểm trên ta thấy rằng nhiệm vụ của một modul thư viện cần xây dựng là:
* Cài đặt các thao tác cho dãy các bộ lọc thông dải (thực hiện trên một frame).
* Cài đặt thao tác phục vụ cho việc quản lý chuỗi đầu vào các mẫu tín hiệu tiếng nói (bao gổm cả việc tạo các frame) và chuỗi đầu ra các vector đặc trưng (vector feature).
Modul công cụ cho phép thực hiện hoàn chỉnh một quá trình xử lý Filter Bank
Như sẽ trình bày ở dưới, có các modul thư viện chuyên trách việc giao tiếp với các file âm thanh và các file tham số. Nhiệm của modul trong phần này chỉ là sử dụng các thủ tục thư viện đã xây dựng để tạo nên một thao tác chung hoàn chỉnh cho Filter Bank từ đầu vào là các file âm thanh tới đầu ra là các file tham số (lưu giữ các vector đặc trưng).