TỔNG QUAN VỀ XỬ LÝ ÂM THANH
Giới thiệu sơ lược về âm thanh & hệ thống xử lý âm thanh
Đặc tính của âm thanh tương tự
Lời nói có mục đích chính là truyền đạt thông tin, và có nhiều cách để mô tả đặc điểm của quá trình này Theo lý thuyết thông tin, lời nói có thể được hiểu là nội dung thông điệp hoặc thông tin Ngoài ra, lời nói cũng có thể được biểu thị dưới dạng tín hiệu mang nội dung thông điệp, như sóng âm thanh.
Kỹ thuật ghi âm đầu tiên dựa vào các thông số cơ, điện và trường, cho phép tạo ra nhiều phương pháp ghi âm khác nhau tương ứng với các loại áp suất không khí Tín hiệu điện áp từ microphone phản ánh áp suất không khí hoặc đôi khi là vận tốc Khi so sánh các phương pháp ghi âm, cần sử dụng một tỷ lệ thời gian nhất định để phân tích.
Là đại lượng vật lý biến thiên theo thời gian, theo không gian, theo một hoặc nhiều biến độc lập khác, ví dụ như:
Âm thanh, tiếng nói: dao động sóng theo thời gian (t)
Hình ảnh: cường độ sáng theo không gian (x, y, z)
Địa chấn: chấn động địa lý theo thời gian
Biểu diễn toán học của tín hiệu: hàm theo biến độc lập
5 download by : skknchat@gmail.com
Các tín hiệu tự nhiên thường không thể được biểu diễn bằng hàm sơ cấp, vì vậy trong quá trình tính toán, người ta thường sử dụng các hàm xấp xỉ để đại diện cho các tín hiệu này.
Hệ thống là một thiết bị vật lý, thiết bị sinh học hoặc chương trình có chức năng thực hiện các phép toán trên tín hiệu Mục đích của các phép toán này là để biến đổi tín hiệu và rút trích thông tin, quá trình này được gọi là xử lý tín hiệu.
Tín hiệu đa kênh là loại tín hiệu bao gồm nhiều tín hiệu thành phần khác nhau, cùng chung mô tả một đối tượng cụ thể Loại tín hiệu này thường được biểu diễn dưới dạng vector, giúp thể hiện thông tin chi tiết và đa chiều Ví dụ về tín hiệu đa kênh bao gồm tín hiệu điện tim (ECG), tín hiệu điện não (EEG) và tín hiệu ảnh màu RGB, tất cả đều cung cấp thông tin đa chiều về đối tượng được quan sát.
Tín hiệu đa chiều: biến thiên theo nhiều hơn một biến độc lập, ví dụ như tín hiệu hình ảnh, tín hiệu tivi trắng đen.
Tín hiệu liên tục theo thời gian: là tín hiệu được định nghĩa tại mọi điểm trong đoạn thời gian [a,b], ký hiệu x(t).
6 download by : skknchat@gmail.com
Tín hiệu rời rạc thời gian: là tín hiệu chỉ được định nghĩa tại những thời điểm rời rạc khác nhau, ký hiệu x(n).
Tín hiệu liên tục giá trị: là tín hiệu có thể nhận trị bất kỳtrong đoạn [Ymin, Ymax], ví dụ tín hiệu tương tự(analog).
Tín hiệu rời rạc giá trị: tín hiệu chỉ nhận trị trong một tập trị rời rạc định trước (tín hiệu số).
7 download by : skknchat@gmail.com
Tín hiệu analog: là tín hiệu liên tục về thời gian, liên tục về giá trị.
Tín hiệu số: là tín hiệu rời rạc về thời gian, rời rạc về giá trị.
8 download by : skknchat@gmail.com
Tín hiệu ngẫu nhiên: giá trị của tín hiệu trong tương lai không thể biết trước được. Các tín hiệu trong tự nhiên thường thuộc nhóm này.
Tín hiệu tất định: giá trị tín hiệu ở quá khứ, hiện tại và tương lai đều được xác định rõ, thông thường có công thức xác định rõ ràng
1.1.4 Phân loại hệ thống xử lý
Hệ thống xử lý thông tin được chia thành hai loại: hệ thống tương tự và hệ thống số Hệ thống xử lý số nổi bật với khả năng lập trình, dễ dàng mô phỏng và cấu hình, cho phép sản xuất hàng loạt với độ chính xác cao và chi phí thấp Tín hiệu số cũng dễ dàng lưu trữ, vận chuyển và sao lưu Tuy nhiên, nhược điểm của hệ thống này là khó thực hiện với các tín hiệu có tần số cao.
1.1.5 Hệ thống số xử lý âm thanh Độ nhạy của tai người rất cao, nó có thể phân biệt được số lượng nhiễu rất nhỏ cũng như chấp nhận tầm biên độ âm thanh rất lớn Các đặc tính của một tín hiệu tai người nghe được có thể được đo đạc bằng các công cụ phù hợp Thông thường, tai người nhạy nhất ở tầm tần số 2kHz và 5kHz, mặc dù cũng có người có thể nhận dạng được tín hiệu trên
9 download by : skknchat@gmail.com
20kHz Tầm động nghe được của tai người được phân tích và người ta nhận được kết quả là có dạng đáp ứng logarith
Tín hiệu âm thanh trong hệ thống số được chuyển đổi thành chuỗi bit rời rạc Điều này cho phép dễ dàng đếm số lượng bit trong một giây và xác định tốc độ truyền bit cần thiết để đảm bảo tín hiệu được truyền mà không bị mất thông tin.
1.1.6 Kiến trúc hệ thống số xử lý âm thanh Đối với máy tính số xử lý âm thanh, người ta thường dùng phương pháp Điều chế xung (Pulse Code Modulation , viết tắt PCM) Dạng sóng âm thanh được chuyển sang dãy số PCM như sau, xét tín hiệu hình sin làm ví dụ:
Tín hiệu gốc là tín hiệu như Hình 1.9
Sử dụng microphone để thu tín hiệu âm thanh từ không khí và chuyển đổi thành tín hiệu điện với điện áp ngõ ra khoảng ±1 volt, như thể hiện trong Hình 1.10.
Tín hiệu điện áp tương tự được chuyển đổi thành dạng số thông qua thiết bị chuyển đổi tương tự-số (ADC) Việc sử dụng bộ chuyển đổi 16 bit giúp nâng cao độ chính xác và độ phân giải trong quá trình số hóa tín hiệu.
10 download by : skknchat@gmail.com tương tự-số, tầm số nguyên ngõ ra có giá trị–32,768 đến +32,767, được mô tả như hình 1.11.
Vì số lượng điểm dữ liệu là vô hạn, việc lấy mẫu sẽ được thực hiện trong một khoảng thời gian đều đặn, không thể lấy tất cả các điểm thuộc trục thời gian Tần số lấy mẫu (sampling rate) được định nghĩa là số lượng mẫu thu thập trong một giây Hình 1.12 minh họa 43 mẫu đã được lấy.
Kết quả của việc lấy mẫu là một chuỗi gồm 43 chữ số biểu diễn cho các vị trí của dạng sóng ứng thời gian là một chu kỳ(hình 1.13).
11 download by : skknchat@gmail.com
Máy tính sẽ tái tạo dạng sóng của tín hiệu bằng cách kết nối các điểm dữ liệu, và kết quả này được thể hiện trong Hình 1.14.
Hình 1.14 Dạng sóng được tái tạo lại
Lưu ý rằng có một vài điểm khác biệt giữa dạng sóng nguyên thủy và dạng sóng tái tạo (Hình 1.9 và Hình 1.14), lý do:
A Các giá trị được tạo ra tại bộ chuyển đổi tín hiệu tương tự sang tín hiệu số là các số nguyên và được làm tròn giá trị.
B Hình dáng của tín hiệu tái tạo phụ thuộc vào số lượng mẫu được ghi nhận.
Một dãy số hữu hạn, đại diện cho tín hiệu số, chỉ có khả năng biểu diễn một dạng sóng tín hiệu tương tự với độ chính xác nhất định.
Các thuộc tính
12 download by : skknchat@gmail.com
Quá trình thu âm số diễn ra trong các studio với nhiều thiết bị phức tạp, nhưng bản chất của nó là chuyển đổi sóng âm thanh thành tín hiệu số Âm thanh thực là các sóng cơ học liên tục (analog), trong khi âm thanh số được tạo ra từ những xung điện tử rời rạc (digital) Vì vậy, âm thanh số chỉ có thể mô phỏng gần giống âm thanh thực tế thông qua các thông số đặc trưng.
Sample là thành phần nhỏ nhất trong bản nhạc số, được tạo ra thông qua quá trình lấy mẫu nhiều lần để tạo ra các xung điện tử rời rạc Mỗi mẫu đại diện cho giá trị biên độ của tần số sóng âm tại thời điểm lấy mẫu Việc lấy nhiều mẫu sẽ giúp tín hiệu số thu được chính xác hơn.
Sample Rate, also known as Sampling Rate or Sampling Frequency, refers to the number of samples taken per second, measured in Hertz (Hz) For instance, a music track with a sample rate of 44,100 Hz means that audio is sampled 44,100 times every second.
BitDepth là số lượng bit dữ liệu dùng để lưu trữ âm thanh, với các bản nhạc hiện nay thường có BitDepth là 16 bits hoặc 24 bits BitDepth càng lớn, âm thanh càng sắc nét và trung thực, vì vậy nó còn được gọi là Resolution (độ nét).
- Channel: Bằng các thuật toán, tín hiệu số sẽ được tách ra thành nhiều kênh
(Channel) sao cho khi nghe bằng hệ thống loa thích hợp sẽ có cảm giác như khi đang nghe nhạc trong không gian thực tế.
Từ 4 thông số cơ bản trên, ta không những biết được chất lượng mà còn có thể tính được dung lượng của bản nhạc Ví dụ một phút của bản nhạc có : Sample rate = 44100 Hz, BitDepth = 16 bits = 2 bytes, Channel = 2 kênh sẽ có dung lượng: 44100 đợt lấy mẫu x 2 bytes x 60 giây x 2 kênh = 10.584.000 bytes, tức khoảng 10.1 MB.
13 download by : skknchat@gmail.com
BitRate là thông số quan trọng, thể hiện dung lượng và chất lượng âm thanh số, được đo bằng Kbps (Kilobits per second) Bitrate cho phép xác định dung lượng âm thanh trong một giây, ví dụ, một phút nhạc 128 kbps có dung lượng khoảng 1 MB, trong khi bản nhạc 320 kbps thường có chất lượng tốt hơn.
CÁC KỸ THUẬT XỬ LÝ ÂM THANH
PHƯƠNG PHÁP CHUYỂN ĐỔI FOURIER RỜI RẠC
THU THẬP CÁC ĐOẠN AUDIO
5 Code chuyển đối file âm thanh sử dụng Fourier rời rạc
6 Đánh giá phân loại file âm thanh mới
Do kiến thức của chúng em còn hạn chế, bài tập của chúng em vẫn còn nhiều sai sót và hạn chế Chúng em rất mong thầy có thể góp ý và giúp sửa chữa để chúng em hoàn thiện hơn Chân thành cảm ơn thầy!
2 download by : skknchat@gmail.com
1 TỔNG QUAN VỀ XỬ LÝ ÂM THANH 4
1.1 Giới thiệu sơ lược về âm thanh & hệ thống xử lý âm thanh 4
1.1.1 Đặc tính của âm thanh tương tự 4
1.1.4 Phân loại hệ thống xử lý 9
1.1.5 Hệ thống số xử lý âm thanh 9
1.1.6 Kiến trúc hệ thống số xử lý âm thanh 10
2 CÁC KỸ THUẬT XỬ LÝ ÂM THANH 14
2.1 Kỹ thuật nén âm thanh 14
2.1.2 Mã hóa RLE(Run-length Encoding) 14
2.1.3 Giải thuật Lempel – Ziv – Welch (LZW) 15
2.1.6 Chuẩn mã hóa audio MP3 20
3 PHƯƠNG PHÁP CHUYỂN ĐỔI FOURIER RỜI RẠC 21
4 THU THẬP CÁC ĐOẠN AUDIO 23
4.2 20 đoạn hội thoại khác nhau 24
5 CODE CHUYỂN ĐỔI FILE ÂM THANH SỬA DỤNG CHUYỂN ĐỔI FOURIER RỜI RẠC(DFT) 24
5.1 Cấu trúc file nhạc wav 24
5.2 Code đọc thông tin file wav để lấy thông tin biên độ sau khi rời rạc hóa âm thanh 25
5.3 Thuật toán DFT sử dụng công thức như định nghĩa 26
3 download by : skknchat@gmail.com
5.4 Hàm sử dụng trong phương pháp FFT giúp tính toán nhanh DFT 27
5.5 Triển khai các hàm của phương pháp FFT 27
5.5.3 Hàm chuyển đổi sang miền tần số sử dụng thuật toán Cooley-Tukey nếu số lượng mẫu là lũy thừa của 2 28
5.5.4 Hàm chuyển đổi sang miền tần số sử dụng thuật toán Bluestein nếu số lượng mẫu là bất kỳ 29 5.5.6 Sử dụng FFT để tính toán nhanh DFT 31
5.6 Xây dựng vector thuộc tính trong miền tần số 32
6 Đánh giá phân loại file âm thanh mới 35
6.1 Phương pháp sử dụng trọng tâm của từng cụm 35
6.2 Phương pháp tính khoảng cách 38
4 download by : skknchat@gmail.com
1 TỔNG QUAN VỀ XỬ LÝ ÂM THANH
1.1 Giới thiệu sơ lược về âm thanh & hệ thống xử lý âm thanh Đặc tính của âm thanh tương tự
Lời nói có mục đích chính là truyền đạt thông tin, và có nhiều cách để mô tả đặc điểm của quá trình này Theo lý thuyết thông tin, lời nói có thể được hiểu là nội dung thông điệp hoặc thông tin Ngoài ra, lời nói cũng có thể được biểu thị dưới dạng tín hiệu mang nội dung thông điệp, chẳng hạn như sóng âm thanh.
Kỹ thuật ghi âm đầu tiên dựa trên các thông số về cơ, điện và trường, cho phép tạo ra nhiều phương pháp ghi âm tương ứng với các loại áp suất không khí khác nhau Tín hiệu từ microphone phản ánh áp suất không khí hoặc vận tốc dưới dạng tín hiệu tương tự Khi so sánh các phương pháp ghi âm, cần sử dụng một tỷ lệ thời gian nhất định.
Là đại lượng vật lý biến thiên theo thời gian, theo không gian, theo một hoặc nhiều biến độc lập khác, ví dụ như:
Âm thanh, tiếng nói: dao động sóng theo thời gian (t)
Hình ảnh: cường độ sáng theo không gian (x, y, z)
Địa chấn: chấn động địa lý theo thời gian
Biểu diễn toán học của tín hiệu: hàm theo biến độc lập
5 download by : skknchat@gmail.com
Các tín hiệu tự nhiên thường không thể được mô tả bằng hàm sơ cấp, vì vậy trong quá trình tính toán, người ta thường sử dụng hàm xấp xỉ để đại diện cho các tín hiệu này.
Hệ thống là thiết bị vật lý, thiết bị sinh học hoặc chương trình thực hiện các phép toán trên tín hiệu để biến đổi và rút trích thông tin, quá trình này được gọi là xử lý tín hiệu.
Tín hiệu đa kênh bao gồm nhiều tín hiệu thành phần mô tả cùng một đối tượng, thường được biểu diễn dưới dạng vector Ví dụ về tín hiệu đa kênh bao gồm tín hiệu điện tim (ECG - ElectroCardioGram), tín hiệu điện não (EEG - ElectroEncephaloGram) và tín hiệu ảnh màu RGB.
Tín hiệu đa chiều: biến thiên theo nhiều hơn một biến độc lập, ví dụ như tín hiệu hình ảnh, tín hiệu tivi trắng đen.
Tín hiệu liên tục theo thời gian: là tín hiệu được định nghĩa tại mọi điểm trong đoạn thời gian [a,b], ký hiệu x(t).
6 download by : skknchat@gmail.com
Tín hiệu rời rạc thời gian: là tín hiệu chỉ được định nghĩa tại những thời điểm rời rạc khác nhau, ký hiệu x(n).
Tín hiệu liên tục giá trị: là tín hiệu có thể nhận trị bất kỳtrong đoạn [Ymin, Ymax], ví dụ tín hiệu tương tự(analog).
Tín hiệu rời rạc giá trị: tín hiệu chỉ nhận trị trong một tập trị rời rạc định trước (tín hiệu số).
7 download by : skknchat@gmail.com
Tín hiệu analog: là tín hiệu liên tục về thời gian, liên tục về giá trị.
Tín hiệu số: là tín hiệu rời rạc về thời gian, rời rạc về giá trị.
8 download by : skknchat@gmail.com
Tín hiệu ngẫu nhiên: giá trị của tín hiệu trong tương lai không thể biết trước được. Các tín hiệu trong tự nhiên thường thuộc nhóm này.
Tín hiệu tất định: giá trị tín hiệu ở quá khứ, hiện tại và tương lai đều được xác định rõ, thông thường có công thức xác định rõ ràng
1.1.4 Phân loại hệ thống xử lý
Hệ thống xử lý được chia thành hai loại: hệ thống tương tự và hệ thống số Hệ thống xử lý số có khả năng lập trình, dễ dàng mô phỏng và cấu hình, cho phép sản xuất hàng loạt với độ chính xác cao và chi phí thấp Tín hiệu số cũng dễ dàng lưu trữ, vận chuyển và sao lưu Tuy nhiên, nhược điểm của hệ thống này là khó thực hiện với các tín hiệu có tần số cao.
Hệ thống số xử lý âm thanh cho thấy độ nhạy cao của tai người, có khả năng phân biệt những nhiễu nhỏ và chấp nhận biên độ âm thanh lớn Đặc tính của tín hiệu mà tai người có thể nghe được có thể được đo bằng các công cụ phù hợp Thông thường, tai người nhạy nhất ở tần số 2kHz và 5kHz, mặc dù một số người có thể nhận diện tín hiệu ở các tần số khác.
9 download by : skknchat@gmail.com
20kHz Tầm động nghe được của tai người được phân tích và người ta nhận được kết quả là có dạng đáp ứng logarith
Tín hiệu âm thanh trong hệ thống số được biểu diễn dưới dạng chuỗi bit, cho phép xác định số lượng tín hiệu một cách dễ dàng bằng cách đếm trong một giây Nhờ vào tính chất rời rạc của bit, việc xác định tốc độ truyền bit cần thiết để duy trì chất lượng tín hiệu mà không mất thông tin trở nên thuận tiện hơn.
Hệ thống số xử lý âm thanh thường sử dụng phương pháp Điều chế xung (PCM - Pulse Code Modulation) Trong quá trình này, dạng sóng âm thanh, chẳng hạn như tín hiệu hình sin, sẽ được chuyển đổi thành một dãy số PCM.
Tín hiệu gốc là tín hiệu như Hình 1.9
Sử dụng microphone để thu tín hiệu âm thanh từ môi trường và chuyển đổi nó thành tín hiệu điện, với điện áp đầu ra khoảng ±1 volt, như thể hiện trong Hình 1.10.
Tín hiệu điện áp tương tự được chuyển đổi thành dạng số hóa thông qua bộ chuyển đổi tương tự-số (ADC) Việc sử dụng bộ chuyển đổi 16 bit giúp cải thiện độ chính xác và độ phân giải của tín hiệu số.
10 download by : skknchat@gmail.com tương tự-số, tầm số nguyên ngõ ra có giá trị–32,768 đến +32,767, được mô tả như hình 1.11.
Do số lượng điểm dữ liệu là vô hạn, việc lấy mẫu sẽ được thực hiện trong khoảng thời gian đều đặn Tần số lấy mẫu (sampling rate) là số lượng mẫu được thu thập trong một giây Hình 1.12 minh họa 43 mẫu đã được lấy.
Kết quả của việc lấy mẫu là một chuỗi gồm 43 chữ số biểu diễn cho các vị trí của dạng sóng ứng thời gian là một chu kỳ(hình 1.13).
11 download by : skknchat@gmail.com
Máy tính sẽ tái tạo dạng sóng của tín hiệu bằng cách kết nối các điểm dữ liệu, và kết quả của quá trình này được thể hiện trong Hình 1.14.
Hình 1.14 Dạng sóng được tái tạo lại
Lưu ý rằng có một vài điểm khác biệt giữa dạng sóng nguyên thủy và dạng sóng tái tạo (Hình 1.9 và Hình 1.14), lý do:
A Các giá trị được tạo ra tại bộ chuyển đổi tín hiệu tương tự sang tín hiệu số là các số nguyên và được làm tròn giá trị.
B Hình dáng của tín hiệu tái tạo phụ thuộc vào số lượng mẫu được ghi nhận.
Một dãy số hữu hạn, đại diện cho tín hiệu số, chỉ có khả năng biểu diễn một dạng sóng tín hiệu tương tự với độ chính xác có giới hạn.
12 download by : skknchat@gmail.com
CODE CHUYỂN ĐỔI FILE ÂM THANH SỬA DỤNG CHUYỂN ĐỔI FOURIER RỜI RẠC(DFT)
Cấu trúc file nhạc wav
24 download by : skknchat@gmail.com
Code đọc thông tin file wav để lấy thông tin biên độ sau khi rời rạc hóa âm thanh
25 download by : skknchat@gmail.com
Thuật toán DFT sử dụng công thức như định nghĩa
Phương pháp này không thích hợp cho việc áp dụng trong thời gian thực Do đó, nhóm chúng tôi đã sử dụng thuật toán FFT để tính toán DFT một cách nhanh chóng và hiệu quả.
Hàm sử dụng trong phương pháp FFT giúp tính toán nhanh DFT
26 download by : skknchat@gmail.com
Triển khai các hàm của phương pháp FFT
5.5.1 Hàm FFT:Transform Đây là hàm kiểm tra số lượng mẫu chứa trong file wav, nếu số lượng mẫu là lũy thừa của 2 thì áp dụng thuật toán Cooley-Tukey.
Chi tiết thuật toán như sau
27 download by : skknchat@gmail.com
5.5.2 Hàm inverseTransform Đây là hàm chuyển đổi ngược IDFT Chi tiết như sau
5.5.3.Hàm chuyển đổi sang miền tần số sử dụng thuật toán Cooley-Tukey nếu số lượng mẫu là lũy thừa của 2 Đây là phương pháp tính toán DFT chia thành 2 phần 1 phần bao gồm n(chỉ số chạy trong công thức DFT) thành n chẵn và n lẻ
28 download by : skknchat@gmail.com
5.5.4.Hàm chuyển đổi sang miền tần số sử dụng thuật toán Bluestein nếu số lượng mẫu là bất kỳ Đây là phương pháp tổng quát để tính toán DFT một cách nhanh chóng tuy nhiên thuật toán này chậm hơn Cooley-Tukey vài lần Chi tiết thuật toán như sau:
29 download by : skknchat@gmail.com
30 download by : skknchat@gmail.com
5.5.6 Sử dụng FFT để tính toán nhanh DFT
Nhóm chúng tôi đã kiểm chứng công thức DFT theo định nghĩa và áp dụng FFT để tính toán nhanh DFT Kết quả thu được cho thấy phổ trong miền tần số là giống nhau, được trình bày trong hai file sau: out.dat và ou1.dat.
31 download by : skknchat@gmail.com
5.6 Xây dựng vector thuộc tính trong miền tần số
Nhóm em trích xuất ra 7 thuộc tính trong miền tần số của dữ liệu âm thanh bao gồm
Năng lượng trung bình (avergeEnergy)
Tần số ứng với biên độ lớn nhất(frequencyWithmagnitudemax)
Tần số ứng với biên độ nhỏ nhất(frequencyWithmagnitudemax)
Tần số lớn nhất(maxMagnitude)
Tần số nhỏ nhất(maxMagnitude)
Năng lượng trung bình trong dải băng thông(energyInbandWidth)
Các thuộc tính được định nghĩa trong một struct như sau
Kết quả trích xuất các thuộc tính của 2 loại nhạc và hội thoại nhóm em đưa ra 2 file dữ liệu là nhạc và hội thoại như sau
32 download by : skknchat@gmail.com
Thuộc tính file hội thoại
33 download by : skknchat@gmail.com
Đánh giá phân loại file âm thanh mới
Phương pháp sử dụng trọng tâm của từng cụm
Bằng cách trích xuất các thuộc tính trong miền tần số của hai cụm, nhóm chúng tôi đã xác định được trọng tâm của từng cụm Trọng tâm này được tính toán và lưu trữ trong file tương ứng, như thể hiện trong hình dưới đây.
35 download by : skknchat@gmail.com
Các thuộc tính trong miền tần số tương ứng với trọng tâm của 20 file âm nhạc
Các thuộc tính trong miền tần số tương ứng với trọng tâm của 20 file hội thoại
36 download by : skknchat@gmail.com
Bằng cách trích xuất thuộc tính miền tần số từ file âm thanh cần phân loại và áp dụng công thức L1-norm để tính khoảng cách giữa file âm thanh đó và trọng tâm của từng cụm, chúng ta có thể xác định xem file âm thanh có thuộc về cụm nào hay không Nếu khoảng cách nhỏ hơn một ngưỡng nhất định, ta có thể kết luận rằng file âm thanh đó thuộc về cụm âm thanh tương ứng.
37 download by : skknchat@gmail.com
Phương pháp tính khoảng cách
Phương pháp thứ hai mà nhóm em áp dụng là tính toán khoảng cách giữa file âm thanh cần phân loại và tất cả các file trong từng cụm Chúng em cộng tổng các khoảng cách này bằng cách sử dụng công thức L1-norm cho các thuộc tính được trích xuất trong miền tần số Nếu khoảng cách đến một cụm nào đó nhỏ hơn, chúng em có thể kết luận rằng file âm thanh cần phân loại thuộc về cụm âm thanh tương ứng.
38 download by : skknchat@gmail.com
39 download by : skknchat@gmail.com