Kĩ thuật nén Audio

Một phần của tài liệu Nghiên cứu truyền hình số HD (Trang 51 - 56)

Chương 2: Cơ sở truyền hình số độ phân giải cao HDTV

2.3 Kĩ thuật nén Audio

Có hai kỹ thuật nén chủ yếu sử dụng hiện nay là:

• Mã hoá dự đoán trước trong miền thời gian: Phương pháp này sử dụng việc mã hoá khác nhau đối với các thành phần khác nhau của các mẫu liên tiếp mà có thể khôi phục được. Việc giảm tốc độ dòng

51

bít sẽ đựoc sử dụng để mã hoá và truyền dẫn các thông tin của tín hiệu audio.

• Mã chuyển đổi trong miền tần số: Kỹ thuật này sử dụng các khối block của các mẫu audio ra từ bộ PCM đều để truyền từ miền thời gian sang miền tần số những dải băng khác nhau.

2.3.1 Nén audio không tổn hao

Nén không tổn hao cho phép khôi phục lại dòng bít thông tin nguyên thuỷ sau khi giải nén mà không gây ra tổn hao. Hệ thống này loại bỏ độ dư thừa thống kê, những thông tin tồn tại trong tín hiệu audio có thể dự báo trước từ những mẫu trước đó. Bộ nén loại này cho các tỉ số nén thấp, tỉ số tốt nhất đạt được là 2:1 nó phụ thuộc vào sự phức tạp của tín hiệu audio nguồn. Nén không tổn hao sử dụng những kỹ thuật mã dự đoán trước trong miền thời gian bao gồm:

• Thuật toán visai: Các tín hiệu âm thanh có đặc tính là lặp đi lặp lại vì vậy sẽ xuất hiện lượng dư thừa tín hiệu lớn, ngoài ra còn có những dư thừa như các tín hiệu âm thanh không liên quan đến giác quan của con người. Những thông tin được lặp đi lặp lại sẽ được loại bỏ trong quá trình mã hóa và lại đưa vào tại quá trình giải mã cuối cùng. Kỹ thuật DPCM thường đựơc sử dụng trong quá trình này. Các tín hiệu audio được phân tích thành tập hợp các dải băng con bao gồm một số lượng âm thanh rời rạc. Sau đó DPCM được sử dụng nhằm dự báo trước các tín hiệu lặp theo một đoạn chu kỳ.

Quá trình mã hoá này tạo ra sự thích ứng trở lại năng lượng tín hiệu đầu vào nhằm sửa kích cỡ bước lượng tử phù hợp.

• Các mã entropy tận dụng độ dư thừa trong cách miêu tả của các hệ số băng con đã lượng tử hoá nhằm cải thiện tính hiệu quả của quá trình mã hoá. Các hệ số lượng tử này được gửi đi theo sự tăng dần của tần số kết quả chúng có giá trị lớn tại những tần số thấp và tại những tần số cao là một dãy dài các hệ số nhỏ hoặc bằng 0. Mã có độ dài thay đổi được sử dụng như Huffman sẽ tạo ra bảng mã tối ưu thống kê các giá trị miền tần số thấp và cao.

52 2.3.2 Nén có tổn hao

Nén có tổn hao được đề cập đến bởi sự kết hợp của hai hay nhiều hơn các công nghệ xử lý mà lợi dụng đặc tính của hệ thống HAS là không thể phân biệt bởi được các thành phần phổ có biên độ lớn. Các phương pháp giảm số liệu xử lý cao có hệ số nén từ 2:1 đến 20:1, nó phụ thuộc vào quá trình nén và giải nén và vào yêu cầu chất lượng của audio. Nén có tổn hao sử dụng công nghệ mã hoá tri giác.

Nguyên lý cơ bản của nó là loại bỏ các thành phần dư thừa trong tín hiệu audio bằng cách loại bỏ các thành phần tín hiệu nằm dưới đường cong ngưỡng âm, điều này giải thích tại sao người ta gọi nén tổn hao là mất các thành phần âm. Nén có tổn hao được kết hợp từ các kỹ thuật như sau:

• Kỹ thuật “masking-che” đối với các thành phần tín hiệu trong miền thời gian và miền tần số. Tỷ lệ signal-mask được sử dụng để xác định số bít cho quá trình lượng tử hoá mỗi băng với mục đích giảm thiểu khả năng nghe thấy của âm thanh.

• Chặn mức tạp âm lượng tử cho từng âm độ của tín hiệu âm thanh bằng cách chỉ định số bít vừa đủ để chắc chắn rằng mức nhiễu lượng tử luôn nẵm dưới mức giá trị cần chặn. Tại những tần số gần với tần số tín hiệu âm thanh thì tỷ số tín hiệu trên tạp âm SNR có thể chấp nhận được là từ 20 đến 30 dB, tương đương với độ phân tách từ 4 đến 5 bít.

• Mã hoá nối: Công nghệ này khai thác sự dư thừa trong hệ thống audio đa kênh, người ta thấy rằng có rất nhiều các phần số liệu ở trong các kênh là giông nhau, do đó người ta có thể nén số liệu bằng cách mã hoá một phần số liệu chung đó trên một kênh và chỉ định cho bộ giải mã lặp lại tín hiệu đó trên các kênh còn lại.

2.3.3 Các tiêu chuẩn nén audio a. Tiêu chuẩn nén MPEG 1

Tiêu chuẩn nén MPEG 1 được phát triển trên cơ sở phối hợp của chuẩn ISO/IEC 11172 nhằm tạo ra một hệ thống nén video và audio để lưu trữ chương

53

trình với tốc độ 1,5Mbit/s. thành phần audio theo tiêu chuẩn này xá định ba lớp để mã hoá tín hiệu PCM với tần số lấy mẫu là 32;44,1 và 48 khz. Bộ mã hoá và giải mã MPEG audio được thể hiện trên hình 2.8

Ba lớp tiêu chuẩn MPEG audio đáp ứng cho các chế độ khác nhau bao gồm:

• Chế độ mono: chỉ có một kênh audio

• Chế độ dual mono: có hai kênh audio độc lập

• Chế độ stereo :các kênh âm thanh nổi

• Chế độ joint stereo :phối hợp quan hệ giữa các kênh am thanh nổi.

Sắp xếp tần số

Mã phối hợp

Mã hoã lượng tử cân bằng

Bộ đệm khung

Cảm nhận am thanh

Mở khung Tái tạo Sắp xếp

tần số Các mẫu

PCM 32 44,1

48

Số liệu phụ

Các mẫu PCM 32;44,1;48 Dòng số

nén

Dòng số nén

Số liệu phụ

CẤU TRÚC BỘ MÃ HOÁ AUDIO MPEG

CẤU TRÚC BỘ GIẢI MÃ AUDIO MPEG

Hình 2.8 Bộ mã hoá và giải mã audio MPEG

54

Hình 2.9 Dạng dòng số liệu của các lớp audio MPEG

Đặc tính của các lớp 1, 2, 3 nén MPEG audio được xác định các tham số khác nhau về tốc độ dòng sau khi nén, số mẫu trong một khối đầu vào cho mỗi kênh, cấu trúc thời gian khung, phương pháp dự đoán và các chế độ làm việc.

Lớp 1 tương ứng với tốc độ là 32 đến 448 Kbit/s, được sự dụng chủ yếu trong các băng ghi số. Lớp 2 với tốc độ tương ứng là 32 đến 384 Kbit/s, được sự dụng chủ yếu trong đĩa CD và các tiêu chuẩn nén audio số trong truyền thông đa phương tiện. Lớp 3 của nén audio MPEG có tốc độ từ 32 đến 320Kbit/s thường được sự dụng trong các ứng dụng nén với hệ số nén cao như mạng ISDN băng hẹp, truyền thông từ xa, đường truyền vệ tinh và qua mạng internet.

b. Tiêu chuẩn nén MPEG 2

Nén MPEG 2 cho audio là tiêu chuẩn mở rộng của MPEG 1 để cho các ứng dụng mới. Tiêu chuẩn MPEG 2 audio có thể áp dụng cho nhiều tốc độ khác nhau từ 32 đến 1066 Kbit/s, với chất lượng âm thanh biến đổi tuỳ theo ứng dụng.

Khung của MPEG 2 được chia làm 2 phần, một dòng bít cơ bản tương thích với chuẩn MPEG 1 và một dòng bít mở rộng. Với lớp 3 tốc độ tại 64 Kbit/s cho một kênh audio, quá trình mã hoá có thể phối hợp 5 kênh audio để tạo thành dòng bít 320 Kbit/s.

55

Để đạt được kết quả trên mỗi lớp tương ứng sẽ được mở rộng với các tính chất khác. Tần số lấy mẫu có thể được giảm còn một nửa mức tần số lấy mẫu của chuẩn nén MPEG 1 tức là 16;22,05 hoặc 24 Khz.

Nén MPEG 2 audio cho khả năng sự dụng nhiều kênh (tốc độ bít mở rộng của các kênh có thể lên đến 1Mbit/s phục vụ cho các ứng dụng tốc độ cao.

Một phần của tài liệu Nghiên cứu truyền hình số HD (Trang 51 - 56)

Tải bản đầy đủ (PDF)

(107 trang)