Các chuẩn nén JPEG và MPEG

Một phần của tài liệu Nghiên cứu truyền hình số HD (Trang 45 - 51)

Chương 2: Cơ sở truyền hình số độ phân giải cao HDTV

2.2 Kĩ thuật nén tín hiệu video

2.2.6 Các chuẩn nén JPEG và MPEG

Các tiêu chuẩn nén video ra đời nhằm đạt được các mục đích trình bày chi tiết các dư thừa thông tin, tín hiệu dư thừa di cảm nhận của mắt người, qua đó giảm tốc độ dòng video số, đưa ra dòng số liệu video đã được nén theo một khuôn dạng

45

nhất định có thể sử dụng cho các yêu cầu sản xuất chương trình cũng như để lưu trữ hay truyền dẫn chương trình.

JPEG là tên một tổ chức nghiên cứu về các chuẩn nén cho ảnh đa tần liên tục được thành lập vào năm 1982. Năm 1986, JPEG chính thức được thiết lập nhờ sự phức hợp giữa nhóm ISO/IEC và ITV. Tiêu chuẩn này được ứng dụng cho nhiều lĩnh vực như: Lưu trữ ảnh, Fax màu, truyền ảnh báo chí, ảnh cho y học, camera số...

JPEG được định ra cho nén ảnh tĩnh đơn sắc và màu, thực hiện bởi bốn chế độ mã hoá. Đó là:

• Mã hoá tuần tự: ảnh được mã hoá theo kiểu quét từ trái sang phải, từ trên xuống dưới dựa trên khối DCT.

• Mã hoá luỹ tiến: ảnh được mã hoá bằng kiểu quét phức hợp theo chế độ phân giải không gian cho các ứng dụng trên các kiểu băng hẹp và do đó thời gian truyền dẫn có thể dài.

• Mã hoá không tổn thất: ảnh được đảm bảo khôi phục chính xác cho mỗi giá trị mẫu của nguồn. Thông tin không cần thiết sẽ bị cắt bỏ cho nên cho hiệu quả nén thấp hơn so với phương pháp nén có tổn thất.

• Mã hoá phân cấp: ảnh được mã hóa ở chế độ phân giải không gian phức hợp, để cho những ảnh có độ phân giải thấp có thể được truy xuất và hiển thị mà không cầm giải nén như các ảnh trong có độ phân giải trong không gian cao hơn.

Thuật toán đơn giản nhất là chế độ DCT trên là JPEG Baseline, và nó được sử dụng rộng rãi nhất trong các thuật toán nén JPEG.

+ Mã hoá và giải mã JPEG:

46

DCT

Lượng tử hoá Mã hoá

entropy Số liệu ảnh

nén

Bảng lượng tử Bảng mã

hoá Block 8.8

MÃ HOÁ

Giải mã entropy

Giair lượng tử

Bảng mã hoá

Bảng lượng tử Số liệu ảnh

nén IDCT

BLOCK 8.8

GIẢI MÃ

Hình 2.7 Sơ đồ khối thuật toán mã hoá và giải mã JPEG

Quá trình mã hoá và giải mã là hai quá trình ngược nhau. Bộ mã hoá cho ra dòng số liệu sau khi nén và sau đó được đưa tới phần giãn (giải mã). ở bộ giải nén, bộ mã hoá entropy biến đổi dòng bít được nén thành một bảng zig-zag mới có các hệ số DCT. Các hệ số này được nhân với các hệ số giải lượng tử hoá và đưa đến quá trình biến đổi DCT ngược. Đầu ra ta có khối 8x8 pixels có thể không tạo lại một ảnh chính xác tín hiệu gốc vì thông tin bị mất trong quá trình mã hoá ảnh (nén có tổn hao).

Tiêu chuẩn JPEG bao gồm một phân cấp cấu trúc số liệu video nhằm tạo điều kiện thuận lợi cho việc biến đổi các hình ảnh được mã hoá. Các thông số mã hoá như dạng làm việc của JPEG, kích thước và tần số ảnh, độ chi tiết điểm ảnh, độ chính xác của lượng tử, các bảng mã đều được cộngvào dòng số liệu đựơc truyền

47

đi. Cấu trúc của JPEG gồm có 6 cấp khác nhau phụ thuộc vào chế độ làm việc của JPEG:

- Đơn vị số liệu (DU): Bao gồm một khối 8x8 các mẫu thành phần trong dạng nén mất thông tin.

- Đơn vị mã hoá nhỏ nhất (MCU): Là nhóm nhỏ nhất các DU xen kẽ.

Trong sử dụng nén DCT theo tiêu chuẩn CCIR 601, MCU bao gồm hai khối Y, một khối CR, một khối CB.

- Đoạn mã Entropy (ECS): Gồm một số các MCU. Đoạn mã entropy cho phép giảm kích thước cho khôi phục từ giới hạn ngắt của số liệu mã entropy.

- Quét: Tiêu chuẩn xác định phương pháp quét cho toàn bộ ảnh.

- Khung hình: Có thể được tạo thành từ một hay nhiều quá trình quét.

- Lớp ảnh: ảnh là lớp trên cùng củ phân cấp số liệu nén bao gồm lớp khung và các mã cho toàn bộ một bức ảnh.

Trên quan điểm hình ảnh động là một chuỗi liên tiếp các hình ảnh tĩnh. Khi đó tiêu chuẩn JPEG được áp dụng cho việc nén ảnh động và nó có tên gọi là M-JPEG.

Nén M-JPEG chỉ thực hiện trong ảnh cho nên hiệu quả nén thấp (tỉ số nén thấp). Khi nén với tỉ số nén cao sẽ xuất hiện các ô vuông trên ảnh khôi phục, đó là các đặc trưng của hệ số DCT, nếu mã hoá nhiều lần thì hiệu ứng trên sẽ tăng lên.

Chuẩn nén M-JPEG có ưu điểm khi sử dụng trong các công nghệ sản xuất chương trình truyền hình. Vì các ảnh được mã hoá độc lập với nhau nên việc thực hiện dựng chính xác đến từng ảnh là hoàn toàn có thể được, đây chính là điểm mạnh của M-JPEG sử dụng trong các thiết bị sản xuất chương trình tiện dụng cho studio và dựng hậu kỳ, làm kỹ xảo với giá thành hệ thống phù hợp, không gây tổn hao trong quá trình dựng. Tuy nhiên đối với các thiết bị dựng M-JPEG có các nhược điểm: Do M-JPEG được phát triển từ chuẩn JPEG là một tiêu chuẩn nén ảnh tĩnh nên mặc dù sử dụng một phương pháp nén M-JPEG trong các thiết bị của mình, các sản phẩm của các nhà máy khác nhau cũng không hoàn toàn giống nhau về mặt biểu diễn cũng như phương pháp xử lý đối với tín hiệu video được nén.

48

Chính vì thế các thiết bị này rất khó có thể trao đổi trực tiếp số liệu cho nhau. Nói cách khác, khi nối ghép các thiết bị trực tiếp với nhau, tín hiệu đã được nén nhất định phải qua các quá trình mã hoá, giải mã và điều đó luôn luôn dẫn tới chất lượng của hình ảnh bị suy giảm. Hơn nữa khu chuyển đổi về dạng không nén để truyền giữa các thiết bị với nhau, tốc độ bít sẽ rất lớn và điều này là một trở ngại thực sự khi toàn bộ buồng máy trong trung tâm truyền hình được ghép nối với nhau thành một mạng hoạt động có tác dụng tương hỗ. Các thiết bị nén M-JPEG không thể sử dụng cho truyền dẫn, phát sóng vì tốc độ dòng bít sau khi được nén còn cao.

b. Chuẩn MPEG

MPEG là chuỗi các chuẩn nén video với mục đích mã hoá tín hiệu hình ảnh và âm thanh cho DSM (Digital storage media) ở tốc độ bít từ 1,5 tới 50 Mb/s. Các chuẩn nén được biết đến như MPEG-1, MPEG-2, MPEG-3... tiến tới tối ưu hoá cho những ứng dụng video độngvà các đặc điểm của nó cũng bao gồm một thuật toán cho việc nén dữ liệu audio với tỉ lệ nén khoảng 5:1đến 10:1

MPEG-1: Dùng cho ghi hình trên băng từ và đĩa quang (CD), đồng thời truyền dẫn trong các mạng như mạng máy tính.

MPEG-2: Sử dụng cho các ứng dụng cao hơn để truyền tín hiệu truyền hình số thông thường. Chuẩn MPEG-2 cũng cho phép mã hoá tín hiệu video với hàng loạt các ứng dụng đòi hỏi có thể phân tích ảnh theo các cách khác nhau như thông tin video trên mạng ISDN sử dụng ATM.

MPEG-3: Nén tín hiệu số để truyền tín hiệu truyền hình độ phân giải cao. Năm 1992, MPEG-3 kết hợp với MPEG-2 dùng cho truyền hình thông thường và truyền hình có độ phân giải cao và được gọi chung là MPEG-2.

MPEG-4: Dành cho nén ảnh video với ít khung hình và yêu cầu làm tươi chậm, tiêu chuẩn này nhằm mục đích phát triển các tiêu chuẩn mã hoá mới có tốc độ bít rất thấp.

49

MPEG-7: Mô tả thông tin của nhiều loại đa phương tiện. Mô tả này sẽ kết hợp với chính nó cho phép khả năng tìm kiếm nhanh và hiệu quả theo tiêu chuẩn người dùng.

MPEG được gọi là “giao thức mô tả nọi dung đa phương tiện”. Tiêu chuẩn MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh, tức là phương pháp nén có tổn hao dựa trên biến đổi DCT và bù chuyển động. Tiêu chuẩn MPEG không biểu diễn cấu trúc bộ mã hoá một cách chính xác, chỉ đặc trưng chính xác các thuật toán nén và kích thước dòng số liệu. Cấu trúc một hệ thống MPEG cơ bản gồm có các khối:

• Bộ đồng bộ và dồn kênh tín hiệu audio và video

• Hệ thống Audio

• Hệ thống Video

MPEG định nghĩa các loại ảnh khác nhau cho phép sự linh hoạt để cân nhắc giữa hiệu quả mã hoá truy cập ngẫu nhiên. Các loại ảnh đó như sau:

ảnh loại I: Là ảnh được mã hoá riêng, tương tự như việc mã hoá ảnh tĩnh trong JPEG. ảnh I chứa đựng dữ liệu để tái tạo lại toàn bộ hình ảnh cì chúng đựơc tạo thành bằng thông tin của chỉ một ảnh. ảnh I cho phép truy cập ngẫu nhiên tuy nhiên đạt được tỷ lệ nén thấp.

ảnh loại P: Là ảnh được mã hoá có bù chuyển động từ ảnh I hoặc P phía trước (ảnh dự đoán trước). ảnh P cung cấp cho hệ số nén cao hơn ảnh I và có thể sử dụng làm một ảnh so sánh cho việc bù chuyển động cho các ảnh P và B khác.

ảnh loại B: Là ảnh được mã hoá sử dụng bù chuyển động từ các I hoặc P ở phía trước và ở phía sau (ảnh dự đoán hai chiều) ảnh B cho tỷ lệ nén cao nhất, bên cạnh đó việc sử dụng ản B còn có một số ưu điểm: giải quyết được các vấn đề thay đổi ảnh cũng như không dự báo trước được sự thay đổi về nội dung của hình ảnh;

Việc sử dụgn bù chuyển động từ hai ảnh cho tỷ số tín hiệu trên tạp âm tốt hơn nếu như chỉ sử dụng bù chuyển động từ một ảnh. Vì ảnh B kông sử dụng là ảnh so sánh cho các ảnh khác, nó có thể mã hoá với số lượng bit thấp và khôgn gây lỗi trễ đường truyền.

50

ảnh loại D: Là ảnh được sử dụng trong MPEG-1 và MPEG-4 nhưng không được sử dụng trong MPEG-2. Nó giống như ảnh I tuy nhiên chỉ có thành phần 1 chiều ở đầu ra DCT đựơc thể hiện.

Nhóm ảnh (GOP) : Đối với MPEG, chất lượng ảnh không chỉ phụ thuộc vào tỷ lệ nén trong từng khuôn hình mà còn phụ thuộc vào độ dài của nhóm ảnh. Nhóm ảnh là khái niệm cơ bản của MPEG. Do MPEG sử dụng ba loại ảnh I, P, B, trong đó ảnh P, B không phải là ảnh hoàn chỉnh mà chỉ chứa đựng sự khác biệt giữa ảnh đó với ảnh xuất hiện trước nó (đối với P) hay chỉ sự khác biệt đối với cả hai khuôn hình xuất hiện trước và sau nó (đối với B). Nên để có được một khuôn hình hoàn chỉnh ảnh P và B cần phải có dữ liệu các ảnh lân cận, chính vì thế khái niệm nhóm ảnh được sử dụng. Mỗi GOP bắt buộc phải bắt đầu bằng ảnh hoàn chỉnh I và tiếp theo là một loạt các ảnh P và B, nhóm ảnh có thể mở hoặc đóng. Nhóm ảnh mở luôn bắt đầu bằng một ảnh I và kết thúc ở một ảnh I tiếp theo, tức là ảnh cuối cùng của GOP dùng hình ảnh đầu tiên của GOP tiếp theo làm ảnh chuẩn. Nhóm ảnh đóng (cấu trúc khép kín) không sử dụng thông tin của các GOP khác để dự đoán ảnh, ảnh cuối cùng của một nhóm ảnh loại này bao giờ cũng là một ảnh P. Nhóm ảnh được xác định bởi hai thông số n và m. Thông số m xác định số khung hình P và khung hình B xuất hiện giữa hai khung hình I gần nhau nhất, số n xác định số khung hình B xuất hiện giữa hai khung hình P. Tỷ lệ nén video của MPEG phụ thuộc rất nhiều vào độ dài của GOP, tuy nhiên GOP dài thường gây khó khăn cho quá trình tua, định vị, sửa lỗi vì vậy tuỳ vào từng khâu (sản xuất, dựng hình, phát sóng, truyền dẫn...) mà ta có độ dài GOP phù hợp

Một phần của tài liệu Nghiên cứu truyền hình số HD (Trang 45 - 51)

Tải bản đầy đủ (PDF)

(107 trang)