Lý do lựa chọn đề tài
Video hiện chiếm khoảng 75% tổng dữ liệu truyền tải toàn cầu và tỷ lệ này đang gia tăng, dự kiến sẽ tiếp tục phát triển trong tương lai Sự ra đời của video siêu cao độ phân giải, dải động cao, gam màu rộng, và tốc độ khung hình cao sẽ tạo ra những thách thức mới Do đó, nhu cầu về công nghệ mã hóa video hiệu quả trở nên cấp thiết hơn bao giờ hết.
Kể từ khi Habibi đề xuất khái niệm mã hóa kết hợp vào năm 1974 và Forchheimer phát triển khung mã hóa không gian-thời gian vào năm 1981, mã hóa video kết hợp (HVC) đã được áp dụng rộng rãi trong các chuẩn mã hóa hình ảnh/video như JPEG, H.261, MPEG2, H.264/AVC và H.265/HEVC Hiệu suất mã hóa video đã cải thiện khoảng 50% sau mỗi 10 năm, tuy nhiên, độ phức tạp tính toán và bộ nhớ cũng tăng lên Hiện nay, ngành công nghiệp đang đối mặt với những thách thức lớn trong việc cải thiện hiệu quả mã hóa để đáp ứng yêu cầu kỹ thuật của các ứng dụng phương tiện thông minh và công nghệ hiện đại như nhận diện khuôn mặt, theo dõi đối tượng và truy xuất hình ảnh.
Với sự gia tăng nhanh chóng của các thiết bị video như máy quay cầm tay, mạng cảm biến video và điện thoại di động đa phương tiện, việc mã hóa độ phức tạp thấp trở nên cần thiết để phù hợp với công suất và mức tiêu thụ năng lượng của các thiết bị này Để đáp ứng nhu cầu truyền thông video, mã hóa video phân tán (DVC) đã được phát triển dựa trên lý thuyết Slepian-Wolf và Wyner-Ziv.
DVC có thể được phát triển theo hai cách tiếp cận chính Cách tiếp cận đầu tiên, được đề xuất bởi nhóm nghiên cứu tại Đại học Stanford, tập trung vào việc mã hóa toàn bộ khung hình Trong phương pháp này, video đầu vào được chia thành hai loại: khung hình chính (Key frame) và khung hình Wyner-Ziv (WZ frame) Các khung chính được mã hóa bằng các bộ mã hóa chuẩn với cấu hình phức tạp thấp như H.263 Intra hoặc H.264/AVC Intra, trong khi các khung WZ được mã hóa bằng các bộ mã hóa kênh.
9 mã turbo hoặc mã LDPC [5], kết hợp với ƣớc lƣợng giá trị của khung hình tại phía thu
Phương pháp mã hóa khối PRISM là một cách tiếp cận thứ hai, trong đó kết hợp với các khối được mã hóa theo phương pháp truyền thống, như mã hóa trong khung.
Intra coding kết hợp với mã kênh BCH giúp bộ mã hóa chuyển giao các phần phức tạp, như ước lượng chuyển động, từ phía phát sang phía thu.
Phương pháp xử lý thông tin video truyền thống yêu cầu cả phía phát và phía thu tạo dự đoán, dẫn đến việc phía phát phải thực hiện nhiều nhiệm vụ phức tạp để xác định và gửi thông tin dư thừa Ngược lại, trong phương pháp mã hóa video phân tán, phía thu đảm nhận việc tạo dự đoán thông qua bộ thông tin phụ, trong khi phía phát chỉ cần truyền đi sự khác biệt giữa thông tin gốc và thông tin phụ Nhờ đó, thời gian mã hóa được giảm đáng kể, mang lại hiệu quả cao hơn trong xử lý video.
Mã hóa video truyền thống và mã hóa video phân tán
Sự ra đời của chuẩn mã hóa H.265/HEVC đã giảm khoảng 50% lượng bit so với H.264/AVC, tạo động lực cho nghiên cứu cải tiến mô hình mã hóa phân tán DVC Luận văn này tập trung vào việc nghiên cứu và xây dựng mô hình mã hóa video phân tán thế hệ mới, dựa trên chuẩn H.265/HEVC và mô hình tạo thông tin phụ mới.
W W Độ phức tạp phía mã hóa cao Độ phức tạp phía giải mã thấp
W W Độ phức tạp phía mã hóa thấp Độ phức tạp phía giải mã cao
Mục đích nghiên cứu
Luận văn tập trung tìm hiểu về chuẩn mã hóa video thế hệ mới H.265/HEVC
Mô hình mã hóa video phân tán DVC được nghiên cứu nhằm cải tiến thông tin phụ cho mã hóa video thế hệ mới H.265/HEVC.
Đối tƣợng nghiên cứu
Nghiên cứu, cải thiện chất lƣợng thông tin phụ trong mô hình DVC
- Mô hình mã hóa video phân tán DVC-HEVC
- Các chuỗi video với khung hình thước nhỏ do sử dụng mã video phân tán
Phạm vi và phương pháp nghiên cứu
Luận văn cung cấp cái nhìn tổng quan về mã hóa video, đặc biệt là chuẩn HEVC và mã hóa video phân tán DVC, với trọng tâm vào mô hình DVC dựa trên kiến trúc DISCOVER Bài viết sẽ phân tích cách hình thành thông tin phụ từ mô hình kiến trúc này.
- Khảo sát và nghiên cứu lý thuyết
- Phương pháp thu thập thông tin bằng cách nghiên cứu tài liệu kết hợp với kết quả thực nghiệm
- Tìm hiểu mô hình mã hóa video dự đoán chuẩn H.265/HEVC và mô hình mã hóa video phân tán DVC
- Nghiên cứu và đƣa ra cải tiến tạo thông tin phụ
- Phân tích và đánh giá.
Cấu trúc luận văn
Nội dung chính của luận văn được trình bày qua 5 chương:
Chương 1: Tổng quan về mã hóa video dự đoán HEVC và mã hóa phân tán DVC
Chương này giới thiệu về bối cảnh của nghiên cứu mã hóa video và cấu trúc tổng quan mã hóa video
Chương 2: Xây dựng mô hình mã hóa video tiên tiến thế hệ mới trên nền chuẩn H.265/HEVC
Chương này giới thiệu kiến trúc tổng quan về mã hóa video phân tán sử dụng HEVC cho mã hóa intra, đồng thời trình bày mô hình tạo thông tin phụ mới Bên cạnh đó, bài viết cũng đề cập đến ứng dụng của mã hóa DVC trong việc cải thiện hiệu quả năng lượng tiêu thụ của các cảm biến.
Chương 3: Mô phỏng và đánh giá
Chương này sẽ đưa ra các kịch bản mô phỏng và đánh giá tính hiệu quả của mô hình mã hóa video phân tán thế hệ mới, DVC-HEVC
Kết luận sẽ tổng quát lại những kết quả lý thuyết và mô phỏng từ chương 1,2,3 và đƣa ra những nhận xét
TỔNG QUAN VỀ MÃ HÓA VIDEO DỰ ĐOÁN HEVC VÀ MÃ HÓA PHÂN TÁN DVC
Giới thiệu chung
Trong những năm gần đây, việc truyền tải và lưu trữ video đã trở nên phổ biến hơn nhờ vào sự giảm giá của các sản phẩm như máy quay video HD, TV màn hình lớn và thiết bị lưu trữ Đồng thời, sự phát triển của các bộ vi xử lý với tốc độ cao và cải thiện đáng kể về tốc độ internet đã giúp cho việc tải phim nhanh chóng và trải nghiệm mượt mà hơn.
Nhu cầu trải nghiệm video ngày càng gia tăng, từ việc thưởng thức phim ở độ phân giải 480p và mHD 720p, giờ đây người xem đã chuyển sang Full HD 1080p Sự xuất hiện của TV 4K với độ phân giải siêu cao trong 2 năm qua càng thể hiện rõ nhu cầu này Tuy nhiên, các thiết bị lưu trữ và đường truyền internet hiện tại không đủ khả năng đáp ứng, dẫn đến việc cần có một chuẩn nén video mới hiệu quả hơn để giảm áp lực cho hệ thống.
Độ phân giải Full HD (FHD) 1920x1080 với chuẩn nén H.264 đã từng phổ biến, nhưng hiện nay đang dần bị thay thế bởi độ phân giải 4K x 2K (3840x2610) và gặp khó khăn với các độ phân giải cao hơn như 8K x 4K (7680x4320) hay Ultra HD H.264 không chỉ bị tụt hậu mà còn gặp vấn đề về dung lượng lưu trữ và khả năng xử lý hình ảnh độ nét cao, khiến cho việc xử lý hình ảnh 4K trở nên khó khăn, thậm chí bất khả thi.
H.265, hay còn gọi là HEVC (High Efficiency Video Coding), đã được Ủy ban Viễn thông Quốc tế ITU-T phê duyệt và đang được các nhà phát triển áp dụng vào sản phẩm thương mại Công nghệ này hứa hẹn mang lại khả năng nén gấp đôi so với H.264/AVC, hiện đang chiếm tới 80% nội dung video lưu trữ Nhờ vào khả năng nén vượt trội, H.265 giúp giảm băng thông cần thiết để truyền tải phim, giảm dung lượng lưu trữ và tiết kiệm chi phí cho người dùng.
13 hơn cho băng thông internet và thiết bị lưu trữ Ưu điểm vượt trội này cũng sẽ là cú hích cho thị trường thiết bị nghe nhìn 4K/UHD
Trong tương lai, chúng ta sẽ có thể xem các đoạn video trên YouTube, Facebook và các nền tảng khác với chất lượng hình ảnh cực nét mà không cần phải chờ đợi để tải về.
Vào ngày 29/2/2012, tại triển lãm Mobile World Congress, Qualcomm đã giới thiệu bộ nén mới trên tablet, cho thấy hiệu năng ấn tượng với chất lượng hiển thị tương đương nhưng dung lượng giảm gần một nửa.
Mã hóa video dự đoán chuẩn HEVC
Hình 1.1 mô tả sơ đồ kiến trúc mã hóa video theo chuẩn HEVC [7]
Hình 1.1: Sơ đồ cấu trúc mã hóa video theo chuẩn HEVC
Trong HEVC, mỗi ảnh đầu vào được chia thành các khối và mã hóa trước khi truyền tải đến bộ giải mã Ảnh đầu tiên trong chuỗi video chỉ sử dụng dự đoán trong khung, trong khi các ảnh còn lại áp dụng các chế độ mã hóa dự đoán liên khung theo thời gian Quá trình mã hóa này tối ưu hóa hiệu suất nén dữ liệu.
Tỷ lệ Lƣợng tử Ƣớc lƣợng hình ảnh
Bù chuyển động Ƣớc lƣợng chuyển động
Tỷ lệ và biến đổi ngƣợc
Phân tích điều khiển bộ lọc
Tạo khối và lọc dữ liệu
Bộ điều khiển dữ liệu chung
Dự đoán dữ liệu Điều khiển lọc dữ liệu
Hình ảnh đƣợc giải mã và lưu trong bộ đệm
Tỷ lệ Đầu ra cho video Định dạng tiêu đề và CABAC Luồng dữ liệu nhị phân đƣợc mã hóa Đầu vào là 1 video
Khung lựa chọn dữ liệu chuyển động bao gồm các ảnh tham chiếu và vector chuyển động (MV) để dự đoán các mẫu của mỗi khối ảnh Các bộ mã hóa và giải mã sử dụng kỹ thuật bù chuyển động (MC) cùng với thông tin phụ để tạo ra tín hiệu dự đoán liên khung giống nhau Tín hiệu dư thừa trong khung và liên khung được biến đổi qua phép biến đổi không gian tuyến tính, sau đó được định cỡ, lượng tử hóa, mã hóa entropy và truyền đi cùng với thông tin dự đoán Bộ mã hóa cũng xử lý giải mã để đảm bảo cả hai phía tạo ra các dự đoán giống nhau cho ảnh kế tiếp Hệ số biến đổi lượng tử được tạo lại qua định cỡ ngược và biến đổi ngược để tái tạo tín hiệu dư thừa gần đúng, sau đó được kết hợp với các tín hiệu dự đoán và đưa vào bộ lọc để làm mịn ảnh Ảnh cuối cùng được lưu trữ trong bộ đệm ảnh giải mã và sử dụng để dự đoán các ảnh tiếp theo Trong các chuẩn mã hóa trước, khung ảnh được chia thành macroblock, trong khi HEVC sử dụng đơn vị cây mã hóa (CTU), với mỗi CTU bao gồm các CTB chói và CTB màu có kích thước 16, 32 hoặc 64, cho phép nén hiệu quả hơn HEVC cũng hỗ trợ phân chia CTB thành các khối nhỏ hơn thông qua cấu trúc cây và tín hiệu hóa cây tứ phân.
Đơn vị mã hóa (CU – Coding Unit) và khối mã hóa (CB – Coding Block)
Cú pháp cây tứ phân (quadtree syntax) trong CTU cho phép chia các khối (CB) dựa trên đặc tính tín hiệu của vùng do CTB tạo ra, với gốc của cây tứ phân là CTU Kích cỡ của CB thường được xác định trong khoảng 8x8 đến kích cỡ CTB, và mỗi đơn vị mã hóa CU sẽ bao gồm một khối chói.
Hai CB màu với cú pháp tương ứng Một CTB có khả năng chứa một hoặc nhiều CU, trong đó mỗi CU được phân bổ một vùng liên quan đến các đơn vị dự báo (PUs) và một cây các đơn vị biến đổi (TUs).
Đơn vị dự đoán (PU) và khối dự đoán (PB)
Quyết định mã hóa vùng ảnh dựa trên dự đoán liên khung hoặc trong khung được thực hiện ở mức CU, với cấu trúc phân chia PU gắn liền với CU Tùy thuộc vào kiểu dự đoán, các thành phần chói và màu sẽ được phân chia thành các khối dự đoán (PB) tương ứng, mỗi PB chứa một vector chuyển động.
Đơn vị biến đổi (TU) và khối biến đổi (TB)
Dư thừa dự đoán mã hóa sử dụng các biến đổi khối với cấu trúc cây TU có gốc ở mức CU Dư thừa CB chói có thể tương tự như khối biến đổi chói hoặc tiếp tục chia thành các khối chói nhỏ hơn Điều này cũng áp dụng cho các khối màu Hàm số nguyên tương tự như hàm biến đổi cosin rời rạc (DCT) được xác định cho các khối kích thước 4x4, 8x8, 16x16 và 32x32.
Hình 1.2: Kỹ thuật phân vùng trong HEVC
1.2.2 Mã hóa trong khung (Intra coding)
Dự đoán trong khung hoạt động theo kích thước TB sử dụng các mẫu biên giải mã từ những TB lân cận để tạo ra tín hiệu dự đoán, hỗ trợ 33 hướng khác nhau với kích thước TB từ 4x4 đến 32x32 Các hướng dự đoán được minh họa trong hình 1.3 Ngoài ra, dự đoán mặt phẳng và dự đoán DC cũng có thể được áp dụng Đối với thành phần màu, các chế độ dự đoán như ngang, dọc, mặt phẳng và DC có thể được chỉ định rõ ràng, tương tự như các chế độ dự đoán thành phần chói.
Mỗi khối (CB) được mã hóa bằng các phương pháp khác nhau tùy thuộc vào loại mảng, tương tự như H.264 / MPEG-4 AVC HEVC hỗ trợ nhiều phương pháp mã hóa dự đoán trong ảnh, bao gồm Intra_Angular, Intra_Planar và Intra_DC.
Một khối (CB) trong video có thể được phân chia thành hai loại vùng (PB) là PART_2Nx2N và PART_NxN PART_2Nx2N cho thấy rằng khối không bị phân chia, trong khi PART_NxN chỉ ra rằng khối được chia thành bốn vùng bằng nhau (N = M / 2) HEVC chỉ cho phép kiểu phân chia PART_NxN khi kích thước của khối hiện tại bằng với kích thước khối tối thiểu (CU) Điều này đảm bảo rằng kích thước của các vùng luôn tương ứng với kích thước tối thiểu của khối.
CB được mã hóa bằng chế độ dự đoán trong khung, với kích thước CB không bằng kích thước CU tối thiểu Mặc dù chế độ dự đoán trong khung ở mức PB, các quá trình dự đoán thực tại vẫn hoạt động độc lập cho từng TB.
Hình 1.3: Các chế độ và các hướng cho dự đoán hình trong khung [8]
1.2.3 Mã hóa liên khung (Inter coding)
Dự đoán ảnh liên khung trong chuẩn H.265/HEVC hỗ trợ dự đoán vectơ chuyển động với độ chính xác lên đến điểm ảnh (sub-pel) Giá trị tại vị trí sub-pel được nội suy từ hai bộ lọc với 7 hoặc 8 tham số cấu hình Các khối hình sử dụng cho dự đoán ảnh liên khung rất đa dạng, bao gồm cả khối đối xứng và không đối xứng, ví dụ như 2N×2N, 2N×N, N×2N, N×N, 2N×nD, và nL×2N.
1.2.4 Phép biến đổi cosin rời rạc (DCT) và phép lƣợng tử
Phần dư từ khung gốc được trừ đi cho khung dự đoán và sau đó được chuyển đổi sang miền tần số bằng phương pháp biến đổi Cosin rời rạc Mục tiêu của việc chuyển đổi này là tách biệt các thành phần tần số thấp và loại bỏ thông tin ở thành phần tần số cao Việc giảm bớt thông tin mã hóa này thường không ảnh hưởng nhiều đến cảm nhận của mắt người về chất lượng hình ảnh.
Hình 1.4: Giá trị điểm ảnh trong miền pixel và miền DCT tương ứng
Các thành phần tần số cao thường không dễ nhận thấy bởi mắt người, vì vậy việc loại bỏ chúng được thực hiện thông qua phép lượng tử hóa Mục tiêu chính của phép lượng tử hóa là chuyển đổi tín hiệu đầu vào, cụ thể là các hệ số DCT, thành các mức lượng tử Nhờ vào quá trình này, nhiều giá trị DCT tương đương sẽ được chuyển đổi thành một giá trị lượng tử duy nhất, giúp giảm thiểu lượng thông tin cần mã hóa.
Hình 1.5: Mô hình phép lượng tử tuyến tính
Giá trị lượng tử được biểu diễn dưới dạng chuỗi ký tự số nguyên, và để truyền tải chuỗi này, cần chuyển đổi sang dạng nhị phân 0 và 1 Mã hóa entropy được áp dụng cho từng khối ảnh và giá trị lượng tử với độ dài tương ứng Chẳng hạn, mã Huffman sử dụng mã hóa độ dài biến đổi (VLC) cho mỗi ký hiệu dựa trên xác suất xuất hiện của chúng.
Để xây dựng một bộ từ mã có độ dài thay đổi, chúng ta cần tính xác suất xuất hiện của từng ký hiệu Việc này giúp tối ưu hóa việc mã hóa thông tin, như được minh họa trong bảng dưới đây.
Bảng 1.1: Giá trị lượng tử và xác suất tương ứng
Từ cây mã Huffman, ta có thể dễ dàng xác định được các từ mã tương ứng với từng ký hiệu theo nhƣ bảng sau:
Bảng 1.2: Mã Huffman và số lượng bit cần mã hóa tương ứng
Vectơ Mã Số bit (thực tế) Số bit (lý tưởng)
Mã hóa video phân tán (DVC – Distributed Video Coding)
1.3.1 Định lý Slepian-Wolf và định lý Wyner-Ziv
DVC được ứng dụng trong các cảm biến camera, với bộ mã hóa thường đơn giản và phần phức tạp được chuyển sang giải mã Bộ mã hóa DVC phát triển dựa trên lý thuyết thông tin, đặc biệt là hai định lý Slepian-Wolf và Wyner-Ziv.
Entropy thông tin là khái niệm mở rộng từ entropy trong nhiệt động lực học và cơ học thống kê, áp dụng cho lý thuyết thông tin Nó mô tả mức độ hỗn loạn trong tín hiệu từ sự kiện ngẫu nhiên, đồng thời chỉ ra lượng thông tin có trong tín hiệu, với thông tin được coi là các phần không hỗn loạn của tín hiệu.
Tốc độ mã hóa, hay còn gọi là entropy của nguồn, là mức tối thiểu cần thiết để khôi phục chính xác nguồn X tại bộ giải mã Đối với hai nguồn khác nhau, tốc độ mã hóa có thể thay đổi, nhưng vẫn giữ vai trò quan trọng trong việc đảm bảo tính chính xác của quá trình giải mã.
21 độc lập và Tốc độ mã hóa tối thiểu cho từng nguồn để giải mã không lỗi chính là entropy của từng nguồn và
Với hai nguồn thống kê phụ thuộc thì tính chất của Entropy đồng thời:
Tính chất của entropy có điều kiện:
- | : là entropy có điều kiện đặc trƣng cho độ bất định về nguồn tin
- | : là entropy có điều kiện đặc trƣng cho độ bất định về nguồn tin
Trong trường hợp cần mã hóa độc lập và thì tốc độ mã hóa tối thiểu sẽ là
Định lý Slepian-Wolf liên quan đến nén không tổn thất, trong đó các nguồn tương quan được mã hóa độc lập và sau đó được giải mã liên kết tại một bộ giải mã chung Để áp dụng định lý Slepian, cần thỏa mãn ba điều kiện nhất định.
So sánh với bộ mã hóa độc lập, bộ mã hóa này không tận dụng sự tương quan giữa các nguồn, dẫn đến yêu cầu tốc độ tối thiểu theo điều kiện (3) Ngược lại, mã Slepian-Wolf khai thác sự tương quan này, cho phép đạt được tốc độ mã hóa tương đương với mã hóa liên kết.
Định lý Wyner-Ziv là một mở rộng của định lý Slepian-Wolf, áp dụng cho mã hóa có mất mát Theo định lý này, quá trình giải mã sẽ tập trung vào việc tái tạo thông tin, sử dụng thông tin phụ có sẵn Hệ thống được thiết kế để đảm bảo xác suất lỗi nhỏ trong việc tái tạo, cho phép truyền tải thông tin với tốc độ tối ưu.
22 theo nhƣ biểu đồ Slepian-Wolf, tốc độ mã hóa X có thể đạt đƣợc về mặt lý thuyết | ( nhỏ tùy ý)
Hình 1.7: Biểu đồ vùng tỷ lệ tốc độ mã giữ hai nguồn X,Y
1.3.2 Kiến trúc mã hóa video phân tán DISCOVER
Kiến trúc mã hóa video phân tán DVC, được đề xuất và cải tiến bởi nhóm nghiên cứu F Pereira với tên gọi DISCOVER, đã chứng minh hiệu quả vượt trội so với các mô hình trước đó Hình 1.8 minh họa rõ nét cấu trúc của kiến trúc này, cho thấy sự phổ biến và tính hiệu quả của nó trong lĩnh vực mã hóa video.
Hình 1.8 Kiến trúc mã hóa video phân tán DVC DISCOVER[2]
Trong bộ mã hóa DVC DISCOVER, video được chia thành hai chuỗi chính: khung WZ và khung chính Khung chính được mã hóa theo chuẩn H.264/AVC với cấu hình Intra coding, trong khi khung WZ sử dụng phương pháp mã hóa kênh do trưởng Đại học Stanford đề xuất.
Mặc dù bộ mã hóa DISCOVER mang lại hiệu năng mã hóa cao, nhưng các nghiên cứu gần đây chỉ ra rằng cần có những cải tiến cho mô hình mã hóa video phân tán, đặc biệt là kế thừa từ chuẩn HEVC Chương 2 của luận văn sẽ trình bày một mô hình mã hóa video phân tán thế hệ mới, được phát triển dựa trên nền tảng HEVC, với một số cải tiến nhỏ tại khối tạo thông tin phụ.
Kết luận chương
Chương I đã giới thiệu và đề cập nhu cầu của mã hóa video ngày càng cao trong bối cảnh độ phân giải Full HD 1080p đã ngày một nhiều hơn Nhu cầu đó càng thể hiện mạnh mẽ hơn khi gần đây xuất hiện các TV với công nghệ hình ảnh 4K với độ phân giải siêu cao Các thiết bị lưu trữ và đường truyền internet phải chịu nhiều áp lực hơn để đáp ứng đƣợc các chuẩn phân giải mới Trong bối cảnh đó, chuẩn mã hóa video HEVC đƣợc ra đời để đáp ứng yêu cầu
Sơ đồ bộ mã hóa HEVC được trình bày trong chương này, cùng với các kỹ thuật cơ bản của mã hóa video như mã hóa trong khung và mã hóa liên khung, cũng như phép biến.
HEVC sử dụng 24 đổi cosin rời rạc, mã hóa entropy, bộ lọc khối và bù thích ứng để cải thiện hiệu suất nén Khung ảnh được chia thành các đơn vị mã hóa gọi là cây mã hóa (CTU), khác với các macroblock 16x16 mẫu thành phần chói và 8x8 mẫu thành phần màu trong các chuẩn mã hóa trước Mỗi CTU bao gồm các CTB chói và CTB màu, với kích thước linh hoạt là 16, 32 hoặc 64, giúp quá trình nén của HEVC trở nên hiệu quả và linh hoạt hơn so với các chuẩn nén trước đó.
Mạng cảm biến hình ảnh không dây đang ngày càng phổ biến nhờ khả năng thu thập dữ liệu hiệu quả trong mọi điều kiện và vùng địa lý Tuy nhiên, để giảm mức tiêu thụ năng lượng của các cảm biến, cần một chuẩn mã hóa mới nhằm đơn giản hóa quá trình mã hóa và chuyển tải phần lớn tính toán phức tạp sang phía giải mã Bộ mã hóa video phân tán DVC đã được phát triển để đáp ứng nhu cầu này Chương I đã giới thiệu về mã hóa video phân tán với hai định lý quan trọng: định lý Slepian-Wolf, liên quan đến nén không tổn thất và mã hóa độc lập của các nguồn tương quan, và định lý Wyner-Ziv, mở rộng từ định lý Slepian-Wolf với mã hóa có mất mát Định lý Wyner-Ziv nhấn mạnh việc tái tạo thông tin tại phía giải mã với thông tin phụ sẵn có Ngoài ra, chương này cũng trình bày kiến trúc mã hóa video phân tán DISCOVER, trong đó chuỗi video đầu vào được chia thành khung Wyner-Ziv và khung chính, với khung chính được mã hóa theo chuẩn H.264/AVC và khung WZ được mã hóa bằng phương pháp mã hóa kênh.
XÂY DỰNG MÔ HÌNH MÃ HÓA VIDEO TIÊN TIẾN THẾ HỆ MỚI TRÊN NỀN CHUẨN H.265/HEVC
Kiến trúc mã hóa video phân tán với bộ mã hóa H.265/HEVC
Hình 2.1 mô tả kiến trúc mã hóa video phân tán thế hệ mới, đƣợc xây dựng trên nền tảng bộ mã hóa chuẩn HEVC (DVC-HEVC)
Hình 2.1: Cấu trúc mã hóa DVC-HEVC
Kiến trúc DVC-HEVC tương tự như các kiến trúc mã hóa video thế hệ cũ, trong đó video đầu vào được chia thành hai nhóm: Key frames và WZ frames Các khung chính được mã hóa theo chuẩn HEVC với cấu hình Intra, trong khi các khung WZ được xử lý theo cách khác.
WZ được mã hóa phân tán theo các bước sau:
Chuỗi video được phân loại thành các khung WZ và các khung chính, trong đó số lượng khung WZ giữa hai khung chính phụ thuộc vào kích thước của nhóm ảnh (GOPs).
Biến đổi cosin rời rạc Lƣợng tử hóa
Biến đổi cosin rời rạc ngƣợc
Biến đổi cosin rời rạc CNM
Tạo thông tin phụ trợ
Bộ giải mã H265/HEVC intra
Bộ mã hóa H265/HEVC intra
Phía mã hóa Phía giải mã
Khung WZ đã đƣợc giải mã
Key frame Khung chính đã đƣợc giải mã
- Biến đổi không gian: một biến đổi dựa trên khối, điển hình là DCT, đƣợc áp dụng cho từng khung WZ
- Lƣợng tử hóa: Mỗi dải DCT đƣợc lƣợng tử hóa đồng nhất với một số mức phụ thuộc vào chất lƣợng mục tiêu
Mã hóa LDPC (hoặc Turbo) thực hiện việc mã hóa cho mỗi băng DCT bắt đầu từ mặt phẳng bit quan trọng nhất (MSB) Thông tin chẵn lẻ được tạo ra cho từng mặt phẳng bit sẽ được lưu trữ trong bộ đệm và gửi đến bộ giải mã khi có yêu cầu.
Bộ giải mã tạo thông tin phụ từ các khung chính đã được giải mã, với thông tin phụ cho mỗi khung WZ được ước lượng từ phiên bản nhiễu của khung gốc Chất lượng thông tin phụ càng cao thì số bit chẵn lẻ cần thiết càng giảm.
Mô hình nhiễu tương quan (CNM) được sử dụng để sửa lỗi trong khung thông tin phụ bằng cách ước tính nhiễu giữa khung thông tin phụ và khung WZ Do bộ giải mã không có khung WZ, các khung chính sẽ được giải mã trước và sau đó, cùng với vectơ chuyển động trong quá trình tạo thông tin phụ Mô hình phân phối Laplacian sẽ được áp dụng để ước tính nhiễu này.
Giải mã LDPC (Low-Density Parity-Check) và Turbo là những phương pháp quan trọng trong việc giải mã các khối mã hóa liên tiếp của các bit chẵn lẻ Bộ giải mã LDPC hoạt động dựa trên các yêu cầu từ kênh phản hồi, trong đó số lượng yêu cầu bit chẵn lẻ được xác định dựa trên mô hình ước lượng nhiễu.
Sau khi giải mã LDPC, các mặt phẳng bit được nhóm lại theo từng dải DCT để tạo thành các ký hiệu lượng tử đã được giải mã Việc thu thập tất cả các ký hiệu này cho phép tái tạo lại tất cả các hệ số DCT Sau khi hoàn tất quá trình giải mã kênh, các mặt phẳng bit liên quan đến từng DCT chuẩn cũng được kết hợp để tạo ra ký hiệu lượng tử Ký hiệu lượng tử đã giải mã sau đó được kết hợp với thông tin phụ có sẵn tại bộ giải mã nhằm khôi phục lại các hệ số DCT.
27 đƣợc xây dựng lại, một biến đổi cosine rời rạc ngƣợc (IDCT) đƣợc thực hiện và thu đƣợc khung WZ đƣợc giải mã.
Tạo thông tin phụ
Để cải thiện chất lượng thông tin phụ (SI), nhiều tài liệu đã được giới thiệu, chủ yếu tập trung vào phương pháp nội suy thay vì ngoại suy Quá trình tạo thông tin phụ bao gồm bốn bước: ước lượng chuyển động trước, ước lượng chuyển động hai chiều, lọc trung bình vectơ có trọng số và bù chuyển động khối không chồng chéo Tuy nhiên, do thiếu khung gốc ở bộ giải mã, các vectơ chuyển động được tạo ra thường không chính xác, dẫn đến thông tin phụ chất lượng thấp và hiệu quả mã hóa kém trong mã hóa video phân tán Để khắc phục vấn đề này, một phương pháp sàng lọc bù chuyển động đã được đề xuất, nhằm tinh chỉnh các khối bù sai bằng cách lựa chọn giữa các chế độ bù chuyển động trước, sau hoặc hai chiều.
Thông tin phụ cho mã hóa video phân tán có thể được tạo ra qua các phương pháp như ngoại suy khung và nội suy khung Ngoại suy khung ước tính khung tiếp theo dựa trên các khung tham chiếu trước đó, trong khi nội suy khung, hay còn gọi là MCTI (Nội suy tạm thời bù chuyển động), ước tính khung dựa trên các khung lân cận, sử dụng cả tham chiếu trong quá khứ và tương lai Kỹ thuật nội suy khung mang lại thông tin phụ chính xác hơn, giảm thiểu lỗi và giúp bộ giải mã yêu cầu ít bit chẵn lẻ hơn từ bộ mã hóa, từ đó giảm số lượng bit cần truyền Phía giải mã sẽ cố gắng dự đoán khung WZ dựa trên các khung chính.
Kỹ thuật nội suy khung đơn giản nhất nhằm tạo ra Y (dựa trên khung WZ) có thể được thực hiện bằng cách sử dụng khung chính, từ khung liền kề trước đó hoặc bằng cách nội suy giữa các khung chính k-i và k Tuy nhiên, khi áp dụng các kỹ thuật này để tạo thông tin phụ trong các chuỗi video chuyển động trung bình hoặc cao, Y chỉ là ước lượng thô của X (khung WZ) do sự tương quan giữa hai khung.
Khi xử lý video, việc nội suy khung liền kề theo thời gian có thể gặp khó khăn do yêu cầu nhiều bit chẵn lẻ hơn từ mã hóa để ước lượng chính xác Điều này dẫn đến việc tăng tốc độ bit và PSNR Để thực hiện nội suy khung, cần tìm ước lượng của khung hiện tại dựa trên chuyển động thực, từ đó bù chuyển động giữa các khung liền kề Phương pháp này sử dụng các khối với độ phức tạp thấp, giúp tương thích với hầu hết các chuẩn nén video hiện nay.
Hình 2.2: Quá trình nội suy khung
Ước lượng chuyển động trước
Cả hai khung chính đều được lọc thông thấp để cải thiện độ tin cậy của các vectơ chuyển động, giúp ước lượng các vectơ này gần hơn với trường chuyển động thực Thuật toán so khối được sử dụng để ước lượng chuyển động giữa khung chính kế tiếp và trước đó, với các tham số như kích thước cửa sổ tìm kiếm, phạm vi tìm kiếm và kích thước bước Kích thước bước, tức khoảng cách giữa các pixel trong khung chính trước, giúp giảm độ phức tạp tính toán Tuy nhiên, sơ đồ ước lượng chuyển động dựa trên khối cố định không thể nắm bắt tất cả khía cạnh của trường chuyển động, dẫn đến sự xuất hiện của các vùng chồng chéo khi nội suy khung, do vectơ chuyển động không nhất thiết cắt khung nội suy ở trung tâm của mỗi khối không bị chồng chéo.
Lọc thông thấp Ƣớc lƣợng chuyển động trước Lọc thông thấp Ƣớc lƣợng chuyển động hai chiều
Bù chuyển động hai chiều
Các vectơ chuyển động đóng vai trò là ứng viên cho mỗi khối trong khung nội suy, và vectơ nào cắt khung gần trung tâm khối hơn sẽ được chọn Mỗi khối trong hình ảnh nội suy sẽ có một vectơ chuyển động, cho phép thực hiện bù chuyển động hai chiều nhằm thu được khung nội suy hoặc xử lý thêm trong các khối tiếp theo.
Ước lượng chuyển động hai chiều với quỹ đạo tuyến tính
Khối ước lượng chuyển động hai chiều tinh chỉnh các vectơ chuyển động từ bước trước bằng cách chọn một quỹ đạo tuyến tính giữa các khung chính kế tiếp và trước đó, đi qua điểm trung tâm của các khối trong khung nội suy Phạm vi tìm kiếm được giới hạn trong một chuyển vị nhỏ xung quanh vị trí khối ban đầu, với các vectơ chuyển động giữa khung nội suy và các khung chính đối xứng nhau Cụ thể, tọa độ của khối trong khung chính trước đó và kế tiếp được xác định bởi vectơ chuyển động chia cho một nửa, vì khung nội suy có khoảng cách tương đương với cả hai khung chính.
Hình 2.3: Lựa chọn vectơ chuyển động
Hình 2.4: Ước lượng chuyển động hai chiều
MV ứng viên trong một phạm vi tìm kiếm
Làm mịn chuyển động không gian
Sau khi ước lượng chuyển động hai chiều, có thể xuất hiện các vectơ chuyển động không chính xác so với trường chuyển động thực Để cải thiện điều này, thuật toán làm mịn chuyển động không gian có thể được áp dụng Lọc trung bình vectơ có trọng số được sử dụng để loại bỏ nhiễu trong ảnh, vì tất cả các thành phần trong ảnh nhiễu đều được xem xét Bộ lọc này tìm kiếm các vectơ chuyển động ứng viên tại mỗi khối và các khối lân cận, giúp duy trì sự kết hợp không gian của các vectơ trong trường chuyển động.
Bộ lọc này được điều chỉnh thông qua một tập hợp trọng số, giúp làm mịn dựa trên lỗi dự đoán MSE của khối với từng vectơ ứng viên Bộ lọc vectơ trung bình có trọng số được định nghĩa như trong tài liệu [13].
- x 1 ,….,xN là các vectơ chuyển động của khối hiện tại trong khung đƣợc nội suy trước đó và các khối lân cận gần nhất
- w 1 ,….w N tương ứng với một tập các trọng số biến đổi thích ứng
- x wvmf đại diện cho đầu ra vectơ chuyển động của bộ lọc
Việc lựa chọn trọng số đƣợc thực hiện theo lỗi dự đoán đƣợc xác định nhƣ sau: c j j
- x c đại diện cho vectơ ứng viên của khối đƣợc làm mịn B
MSE biểu thị sự so khớp giữa khối B hiện tại trong khung chính kế tiếp và khối trong khung chính trước đó được bù chuyển động bằng vectơ x c và x j
Sau khi xác định được trường vectơ chuyển động cuối cùng, khung nội suy có thể được tạo ra thông qua việc sử dụng bù chuyển động hai chiều, theo các tiêu chuẩn trong sơ đồ mã hóa video.
Cải tiến quá trình nội suy
Hình 2.5: Quá trình nội suy khung kết hợp ước lượng chuyển động trước và sau
Sơ đồ mô tả một hướng mở rộng mới cho quá trình nội suy khung, trong đó kết hợp ước lượng chuyển động trước và sau để cải thiện chất lượng khung nội suy Khác với quá trình nội suy khung truyền thống chỉ sử dụng ước lượng chuyển động trước, phương pháp mới này ước lượng vectơ chuyển động dựa trên key frame k-i thay vì key frame k, mang lại kết quả tốt hơn cho việc tạo khung nội suy.
Quá trình nội suy khung kết hợp ước lượng chuyển động trước và sau sẽ thực hiện các bước tương tự như mô tả ở hình 2.2 Sau đó, hai kết quả nội suy sẽ được kết hợp bằng cách tính trung bình cộng để tạo ra khung nội suy cuối cùng.
Lọc thông thấp Ƣớc lƣợng chuyển động trước Lọc thông thấp Ƣớc lƣợng chuyển động hai chiều
Bù chuyển động hai chiều
Lọc thông thấp Ƣớc lƣợng chuyển động sau
Lọc thông thấp Ƣớc lƣợng chuyển động hai chiều
Bù chuyển động hai chiều
2.3 Ứng dụng DVC trong việc tiết kiệm năng lƣợng cho cảm biến
Mạng cảm biến không dây được cấu thành từ nhiều nút cảm biến được triển khai dày đặc gần đối tượng cần thu thập dữ liệu, cho phép vị trí cảm biến được xác định ngẫu nhiên Điều này rất hữu ích trong các khu vực khó tiếp cận hoặc nguy hiểm Một trong những đặc điểm nổi bật của mạng này là khả năng tự tổ chức và hợp tác giữa các cảm biến Với sự hiện diện của nhiều cảm biến gần nhau, truyền thông đa liên kết được ưu tiên sử dụng nhằm giảm thiểu tiêu thụ năng lượng và nâng cao hiệu quả truyền tín hiệu so với phương pháp truyền thông đơn liên kết.
Mạng cảm biến hình ảnh không dây được sử dụng để giám sát từ xa các khu vực địa lý, tuy nhiên, việc truyền và nhận dữ liệu hình ảnh và video đòi hỏi phải mã hóa để tiết kiệm năng lượng Mã hóa video, mặc dù cần thiết, có thể dẫn đến sự hao hụt năng lượng lớn ở các cảm biến có dung lượng pin hạn chế Vì vậy, việc đánh giá các tùy chọn mã hóa video khác nhau là rất quan trọng để thiết kế và lựa chọn kỹ thuật nén tiết kiệm năng lượng nhất cho mạng cảm biến hình ảnh không dây.
Mô hình mã hóa video dự đoán và phân tán đã được thực nghiệm và đánh giá hiệu quả năng lượng để xác định mô hình phù hợp cho các thiết bị cảm biến thực tế Kết quả cho thấy mã hóa video dự đoán có hiệu quả nén cao hơn, nhưng mã hóa liên khung tiêu tốn năng lượng nhiều hơn so với mã hóa trong khung Do đó, nén hình ảnh dựa trên mã hóa trong khung được khuyến nghị để cải thiện hiệu quả năng lượng Đối với mã hóa video phân tán, bộ mã hóa Wyner-Ziv cho thấy hiệu suất năng lượng tốt hơn so với bộ mã hóa PRISM.
Kết luận chương
Chương II mô tả kiến trúc mã hóa video phân tán thế hệ mới, được xây dựng trên nền tảng bộ mã hóa chuẩn HEVC Tương tự như các kiến trúc mã hóa video thế hệ cũ, với kiến trúc DVC-HEVC, video đầu vào đƣợc phân tách thành 2 nhóm bao gồm khung chính và khung WZ Trong khi các khung chính đƣợc mã hóa với chuẩn
HEVC cấu hình Intra, các khung WZ được mã hóa phân tán gồm các bước phân loại khung, biến đổi không gian, lƣợng tử hóa và mã hóa LDPC
Tạo thông tin phụ là kỹ thuật quan trọng trong mã hóa video phân tán, giúp giảm lỗi và lượng bit cần truyền Chương II mô tả quy trình tạo thông tin phụ qua kỹ thuật nội suy khung, bao gồm ước lượng chuyển động trước, ước lượng chuyển động hai chiều, làm mịn chuyển động và bù chuyển động hai chiều Một cải tiến trong quá trình này là kết hợp ước lượng chuyển động sau với ước lượng chuyển động trước, từ đó tạo ra khung nội suy cuối cùng bằng cách lấy trung bình cộng của hai khung nội suy Cải tiến này giúp nâng cao độ chính xác của khung nội suy.
Chương II cũng đã đề cập đến một trong những ứng dụng của mạng cảm biến hình ảnh không dây trong việc giúp các cảm biến có thể tiết kiệm năng lƣợng hơn nhờ giảm thiểu mức độ phức tạp tại phía mã hóa Bằng việc đƣa ra các thông số thực nghiệm về tiêu thụ năng lƣợng đối với mã hóa liên khung và mã hóa trong khung cũng nhƣ của mô hình mã hóa phân tán và mã hóa dự đoán, chúng ta có thể thấy đƣợc lợi ích của mô hình mã hóa phân tán nói chung và mô hình mã hóa video phân tán nói riêng trong việc giảm thiểu mức độ tiêu thụ năng lƣợng, một trong những yêu cầu bắt buộc đối với các mạng cảm biến
MÔ PHỎNG VÀ ĐÁNH GIÁ
Điều kiện đánh giá
Để đánh giá hiệu quả của thông tin phụ SI từ các kỹ thuật mã hóa Intra cho khung chính, chúng tôi đã thực hiện nhiều thí nghiệm với các chuỗi video sử dụng các chuẩn mã hóa Intra khác nhau, bao gồm H.264/AVC và H.265/HEVC.
Bài viết này đề cập đến bốn chuỗi video chuẩn QCIF: Soccer, Foreman, Coastguard và Hall Monitor, được sử dụng để khảo sát hiệu năng của các bộ mã hóa khung chính và mã hóa khung WZ, từ đó đánh giá hiệu suất chung của hệ mã hóa DVC Hiệu năng mã hóa được đo lường qua PSNR, một chỉ số chất lượng video sau khi giải mã khung chính và khung WZ, tương ứng với tốc độ Bitrate của từng khung video.
Kích thước GOP trong các phép thử nghiệm được cấu hình là 2, bao gồm 1 khung chính và 1 khung WZ, là cấu hình phổ biến trong mã hóa DVC Chất lượng mã hóa của khung chính dựa vào kỹ thuật mã hóa Intra có ảnh hưởng lớn đến chất lượng và độ tin cậy của thông tin phụ SI, từ đó tác động trực tiếp đến hiệu năng mã hóa tổng thể của bộ mã hóa DVC.
Với các mô hình mã hóa video phân tán, ứng dụng chủ yếu trong hệ thống cảm biến không dây dẫn đến kích thước khung hình nhỏ Bài viết này lựa chọn 04 chuỗi video phổ biến để đánh giá hiệu năng mã hóa DVC, bao gồm: Foreman, Hall monitor, Coastguard và Soccer Các chuỗi video này có thể tải về từ [http://trace.eas.asu.edu/yuv/].
Các thông số như kích thước, tốc độ khung hình và số khung hình được mô tả chi tiết trong bảng 3.1, trong khi hình ảnh đầu tiên của các chuỗi video được trình bày ở hình 3.1.
Bảng 3.1: Bảng mô tả tóm tắt các thông số sử dụng đánh giá
Tên chuỗi video Foreman Hall Monitor Coastguard Soccer
Tốc độ khung hình 15 Hz
Kích cỡ nhóm ảnh 2 (Key – WZ – Key)
Tham số lƣợng tử QM1, QM3, QM5, QM7
Hình 3.1: Mô tả khung hình đầu tiên của 4 chuỗi video
Foreman Coastguard Hall monitor Soccer
Bộ mã hóa DVC sử dụng bảng giá trị ma trận lượng tử (QM) như đã nêu trong bài báo [9], trong khi các giá trị lượng tử tương ứng được áp dụng trong bộ mã hóa chuẩn HEVC theo bảng 3.2.
Bảng 3.2: Giá trị lượng tử cho khung chính tại GOP=2, QCIF 15Hz
Sequences QM1 QM3 QM5 QM7
Các bộ mã hóa tham chiếu:
- H.264/AVC Intra: H.264/AVC Intra là mô hình mã hóa theo chuẩn H.264/AVC
Mô hình H.264/AVC Intra có độ phức tạp thấp, cho phép khai thác tính tương quan không gian trong các khung hình video, dẫn đến hiệu năng mã hóa thấp hơn so với việc khai thác tính tương quan thời gian như trong H.264/AVC Inter Tuy nhiên, nhờ vào ưu điểm này, H.264/AVC Intra thường được sử dụng trong các mạng cảm biến không dây và là mô hình mã hóa phổ biến trong việc đánh giá hiệu năng mã hóa DVC trước đây.
HEVC Intra là công nghệ mã hóa video tiên tiến nhất hiện nay, cho phép mã hóa hiệu quả các video với thời gian mã hóa tối ưu.
Mô hình mã hóa tham chiếu chính được nghiên cứu và đề xuất trong luận văn này là mô hình mã hóa HEVC, với trọng tâm là cấu hình mã hóa toàn Intra được trình bày chi tiết trong Chương II.
- DVC-AVC: Đây là bộ mã hóa video phân tán thế hệ cũ, sử dụng chuẩn
H.264/AVC Intra được sử dụng để mã hóa và giải mã các key frames, đóng vai trò quan trọng trong việc đánh giá hiệu năng mã hóa cho mô hình mã hóa video đề xuất Bộ mã hóa video DVC-AVC, được khai thác trong luận văn này, dựa trên nền tảng nghiên cứu gần đây.
DVC-HEVC là bộ mã hóa video phân tán thế hệ mới, nghiên cứu các giải pháp tạo thông tin phụ trong luân văn Bộ mã hóa này sử dụng chuẩn HEVC để mã hóa và giải mã các khung chính, đồng thời nâng cao hiệu năng mã hóa bằng cách đề xuất phương pháp tạo khung hình phụ, kết hợp hiệu quả các mô hình ước lượng chuyển động từ cả hai chiều như mô tả ở chương II.
Đánh giá chất lƣợng key frames
Mã hóa và giải mã khung chính có vai trò quan trọng trong việc ảnh hưởng đến quá trình mã hóa các khung hình WZ sau này Chương này sẽ đánh giá chất lượng giải mã khung chính dựa trên hai chuẩn mã hóa video phổ biến là H.264/AVC và HEVC.
Phương pháp đánh giá chất lượng video bao gồm cả đánh giá chủ quan và khách quan Đánh giá chủ quan dựa vào cảm nhận của người xem khi so sánh các khung hình sau khi giải mã theo chuẩn H.264/AVC và HEVC Trong khi đó, đánh giá khách quan sử dụng đồ thị thể hiện mối quan hệ giữa số lượng bit thông tin cần mã hóa và chất lượng video sau giải mã, được đo bằng ma trận PSNR (Peak Signal to Noise Ratio).
- MSE: Mean Squared Error là giá trị trung bình bình phương lỗi (sự khác biệt) giữa tín hiệu trước và sau giải mã
Hình 3.2, 3.3, 3.4, 3.5 mô tả đánh giá khách quan trong khi hình 3.6 và hình 3.7 mô tả đánh giá chủ quan cho 4 chuỗi video đƣợc lựa chọn trong luận văn này
Hình 3.2: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC
Hình 3.3: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC
Hình 3.4: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC
Hình 3.5: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC
Hình 3.6: Đánh giá chất lượng khung hình giữa H.264/AVC và H.265/HEVC (Video
Hình 3.7: Đánh giá chất lượng khung hình giữa H.264/AVC và H.265/HEVC (Video coastguard)
Từ kết quả thu đƣợc trên các hình, một số kết luận có thể đƣợc rút ra nhƣ sau:
Mô hình mã hóa H.265/HEVC mang lại hiệu suất mã hóa vượt trội so với H.264/AVC, được chứng minh qua cả các đánh giá chủ quan và khách quan.
Với đánh giá chủ quan, bằng mắt thường có thể dễ dàng thấy sự khác biệt về chất lƣợng giữa hai mô hình nhƣ minh họa ở hình 3.6 và hình 3.7
Đánh giá hiệu năng mã hóa mô hình DVC-HEVC
Để đánh giá tổng quan hiệu suất mã hóa của mô hình DVC-HEVC, các kết quả về lượng bit mã hóa và chất lượng video sau khi giải mã được trình bày và phân tích trong hình 3.8 và hình 3.9.
Hình 3.8: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC
Hình 3.9: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC
Hình 3.10: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC
Hình 3.11: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC