1. Trang chủ
  2. » Luận Văn - Báo Cáo

Kỹ thuật mã hóa video phân tán dvc và ứng dụng kỹ thuật dvc trong mạng cảm biến hình ảnh không dây

49 9 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Kỹ Thuật Mã Hóa Video Phân Tán DVC Và Ứng Dụng Kỹ Thuật DVC Trong Mạng Cảm Biến Hình Ảnh Không Dây
Tác giả Nguyễn Anh Tuấn
Người hướng dẫn TS. Hoàng Văn Xiêm, TS. Đinh Triều Dương, ThS. Phí Công Huy
Trường học Đại học Quốc gia Hà Nội
Chuyên ngành Công nghệ kỹ thuật điện tử - viễn thông
Thể loại luận văn thạc sĩ
Năm xuất bản 2019
Thành phố Hà Nội
Định dạng
Số trang 49
Dung lượng 1,44 MB

Cấu trúc

  • 1. Lý do lựa chọn đề tài (9)
  • 2. Mục đích nghiên cứu (11)
  • 3. Đối tƣợng nghiên cứu (11)
  • 4. Phạm vi và phương pháp nghiên cứu (11)
  • 5. Cấu trúc luận văn (11)
  • CHƯƠNG I. TỔNG QUAN VỀ MÃ HÓA VIDEO DỰ ĐOÁN HEVC VÀ MÃ HÓA PHÂN TÁN DVC (13)
    • 1.1. Giới thiệu chung (13)
    • 1.2. Mã hóa video dự đoán chuẩn HEVC (14)
      • 1.2.1. Sơ đồ cấu trúc (14)
      • 1.2.2. Mã hóa trong khung (Intra coding) (17)
      • 1.2.3. Mã hóa liên khung (Inter coding) (18)
      • 1.2.4. Phép biến đổi cosin rời rạc (DCT) và phép lƣợng tử (18)
      • 1.2.5. Mã hóa entropy (19)
      • 1.2.6. Bộ lọc khối và bù thích ứng mẫu SAO (21)
    • 1.3. Mã hóa video phân tán (DVC – Distributed Video Coding) (21)
      • 1.3.1. Định lý Slepian-Wolf và định lý Wyner-Ziv (21)
      • 1.3.2. Kiến trúc mã hóa video phân tán DISCOVER (23)
    • 1.4. Kết luận chương (24)
  • CHƯƠNG II. XÂY DỰNG MÔ HÌNH MÃ HÓA VIDEO TIÊN TIẾN THẾ HỆ MỚI TRÊN NỀN CHUẨN H.265/HEVC (26)
    • 2.1. Kiến trúc mã hóa video phân tán với bộ mã hóa H.265/HEVC (26)
    • 2.2. Tạo thông tin phụ (28)
    • 2.3. Ứng dụng DVC trong mạng cảm biến hình ảnh không dây (0)
    • 2.4. Kết luận chương (35)
  • CHƯƠNG III. MÔ PHỎNG VÀ ĐÁNH GIÁ (37)
    • 3.1. Điều kiện đánh giá (37)
    • 3.2. Đánh giá chất lƣợng key frames (40)
    • 3.3. Đánh giá hiệu năng mã hóa mô hình DVC-HEVC (44)
    • 3.4. Kết luận chương (46)
  • KẾT LUẬN (12)
  • TÀI LIỆU THAM KHẢO (48)

Nội dung

Lý do lựa chọn đề tài

Video hiện chiếm khoảng 75% tổng dữ liệu truyền tải toàn cầu và tỷ lệ này đang gia tăng, dự kiến sẽ tiếp tục phát triển trong tương lai Sự ra đời của video siêu cao độ phân giải, dải động cao, gam màu rộng, và tốc độ khung hình cao sẽ tạo ra những thách thức mới Do đó, nhu cầu về công nghệ mã hóa video hiệu quả trở nên cấp thiết hơn bao giờ hết.

Kể từ khi Habibi đề xuất khái niệm mã hóa kết hợp vào năm 1974 và Forchheimer phát triển khung mã hóa không gian-thời gian vào năm 1981, mã hóa video kết hợp (HVC) đã được áp dụng rộng rãi trong các chuẩn mã hóa hình ảnh/video như JPEG, H.261, MPEG2, H.264/AVC và H.265/HEVC Hiệu suất mã hóa video đã cải thiện khoảng 50% sau mỗi 10 năm, tuy nhiên, độ phức tạp tính toán và bộ nhớ cũng tăng lên Hiện nay, ngành công nghiệp đang đối mặt với những thách thức lớn trong việc cải thiện hiệu quả mã hóa để đáp ứng yêu cầu kỹ thuật của các ứng dụng phương tiện thông minh và công nghệ hiện đại như nhận diện khuôn mặt, theo dõi đối tượng và truy xuất hình ảnh.

Với sự gia tăng nhanh chóng của các thiết bị video như máy quay cầm tay, mạng cảm biến video và điện thoại di động đa phương tiện, việc mã hóa độ phức tạp thấp trở nên cần thiết để phù hợp với công suất và mức tiêu thụ năng lượng của các thiết bị này Để đáp ứng nhu cầu truyền thông video, mã hóa video phân tán (DVC) đã được phát triển dựa trên lý thuyết Slepian-Wolf và Wyner-Ziv.

DVC có thể được phát triển theo hai cách tiếp cận chính Cách tiếp cận đầu tiên, được đề xuất bởi nhóm nghiên cứu tại Đại học Stanford, tập trung vào việc mã hóa toàn bộ khung hình Trong phương pháp này, video đầu vào được chia thành hai loại: khung hình chính (Key frame) và khung hình Wyner-Ziv (WZ frame) Các khung chính được mã hóa bằng các bộ mã hóa chuẩn với cấu hình phức tạp thấp như H.263 Intra hoặc H.264/AVC Intra, trong khi các khung WZ được mã hóa bằng các bộ mã hóa kênh.

9 mã turbo hoặc mã LDPC [5], kết hợp với ƣớc lƣợng giá trị của khung hình tại phía thu

Phương pháp mã hóa khối PRISM là một cách tiếp cận thứ hai, trong đó kết hợp với các khối được mã hóa theo phương pháp truyền thống, như mã hóa trong khung.

Intra coding kết hợp với mã kênh BCH giúp bộ mã hóa chuyển giao các phần phức tạp, như ước lượng chuyển động, từ phía phát sang phía thu.

Phương pháp xử lý thông tin video truyền thống yêu cầu cả phía phát và phía thu tạo dự đoán, dẫn đến việc phía phát phải thực hiện nhiều nhiệm vụ phức tạp để xác định và gửi thông tin dư thừa Ngược lại, trong phương pháp mã hóa video phân tán, phía thu đảm nhận việc tạo dự đoán thông qua bộ thông tin phụ, trong khi phía phát chỉ cần truyền đi sự khác biệt giữa thông tin gốc và thông tin phụ Nhờ đó, thời gian mã hóa được giảm đáng kể, mang lại hiệu quả cao hơn trong xử lý video.

Mã hóa video truyền thống và mã hóa video phân tán

Sự ra đời của chuẩn mã hóa H.265/HEVC đã giảm khoảng 50% lượng bit so với H.264/AVC, tạo động lực cho nghiên cứu cải tiến mô hình mã hóa phân tán DVC Luận văn này tập trung vào việc nghiên cứu và xây dựng mô hình mã hóa video phân tán thế hệ mới, dựa trên chuẩn H.265/HEVC và mô hình tạo thông tin phụ mới.

W W Độ phức tạp phía mã hóa cao Độ phức tạp phía giải mã thấp

W W Độ phức tạp phía mã hóa thấp Độ phức tạp phía giải mã cao

Mục đích nghiên cứu

Luận văn tập trung tìm hiểu về chuẩn mã hóa video thế hệ mới H.265/HEVC

Mô hình mã hóa video phân tán DVC được nghiên cứu nhằm cải tiến thông tin phụ cho mã hóa video thế hệ mới H.265/HEVC.

Đối tƣợng nghiên cứu

Nghiên cứu, cải thiện chất lƣợng thông tin phụ trong mô hình DVC

- Mô hình mã hóa video phân tán DVC-HEVC

- Các chuỗi video với khung hình thước nhỏ do sử dụng mã video phân tán

Phạm vi và phương pháp nghiên cứu

Luận văn cung cấp cái nhìn tổng quan về mã hóa video, đặc biệt là chuẩn HEVC và mã hóa video phân tán DVC, với trọng tâm vào mô hình DVC dựa trên kiến trúc DISCOVER Bài viết sẽ phân tích cách hình thành thông tin phụ từ mô hình kiến trúc này.

- Khảo sát và nghiên cứu lý thuyết

- Phương pháp thu thập thông tin bằng cách nghiên cứu tài liệu kết hợp với kết quả thực nghiệm

- Tìm hiểu mô hình mã hóa video dự đoán chuẩn H.265/HEVC và mô hình mã hóa video phân tán DVC

- Nghiên cứu và đƣa ra cải tiến tạo thông tin phụ

- Phân tích và đánh giá.

Cấu trúc luận văn

Nội dung chính của luận văn được trình bày qua 5 chương:

Chương 1: Tổng quan về mã hóa video dự đoán HEVC và mã hóa phân tán DVC

Chương này giới thiệu về bối cảnh của nghiên cứu mã hóa video và cấu trúc tổng quan mã hóa video

Chương 2: Xây dựng mô hình mã hóa video tiên tiến thế hệ mới trên nền chuẩn H.265/HEVC

Chương này giới thiệu kiến trúc tổng quan về mã hóa video phân tán sử dụng HEVC cho mã hóa intra, đồng thời trình bày mô hình tạo thông tin phụ mới Bên cạnh đó, bài viết cũng đề cập đến ứng dụng của mã hóa DVC trong việc cải thiện hiệu quả năng lượng tiêu thụ của các cảm biến.

Chương 3: Mô phỏng và đánh giá

Chương này sẽ đưa ra các kịch bản mô phỏng và đánh giá tính hiệu quả của mô hình mã hóa video phân tán thế hệ mới, DVC-HEVC

Kết luận sẽ tổng quát lại những kết quả lý thuyết và mô phỏng từ chương 1,2,3 và đƣa ra những nhận xét

TỔNG QUAN VỀ MÃ HÓA VIDEO DỰ ĐOÁN HEVC VÀ MÃ HÓA PHÂN TÁN DVC

Giới thiệu chung

Trong những năm gần đây, việc truyền tải và lưu trữ video đã trở nên phổ biến hơn nhờ vào sự giảm giá của các sản phẩm như máy quay video HD, TV màn hình lớn và thiết bị lưu trữ Đồng thời, sự phát triển của các bộ vi xử lý với tốc độ cao và cải thiện đáng kể về tốc độ internet đã giúp cho việc tải phim nhanh chóng và trải nghiệm mượt mà hơn.

Nhu cầu trải nghiệm video ngày càng gia tăng, từ việc thưởng thức phim ở độ phân giải 480p và mHD 720p, giờ đây người xem đã chuyển sang Full HD 1080p Sự xuất hiện của TV 4K với độ phân giải siêu cao trong 2 năm qua càng thể hiện rõ nhu cầu này Tuy nhiên, các thiết bị lưu trữ và đường truyền internet hiện tại không đủ khả năng đáp ứng, dẫn đến việc cần có một chuẩn nén video mới hiệu quả hơn để giảm áp lực cho hệ thống.

Độ phân giải Full HD (FHD) 1920x1080 với chuẩn nén H.264 đã từng phổ biến, nhưng hiện nay đang dần bị thay thế bởi độ phân giải 4K x 2K (3840x2610) và gặp khó khăn với các độ phân giải cao hơn như 8K x 4K (7680x4320) hay Ultra HD H.264 không chỉ bị tụt hậu mà còn gặp vấn đề về dung lượng lưu trữ và khả năng xử lý hình ảnh độ nét cao, khiến cho việc xử lý hình ảnh 4K trở nên khó khăn, thậm chí bất khả thi.

H.265, hay còn gọi là HEVC (High Efficiency Video Coding), đã được Ủy ban Viễn thông Quốc tế ITU-T phê duyệt và đang được các nhà phát triển áp dụng vào sản phẩm thương mại Công nghệ này hứa hẹn mang lại khả năng nén gấp đôi so với H.264/AVC, hiện đang chiếm tới 80% nội dung video lưu trữ Nhờ vào khả năng nén vượt trội, H.265 giúp giảm băng thông cần thiết để truyền tải phim, giảm dung lượng lưu trữ và tiết kiệm chi phí cho người dùng.

13 hơn cho băng thông internet và thiết bị lưu trữ Ưu điểm vượt trội này cũng sẽ là cú hích cho thị trường thiết bị nghe nhìn 4K/UHD

Trong tương lai, chúng ta sẽ có thể xem các đoạn video trên YouTube, Facebook và các nền tảng khác với chất lượng hình ảnh cực nét mà không cần phải chờ đợi để tải về.

Vào ngày 29/2/2012, tại triển lãm Mobile World Congress, Qualcomm đã giới thiệu bộ nén mới trên tablet, cho thấy hiệu năng ấn tượng với chất lượng hiển thị tương đương nhưng dung lượng giảm gần một nửa.

Mã hóa video dự đoán chuẩn HEVC

Hình 1.1 mô tả sơ đồ kiến trúc mã hóa video theo chuẩn HEVC [7]

Hình 1.1: Sơ đồ cấu trúc mã hóa video theo chuẩn HEVC

Trong HEVC, mỗi ảnh đầu vào được chia thành các khối và mã hóa trước khi truyền tải đến bộ giải mã Ảnh đầu tiên trong chuỗi video chỉ sử dụng dự đoán trong khung, trong khi các ảnh còn lại áp dụng các chế độ mã hóa dự đoán liên khung theo thời gian Quá trình mã hóa này tối ưu hóa hiệu suất nén dữ liệu.

Tỷ lệ Lƣợng tử Ƣớc lƣợng hình ảnh

Bù chuyển động Ƣớc lƣợng chuyển động

Tỷ lệ và biến đổi ngƣợc

Phân tích điều khiển bộ lọc

Tạo khối và lọc dữ liệu

Bộ điều khiển dữ liệu chung

Dự đoán dữ liệu Điều khiển lọc dữ liệu

Hình ảnh đƣợc giải mã và lưu trong bộ đệm

Tỷ lệ Đầu ra cho video Định dạng tiêu đề và CABAC Luồng dữ liệu nhị phân đƣợc mã hóa Đầu vào là 1 video

Khung lựa chọn dữ liệu chuyển động bao gồm các ảnh tham chiếu và vector chuyển động (MV) để dự đoán các mẫu của mỗi khối ảnh Các bộ mã hóa và giải mã sử dụng kỹ thuật bù chuyển động (MC) cùng với thông tin phụ để tạo ra tín hiệu dự đoán liên khung giống nhau Tín hiệu dư thừa trong khung và liên khung được biến đổi qua phép biến đổi không gian tuyến tính, sau đó được định cỡ, lượng tử hóa, mã hóa entropy và truyền đi cùng với thông tin dự đoán Bộ mã hóa cũng xử lý giải mã để đảm bảo cả hai phía tạo ra các dự đoán giống nhau cho ảnh kế tiếp Hệ số biến đổi lượng tử được tạo lại qua định cỡ ngược và biến đổi ngược để tái tạo tín hiệu dư thừa gần đúng, sau đó được kết hợp với các tín hiệu dự đoán và đưa vào bộ lọc để làm mịn ảnh Ảnh cuối cùng được lưu trữ trong bộ đệm ảnh giải mã và sử dụng để dự đoán các ảnh tiếp theo Trong các chuẩn mã hóa trước, khung ảnh được chia thành macroblock, trong khi HEVC sử dụng đơn vị cây mã hóa (CTU), với mỗi CTU bao gồm các CTB chói và CTB màu có kích thước 16, 32 hoặc 64, cho phép nén hiệu quả hơn HEVC cũng hỗ trợ phân chia CTB thành các khối nhỏ hơn thông qua cấu trúc cây và tín hiệu hóa cây tứ phân.

 Đơn vị mã hóa (CU – Coding Unit) và khối mã hóa (CB – Coding Block)

Cú pháp cây tứ phân (quadtree syntax) trong CTU cho phép chia các khối (CB) dựa trên đặc tính tín hiệu của vùng do CTB tạo ra, với gốc của cây tứ phân là CTU Kích cỡ của CB thường được xác định trong khoảng 8x8 đến kích cỡ CTB, và mỗi đơn vị mã hóa CU sẽ bao gồm một khối chói.

Hai CB màu với cú pháp tương ứng Một CTB có khả năng chứa một hoặc nhiều CU, trong đó mỗi CU được phân bổ một vùng liên quan đến các đơn vị dự báo (PUs) và một cây các đơn vị biến đổi (TUs).

 Đơn vị dự đoán (PU) và khối dự đoán (PB)

Quyết định mã hóa vùng ảnh dựa trên dự đoán liên khung hoặc trong khung được thực hiện ở mức CU, với cấu trúc phân chia PU gắn liền với CU Tùy thuộc vào kiểu dự đoán, các thành phần chói và màu sẽ được phân chia thành các khối dự đoán (PB) tương ứng, mỗi PB chứa một vector chuyển động.

 Đơn vị biến đổi (TU) và khối biến đổi (TB)

Dư thừa dự đoán mã hóa sử dụng các biến đổi khối với cấu trúc cây TU có gốc ở mức CU Dư thừa CB chói có thể tương tự như khối biến đổi chói hoặc tiếp tục chia thành các khối chói nhỏ hơn Điều này cũng áp dụng cho các khối màu Hàm số nguyên tương tự như hàm biến đổi cosin rời rạc (DCT) được xác định cho các khối kích thước 4x4, 8x8, 16x16 và 32x32.

Hình 1.2: Kỹ thuật phân vùng trong HEVC

1.2.2 Mã hóa trong khung (Intra coding)

Dự đoán trong khung hoạt động theo kích thước TB sử dụng các mẫu biên giải mã từ những TB lân cận để tạo ra tín hiệu dự đoán, hỗ trợ 33 hướng khác nhau với kích thước TB từ 4x4 đến 32x32 Các hướng dự đoán được minh họa trong hình 1.3 Ngoài ra, dự đoán mặt phẳng và dự đoán DC cũng có thể được áp dụng Đối với thành phần màu, các chế độ dự đoán như ngang, dọc, mặt phẳng và DC có thể được chỉ định rõ ràng, tương tự như các chế độ dự đoán thành phần chói.

Mỗi khối (CB) được mã hóa bằng các phương pháp khác nhau tùy thuộc vào loại mảng, tương tự như H.264 / MPEG-4 AVC HEVC hỗ trợ nhiều phương pháp mã hóa dự đoán trong ảnh, bao gồm Intra_Angular, Intra_Planar và Intra_DC.

Một khối (CB) trong video có thể được phân chia thành hai loại vùng (PB) là PART_2Nx2N và PART_NxN PART_2Nx2N cho thấy rằng khối không bị phân chia, trong khi PART_NxN chỉ ra rằng khối được chia thành bốn vùng bằng nhau (N = M / 2) HEVC chỉ cho phép kiểu phân chia PART_NxN khi kích thước của khối hiện tại bằng với kích thước khối tối thiểu (CU) Điều này đảm bảo rằng kích thước của các vùng luôn tương ứng với kích thước tối thiểu của khối.

CB được mã hóa bằng chế độ dự đoán trong khung, với kích thước CB không bằng kích thước CU tối thiểu Mặc dù chế độ dự đoán trong khung ở mức PB, các quá trình dự đoán thực tại vẫn hoạt động độc lập cho từng TB.

Hình 1.3: Các chế độ và các hướng cho dự đoán hình trong khung [8]

1.2.3 Mã hóa liên khung (Inter coding)

Dự đoán ảnh liên khung trong chuẩn H.265/HEVC hỗ trợ dự đoán vectơ chuyển động với độ chính xác lên đến điểm ảnh (sub-pel) Giá trị tại vị trí sub-pel được nội suy từ hai bộ lọc với 7 hoặc 8 tham số cấu hình Các khối hình sử dụng cho dự đoán ảnh liên khung rất đa dạng, bao gồm cả khối đối xứng và không đối xứng, ví dụ như 2N×2N, 2N×N, N×2N, N×N, 2N×nD, và nL×2N.

1.2.4 Phép biến đổi cosin rời rạc (DCT) và phép lƣợng tử

Phần dư từ khung gốc được trừ đi cho khung dự đoán và sau đó được chuyển đổi sang miền tần số bằng phương pháp biến đổi Cosin rời rạc Mục tiêu của việc chuyển đổi này là tách biệt các thành phần tần số thấp và loại bỏ thông tin ở thành phần tần số cao Việc giảm bớt thông tin mã hóa này thường không ảnh hưởng nhiều đến cảm nhận của mắt người về chất lượng hình ảnh.

Hình 1.4: Giá trị điểm ảnh trong miền pixel và miền DCT tương ứng

Các thành phần tần số cao thường không dễ nhận thấy bởi mắt người, vì vậy việc loại bỏ chúng được thực hiện thông qua phép lượng tử hóa Mục tiêu chính của phép lượng tử hóa là chuyển đổi tín hiệu đầu vào, cụ thể là các hệ số DCT, thành các mức lượng tử Nhờ vào quá trình này, nhiều giá trị DCT tương đương sẽ được chuyển đổi thành một giá trị lượng tử duy nhất, giúp giảm thiểu lượng thông tin cần mã hóa.

Hình 1.5: Mô hình phép lượng tử tuyến tính

Giá trị lượng tử được biểu diễn dưới dạng chuỗi ký tự số nguyên, và để truyền tải chuỗi này, cần chuyển đổi sang dạng nhị phân 0 và 1 Mã hóa entropy được áp dụng cho từng khối ảnh và giá trị lượng tử với độ dài tương ứng Chẳng hạn, mã Huffman sử dụng mã hóa độ dài biến đổi (VLC) cho mỗi ký hiệu dựa trên xác suất xuất hiện của chúng.

Để xây dựng một bộ từ mã có độ dài thay đổi, chúng ta cần tính xác suất xuất hiện của từng ký hiệu Việc này giúp tối ưu hóa việc mã hóa thông tin, như được minh họa trong bảng dưới đây.

Bảng 1.1: Giá trị lượng tử và xác suất tương ứng

Từ cây mã Huffman, ta có thể dễ dàng xác định được các từ mã tương ứng với từng ký hiệu theo nhƣ bảng sau:

Bảng 1.2: Mã Huffman và số lượng bit cần mã hóa tương ứng

Vectơ Mã Số bit (thực tế) Số bit (lý tưởng)

Mã hóa video phân tán (DVC – Distributed Video Coding)

1.3.1 Định lý Slepian-Wolf và định lý Wyner-Ziv

DVC được ứng dụng trong các cảm biến camera, với bộ mã hóa thường đơn giản và phần phức tạp được chuyển sang giải mã Bộ mã hóa DVC phát triển dựa trên lý thuyết thông tin, đặc biệt là hai định lý Slepian-Wolf và Wyner-Ziv.

Entropy thông tin là khái niệm mở rộng từ entropy trong nhiệt động lực học và cơ học thống kê, áp dụng cho lý thuyết thông tin Nó mô tả mức độ hỗn loạn trong tín hiệu từ sự kiện ngẫu nhiên, đồng thời chỉ ra lượng thông tin có trong tín hiệu, với thông tin được coi là các phần không hỗn loạn của tín hiệu.

Tốc độ mã hóa, hay còn gọi là entropy của nguồn, là mức tối thiểu cần thiết để khôi phục chính xác nguồn X tại bộ giải mã Đối với hai nguồn khác nhau, tốc độ mã hóa có thể thay đổi, nhưng vẫn giữ vai trò quan trọng trong việc đảm bảo tính chính xác của quá trình giải mã.

21 độc lập và Tốc độ mã hóa tối thiểu cho từng nguồn để giải mã không lỗi chính là entropy của từng nguồn và

Với hai nguồn thống kê phụ thuộc thì tính chất của Entropy đồng thời:

Tính chất của entropy có điều kiện:

- | : là entropy có điều kiện đặc trƣng cho độ bất định về nguồn tin

- | : là entropy có điều kiện đặc trƣng cho độ bất định về nguồn tin

Trong trường hợp cần mã hóa độc lập và thì tốc độ mã hóa tối thiểu sẽ là

Định lý Slepian-Wolf liên quan đến nén không tổn thất, trong đó các nguồn tương quan được mã hóa độc lập và sau đó được giải mã liên kết tại một bộ giải mã chung Để áp dụng định lý Slepian, cần thỏa mãn ba điều kiện nhất định.

So sánh với bộ mã hóa độc lập, bộ mã hóa này không tận dụng sự tương quan giữa các nguồn, dẫn đến yêu cầu tốc độ tối thiểu theo điều kiện (3) Ngược lại, mã Slepian-Wolf khai thác sự tương quan này, cho phép đạt được tốc độ mã hóa tương đương với mã hóa liên kết.

Định lý Wyner-Ziv là một mở rộng của định lý Slepian-Wolf, áp dụng cho mã hóa có mất mát Theo định lý này, quá trình giải mã sẽ tập trung vào việc tái tạo thông tin, sử dụng thông tin phụ có sẵn Hệ thống được thiết kế để đảm bảo xác suất lỗi nhỏ trong việc tái tạo, cho phép truyền tải thông tin với tốc độ tối ưu.

22 theo nhƣ biểu đồ Slepian-Wolf, tốc độ mã hóa X có thể đạt đƣợc về mặt lý thuyết | ( nhỏ tùy ý)

Hình 1.7: Biểu đồ vùng tỷ lệ tốc độ mã giữ hai nguồn X,Y

1.3.2 Kiến trúc mã hóa video phân tán DISCOVER

Kiến trúc mã hóa video phân tán DVC, được đề xuất và cải tiến bởi nhóm nghiên cứu F Pereira với tên gọi DISCOVER, đã chứng minh hiệu quả vượt trội so với các mô hình trước đó Hình 1.8 minh họa rõ nét cấu trúc của kiến trúc này, cho thấy sự phổ biến và tính hiệu quả của nó trong lĩnh vực mã hóa video.

Hình 1.8 Kiến trúc mã hóa video phân tán DVC DISCOVER[2]

Trong bộ mã hóa DVC DISCOVER, video được chia thành hai chuỗi chính: khung WZ và khung chính Khung chính được mã hóa theo chuẩn H.264/AVC với cấu hình Intra coding, trong khi khung WZ sử dụng phương pháp mã hóa kênh do trưởng Đại học Stanford đề xuất.

Mặc dù bộ mã hóa DISCOVER mang lại hiệu năng mã hóa cao, nhưng các nghiên cứu gần đây chỉ ra rằng cần có những cải tiến cho mô hình mã hóa video phân tán, đặc biệt là kế thừa từ chuẩn HEVC Chương 2 của luận văn sẽ trình bày một mô hình mã hóa video phân tán thế hệ mới, được phát triển dựa trên nền tảng HEVC, với một số cải tiến nhỏ tại khối tạo thông tin phụ.

Kết luận chương

Chương I đã giới thiệu và đề cập nhu cầu của mã hóa video ngày càng cao trong bối cảnh độ phân giải Full HD 1080p đã ngày một nhiều hơn Nhu cầu đó càng thể hiện mạnh mẽ hơn khi gần đây xuất hiện các TV với công nghệ hình ảnh 4K với độ phân giải siêu cao Các thiết bị lưu trữ và đường truyền internet phải chịu nhiều áp lực hơn để đáp ứng đƣợc các chuẩn phân giải mới Trong bối cảnh đó, chuẩn mã hóa video HEVC đƣợc ra đời để đáp ứng yêu cầu

Sơ đồ bộ mã hóa HEVC được trình bày trong chương này, cùng với các kỹ thuật cơ bản của mã hóa video như mã hóa trong khung và mã hóa liên khung, cũng như phép biến.

HEVC sử dụng 24 đổi cosin rời rạc, mã hóa entropy, bộ lọc khối và bù thích ứng để cải thiện hiệu suất nén Khung ảnh được chia thành các đơn vị mã hóa gọi là cây mã hóa (CTU), khác với các macroblock 16x16 mẫu thành phần chói và 8x8 mẫu thành phần màu trong các chuẩn mã hóa trước Mỗi CTU bao gồm các CTB chói và CTB màu, với kích thước linh hoạt là 16, 32 hoặc 64, giúp quá trình nén của HEVC trở nên hiệu quả và linh hoạt hơn so với các chuẩn nén trước đó.

Mạng cảm biến hình ảnh không dây đang ngày càng phổ biến nhờ khả năng thu thập dữ liệu hiệu quả trong mọi điều kiện và vùng địa lý Tuy nhiên, để giảm mức tiêu thụ năng lượng của các cảm biến, cần một chuẩn mã hóa mới nhằm đơn giản hóa quá trình mã hóa và chuyển tải phần lớn tính toán phức tạp sang phía giải mã Bộ mã hóa video phân tán DVC đã được phát triển để đáp ứng nhu cầu này Chương I đã giới thiệu về mã hóa video phân tán với hai định lý quan trọng: định lý Slepian-Wolf, liên quan đến nén không tổn thất và mã hóa độc lập của các nguồn tương quan, và định lý Wyner-Ziv, mở rộng từ định lý Slepian-Wolf với mã hóa có mất mát Định lý Wyner-Ziv nhấn mạnh việc tái tạo thông tin tại phía giải mã với thông tin phụ sẵn có Ngoài ra, chương này cũng trình bày kiến trúc mã hóa video phân tán DISCOVER, trong đó chuỗi video đầu vào được chia thành khung Wyner-Ziv và khung chính, với khung chính được mã hóa theo chuẩn H.264/AVC và khung WZ được mã hóa bằng phương pháp mã hóa kênh.

XÂY DỰNG MÔ HÌNH MÃ HÓA VIDEO TIÊN TIẾN THẾ HỆ MỚI TRÊN NỀN CHUẨN H.265/HEVC

Kiến trúc mã hóa video phân tán với bộ mã hóa H.265/HEVC

Hình 2.1 mô tả kiến trúc mã hóa video phân tán thế hệ mới, đƣợc xây dựng trên nền tảng bộ mã hóa chuẩn HEVC (DVC-HEVC)

Hình 2.1: Cấu trúc mã hóa DVC-HEVC

Kiến trúc DVC-HEVC tương tự như các kiến trúc mã hóa video thế hệ cũ, trong đó video đầu vào được chia thành hai nhóm: Key frames và WZ frames Các khung chính được mã hóa theo chuẩn HEVC với cấu hình Intra, trong khi các khung WZ được xử lý theo cách khác.

WZ được mã hóa phân tán theo các bước sau:

Chuỗi video được phân loại thành các khung WZ và các khung chính, trong đó số lượng khung WZ giữa hai khung chính phụ thuộc vào kích thước của nhóm ảnh (GOPs).

Biến đổi cosin rời rạc Lƣợng tử hóa

Biến đổi cosin rời rạc ngƣợc

Biến đổi cosin rời rạc CNM

Tạo thông tin phụ trợ

Bộ giải mã H265/HEVC intra

Bộ mã hóa H265/HEVC intra

Phía mã hóa Phía giải mã

Khung WZ đã đƣợc giải mã

Key frame Khung chính đã đƣợc giải mã

- Biến đổi không gian: một biến đổi dựa trên khối, điển hình là DCT, đƣợc áp dụng cho từng khung WZ

- Lƣợng tử hóa: Mỗi dải DCT đƣợc lƣợng tử hóa đồng nhất với một số mức phụ thuộc vào chất lƣợng mục tiêu

Mã hóa LDPC (hoặc Turbo) thực hiện việc mã hóa cho mỗi băng DCT bắt đầu từ mặt phẳng bit quan trọng nhất (MSB) Thông tin chẵn lẻ được tạo ra cho từng mặt phẳng bit sẽ được lưu trữ trong bộ đệm và gửi đến bộ giải mã khi có yêu cầu.

Bộ giải mã tạo thông tin phụ từ các khung chính đã được giải mã, với thông tin phụ cho mỗi khung WZ được ước lượng từ phiên bản nhiễu của khung gốc Chất lượng thông tin phụ càng cao thì số bit chẵn lẻ cần thiết càng giảm.

Mô hình nhiễu tương quan (CNM) được sử dụng để sửa lỗi trong khung thông tin phụ bằng cách ước tính nhiễu giữa khung thông tin phụ và khung WZ Do bộ giải mã không có khung WZ, các khung chính sẽ được giải mã trước và sau đó, cùng với vectơ chuyển động trong quá trình tạo thông tin phụ Mô hình phân phối Laplacian sẽ được áp dụng để ước tính nhiễu này.

Giải mã LDPC (Low-Density Parity-Check) và Turbo là những phương pháp quan trọng trong việc giải mã các khối mã hóa liên tiếp của các bit chẵn lẻ Bộ giải mã LDPC hoạt động dựa trên các yêu cầu từ kênh phản hồi, trong đó số lượng yêu cầu bit chẵn lẻ được xác định dựa trên mô hình ước lượng nhiễu.

Sau khi giải mã LDPC, các mặt phẳng bit được nhóm lại theo từng dải DCT để tạo thành các ký hiệu lượng tử đã được giải mã Việc thu thập tất cả các ký hiệu này cho phép tái tạo lại tất cả các hệ số DCT Sau khi hoàn tất quá trình giải mã kênh, các mặt phẳng bit liên quan đến từng DCT chuẩn cũng được kết hợp để tạo ra ký hiệu lượng tử Ký hiệu lượng tử đã giải mã sau đó được kết hợp với thông tin phụ có sẵn tại bộ giải mã nhằm khôi phục lại các hệ số DCT.

27 đƣợc xây dựng lại, một biến đổi cosine rời rạc ngƣợc (IDCT) đƣợc thực hiện và thu đƣợc khung WZ đƣợc giải mã.

Tạo thông tin phụ

Để cải thiện chất lượng thông tin phụ (SI), nhiều tài liệu đã được giới thiệu, chủ yếu tập trung vào phương pháp nội suy thay vì ngoại suy Quá trình tạo thông tin phụ bao gồm bốn bước: ước lượng chuyển động trước, ước lượng chuyển động hai chiều, lọc trung bình vectơ có trọng số và bù chuyển động khối không chồng chéo Tuy nhiên, do thiếu khung gốc ở bộ giải mã, các vectơ chuyển động được tạo ra thường không chính xác, dẫn đến thông tin phụ chất lượng thấp và hiệu quả mã hóa kém trong mã hóa video phân tán Để khắc phục vấn đề này, một phương pháp sàng lọc bù chuyển động đã được đề xuất, nhằm tinh chỉnh các khối bù sai bằng cách lựa chọn giữa các chế độ bù chuyển động trước, sau hoặc hai chiều.

Thông tin phụ cho mã hóa video phân tán có thể được tạo ra qua các phương pháp như ngoại suy khung và nội suy khung Ngoại suy khung ước tính khung tiếp theo dựa trên các khung tham chiếu trước đó, trong khi nội suy khung, hay còn gọi là MCTI (Nội suy tạm thời bù chuyển động), ước tính khung dựa trên các khung lân cận, sử dụng cả tham chiếu trong quá khứ và tương lai Kỹ thuật nội suy khung mang lại thông tin phụ chính xác hơn, giảm thiểu lỗi và giúp bộ giải mã yêu cầu ít bit chẵn lẻ hơn từ bộ mã hóa, từ đó giảm số lượng bit cần truyền Phía giải mã sẽ cố gắng dự đoán khung WZ dựa trên các khung chính.

Kỹ thuật nội suy khung đơn giản nhất nhằm tạo ra Y (dựa trên khung WZ) có thể được thực hiện bằng cách sử dụng khung chính, từ khung liền kề trước đó hoặc bằng cách nội suy giữa các khung chính k-i và k Tuy nhiên, khi áp dụng các kỹ thuật này để tạo thông tin phụ trong các chuỗi video chuyển động trung bình hoặc cao, Y chỉ là ước lượng thô của X (khung WZ) do sự tương quan giữa hai khung.

Khi xử lý video, việc nội suy khung liền kề theo thời gian có thể gặp khó khăn do yêu cầu nhiều bit chẵn lẻ hơn từ mã hóa để ước lượng chính xác Điều này dẫn đến việc tăng tốc độ bit và PSNR Để thực hiện nội suy khung, cần tìm ước lượng của khung hiện tại dựa trên chuyển động thực, từ đó bù chuyển động giữa các khung liền kề Phương pháp này sử dụng các khối với độ phức tạp thấp, giúp tương thích với hầu hết các chuẩn nén video hiện nay.

Hình 2.2: Quá trình nội suy khung

 Ước lượng chuyển động trước

Cả hai khung chính đều được lọc thông thấp để cải thiện độ tin cậy của các vectơ chuyển động, giúp ước lượng các vectơ này gần hơn với trường chuyển động thực Thuật toán so khối được sử dụng để ước lượng chuyển động giữa khung chính kế tiếp và trước đó, với các tham số như kích thước cửa sổ tìm kiếm, phạm vi tìm kiếm và kích thước bước Kích thước bước, tức khoảng cách giữa các pixel trong khung chính trước, giúp giảm độ phức tạp tính toán Tuy nhiên, sơ đồ ước lượng chuyển động dựa trên khối cố định không thể nắm bắt tất cả khía cạnh của trường chuyển động, dẫn đến sự xuất hiện của các vùng chồng chéo khi nội suy khung, do vectơ chuyển động không nhất thiết cắt khung nội suy ở trung tâm của mỗi khối không bị chồng chéo.

Lọc thông thấp Ƣớc lƣợng chuyển động trước Lọc thông thấp Ƣớc lƣợng chuyển động hai chiều

Bù chuyển động hai chiều

Các vectơ chuyển động đóng vai trò là ứng viên cho mỗi khối trong khung nội suy, và vectơ nào cắt khung gần trung tâm khối hơn sẽ được chọn Mỗi khối trong hình ảnh nội suy sẽ có một vectơ chuyển động, cho phép thực hiện bù chuyển động hai chiều nhằm thu được khung nội suy hoặc xử lý thêm trong các khối tiếp theo.

 Ước lượng chuyển động hai chiều với quỹ đạo tuyến tính

Khối ước lượng chuyển động hai chiều tinh chỉnh các vectơ chuyển động từ bước trước bằng cách chọn một quỹ đạo tuyến tính giữa các khung chính kế tiếp và trước đó, đi qua điểm trung tâm của các khối trong khung nội suy Phạm vi tìm kiếm được giới hạn trong một chuyển vị nhỏ xung quanh vị trí khối ban đầu, với các vectơ chuyển động giữa khung nội suy và các khung chính đối xứng nhau Cụ thể, tọa độ của khối trong khung chính trước đó và kế tiếp được xác định bởi vectơ chuyển động chia cho một nửa, vì khung nội suy có khoảng cách tương đương với cả hai khung chính.

Hình 2.3: Lựa chọn vectơ chuyển động

Hình 2.4: Ước lượng chuyển động hai chiều

MV ứng viên trong một phạm vi tìm kiếm

 Làm mịn chuyển động không gian

Sau khi ước lượng chuyển động hai chiều, có thể xuất hiện các vectơ chuyển động không chính xác so với trường chuyển động thực Để cải thiện điều này, thuật toán làm mịn chuyển động không gian có thể được áp dụng Lọc trung bình vectơ có trọng số được sử dụng để loại bỏ nhiễu trong ảnh, vì tất cả các thành phần trong ảnh nhiễu đều được xem xét Bộ lọc này tìm kiếm các vectơ chuyển động ứng viên tại mỗi khối và các khối lân cận, giúp duy trì sự kết hợp không gian của các vectơ trong trường chuyển động.

Bộ lọc này được điều chỉnh thông qua một tập hợp trọng số, giúp làm mịn dựa trên lỗi dự đoán MSE của khối với từng vectơ ứng viên Bộ lọc vectơ trung bình có trọng số được định nghĩa như trong tài liệu [13].

- x 1 ,….,xN là các vectơ chuyển động của khối hiện tại trong khung đƣợc nội suy trước đó và các khối lân cận gần nhất

- w 1 ,….w N tương ứng với một tập các trọng số biến đổi thích ứng

- x wvmf đại diện cho đầu ra vectơ chuyển động của bộ lọc

Việc lựa chọn trọng số đƣợc thực hiện theo lỗi dự đoán đƣợc xác định nhƣ sau: c j j

- x c đại diện cho vectơ ứng viên của khối đƣợc làm mịn B

MSE biểu thị sự so khớp giữa khối B hiện tại trong khung chính kế tiếp và khối trong khung chính trước đó được bù chuyển động bằng vectơ x c và x j

Sau khi xác định được trường vectơ chuyển động cuối cùng, khung nội suy có thể được tạo ra thông qua việc sử dụng bù chuyển động hai chiều, theo các tiêu chuẩn trong sơ đồ mã hóa video.

 Cải tiến quá trình nội suy

Hình 2.5: Quá trình nội suy khung kết hợp ước lượng chuyển động trước và sau

Sơ đồ mô tả một hướng mở rộng mới cho quá trình nội suy khung, trong đó kết hợp ước lượng chuyển động trước và sau để cải thiện chất lượng khung nội suy Khác với quá trình nội suy khung truyền thống chỉ sử dụng ước lượng chuyển động trước, phương pháp mới này ước lượng vectơ chuyển động dựa trên key frame k-i thay vì key frame k, mang lại kết quả tốt hơn cho việc tạo khung nội suy.

Quá trình nội suy khung kết hợp ước lượng chuyển động trước và sau sẽ thực hiện các bước tương tự như mô tả ở hình 2.2 Sau đó, hai kết quả nội suy sẽ được kết hợp bằng cách tính trung bình cộng để tạo ra khung nội suy cuối cùng.

Lọc thông thấp Ƣớc lƣợng chuyển động trước Lọc thông thấp Ƣớc lƣợng chuyển động hai chiều

Bù chuyển động hai chiều

Lọc thông thấp Ƣớc lƣợng chuyển động sau

Lọc thông thấp Ƣớc lƣợng chuyển động hai chiều

Bù chuyển động hai chiều

2.3 Ứng dụng DVC trong việc tiết kiệm năng lƣợng cho cảm biến

Mạng cảm biến không dây được cấu thành từ nhiều nút cảm biến được triển khai dày đặc gần đối tượng cần thu thập dữ liệu, cho phép vị trí cảm biến được xác định ngẫu nhiên Điều này rất hữu ích trong các khu vực khó tiếp cận hoặc nguy hiểm Một trong những đặc điểm nổi bật của mạng này là khả năng tự tổ chức và hợp tác giữa các cảm biến Với sự hiện diện của nhiều cảm biến gần nhau, truyền thông đa liên kết được ưu tiên sử dụng nhằm giảm thiểu tiêu thụ năng lượng và nâng cao hiệu quả truyền tín hiệu so với phương pháp truyền thông đơn liên kết.

Mạng cảm biến hình ảnh không dây được sử dụng để giám sát từ xa các khu vực địa lý, tuy nhiên, việc truyền và nhận dữ liệu hình ảnh và video đòi hỏi phải mã hóa để tiết kiệm năng lượng Mã hóa video, mặc dù cần thiết, có thể dẫn đến sự hao hụt năng lượng lớn ở các cảm biến có dung lượng pin hạn chế Vì vậy, việc đánh giá các tùy chọn mã hóa video khác nhau là rất quan trọng để thiết kế và lựa chọn kỹ thuật nén tiết kiệm năng lượng nhất cho mạng cảm biến hình ảnh không dây.

Mô hình mã hóa video dự đoán và phân tán đã được thực nghiệm và đánh giá hiệu quả năng lượng để xác định mô hình phù hợp cho các thiết bị cảm biến thực tế Kết quả cho thấy mã hóa video dự đoán có hiệu quả nén cao hơn, nhưng mã hóa liên khung tiêu tốn năng lượng nhiều hơn so với mã hóa trong khung Do đó, nén hình ảnh dựa trên mã hóa trong khung được khuyến nghị để cải thiện hiệu quả năng lượng Đối với mã hóa video phân tán, bộ mã hóa Wyner-Ziv cho thấy hiệu suất năng lượng tốt hơn so với bộ mã hóa PRISM.

Kết luận chương

Chương II mô tả kiến trúc mã hóa video phân tán thế hệ mới, được xây dựng trên nền tảng bộ mã hóa chuẩn HEVC Tương tự như các kiến trúc mã hóa video thế hệ cũ, với kiến trúc DVC-HEVC, video đầu vào đƣợc phân tách thành 2 nhóm bao gồm khung chính và khung WZ Trong khi các khung chính đƣợc mã hóa với chuẩn

HEVC cấu hình Intra, các khung WZ được mã hóa phân tán gồm các bước phân loại khung, biến đổi không gian, lƣợng tử hóa và mã hóa LDPC

Tạo thông tin phụ là kỹ thuật quan trọng trong mã hóa video phân tán, giúp giảm lỗi và lượng bit cần truyền Chương II mô tả quy trình tạo thông tin phụ qua kỹ thuật nội suy khung, bao gồm ước lượng chuyển động trước, ước lượng chuyển động hai chiều, làm mịn chuyển động và bù chuyển động hai chiều Một cải tiến trong quá trình này là kết hợp ước lượng chuyển động sau với ước lượng chuyển động trước, từ đó tạo ra khung nội suy cuối cùng bằng cách lấy trung bình cộng của hai khung nội suy Cải tiến này giúp nâng cao độ chính xác của khung nội suy.

Chương II cũng đã đề cập đến một trong những ứng dụng của mạng cảm biến hình ảnh không dây trong việc giúp các cảm biến có thể tiết kiệm năng lƣợng hơn nhờ giảm thiểu mức độ phức tạp tại phía mã hóa Bằng việc đƣa ra các thông số thực nghiệm về tiêu thụ năng lƣợng đối với mã hóa liên khung và mã hóa trong khung cũng nhƣ của mô hình mã hóa phân tán và mã hóa dự đoán, chúng ta có thể thấy đƣợc lợi ích của mô hình mã hóa phân tán nói chung và mô hình mã hóa video phân tán nói riêng trong việc giảm thiểu mức độ tiêu thụ năng lƣợng, một trong những yêu cầu bắt buộc đối với các mạng cảm biến

MÔ PHỎNG VÀ ĐÁNH GIÁ

Điều kiện đánh giá

Để đánh giá hiệu quả của thông tin phụ SI từ các kỹ thuật mã hóa Intra cho khung chính, chúng tôi đã thực hiện nhiều thí nghiệm với các chuỗi video sử dụng các chuẩn mã hóa Intra khác nhau, bao gồm H.264/AVC và H.265/HEVC.

Bài viết này đề cập đến bốn chuỗi video chuẩn QCIF: Soccer, Foreman, Coastguard và Hall Monitor, được sử dụng để khảo sát hiệu năng của các bộ mã hóa khung chính và mã hóa khung WZ, từ đó đánh giá hiệu suất chung của hệ mã hóa DVC Hiệu năng mã hóa được đo lường qua PSNR, một chỉ số chất lượng video sau khi giải mã khung chính và khung WZ, tương ứng với tốc độ Bitrate của từng khung video.

Kích thước GOP trong các phép thử nghiệm được cấu hình là 2, bao gồm 1 khung chính và 1 khung WZ, là cấu hình phổ biến trong mã hóa DVC Chất lượng mã hóa của khung chính dựa vào kỹ thuật mã hóa Intra có ảnh hưởng lớn đến chất lượng và độ tin cậy của thông tin phụ SI, từ đó tác động trực tiếp đến hiệu năng mã hóa tổng thể của bộ mã hóa DVC.

Với các mô hình mã hóa video phân tán, ứng dụng chủ yếu trong hệ thống cảm biến không dây dẫn đến kích thước khung hình nhỏ Bài viết này lựa chọn 04 chuỗi video phổ biến để đánh giá hiệu năng mã hóa DVC, bao gồm: Foreman, Hall monitor, Coastguard và Soccer Các chuỗi video này có thể tải về từ [http://trace.eas.asu.edu/yuv/].

Các thông số như kích thước, tốc độ khung hình và số khung hình được mô tả chi tiết trong bảng 3.1, trong khi hình ảnh đầu tiên của các chuỗi video được trình bày ở hình 3.1.

Bảng 3.1: Bảng mô tả tóm tắt các thông số sử dụng đánh giá

Tên chuỗi video Foreman Hall Monitor Coastguard Soccer

Tốc độ khung hình 15 Hz

Kích cỡ nhóm ảnh 2 (Key – WZ – Key)

Tham số lƣợng tử QM1, QM3, QM5, QM7

Hình 3.1: Mô tả khung hình đầu tiên của 4 chuỗi video

Foreman Coastguard Hall monitor Soccer

Bộ mã hóa DVC sử dụng bảng giá trị ma trận lượng tử (QM) như đã nêu trong bài báo [9], trong khi các giá trị lượng tử tương ứng được áp dụng trong bộ mã hóa chuẩn HEVC theo bảng 3.2.

Bảng 3.2: Giá trị lượng tử cho khung chính tại GOP=2, QCIF 15Hz

Sequences QM1 QM3 QM5 QM7

 Các bộ mã hóa tham chiếu:

- H.264/AVC Intra: H.264/AVC Intra là mô hình mã hóa theo chuẩn H.264/AVC

Mô hình H.264/AVC Intra có độ phức tạp thấp, cho phép khai thác tính tương quan không gian trong các khung hình video, dẫn đến hiệu năng mã hóa thấp hơn so với việc khai thác tính tương quan thời gian như trong H.264/AVC Inter Tuy nhiên, nhờ vào ưu điểm này, H.264/AVC Intra thường được sử dụng trong các mạng cảm biến không dây và là mô hình mã hóa phổ biến trong việc đánh giá hiệu năng mã hóa DVC trước đây.

HEVC Intra là công nghệ mã hóa video tiên tiến nhất hiện nay, cho phép mã hóa hiệu quả các video với thời gian mã hóa tối ưu.

Mô hình mã hóa tham chiếu chính được nghiên cứu và đề xuất trong luận văn này là mô hình mã hóa HEVC, với trọng tâm là cấu hình mã hóa toàn Intra được trình bày chi tiết trong Chương II.

- DVC-AVC: Đây là bộ mã hóa video phân tán thế hệ cũ, sử dụng chuẩn

H.264/AVC Intra được sử dụng để mã hóa và giải mã các key frames, đóng vai trò quan trọng trong việc đánh giá hiệu năng mã hóa cho mô hình mã hóa video đề xuất Bộ mã hóa video DVC-AVC, được khai thác trong luận văn này, dựa trên nền tảng nghiên cứu gần đây.

DVC-HEVC là bộ mã hóa video phân tán thế hệ mới, nghiên cứu các giải pháp tạo thông tin phụ trong luân văn Bộ mã hóa này sử dụng chuẩn HEVC để mã hóa và giải mã các khung chính, đồng thời nâng cao hiệu năng mã hóa bằng cách đề xuất phương pháp tạo khung hình phụ, kết hợp hiệu quả các mô hình ước lượng chuyển động từ cả hai chiều như mô tả ở chương II.

Đánh giá chất lƣợng key frames

Mã hóa và giải mã khung chính có vai trò quan trọng trong việc ảnh hưởng đến quá trình mã hóa các khung hình WZ sau này Chương này sẽ đánh giá chất lượng giải mã khung chính dựa trên hai chuẩn mã hóa video phổ biến là H.264/AVC và HEVC.

Phương pháp đánh giá chất lượng video bao gồm cả đánh giá chủ quan và khách quan Đánh giá chủ quan dựa vào cảm nhận của người xem khi so sánh các khung hình sau khi giải mã theo chuẩn H.264/AVC và HEVC Trong khi đó, đánh giá khách quan sử dụng đồ thị thể hiện mối quan hệ giữa số lượng bit thông tin cần mã hóa và chất lượng video sau giải mã, được đo bằng ma trận PSNR (Peak Signal to Noise Ratio).

- MSE: Mean Squared Error là giá trị trung bình bình phương lỗi (sự khác biệt) giữa tín hiệu trước và sau giải mã

Hình 3.2, 3.3, 3.4, 3.5 mô tả đánh giá khách quan trong khi hình 3.6 và hình 3.7 mô tả đánh giá chủ quan cho 4 chuỗi video đƣợc lựa chọn trong luận văn này

Hình 3.2: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC

Hình 3.3: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC

Hình 3.4: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC

Hình 3.5: So sánh mã hóa khung chính với chuẩn H.264/AVC và chuẩn HEVC

Hình 3.6: Đánh giá chất lượng khung hình giữa H.264/AVC và H.265/HEVC (Video

Hình 3.7: Đánh giá chất lượng khung hình giữa H.264/AVC và H.265/HEVC (Video coastguard)

Từ kết quả thu đƣợc trên các hình, một số kết luận có thể đƣợc rút ra nhƣ sau:

Mô hình mã hóa H.265/HEVC mang lại hiệu suất mã hóa vượt trội so với H.264/AVC, được chứng minh qua cả các đánh giá chủ quan và khách quan.

 Với đánh giá chủ quan, bằng mắt thường có thể dễ dàng thấy sự khác biệt về chất lƣợng giữa hai mô hình nhƣ minh họa ở hình 3.6 và hình 3.7

Đánh giá hiệu năng mã hóa mô hình DVC-HEVC

Để đánh giá tổng quan hiệu suất mã hóa của mô hình DVC-HEVC, các kết quả về lượng bit mã hóa và chất lượng video sau khi giải mã được trình bày và phân tích trong hình 3.8 và hình 3.9.

Hình 3.8: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC

Hình 3.9: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC

Hình 3.10: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC

Hình 3.11: Đánh giá tổng thể hiệu năng mã hóa mô hình DVC-HEVC

Ngày đăng: 20/07/2021, 11:27

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] A. Habibi, “Hybrid coding of pictorial data”, IEEE Transactions on Communications, vol. 22, no. 5, pp. 614–624, May 1974 Sách, tạp chí
Tiêu đề: Hybrid coding of pictorial data”, "IEEE Transactions on Communications
[2] C. Brites and F. Pereira, “Distributed video coding: Bringing new applications to life”, 5 th Conference on Telecommunications – ConfTele, Apr. 2005 Sách, tạp chí
Tiêu đề: Distributed video coding: Bringing new applications to life”, "5"th" Conference on Telecommunications – ConfTele
[3] D. Slepian and J. Wolf, “Noiseless coding of correlated information sources”, IEEE Transactions on Information Theory, vol. 19, no. 4, pp. 471-480, 1973 Sách, tạp chí
Tiêu đề: Noiseless coding of correlated information sources”, "IEEE Transactions on Information Theory
[4] B. Girod, A. Aaron, S. Rane, and D. Rebollo-Monedero, “Distributed Video Coding,” Proceedings of the IEEE, vol. 93, no. 1, pp. 71–83, Jan. 2005 Sách, tạp chí
Tiêu đề: Distributed Video Coding,” "Proceedings of the IEEE
[5] A. D. Liveris, “Compression of binary sources with side information at the decoder using LDPC codes,” IEEE Communication Letters, vol. 6, no. 10, October 2002 Sách, tạp chí
Tiêu đề: Compression of binary sources with side information at the decoder using LDPC codes,” "IEEE Communication Letters
[6] R. Puriand and K. Ramchandran, “PRISM: a new robust video coding architecture based on distributed compression principles”, Proceedings of the 40th Allerton Conference Communication, Control and Computing, 2002 Sách, tạp chí
Tiêu đề: PRISM: a new robust video coding architecture based on distributed compression principles”, "Proceedings of the 40th Allerton Conference Communication, Control and Computing
[7] G.J. Sullivan et al, „Overview of the High Efficiency Video Coding (HEVC) Standard‟, IEEE Transactions on Circuits and Systems for Video Technology, vol. 22, no. 12, pp.1649-1668, 2012 Sách, tạp chí
Tiêu đề: et al, "„Overview of the High Efficiency Video Coding (HEVC) Standard‟, "IEEE Transactions on Circuits and Systems for Video Technology
[8] T. Wiegand et al, „Overview of the H.264/AVC video coding standard‟, IEEE Transactions on Circuits and Systems for Video Technology, vol. 13, no. 7, pp. 560-576, 2003 Sách, tạp chí
Tiêu đề: et al, " „Overview of the H.264/AVC video coding standard‟, "IEEE Transactions on Circuits and Systems for Video Technology
[9] X. Artigas, J. Ascenso, M. Dalai, S. Klomp, D. Kubasov, and M. Ouaret, “The discover codec: architecture, techniques and evaluation,” in Proceedings of Picture Coding Symposium (PCS ’07), Portugal, Nov. 2007 Sách, tạp chí
Tiêu đề: The discover codec: architecture, techniques and evaluation,” "in Proceedings of Picture Coding Symposium (PCS ’07)
[10] L. Wei, Y. Zhao, and A. Wang, “Improved side-information in distributed video coding”, in Proceedings of International Conference on Innovative Computing, Information and Control, Beijing, China, Sept. 2006 Sách, tạp chí
Tiêu đề: Improved side-information in distributed video coding”, "in Proceedings of International Conference on Innovative Computing, Information and Control
[11] J. Ascenso, C. Brites, and F. Pereira, „A flexible side information generation framework for distributed video coding‟, Multimedia Tools and Applications, vol. 48, no. 3, pp.381-409, 2010 Sách, tạp chí
Tiêu đề: Multimedia Tools and Applications
[12] A. Wyner and J. Ziv, “The rate-distortion function for source coding with side information at the decoder”, IEEE Transactions on Information Theory, vol. 22, no. 1, pp. 1-10, 1976 Sách, tạp chí
Tiêu đề: The rate-distortion function for source coding with side information at the decoder”, "IEEE Transactions on Information Theory
[13] L. Alparone, M. Barni, F. Bartolini, V. Cappellini, “Adaptively Weighted Vector- Median Filters for Motion Fields Smoothing”, IEEE ICASSP, Georgia, USA, May 1996 Sách, tạp chí
Tiêu đề: Adaptively Weighted Vector-Median Filters for Motion Fields Smoothing”, "IEEE ICASSP

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN