1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Kỹ thuật nén ảnh số

139 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Kỹ Thuật Nén Ảnh Số
Tác giả Đỗ Văn Phúc
Người hướng dẫn TS. Nguyễn Vũ Sơn
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Kỹ Thuật Điện Tử
Thể loại luận văn thạc sĩ
Năm xuất bản 2008
Thành phố Hà Nội
Định dạng
Số trang 139
Dung lượng 18,38 MB

Cấu trúc

  • CHƯƠNG 1: TỔNG QUAN VỀ NÉN ẢNH SỐ (22)
    • 1.1. Giới thiệ u chung v nén ả ề nh s ..................................................... 15 ố 1.2.Các kỹ thuật nén ảnh (0)
      • 1.2.1. Tiêu chuẩn nén ảnh JPEG cơ ở s (23)
      • 1.2.2. Nén ảnh sử dụng biến đổi wavelet (24)
    • 1.3. Tiêu chu n ẩ đánh giá chất lượng mã hoá ả nh (0)
      • 1.3.1. Sai số trung bình bình phương MSE (26)
      • 1.3.2. Tỷ số tín hiệu trên nhiễu nh đỉ (27)
    • 1.4. Kết luận chương 1 (27)
  • CHƯƠNG 2: CƠ SỞ BI N Ế ĐỔI WAVELET RỜI RẠC (0)
    • 2.1. Phép biế đổ n i wavelet (0)
      • 2.1.1. Biến đổi wavelet rời rạc (30)
      • 2.1.2. Khái niệm phân tích đa phân giải (32)
    • 2.2. Biến đổi wavelet hai chiều (38)
      • 2.2.1. Nguyên tắc biến đổi (0)
      • 2.2.2. Ví dụ minh họa (40)
    • 2.3. Kết luận chương 2 (42)
  • CHƯƠNG 3 CÁC THUẬT TOÁN NÉN ẢNH CƠ SỞ WAVELET .36 3.1.Nguyên tắc nén cơ ả b n (43)
    • 3.2. Thuật toán EZW (44)
      • 3.2.1. Mã hóa mặt phẳng bit (45)
      • 3.2.2. Cấu trúc cây zero (47)
      • 3.2.3. Thuật toán mã hóa (50)
    • 3.3. Thuật toán SPIHT (53)
      • 3.3.1. Th ủ tục sắp xếp phân chia tập hợ p (53)
      • 3.3.2. Cấu trúc cây hướng không gian (54)
      • 3.3.3. Thuật toán mã hóa (56)
    • 3.4. Thuật toán WDR (61)
      • 3.4.1. Ưu đ ể i m của WDR (61)
      • 3.4.2. Thuật toán mã hóa (62)
    • 3.4. Thuật toán ASWDR (66)
      • 3.4.1. Nguyên tắc dự đ oán giá trị quan trọng (66)
      • 3.4.2. Nội dung thuật toán (68)
    • 3.5. Kết luận chương 3 (72)
  • CHƯƠNG 4: TIÊU CHUẨN NÉN ẢNH TĨNH JPEG2000 (76)
    • 4.1. L ịch sử ra đời và phát triển chuẩn JPEG2000 (76)
    • 4.2. Các tính nă ng c a JPEG2000....................................................... 69 ủ 4.3. Các bước thực hiệ n nén nh JPEG2000....................................... 71ả 4.3.1.Tiền xử lý ảnh (0)
      • 4.3.2. Nén ảnh (81)
      • 4.3.3. Mã hóa lớp 2 và tổ chức luồng bit (89)
    • 4.4. Thuật toán mã hóa trong JPEG 2000 (89)
      • 4.4.1. Mã hóa lớp 1 (89)
      • 4.4.2. Mã hóa lớp 2 và tổ chức luồng bit (97)
    • 4.5. Kết luận chương 4 (106)
  • CHƯƠNG 5: ĐÁNH GIÁ THỰC NGHIỆ M CÁC THU T TOÁN..100 Ậ 5.1.Thuật toán EZW (107)
    • 5.1.1. Giới thiệu chương trình (107)
    • 5.1.2. Kết quả tính toán (109)
    • 5.1.3. Nhận xét (114)
    • 5.2. Thuật toán SPIHT (114)
      • 5.2.1. Giới thiệu chương trình (114)
    • 2.2. Kết quả tính toán (116)
      • 5.2.3. Nhận xét (120)
    • 5.3. So sánh 2 thuật toán nén (0)
    • 5.5. Kết luận chương 5 (123)

Nội dung

TỔNG QUAN VỀ NÉN ẢNH SỐ

Tiêu chu n ẩ đánh giá chất lượng mã hoá ả nh

Biệt ROI (Region of Interest) và công nghệ WDR cùng với ASWDR đã được đề xuất nhằm khắc phục nhược điểm của WDR Cả WDR và ASWDR đều thể hiện rõ phần chi tiết, đặc biệt là phần gờ của ảnh, ngay cả khi nén ở tỷ lệ rất cao.

EBCOT là một phương pháp nén ảnh mới do Taubman đề xuất, mang lại tính mềm dẻo về tỉ số SNR và độ phân giải, khắc phục nhược điểm của các thuật toán trước đó Thuật toán này dựa trên cơ sở phân chia khối và mã hóa độc lập các khối, cho phép giải mã các vùng quan trọng (ROI - Region Of Interest) mà không cần phải giải mã toàn bộ ảnh Nhờ vào những ưu điểm này, EBCOT được khuyến nghị sử dụng trong tiêu chuẩn nén ảnh JPEG2000.

1.3 Tiêu chuẩ đn ánh giá chất lượng mã hoá ảnh

Chất lượng mã hóa ảnh phản ánh độ chính xác của ảnh nén so với ảnh gốc Để đánh giá chất lượng ảnh của một sơ đồ mã hóa, người ta thường sử dụng hai tham số chính: sai số bình phương trung bình (MSE) và tỷ số tín hiệu trên nhiễu (PSNR).

1.3.1.Sai số trung bình bình phương MSE

MSE thường được gọi là phương sai lượng tử σq 2 (Quantization Error Variance) MSE giữ ảa nh gốc và ảnh khôi phục được tính như sau:

Trong đó f[j,k] và g[j,k] là các giá trị đ ể i m ảnh tại vị trí [j,k] ứng với ảnh g c và nh khôi ph c N là t ng s i m nh trong nh ố ả ụ ổ ố đ ể ả ả

1.3.2.Tỷ số tín hiệu trên nhiễu nh đỉ

PSNR giữa hai ảnh (b bít cho mỗi đ ểi m ảnh, RMSE là căn bậc 2 của MSE) được tính theo công thức dB như sau:

Thông thường, khi PSNR đạt giá trị ≥ 40dB, người dùng gần như không thể phân biệt giữa ảnh gốc và ảnh khôi phục Ảnh khôi phục có giá trị MSE thấp sẽ dẫn đến PSNR cao hơn, đồng nghĩa với việc sai số càng ít Về mặt logic, PSNR cao tương ứng với tỉ số tín hiệu trên nhiễu (SNR) lớn, từ đó cải thiện chất lượng ảnh khôi phục.

Như vậy m t s đồ nén nh được ánh giá là đạt hi u qu cao n u em ộ ơ ả đ ệ ả ế đ lại MSE thấp và PSNR cao.

Kết luận chương 1

Chương 1 đã mang l i một cái nhìn tổng quan về kỹạ thu t nén nh s ậ ả ố Nhiều thuật toán nén ảnh đã đượ đề xuất Trong đó, những thuật toán trên cơ c sở biến đổi wavelet như EZW, SPIHT, WDR, ASWDR… thể hiện tính ưu việt không chỉ v t lề ỷ ệ nén cao mà còn phù h p v i truy n d n l y ti n và kh ợ ớ ề ẫ ũ ế ả năng chống sai lỗi đường truyền Luận văn sẽ tập trung vào phân tích m t s ộ ố thuật toán nén ảnh wavelet tiêu biểu Từ đ đ ó ánh giá ưu nhược đ ểi m cũng như ứng d ng c a chúng trong th c t ụ ủ ự ế

Chương 1 cung cấp các thông số quan trọng để đánh giá chất lượng ảnh sau khi giải nén, bao gồm sai số bình phương trung bình (MSE) và tỉ số tín hiệu trên nhiễu đỉnh (PSNR) Những thông số này là cơ sở để so sánh hiệu năng của các phương pháp nén ảnh khác nhau.

CHƯƠNG 2: CƠ Ở S BIẾN ĐỔI WAVELET RỜI RẠC

Wavelet là các hàm được hình thành từ một hàm mẹ (mother wavelet) thông qua quá trình co giãn và dịch chuyển trong miền tần số Nếu ký hiệu hàm wavelet mẹ là ψ(t), các hàm wavelet khác có thể được biểu diễn dựa trên hàm này.

Với a và b là hai tham số của hàm wavelet, ta có thể nhận thấy rằng sự co dãn (dilation) và dịch chuyển (translation) tương ứng trong miền thời gian có thể được biểu diễn qua hàm wavelet mẹ Biểu thức này cho thấy mối liên hệ giữa các tham số và hình dạng của hàm wavelet trong phân tích tín hiệu.

Với các giá tr b t k a 1 và b 0, ta có : ị ấ ỳ ≠ ≠

Hàm wavelet mẹ ψ(t) được điều chỉnh theo thời gian t bởi tham số co dãn a, với ψ a,0 là phiên bản co dãn của nó Khi a nhỏ hơn 1, hàm ψ(t) sẽ bị co lại theo trục thời gian, trong khi khi a lớn hơn 1, hàm sẽ được trải rộng Do đó, tham số a được gọi là tham số co dãn, ảnh hưởng trực tiếp đến hình dạng của hàm wavelet.

Hàm dịch ψ a,b là kết quả của việc dịch hàm ψ a,0 sang phải một khoảng b khi b > 0, và sang trái một khoảng b khi b < 0 Do đó, b được gọi là hệ số dịch trong miền thời gian.

Hình 2.1 minh họa hàm wavelet mẹ và sự co dãn của nó theo thời gian với tham số co dãn a=α Cụ thể, hàm wavelet mẹ được thể hiện ở hình 2.1.a Khi α1, tín hiệu trải rộng ra trên trục thời gian, được minh họa ở hình 2.1.c.

Hình 2.1 :Hàm wavelet và sự co dãn trong miền thời gian

Căn c vào ứ định ngh a wavelet này, bi n ĩ ế đổi wavelet WT (wavelet transform) của một hàm tín hiệu f(t) được biểu diễn bởi biểu thức toán học:

Biến đổi ngược để tái tạo f(t) từ W(a,b) được tính theo công thức: với : trong đ ψ ωó ( ) là bi n đổi Fourier củế a hàm wavelet m ẹ

Nếu a và b là nh ng bi n liên tụữ ế c (không r i r c) và f(t) là hàm liên t c, ờ ạ ụ

W(a,b) được gọi là bi n ế đổi wavelet liên tục CWT (Continuous Wavelet Transform) Như vậy, CWT ánh x hàm m t chi u ạ ộ ề f(t) thành hàm hai chiều W(a,b) với hai biến thực liên tục a và b

2.1.1.Biến đổi wavelet rờ ại r c

Để xử lý tín hiệu đầu vào, chẳng hạn như ảnh số, cần định nghĩa phiên bản rời rạc của biến đổi wavelet Trước khi thực hiện điều này, các tham số co dãn và dịch rời rạc (a và b) phải được xác định để thay thế cho các giá trị liên tục tương ứng Có nhiều phương pháp để rời rạc hóa các giá trị a và b, cùng với biểu diễn wavelet tương ứng Phương pháp tiếp cận thông thường nhất là rời rạc hóa a và b theo một biểu thức cụ thể.

Khi đó, các hàm wavelet r i r c bi u di n nh sau : ờ ạ ể ễ ư

Người ta thường chọn a = 2 m và b = n2 m, dẫn đến phương pháp lấy mẫu nhị tố (dyadic sampling) và quá trình phân tích nhị tố (dyadic decomposition) của tín hiệu Dựa trên các giá trị này, wavelet rời rạc có thể được biểu diễn thành một họ các hàm cơ sở trực chuẩn.

Các hệ ố s cho hàm f(t) được tính theo công thức :

Với phân tích nh t , các h s wavelet thu được nh sau : ị ố ệ ố ư f(t) được khôi phục từ các hệ số wavelet rời rạc theo công thức :

Với bi n đổi trên, hàm f(t) đầu vào v n liên t c trong khi các h s bi n ế ẫ ụ ệ ố ế đổi là rờ ạ Đi r c ây là bi n ế đổi wavelet thời gian rời rạc DTWT (Discrete Time

Các ứng dụng xử lý ảnh số được thực hiện bởi máy tính số, trong đó tín hiệu f(t) cần được xử lý vì các mức dữ liệu bị giới hạn bởi số lượng bit hữu hạn Khi hàm đầu vào f(t) và các tham số a, b được biểu diễn dưới dạng rời rạc, quá trình này được gọi là biến đổi wavelet rời rạc (DWT - Discrete Wavelet Transform) của tín hiệu f(t).

Biến đổi wavelet rời rạc (DWT) đã trở thành một công cụ xử lý hiệu quả nhờ vào lý thuyết biểu diễn đa phân giải của Mallat Phương pháp này cho phép biểu diễn một tín hiệu thông qua các hệ số, cung cấp thông tin về vị trí và tần số của tín hiệu Ưu điểm nổi bật của DWT so với biến đổi Fourier là khả năng phân tích đa phân giải trong cả miền thời gian và tần số Kết quả là DWT phân rã tín hiệu thành các băng con khác nhau, trong đó các băng tần số thấp có độ phân giải tần số tốt hơn nhưng độ phân giải thời gian kém hơn so với các băng con tần số cao.

DWT, hay Biến đổi Wavelet rời rạc, ngày càng trở nên phổ biến trong kỹ thuật nén hình ảnh nhờ khả năng truyền dẫn ảnh lũy tiến và tạo ra các vùng nén đặc biệt Chính những đặc điểm này đã khiến DWT trở thành nền tảng cho tiêu chuẩn nén JPEG2000.

2.1.2.Khái niệm phân tích đa phân giải

Nhiều hàm cơ sở wavelet tr c chu n ự ẩ được tìm ra trong nh ng n m ữ ă

Lý thuyết phân tích đa phân giải cung cấp phương pháp hiệu quả để tạo ra các hàm wavelet Ý tưởng chính của phân tích đa phân giải là phân tích hàm f(t) ở nhiều mức độ phân giải khác nhau.

Trong lý thuyế đt a phân giải, c n xem xét hai hàm: hàm wavelet mẹ ầ ψ(t) và hàm tỉ lệ Φ(t) (scaling function) Các phiên b n t lệả ỉ và d ch c a hàm ị ủ tỷ lệ là:

Với m c ố định, t p các hàm ậ Φ m,n (t) là trực chu n K t h p tuy n tính ẩ ế ợ ế của hàm tỷ lệ sẽ tạo ra tập các hàm:

Tập hợp các hàm nhị phân {Φ m,n (t)} tạo thành một không gian vectơ Vm tương ứng với vùng span {Φ m,n (t)} Khi độ phân giải tăng lên khi giảm m, các không gian vectơ xấp xỉ sẽ tiếp nối nhau, trong đó mỗi không gian V j+1 nằm trong không gian phân giải kế tiếp V j.

Tập các không gian con tho mãn nh ng tính ch t sau ây : ả ữ ấ đ

1.Mỗi không gian con nằm trong không gian con của độ phân giải kế tiếp Ngh a là với mọi m ta có : ĩ

2.Hợp của các không gian con tạo ra không gian hàm khả tích bình phương (square integrable function) L 2 (R), với R là tập số thực:

3.Giao của tất cả các không gian con t o thành tạ ập rỗng:

4.Phép biến đổi t lệ mộỷ t hàm t không gian phân gi i Vừ ả 0 bở ệi h số 2 m sẽ dẫn đến không gian có độ phân giải thấp hơn là V m

5.Dịch một hàm trong không gian phân giải không làm thay đổi độ phân giải không gian

6.Luôn tồn tại m t tộ ập {Φ(t-n) thuộc V 0 với n nguyên} t o thành m t c ạ ộ ơ sở trực chuẩn V 0

Nguyên lý cơ bản của phân tích wavelet cho biết rằng, khi các thuộc tính nhất định được đáp ứng, sẽ luôn có một cơ sở wavelet trực chuẩn ψ m,n (t) tồn tại.

CƠ SỞ BI N Ế ĐỔI WAVELET RỜI RẠC

CÁC THUẬT TOÁN NÉN ẢNH CƠ SỞ WAVELET 36 3.1.Nguyên tắc nén cơ ả b n

TIÊU CHUẨN NÉN ẢNH TĨNH JPEG2000

ĐÁNH GIÁ THỰC NGHIỆ M CÁC THU T TOÁN 100 Ậ 5.1.Thuật toán EZW

Ngày đăng: 09/07/2022, 11:34

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Nguyễn Kim Sách - “X ử lý ảnh và video số ” - NXB KHKT, Trang 12-38, 1997Tiếng Anh Sách, tạp chí
Tiêu đề: “Xử lý ảnh và video số” "- NXB KHKT, Trang 12-38, 1997
Nhà XB: NXB KHKT
2. A.Said and W.A. Pearlman - “Image compression using the spatial- orientation tree” - IEEE Int. Symp. on Circuits and Systems, Chicago, IL, trang 279–282, May, 1993 Sách, tạp chí
Tiêu đề: “Image compression using the spatial-orientation tree”
3. J. Shapiro - “Smart Compression Using the Embedded Zerotree Wavelet (EZW) Algorithm” - Proc. Asilomar Conf. Sig., Syst. and Comp., IEEE, trang 486-490, 1993 Sách, tạp chí
Tiêu đề: “Smart Compression Using the Embedded Zerotree Wavelet (EZW) Algorithm”
4.Pankaj N. Topiwala – “Wavelet Image and Video Compression” –Kluwer Acamdemic Publishers, trang 158-165, 2002 Sách, tạp chí
Tiêu đề: “Wavelet Image and Video Compression”
5. S.Mallat - “A Theory for Multiresolution Signal Decomposition: The Wavelet Representation” - IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 11, No. 7, trang 674-693, July 1989 Sách, tạp chí
Tiêu đề: A Theory for Multiresolution Signal Decomposition: The Wavelet Representation
6. S. Mallat – “A Wavelet Tour of Signal Processing” - Academic Press, New York, trang 52- 58, 1998 Sách, tạp chí
Tiêu đề: “A Wavelet Tour of Signal Processing”
7. Tinku Acharya – “JPEG2000 – Standard for Image Compression” – Kluwer Academic Publisher, trang 140-157, 2005 Sách, tạp chí
Tiêu đề: “JPEG2000 – Standard for Image Compression”

HÌNH ẢNH LIÊN QUAN

trường hợp, nú được chuyển bởi bảng mó húa entropy 2n ký hiệu. Như vậy cú thể sử dụng cỏc mụ hỡnh s  hốọc thớch  ng, v i 2ứớn ký hiệu (n thuộ c {1,2,3,4}) - Kỹ thuật nén ảnh số
tr ường hợp, nú được chuyển bởi bảng mó húa entropy 2n ký hiệu. Như vậy cú thể sử dụng cỏc mụ hỡnh s hốọc thớch ng, v i 2ứớn ký hiệu (n thuộ c {1,2,3,4}) (Trang 60)
khụng cần bảng tham chiếu mó - Kỹ thuật nén ảnh số
kh ụng cần bảng tham chiếu mó (Trang 73)
Bảng 3.1: Tớnh năng và hạn chế của cỏc thuật toỏn nộn - Kỹ thuật nén ảnh số
Bảng 3.1 Tớnh năng và hạn chế của cỏc thuật toỏn nộn (Trang 75)
Bảng 4.2: Cỏc hệ số của băng lọc cho quỏ trỡnh nộn khụng tổn thất Xử lý đường biờn ảnh - Kỹ thuật nén ảnh số
Bảng 4.2 Cỏc hệ số của băng lọc cho quỏ trỡnh nộn khụng tổn thất Xử lý đường biờn ảnh (Trang 83)
Bảng 4.1: Cỏc hệ số của băng lọc cho quỏ trỡnh nộn cú tổn thất Biến đổi wavlet thuận nghịch cho nộn khụng tổn thất thụng tin - Kỹ thuật nén ảnh số
Bảng 4.1 Cỏc hệ số của băng lọc cho quỏ trỡnh nộn cú tổn thất Biến đổi wavlet thuận nghịch cho nộn khụng tổn thất thụng tin (Trang 83)
Bảng kt qu th c ngh im vi b lc Haar nh sau: ư - Kỹ thuật nén ảnh số
Bảng kt qu th c ngh im vi b lc Haar nh sau: ư (Trang 110)
Bảng 5.1:Thụng số nộn EZW sử dụng bộ lọc Haar b)Với bộ lọc db4: - Kỹ thuật nén ảnh số
Bảng 5.1 Thụng số nộn EZW sử dụng bộ lọc Haar b)Với bộ lọc db4: (Trang 110)
Bảng 5.2:Thụng số nộn EZW sử dụng bộ lọc Db4 c)Với bộ lọc db7: - Kỹ thuật nén ảnh số
Bảng 5.2 Thụng số nộn EZW sử dụng bộ lọc Db4 c)Với bộ lọc db7: (Trang 111)
Bảng kết quả thực nghiệm với bộ lọc Db4 như sau: - Kỹ thuật nén ảnh số
Bảng k ết quả thực nghiệm với bộ lọc Db4 như sau: (Trang 111)
Bảng 5.3:Thụng số nộn EZW sử dụng bộ lọc Db7 d)Với bộ lọc bior6.8: - Kỹ thuật nén ảnh số
Bảng 5.3 Thụng số nộn EZW sử dụng bộ lọc Db7 d)Với bộ lọc bior6.8: (Trang 112)
Bảng kết quả thực nghiệm với bộ lọc Db7 như sau: - Kỹ thuật nén ảnh số
Bảng k ết quả thực nghiệm với bộ lọc Db7 như sau: (Trang 112)
Bảng 5.4:Thụng số nộn EZW sử dụng bộ lọc Bior6.8 - Kỹ thuật nén ảnh số
Bảng 5.4 Thụng số nộn EZW sử dụng bộ lọc Bior6.8 (Trang 113)
Bảng kết quả thực nghiệm với bộ lọc Bior6.8 như sau: - Kỹ thuật nén ảnh số
Bảng k ết quả thực nghiệm với bộ lọc Bior6.8 như sau: (Trang 113)
Bảng kết quả thực nghiệm với bộ lọc Haar như sau: Tỷ lệ nộn CR Tỷ số  PSNR (dB) - Kỹ thuật nén ảnh số
Bảng k ết quả thực nghiệm với bộ lọc Haar như sau: Tỷ lệ nộn CR Tỷ số PSNR (dB) (Trang 117)
Bảng 5.5:Thụng số nộn SPIHT sử dụng bộ lọc Haar b)Với bộ lọc db4: - Kỹ thuật nén ảnh số
Bảng 5.5 Thụng số nộn SPIHT sử dụng bộ lọc Haar b)Với bộ lọc db4: (Trang 117)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w