Kỹ thuật nén ảnh số

TỔNG QUAN VỀ NÉN ẢNH SỐ

Tiêu chu n ẩ đánh giá chất lượng mã hoá ả nh

Biệt ROI (Region of Interest) và công nghệ WDR cùng với ASWDR đã được đề xuất nhằm khắc phục nhược điểm của WDR Cả WDR và ASWDR đều thể hiện rõ phần chi tiết, đặc biệt là phần gờ của ảnh, ngay cả khi nén ở tỷ lệ rất cao.

EBCOT là một phương pháp nén ảnh mới do Taubman đề xuất, mang lại tính mềm dẻo về tỉ số SNR và độ phân giải, khắc phục nhược điểm của các thuật toán trước đó Thuật toán này dựa trên cơ sở phân chia khối và mã hóa độc lập các khối, cho phép giải mã các vùng quan trọng (ROI - Region Of Interest) mà không cần phải giải mã toàn bộ ảnh Nhờ vào những ưu điểm này, EBCOT được khuyến nghị sử dụng trong tiêu chuẩn nén ảnh JPEG2000.

1.3 Tiêu chuẩ đn ánh giá chất lượng mã hoá ảnh

Chất lượng mã hóa ảnh phản ánh độ chính xác của ảnh nén so với ảnh gốc Để đánh giá chất lượng ảnh của một sơ đồ mã hóa, người ta thường sử dụng hai tham số chính: sai số bình phương trung bình (MSE) và tỷ số tín hiệu trên nhiễu (PSNR).

1.3.1.Sai số trung bình bình phương MSE

MSE thường được gọi là phương sai lượng tử σq 2 (Quantization Error Variance) MSE giữ ảa nh gốc và ảnh khôi phục được tính như sau:

Trong đó f[j,k] và g[j,k] là các giá trị đ ể i m ảnh tại vị trí [j,k] ứng với ảnh g c và nh khôi ph c N là t ng s i m nh trong nh ố ả ụ ổ ố đ ể ả ả

1.3.2.Tỷ số tín hiệu trên nhiễu nh đỉ

PSNR giữa hai ảnh (b bít cho mỗi đ ểi m ảnh, RMSE là căn bậc 2 của MSE) được tính theo công thức dB như sau:

Thông thường, khi PSNR đạt giá trị ≥ 40dB, người dùng gần như không thể phân biệt giữa ảnh gốc và ảnh khôi phục Ảnh khôi phục có giá trị MSE thấp sẽ dẫn đến PSNR cao hơn, đồng nghĩa với việc sai số càng ít Về mặt logic, PSNR cao tương ứng với tỉ số tín hiệu trên nhiễu (SNR) lớn, từ đó cải thiện chất lượng ảnh khôi phục.

Như vậy m t s đồ nén nh được ánh giá là đạt hi u qu cao n u em ộ ơ ả đ ệ ả ế đ lại MSE thấp và PSNR cao.

Kết luận chương 1

Chương 1 đã mang l i một cái nhìn tổng quan về kỹạ thu t nén nh s ậ ả ố Nhiều thuật toán nén ảnh đã đượ đề xuất Trong đó, những thuật toán trên cơ c sở biến đổi wavelet như EZW, SPIHT, WDR, ASWDR… thể hiện tính ưu việt không chỉ v t lề ỷ ệ nén cao mà còn phù h p v i truy n d n l y ti n và kh ợ ớ ề ẫ ũ ế ả năng chống sai lỗi đường truyền Luận văn sẽ tập trung vào phân tích m t s ộ ố thuật toán nén ảnh wavelet tiêu biểu Từ đ đ ó ánh giá ưu nhược đ ểi m cũng như ứng d ng c a chúng trong th c t ụ ủ ự ế

Chương 1 cung cấp các thông số quan trọng để đánh giá chất lượng ảnh sau khi giải nén, bao gồm sai số bình phương trung bình (MSE) và tỉ số tín hiệu trên nhiễu đỉnh (PSNR) Những thông số này là cơ sở để so sánh hiệu năng của các phương pháp nén ảnh khác nhau.

CHƯƠNG 2: CƠ Ở S BIẾN ĐỔI WAVELET RỜI RẠC

Wavelet là các hàm được hình thành từ một hàm mẹ (mother wavelet) thông qua quá trình co giãn và dịch chuyển trong miền tần số Nếu ký hiệu hàm wavelet mẹ là ψ(t), các hàm wavelet khác có thể được biểu diễn dựa trên hàm này.

Với a và b là hai tham số của hàm wavelet, ta có thể nhận thấy rằng sự co dãn (dilation) và dịch chuyển (translation) tương ứng trong miền thời gian có thể được biểu diễn qua hàm wavelet mẹ Biểu thức này cho thấy mối liên hệ giữa các tham số và hình dạng của hàm wavelet trong phân tích tín hiệu.

Với các giá tr b t k a 1 và b 0, ta có : ị ấ ỳ ≠ ≠

Hàm wavelet mẹ ψ(t) được điều chỉnh theo thời gian t bởi tham số co dãn a, với ψ a,0 là phiên bản co dãn của nó Khi a nhỏ hơn 1, hàm ψ(t) sẽ bị co lại theo trục thời gian, trong khi khi a lớn hơn 1, hàm sẽ được trải rộng Do đó, tham số a được gọi là tham số co dãn, ảnh hưởng trực tiếp đến hình dạng của hàm wavelet.

Hàm dịch ψ a,b là kết quả của việc dịch hàm ψ a,0 sang phải một khoảng b khi b > 0, và sang trái một khoảng b khi b < 0 Do đó, b được gọi là hệ số dịch trong miền thời gian.

Hình 2.1 minh họa hàm wavelet mẹ và sự co dãn của nó theo thời gian với tham số co dãn a=α Cụ thể, hàm wavelet mẹ được thể hiện ở hình 2.1.a Khi α1, tín hiệu trải rộng ra trên trục thời gian, được minh họa ở hình 2.1.c.

Hình 2.1 :Hàm wavelet và sự co dãn trong miền thời gian

Căn c vào ứ định ngh a wavelet này, bi n ĩ ế đổi wavelet WT (wavelet transform) của một hàm tín hiệu f(t) được biểu diễn bởi biểu thức toán học:

Biến đổi ngược để tái tạo f(t) từ W(a,b) được tính theo công thức: với : trong đ ψ ωó ( ) là bi n đổi Fourier củế a hàm wavelet m ẹ

Nếu a và b là nh ng bi n liên tụữ ế c (không r i r c) và f(t) là hàm liên t c, ờ ạ ụ

W(a,b) được gọi là bi n ế đổi wavelet liên tục CWT (Continuous Wavelet Transform) Như vậy, CWT ánh x hàm m t chi u ạ ộ ề f(t) thành hàm hai chiều W(a,b) với hai biến thực liên tục a và b

2.1.1.Biến đổi wavelet rờ ại r c

Để xử lý tín hiệu đầu vào, chẳng hạn như ảnh số, cần định nghĩa phiên bản rời rạc của biến đổi wavelet Trước khi thực hiện điều này, các tham số co dãn và dịch rời rạc (a và b) phải được xác định để thay thế cho các giá trị liên tục tương ứng Có nhiều phương pháp để rời rạc hóa các giá trị a và b, cùng với biểu diễn wavelet tương ứng Phương pháp tiếp cận thông thường nhất là rời rạc hóa a và b theo một biểu thức cụ thể.

Khi đó, các hàm wavelet r i r c bi u di n nh sau : ờ ạ ể ễ ư

Người ta thường chọn a = 2 m và b = n2 m, dẫn đến phương pháp lấy mẫu nhị tố (dyadic sampling) và quá trình phân tích nhị tố (dyadic decomposition) của tín hiệu Dựa trên các giá trị này, wavelet rời rạc có thể được biểu diễn thành một họ các hàm cơ sở trực chuẩn.

Các hệ ố s cho hàm f(t) được tính theo công thức :

Với phân tích nh t , các h s wavelet thu được nh sau : ị ố ệ ố ư f(t) được khôi phục từ các hệ số wavelet rời rạc theo công thức :

Với bi n đổi trên, hàm f(t) đầu vào v n liên t c trong khi các h s bi n ế ẫ ụ ệ ố ế đổi là rờ ạ Đi r c ây là bi n ế đổi wavelet thời gian rời rạc DTWT (Discrete Time

Các ứng dụng xử lý ảnh số được thực hiện bởi máy tính số, trong đó tín hiệu f(t) cần được xử lý vì các mức dữ liệu bị giới hạn bởi số lượng bit hữu hạn Khi hàm đầu vào f(t) và các tham số a, b được biểu diễn dưới dạng rời rạc, quá trình này được gọi là biến đổi wavelet rời rạc (DWT - Discrete Wavelet Transform) của tín hiệu f(t).

Biến đổi wavelet rời rạc (DWT) đã trở thành một công cụ xử lý hiệu quả nhờ vào lý thuyết biểu diễn đa phân giải của Mallat Phương pháp này cho phép biểu diễn một tín hiệu thông qua các hệ số, cung cấp thông tin về vị trí và tần số của tín hiệu Ưu điểm nổi bật của DWT so với biến đổi Fourier là khả năng phân tích đa phân giải trong cả miền thời gian và tần số Kết quả là DWT phân rã tín hiệu thành các băng con khác nhau, trong đó các băng tần số thấp có độ phân giải tần số tốt hơn nhưng độ phân giải thời gian kém hơn so với các băng con tần số cao.

DWT, hay Biến đổi Wavelet rời rạc, ngày càng trở nên phổ biến trong kỹ thuật nén hình ảnh nhờ khả năng truyền dẫn ảnh lũy tiến và tạo ra các vùng nén đặc biệt Chính những đặc điểm này đã khiến DWT trở thành nền tảng cho tiêu chuẩn nén JPEG2000.

2.1.2.Khái niệm phân tích đa phân giải

Nhiều hàm cơ sở wavelet tr c chu n ự ẩ được tìm ra trong nh ng n m ữ ă

Lý thuyết phân tích đa phân giải cung cấp phương pháp hiệu quả để tạo ra các hàm wavelet Ý tưởng chính của phân tích đa phân giải là phân tích hàm f(t) ở nhiều mức độ phân giải khác nhau.

Trong lý thuyế đt a phân giải, c n xem xét hai hàm: hàm wavelet mẹ ầ ψ(t) và hàm tỉ lệ Φ(t) (scaling function) Các phiên b n t lệả ỉ và d ch c a hàm ị ủ tỷ lệ là:

Với m c ố định, t p các hàm ậ Φ m,n (t) là trực chu n K t h p tuy n tính ẩ ế ợ ế của hàm tỷ lệ sẽ tạo ra tập các hàm:

Tập hợp các hàm nhị phân {Φ m,n (t)} tạo thành một không gian vectơ Vm tương ứng với vùng span {Φ m,n (t)} Khi độ phân giải tăng lên khi giảm m, các không gian vectơ xấp xỉ sẽ tiếp nối nhau, trong đó mỗi không gian V j+1 nằm trong không gian phân giải kế tiếp V j.

Tập các không gian con tho mãn nh ng tính ch t sau ây : ả ữ ấ đ

1.Mỗi không gian con nằm trong không gian con của độ phân giải kế tiếp Ngh a là với mọi m ta có : ĩ

2.Hợp của các không gian con tạo ra không gian hàm khả tích bình phương (square integrable function) L 2 (R), với R là tập số thực:

3.Giao của tất cả các không gian con t o thành tạ ập rỗng:

4.Phép biến đổi t lệ mộỷ t hàm t không gian phân gi i Vừ ả 0 bở ệi h số 2 m sẽ dẫn đến không gian có độ phân giải thấp hơn là V m

5.Dịch một hàm trong không gian phân giải không làm thay đổi độ phân giải không gian

6.Luôn tồn tại m t tộ ập {Φ(t-n) thuộc V 0 với n nguyên} t o thành m t c ạ ộ ơ sở trực chuẩn V 0

Nguyên lý cơ bản của phân tích wavelet cho biết rằng, khi các thuộc tính nhất định được đáp ứng, sẽ luôn có một cơ sở wavelet trực chuẩn ψ m,n (t) tồn tại.

CƠ SỞ BI N Ế ĐỔI WAVELET RỜI RẠC

CÁC THUẬT TOÁN NÉN ẢNH CƠ SỞ WAVELET 36 3.1.Nguyên tắc nén cơ ả b n

TIÊU CHUẨN NÉN ẢNH TĨNH JPEG2000

ĐÁNH GIÁ THỰC NGHIỆ M CÁC THU T TOÁN 100 Ậ 5.1.Thuật toán EZW

Tiêu đề	Kỹ Thuật Nén Ảnh Số
Tác giả	Đỗ Văn Phúc
Người hướng dẫn	TS. Nguyễn Vũ Sơn
Trường học	Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành	Kỹ Thuật Điện Tử
Thể loại	luận văn thạc sĩ
Năm xuất bản	2008
Thành phố	Hà Nội

Định dạng
Số trang	139
Dung lượng	18,38 MB