Nghiên cứu phân tích xử lý ảnh bằng phương pháp wavelet định hướng

Giới thiệu chung

Giới thiệu về nén ảnh

1.1.1 Sự cần thiết của công nghệ nén

Hiện nay, ứng dụng truyền video và hình ảnh trên Internet và truyền hình đang ngày càng phổ biến Tuy nhiên, dữ liệu video và hình ảnh không nén có kích thước rất lớn, điều này cần được xem xét kỹ lưỡng.

Văn bản 11”x8.5” Có độ phân giải khác nhau

Tín hiệu thoại 1s 8 bps 64kbit Ảnh xám 512x512 8 bpp 2mbits Ảnh màu 512x512 24 bpp 6.26 mbits

B ng 1-1 Yả êu cầu v ề không gian lưu trữ ủ c a các loại dữ u không nén liệ

Ảnh số, dữ liệu audio và video đều yêu cầu một không gian lưu trữ lớn Để giảm thiểu dung lượng này, việc nén dữ liệu trước khi lưu trữ hoặc truyền đi là cần thiết Quá trình giải nén sẽ được thực hiện khi người dùng cần sử dụng dữ liệu Với tỷ lệ nén 16:1, không gian lưu trữ yêu cầu giảm được 16 lần so với dung lượng ban đầu.

Hình ảnh chứa đựng lượng thông tin lớn, dẫn đến nhu cầu cao về không gian lưu trữ và băng thông truyền tải Việc lưu trữ và truyền tải hình ảnh với kích thước gốc trở nên tốn kém Do đó, việc tối ưu hóa kích thước hình ảnh là cần thiết để giảm chi phí và tăng hiệu quả truyền tải.

Trong lĩnh vực nén ảnh, sự tương quan cao giữa các pixel liền kề dẫn đến dư thừa thông tin, gây khó khăn cho việc mã hóa hiệu quả Để tối ưu hóa quá trình nén, cần tìm kiếm các biểu diễn ảnh với tương quan thấp hơn, nhằm giảm thiểu độ dư thừa thông tin Thực tế, có hai loại dư thừa thông tin được phân loại rõ ràng.

Dư thừa trong miền không gian đề cập đến mối quan hệ giữa các giá trị pixel trong ảnh, cho thấy rằng các pixel lân cận thường có giá trị tương tự nhau, ngoại trừ những pixel nằm ở đường biên của ảnh.

- Dư thừa trong miền tần số: Tương quan giữa các mặt phẳng màu hoặc dải phổ khác nhau.

Nghiên cứu về nén ảnh chủ yếu tập trung vào việc giảm số bit cần thiết để biểu diễn hình ảnh, thông qua việc loại bỏ sự dư thừa trong cả miền không gian và miền tần số Mục tiêu là tối ưu hóa quá trình nén mà vẫn đảm bảo khả năng khôi phục thông tin trong ảnh một cách chính xác.

Tỷ số nén là tham số quan trọng đánh giá khả năng nén của hệ thống, công thức được tính như sau:

Tỉ số nén được tính bằng cách chia kích thước dữ liệu gốc cho kích thước dữ liệu nén Đối với ảnh tĩnh, kích thước này được xác định bằng số bít cần thiết để biểu diễn toàn bộ bức ảnh Trong khi đó, đối với video, kích thước được tính dựa trên số bít cần để biểu diễn một khung hình video.

 Bộ mã hoá đặc trưng

Hình 1-1Mô hình bộmã hoá ảnh

Hình trên là một hệ thống nén ảnh có tổn hao đặc trưng, gồm: (a) Mã hoá nguồn hay Biến đổi tuyến tính, (b) Lượng tử hoá và (c) Mã hoá entropy

Lượng tử hoá đơn giản giảm bớt các giá trị đầu vào sai khác Có ba phương pháp lượng tử hoá:

Lượng tử hóa vô hướng giống nhau (Uniform Scalar Quantization) là phương pháp chia vùng dữ liệu thành các khoảng đều nhau, ngoại trừ biên Giá trị đầu ra được xác định tại điểm giữa của mỗi khoảng Có hai loại lượng tử hóa vô hướng: quantizer midrise, với số mức ra lẻ, và quantizer midtreat, với số mức ra chẵn.

Lượng tử hóa vô hướng khác nhau (Nonuniform Scalar Quantization) là phương pháp phân chia vùng dữ liệu thành các khoảng không đều nhau, cho phép lựa chọn khoảng cách nhằm tối ưu hóa tỷ số tín hiệu trên nhiễu (SNR) cho từng kiểu tín hiệu cụ thể Một trong những phương pháp nổi bật trong lượng tử hóa này là Companded quantizer.

- Vector Quantization (VQ): Lượng tử hoá thực hiện trên một nhóm hệ số đồng thời.

Bộ mã hoá Entropy thực hiện nén có tổn hao, sẽ đạt được hiệu quả nén cao hơn

Hai phương pháp mã hóa entropy phổ biến nhất là mã hóa Huffman và mã hóa Arithmetic Tuy nhiên, trong các ứng dụng cần xử lý nhanh, mã hóa loạt dài (Run Length Encoding - RLE) lại tỏ ra hiệu quả hơn.

Kỹ thuật mã hoá/nén ảnh có thể chia thành hai loại:

Mã hoá dự đoán (predictive coding) sử dụng các giá trị thông tin đã có để dự đoán các giá trị khác, chỉ mã hoá sự sai lệch giữa chúng Phương pháp này đơn giản và hiệu quả trong việc khai thác các đặc tính cục bộ của bức ảnh.

Kỹ thuật DPCM chính là một ví dụ điển hình của phương pháp này

Mặc dù có sự sai lệch giữa ảnh gốc và ảnh dự đoán sau khi lượng tử hoá, nhưng điều này vẫn giữ ý nghĩa quan trọng cho các bước tiếp theo Chính vì vậy, phương pháp mã hoá dự đoán cho phép truyền tải nhiều dữ liệu hơn so với các phương pháp khác.

 Mã hoá dựa trên phép biến đổi

Mã hoá dựa trên phép biến đổi (transform based coding) thực hiện như sau:

Đầu tiên, cần thực hiện phép biến đổi ảnh để chuyển đổi sự biểu diễn từ miền không gian sang miền biểu diễn khác Một trong những phép biến đổi phổ biến được sử dụng là DCT (Biến đổi Cosin rời rạc).

The discrete cosine transform (DCT), discrete wavelet transform (DWT), and lapped transform (LT) are essential techniques used in signal processing Following these transformations, encoding is performed on the transformed data to optimize storage and transmission efficiency.

Phương pháp nén này đạt hiệu suất cao hơn nhiều so với phương pháp nén dự đoán, nhờ vào việc sử dụng các phép biến đổi để tận dụng các thuộc tính nén năng lượng Điều này cho phép gói gọn toàn bộ năng lượng của bức ảnh chỉ bằng một số ít hệ số, trong khi các hệ số còn lại, vốn ít có ý nghĩa, sẽ bị loại bỏ sau khi lượng tử hóa Kết quả là lượng dữ liệu cần truyền giảm đáng kể.

Độ phân giải thời gian – tần số và nguyên lý bất định

Độ phân giải của tín hiệu có chiều dài hữu hạn là số mẫu tối thiểu cần thiết để biểu diễn tín hiệu đó, liên quan đến nội dung thông tin của tín hiệu Đối với tín hiệu có chiều dài vô hạn với năng lượng hữu hạn, chiều dài tín hiệu được định nghĩa là khoảng chứa hầu hết thông tin, chẳng hạn như 90% năng lượng Trong tín hiệu liên tục, thay đổi tỷ lệ không ảnh hưởng đến độ phân giải vì nó tác động đồng thời đến tốc độ lấy mẫu và chiều dài tín hiệu, khiến số mẫu cần thiết để biểu diễn tín hiệu trở thành hằng số Trong khi đó, ở tín hiệu rời rạc, việc lấy mẫu và nội suy không làm giảm độ phân giải, vì các mẫu nội suy vẫn tồn tại Tuy nhiên, việc giảm độ phân giải có thể dẫn đến mất mát thông tin không thể khôi phục.

Khi nhận tỷ lệ, độ nét sẽ thay đổi theo thời gian hoặc tần số, chỉ đáp ứng một trong hai yêu cầu Độ nét này được gọi là độ phân giải trong thời gian – tần số.

Năng lượng của tín hiệu được định nghĩa như sau:  󰇛󰇜     (1.4) Tín hiệu f(t) được gọi là tín hiệu có tâm năng lượng tại a nếu

Xét một tín hiệu có năng lượng bằng 1 và có tâm năng lượng tại gốc toạ độ f(t) với biến đổi Fourier F(w)thoả mãn:

󰇛󰇜     và  󰇛󰇜     (1.6) Độ rộng thời gian  của f(t):        󰇛󰇜   (1.7) Độ rộng tần số   :          󰇛󰇜   (1.8) Định nghĩa về nguyên lý bất định: N u ế 󰇛󰇜triệt tiêu nhanh hơn   khi   thì     

Dấu “=” xảy ra khi 󰇛󰇜        gọi là tín hiệu Gauss.

Nguyên lý bất định đóng vai trò quan trọng trong việc xác định giới hạn tối đa của độ nét trong cả thời gian và tần số Điều này có nghĩa là việc nhân tỷ lệ không làm thay đổi tích độ rộng của thời gian và tần số.

Kỹ thuật mã hoá dựa trên phép biến đổi

Phép biến đổi Fourier được thực hiện dựa trên cơ sở phân tích một tín hiệu thành tổng của các hàm sin với các tần số khác nhau           

   Nói cách khác, phép biến đổi Fourier (FT) là kỹ thuật biến đổi tín hiệu từ

14 miền thời gian sang miền tần số Với nhiều tín hiệu, phân tích Fourier rất có ích vì nội dung tần số của tín hiệu là rất quan trọng

Biến đổi Fourier của tín hiệu x(t) và biến đổi Fourier ngược của nó được xác định bởi biểu thức sau:

󰇛 󰇜   󰇛󰇜     (1.10) Trong đó x(t) và X(f) được gọi là cặp biến đổi Fourier

Mặc dù phép biến đổi Fourier mang lại nhiều lợi ích như phân tích tín hiệu tuần hoàn và hỗ trợ cho các phép chập tín hiệu, nhưng nó cũng có những hạn chế đáng kể Khi chuyển đổi sang miền tần số, thông tin về thời gian sẽ bị mất, điều này không ảnh hưởng nhiều đến tín hiệu tĩnh, tức là những tín hiệu có thuộc tính không thay đổi nhiều theo thời gian Tuy nhiên, trong thực tế, nhiều tín hiệu thường gặp như tín hiệu nhạc hay tín hiệu nhiễu lại là tín hiệu không dừng, chứa các thông số động như trôi, nghiêng, biến đổi đột ngột, cũng như khởi đầu và kết thúc của các sự kiện Trong những trường hợp này, phép biến đổi Fourier không cung cấp thông tin hữu ích.

1.3.2 Phép biến đổi Fourier thời gian ngắn Để khắc phục những hạn chế của biến đổi FT, phép biến đổi FT thời gian ngắn STFT (Short Term Fourier Transform) ra đời Điểm khác bi t nh gi a STFT và FT ệ ỏ ữ là: trong biến đổi STFT, tín hiệu được chia thành các kho ng nh và trong kho ng ả ỏ ả đó, tín hiệu được gi nh là tín hi u ả đị ệ ổn định B ng cách ch n m t hàm c a s ằ ọ ộ ử ổ có độ dài của cửa sổ đúng bằng khoảng tín hiệu đã phân chia, ta có thể thu được đáp ứng tần số thời gian của tín hiệu một cách đồng thời mà phép biến đổi FT không - thực hiện được

Biến đổi STFT gặp hạn chế về độ chính xác trong việc phân giải thời gian và tần số do nguyên lý bất định Heisenberg Các phương trình cơ bản không thể cung cấp biểu diễn chính xác về thời gian và tần số của tín hiệu.

Các thành phần phổ tồn tại trong một khoảng thời gian nhất định, nhưng không thể xác định chính xác khoảng thời gian nào mà dải tần số đó chắc chắn xuất hiện.

Việc chọn hàm cửa sổ là quan trọng cho toàn bộ phân tích, và lựa chọn này phụ thuộc vào ứng dụng cụ thể Nếu các thành phần tần số trong tín hiệu nguyên bản tách biệt, ta có thể chấp nhận độ phân giải tần số thấp hơn để đạt được độ phân giải thời gian tốt hơn Ngược lại, khi các thành phần phổ không tách biệt, việc chọn cửa sổ phù hợp trở nên khó khăn hơn.

1.3.3 Đa phân giải và Biến đổi Wavelet

Dựa trên những hạn chế của biến đổi STFT, biến đổi Wavelet đã được phát triển và mang lại nhiều ưu điểm vượt trội so với cả biến đổi STFT và Fourier.

Trong phân tích tín hiệu, độ phân giải thời gian và tần số là hai yếu tố quan trọng Trong phép biến đổi ngắn hạn Fourier (STFT), độ phân giải này là cố định và không phụ thuộc vào tần số phân tích Ngược lại, trong biến đổi Wavelets, độ phân giải thời gian tỷ lệ thuận với tần số phân tích, trong khi độ phân giải tần số lại tỷ lệ nghịch với tần số phân tích Điều này cho thấy sự linh hoạt của Wavelets trong việc phân tích các tín hiệu không đồng nhất.

Hàm c a s ử ổ 󰇛󰇜 của STFT là một hàm thông th p còn hàm Wavelet m ấ ẹ 󰇛󰇜 là một hàm thông dải

Biến đổi wavelets nổi bật tính cục bộ của tín hiệu, trong khi biến đổi Fourier chỉ nhận biết tính đều đặn toàn cục hoặc trong một cửa sổ nhất định Phép biến đổi wavelet có khả năng cách ly các điểm gián đoạn khỏi phần còn lại của tín hiệu, và đáp ứng của nó tại khu vực gần điểm gián đoạn sẽ làm nổi bật điểm đó.

Biến đổi Wavelets mạnh mẽ nhờ vào khả năng phân tích tín hiệu ở nhiều tần số và độ phân giải khác nhau thông qua phương pháp đa phân giải (Multiresolution).

Khi phân tích tín hiệu, ta nhận thấy rằng ở tần số cao, phân giải thời gian tốt nhưng phân giải tần số kém, trong khi ở tần số thấp, phân giải tần số tốt nhưng phân giải thời gian kém Điều này khiến biến đổi này trở nên lý tưởng cho các tín hiệu có thành phần tần số cao xuất hiện trong thời gian ngắn và thành phần tần số thấp kéo dài, như ảnh, khung hình video, hoặc các tín hiệu điện não đồ (EEG), điện cơ đồ (EMG), và điện tâm đồ (ECG).

Cơ sở toán học cũng như các tính chất của biến đổi Wavelet liên tục sẽ được trình bầy chi tiết trong chương 2.

Tổ chức luận văn

Mục tiêu của luận văn này là nghiên cứu lý thuyết Wavelet, trình bày các đặc điểm chi tiết của Wavelet và khám phá ứng dụng của nó, đặc biệt nhấn mạnh vai trò quan trọng của Wavelet trong xử lý ảnh.

Bài toán nghiên cứu là áp dụng biến đổi Wavelet thông thường và biến đổi Wavelet định hướng lên các ảnh đầu vào khác nhau nhằm đánh giá hiệu quả xử lý ảnh, với trọng tâm đặc biệt vào biến đổi Wavelet định hướng.

Dựa trên các yêu cầu của đề tài Nghiên cứu phân tích xử lý ảnh bằng phương pháp Wavelet định hướng, luận văn của em được tổ chức thành các phần rõ ràng và có hệ thống.

Giới thiệu chung một số khái niệm trong luận văn, trình bày mục đích, nội dung và những yêu cầu đặt ra trong luận văn.

Trình bày cơ sở của lý thuyết Wavelet, những đặc điểm quan trọng của các dạng Wavelet khác nhau và ứng dụng của Wavelet.

Chương 3: Ứng dụng Wavelet định hướng trong xử lý ảnh

Chương ba trình bày ỹ thuật xử lý ảnh sử dụng biến đổi k Wavelet nói chung và đặc biệt đi sâu nghiên cứu, phân tích biến đổi Wavelet định hướng

Chương 4: Mô phỏng và kết luận

Chương bốn trình bày chương trình mô phỏng ứng dụng Wavelet và Wavelet định hướng trong xử lý ảnh, được phát triển bằng Matlab Bài viết cũng cung cấp các kết quả mô phỏng và phân tích những kết quả này.

Lý thuyết Wavelet

Giới thiệu chung về Wavelet

Ý tưởng cơ bản của Wavelet là phân tích dữ liệu theo tỷ lệ, sử dụng các hàm Wavelet đáp ứng yêu cầu toán học để biểu diễn dữ liệu hoặc các hàm khác Khái niệm về phép xấp xỉ với các hàm xếp chồng đã có từ thế kỷ 18, khi Joseph Fourier phát hiện ra khả năng xếp chồng các hàm sin và cosin để biểu diễn một hàm khác.

Trong phân tích Wavelet, tỷ lệ đóng vai trò quan trọng trong việc xử lý dữ liệu theo nhiều độ phân giải khác nhau Khi sử dụng cửa sổ lớn để quan sát tín hiệu, chúng ta có thể nhận diện các đặc điểm chung, trong khi việc sử dụng cửa sổ nhỏ hơn giúp phát hiện các chi tiết tinh vi hơn trong dữ liệu.

Quy trình phân tích wavelet bắt đầu bằng việc chọn một hàm Wavelet nguyên mẫu, được gọi là Wavelet phân tích hoặc Wavelet mẹ Phân tích thời gian sử dụng dạng co lại với tần số cao của Wavelet mẹ, trong khi phân tích tần số áp dụng dạng giãn ra với tần số thấp của cùng một Wavelet mẹ.

Tín hiệu nguyên bản hoặc hàm có thể được biểu diễn qua khai triển Wavelet, cho phép thực hiện các tính toán dữ liệu bằng cách sử dụng các hệ số Wavelet tương ứng.

Việc lựa chọn Wavelet phù hợp với dữ liệu và loại bỏ các hệ số dưới một ngưỡng nhất định giúp chúng ta thu được dữ liệu biểu diễn rời rạc Mã hóa rời rạc (sparse coding) biến Wavelet thành một công cụ xuất sắc trong lĩnh vực nén dữ liệu.

Wavelet được ứng dụng rộng rãi trong nhiều lĩnh vực như thiên văn học, âm học, kỹ thuật hạt nhân, mã hóa băng con, xử lý tín hiệu và hình ảnh Ngoài ra, nó còn có vai trò quan trọng trong bệnh học thần kinh, âm nhạc, ảnh cộng hưởng từ (MRI), quang học, fractals, turbulence, dự báo động đất, radar, và các ứng dụng toán học như giải phương trình vi phân từng phần.

Wavelet là một tập hợp các hàm số có tính chất địa phương hóa theo thời gian và không gian Chúng được tạo ra từ một hàm cơ bản gọi là hàm Wavelet mẹ thông qua các phép tịnh tiến và co giãn Để trở thành một hàm Wavelet, hàm số đó cần phải đáp ứng một số điều kiện nhất định.

Với là biến đổi Fourier của : 󰇛󰇜   󰇛 󰇜     

V i m t hàm Wavelet m ớ ộ ẹ cho trước,  󰇛  󰇜, ta xây dựng được h các ọ Wavelet b ng phép t nh ti n và co giãn t ằ ị ế ừ󰇛󰇜như sau:

Ví dụ, một số hàm wavelet mẹ thường dung:

Biến đổi wavelet liên tục

  󰇛󰇜    󰇛   󰇜 (2.7) a: thông số dịch chuyển; b: thông số tỷ lệ

 : yếu tố bình thường hoá đảm bảo cho các wavelet có cùng mức năng lượng Cho hàm wavelet m ẹ󰇛󰇜có giá trị c, m t hàm bthự ộ ất kỳ 󰇛󰇜  󰇛󰇜:

Công th c t ng h p: ứ ổ ợ 󰇟 󰇠  󰇛󰇜󰇛󰇜      󰇛󰇜󰇛󰇜; 󰇟 󰇠 được gọi là các hệ số khai triển chuỗi wavelet

Biến đổi Wavelet rời rạc ( Discrete wavelet transform)

Biến đổi Wavelet rời rạc (DWT) được giới thiệu để giảm bớt sự dư thừa khi áp dụng các hàm Wavelet cho mọi điểm trong không gian (a, b) DWT dựa trên cơ sở mã hoá băng con, giúp thực hiện dễ dàng hơn, đồng thời giảm thời gian tính toán và tài nguyên cần thiết.

Cơ sở của Biến Đổi Sóng Rời (DWT) được hình thành từ năm 1976, khi các kỹ thuật phân tích tín hiệu rời rạc được phát triển Nghiên cứu về DWT cũng đã được tiến hành trong lĩnh vực mã hóa tín hiệu tiếng nói, hay còn gọi là mã hóa băng con (sub-band coding).

1983, các kỹ thuật tương tự kỹ thuật mã hoá băng con được phát triển được gọi là

21 mã hoá hình chóp (pyramidal coding) và dẫn đến sơ đồ phân tích đa phân giải (MRA) [3]

Trong biến đổi Wavelet liên tục, tín hiệu được phân tích thông qua một tập hợp hàm cơ sở liên quan, sử dụng hệ số tỷ lệ (a) và hệ số tịnh tiến (b) Ngược lại, biến đổi Wavelet rời rạc cho phép biểu diễn thời gian – tần số của tín hiệu số bằng cách áp dụng n kỹ thuật lọc số Tín hiệu được phân tích qua các bộ lọc với tần số cắt khác nhau ở các tỷ lệ khác nhau.

2.3.1 Phân tích đa phân giải

Một tín hiệu sẽ được phân chia thành các thành phần thô và chi tiết, trong đó không gian con thô và không gian con chi tiết là trực giao Tín hiệu chi tiết được xác định là hiệu giữa phiên bản thô và phiên bản tinh của tín hiệu Bằng cách áp dụng một cách đệ quy các dãy xấp xỉ, không gian các tín hiệu đầu vào có thể được sinh ra từ các không gian của dãy xấp xỉ tại mọi độ phân giải Khi độ phân giải chi tiết tiến đến vô cùng, sai số xấp xỉ sẽ tiến gần đến 0 Độ phân giải này được giới thiệu bởi Mallat và Meyer, không chỉ là nền tảng cho Wavelet mà còn là công cụ toán học mạnh mẽ để liên kết Wavelet với phân tích băng con tín hiệu Định nghĩa về phân tích đa phân giải bao gồm một chuỗi các khối không gian con đóng.

- Tồn tại      sao cho 󰇝󰇛  󰇜  󰇞là một cơ sở trực chuẩn  

Hình 2-1: Không gian và các không gian con trong đa phân giải Không gian   󰇛󰇜 2 bi u di n toàn b không gian ể ễ ộ   bi u di n m t không gian con, ể ễ ộ   chi tiết

2.3.2 Biến đổi wavelet rời rạc

Khai triển wavelet nổi bật với cấu trúc đa phân giải, cho phép phát triển một giải thuật rời rạc thời gian hiệu quả Giải thuật này, do Mallat đề xuất, được biết đến với tên gọi giải thuật Mallat và thực hiện thông qua một dải lọc.

Chọn các giá tr c nh:   ị ố đị   và        ,       

Sử dụng phân tích đa phân giải x( ) được phân tách thành nhiền mức khác nhau:t

  󰇛  󰇜 : wavelet rời rạc dung phân tích

  󰇛󰇜: hàm tỷ lệ rời rạc

  󰇛󰇜: tín hiệu chi tiết (hệ số wavelet) tại mức  

 󰇛󰇜: tín hiệu xấp xỉ (hệ số tỷ lệ) tại mức  

Cơ sở wavelet rời rạc gồm hai hàm cơ bản:

Trường hợp cơ sở trực chuẩn:

- Cơ sở phân tích tín hiệu trùng với cơ sở tổng hợp tín hiệu

- Cơ sở gồm hai hàm cơ bản:   󰇟󰇠  và  󰇟󰇠

Trường hợ cặp cơ sở trực giao:p

- Cơ sở phân tích tín hiệu khác với cơ sở tổng hợp tín hiệu

- Cơ sở phân tích tín hiệu gồm hai hàm cơ bản: 󰇟󰇠 và   󰇟󰇠

- Cơ sở tổng hợp tín hiệu gồm hai hàm cơ bản:  󰇟󰇠 và   󰇟󰇠

Dãy bộ lọc hai kênh: Hai hàm cơ sở của wavelet rời rạc chính là những hệ số của hai bộ lọc thông thấp và thông cao

2.3.3 Phân tích đa phân giải sử dụng băng lọc

Trong lĩnh vực xử lý tín hiệu, bộ lọc là công cụ quan trọng và phổ biến Wavelet có thể được thực hiện thông qua các bộ lọc lặp lại với tỷ lệ thay đổi, giúp cải thiện độ phân giải của tín hiệu Độ phân giải này là tiêu chuẩn đánh giá lượng thông tin chi tiết trong tín hiệu, và nó được xác định bởi các quá trình lọc Tỷ lệ này phụ thuộc vào quá trình phân chia (upsampling) và nội suy (downsampling), hay còn gọi là quá trình lấy mẫu con (subsampling).

Biến đổi Wavelet rời rạc được thực hiện thông qua quá trình lọc thông thấp và thông cao liên tiếp trên tín hiệu rời rạc theo thời gian, được biết đến với thuật toán Mallat hay phân tích cây Mallat Thuật toán Mallat đóng vai trò quan trọng trong việc kết nối đa phân giải liên tục theo thời gian với các bộ lọc rời rạc.

Khởi đầu quá trình, tín hiệu được chiếu lên màn hình với j được xác định bởi tần số lấy mẫu Trong thực tế, việc thay thế các hệ số tỷ lệ bằng các giá trị mẫu là điều cần thiết.

1 Chia các hệ số xấp xỉ thành hai phần xấp xỉ và chi tiết nhờ sử dụng   và

 2 Thay đổi tỷ lệ các hệ số xấp xỉ

3 Tiếp tục chia phần xấp xỉ thành hai phần xấp xỉ và chi tiết như bước (1)

4 Lặp lại bước (2) và (3)cho đến khi đạt được kết quả thoả mãn.

(b) Quá trình tổng hợp Hình 2-2 Thu t toán hình chóp hay thuậ ật toán mã hoá băng con

Trong hình vẽ 2-2, tín hiệu được được bi u th b i dãy ể ị ở 󰇟󰇠, với  là s nguyên ố

B l c thông cao và b l c thông thộ ọ ộ ọ ấp được bi u diể ễn tương ứng là và m  Ở ỗi m c, b l c thông cao ứ ộ ọ  đưa ra thông tin chi tiết 󰇟󰇠 trong khi b l c thông thộ ọ ấp

kết hợp với hàm tỷ ệ đưa ra các xấ l p x ỉ thô 󰇟󰇠

Các bộ lọc nửa dải (half band filter) tại mỗi mức phân tích cung cấp tín hiệu kéo dài với băng tần chỉ bằng một nửa Việc sử dụng các bộ lọc này giúp tăng gấp đôi độ phân giải tần số do giảm một nửa tính bất định của tần số.

Theo lý thuyết Nyquist, nếu tín hiệu nguyên bản có tần số góc cao hơn tần số lấy mẫu yêu cầu, thì khi tần số góc cao nhất là ωmax, tần số lấy mẫu sẽ là ωsampling Điều này cho phép loại bỏ một nửa số mẫu cần lấy mà không gây mất mát thông tin Tuy nhiên, việc lấy mẫu với hệ số chia 2 sẽ làm giảm một nửa độ phân giải thời gian, vì toàn bộ tín hiệu bây giờ chỉ được biểu diễn trên một nửa số lượng mẫu.

Độ phân giải thời gian đạt hiệu quả cao ở tần số cao, trong khi độ phân giải tần số cải thiện ở tần số thấp Quá trình lọc và phân chia diễn ra liên tục cho đến khi đạt được yêu cầu Số lượng tối đa các mức phụ thuộc vào độ dài của tín hiệu.

Biến đổi Wavelet r i r c c a tín hiờ ạ ủ ệu thu được nh s xâu chu i (concatenating) ờ ự ỗ các hệ ố s 󰇟󰇠 và 󰇟󰇠, bắt đầu từ mức cuối cùng của quá trình phân tích

Hình 2.9b biểu diễn quá trình khôi phục tín hiệu nguyên bản từ các hệ số Wavelet

Quá trình khôi phục là sự đảo ngược của quá trình phân tích, trong đó các hệ số xấp xỉ và chi tiết ở mọi mức được nội suy bởi hệ số 2 Các hệ số này được xử lý qua các bộ lọc tổng hợp thông thấp và thông cao, sau đó được gộp lại với nhau để tạo ra kết quả cuối cùng.

Quá trình tiếp tục cho đến đạt được cùng số mức thu được trong quá trình phân tích tín hiệu nguyên bản

Phương pháp hiệu quả nhất để mô tả quy trình xác định các hệ số wavelet là sử dụng biểu diễn phép toán của các bộ lọc.

Trở ạ l i hai bi u th c (2.41) và (2.44) trong phể ứ ần trước, m i liên h gi a  ỗ ệ ữ và :

Dãy 󰇛󰇜 được xem là bộ lọc thông thấp, trong khi dãy ấ 󰇛󰇜 là bộ lọc thông cao Cả hai loại bộ lọc này đều thuộc họ bộ lọc đáp ứng xung hữu hạn (FIR).

Các tính chất sau có thể được chứng minh sử dụng biến đổi Fourier và tính trực giao:

V i dãy ớ   󰇝  󰇞 đại diện cho tín hiệu rời rạc cần được phân tích và các toán t ử

 và được xác định bởi các biểu thức:

Các biểu thức (2.47), (2.48) biễu diễn phép lọc tín hiệu qua các b l c s ộ ọ ố

󰇛󰇜 󰇛󰇜 tương ứng với các phép toán tích chập với đáp ứng xung của các bộ lọc

Hệ số 2k đại diện cho phép phân chia (downsampling) Các toán tử H và G tương ứng với bước trong phân tích wavelet

Như vậy biến đổi wavelet rời rạc có thể tóm tắt như sau (hình 2.10):

Chúng ta có thể gọi các hệ số              là các hệ số chi tiết và   là hệ số xấp xỉ với      ,     

Quy trình khôi phục tín hiệu tương tự như phân tích, trong đó tín hiệu ở mọi mức được nội suy (upsampled) với hệ số 2 thông qua các bộ lọc tổng hợp.

  (thông cao và thông thấp tương ứng), sau đó được cộng với nhau Các toán tử 

  được xác định như sau:

󰇛󰇜    󰇛  󰇜󰇛󰇜  18) (2. Áp dụng đệ quy ta có:

27 trong miền thời gian:  󰇛󰇜      󰇛󰇜    ,  và C được gọi là các chi tiết và xấp xỉ.

2.3.4 Biểu diễn ma trận DWT

Chuỗi Wavelet

M t hàm ộ     󰇛󰇜 có thể được biểu diễn:

- Tuyến tính: Gi s toán t ả ử ử T được định nghĩa 󰇝󰇛󰇜󰇞  󰇛 󰇜 

- Dịch: N u m t tín hi u có m t khai tri n t l h u h n ế ộ ệ ộ ể ỷ ệ ữ ạ

󰇛󰇜        󰇛 󰇜  󰇛󰇜 thì tín hiệu này sẽ có tính dịch yếu tương ứng được dịch đi    , đó là: 󰇛     󰇜  󰇛  

- T l : N u tín hi u f(t) có h s biỷ ệ ế ệ ệ ố ến đổi wavelet là F(m,n) thì 󰇛  󰇜 

- Đẳng thức Pareval: Họ wavelet trực chuẩn 󰇝  󰇛󰇜󰇞 thoả mãn:

Lấy mẫu đôi và Tiling thời gian –tần số:

Quá trình lấy mẫu trong miền thời gian được thực hiện theo chu kỳ nhất định, với tần số thường được biểu thị dưới dạng tỷ lệ Khi tần số là nghịch đảo của tỷ lệ, nếu wavelet tập trung quanh một giá trị nhất định, thì sẽ có sự tập trung tương ứng trong miền tần số Điều này dẫn đến một quá trình lấy mẫu đôi giữa miền thời gian và tần số.

Hình 2-4 Lấy mẫu đôi và tiling thời gian

2.4.2 Các tính chất của hàm tỷ lệ

- Phương trình hai tỷ l : Hàm t l có th ệ ỷ ệ ể được xây d ng t ự ừ chính nó Phương trình hai tỷ lệ: 󰇛󰇜      󰇛󰇜󰇛  󰇜

Tương tự đố i v i wavelet ớ 󰇛󰇜       thì 󰇛󰇜     󰇛󰇜󰇛 

- Tính chất moment: Bộ lọc thông thấp   󰇛󰇜 trong ph n d i l c, nó có ít nhầ ả ọ ất một  tại   , và vì vậy   󰇛󰇜 có ít nh t mấ ột  tại    Khi

󰇛󰇜  , nó kéo theo 󰇛󰇜 có ít nh t mấ ột  tại    Do đó:

Một cách tổng quát:       󰇛  󰇜        Điều đó có nghĩa moment đầ u tiên c a wavelet là ủ 

2.4.3 Biến đổi chuỗi wavelet của tín hiệu

Wavelet bao gồm ba hàm cơ sở, trong đó hai loại chính được nghiên cứu nhiều hiện nay là wavelet trực chuẩn, như Haar và Daubechies, cùng với wavelet cặp trực giao, điển hình là B-Spline.

Biến đổi chuỗi wavelet bao gồm hai quá trình chính: khai triển tín hiệu thành các chuỗi wavelet và tổng hợp chúng để phục hồi tín hiệu ban đầu Quá trình này có thể được thực hiện bằng cách sử dụng cơ sở trực chuẩn hoặc cặp trực giao, với sơ đồ chung nhưng khác nhau ở hàm cơ sở dùng để tổng hợp tín hiệu.

Dựa trên biến đổi wavelet rời rạc, việc phân tích rời rạc giúp mã hóa tiết kiệm không gian và đảm bảo tái tạo chính xác.

Tín hiệu x[n] được phân tích thông qua dãy bộ lọc băng hai kênh, tạo ra hai dãy hệ số co là cD và cA Dãy hệ số của nhánh lọc thông thấp cA tiếp tục được phân tích bởi cùng một dãy bộ lọc hai kênh, và quá trình này lặp lại trên nhánh thông thấp Mỗi lần khai triển sẽ sinh ra hai dãy hệ số wavelet mới.

Bộ lọc thông cao tạo ra những hệ số chi tiết

Bộ lọc thông thấp tạo ra những hệ số xấp xỉ

Sơ đồ rút gọn của phân tích các tầng:

Hình 2-5 Sơ đồ phân tích DWT

Sơ đồ tái tạo các tầng:

Hình 2-6 Sơ đồ tổng hợp DWT

Phân loại Wavelet

Wavelet có thể được phân loại thành hai loại chính: trực giao và song trực giao Việc lựa chọn loại Wavelet phù hợp thường dựa trên cơ sở ứng dụng cụ thể.

 Đặc điểm của băng lọc Wavelet trực giao

Các hệ số của bộ lọc là số thực và có độ dài đồng nhất, không đối xứng Bộ lọc thông thấp H và bộ lọc thông cao G có mối quan hệ chặt chẽ với nhau.

Hai bộ lọc hoạt động xen kẽ với nhau, tạo ra tính trực giao double-shift giữa các bộ lọc thông thấp và thông cao Điều này có nghĩa là tích vô hướng của các bộ lọc cho dịch 2 bằng không, tức là  H    k G k 2 0 với kЄZ Các bộ lọc thỏa mãn biểu thức này được gọi là bộ lọc gương liên hợp (CMF - Conjugate Mirror Filters) Sự khôi phục hoàn hảo có thể đạt được thông qua sự xen kẽ động (alternating flip).

Mặc dù các bộ lọc tổng hợp có khả năng khôi phục hoàn hảo, nhưng chúng vẫn tương tự như các bộ lọc phân tích Các bộ lọc trực giao mang lại nhiều momen triệt tiêu, điều này rất hữu ích trong xử lý tín hiệu và hình ảnh Với cấu trúc cân đối và đều đặn, việc thực hiện và mở rộng các bộ lọc trực giao trở nên dễ dàng hơn.

 Đặc điểm của băng lọc Wavelet song trực giao

Trong bộ lọc Wavelet song trực giao, bộ lọc thông thấp và thông cao có độ dài khác nhau, với bộ lọc thông thấp luôn đối xứng và bộ lọc thông cao thì bất đối xứng Các hệ số của bộ lọc có thể là số thực hoặc số nguyên Để đạt được sự khôi phục hoàn hảo, băng lọc song trực giao cần có độ dài lẻ hoặc độ dài chẵn Hai bộ lọc phân tích có thể cùng đối xứng với độ dài lẻ hoặc một bộ đối xứng với độ dài lẻ và một bộ bất đối xứng với độ dài chẵn Hơn nữa, hai tập hợp bộ lọc phân tích và tổng hợp cũng phải đối ngẫu Các bộ lọc song trực giao pha tuyến tính được sử dụng phổ biến trong các ứng dụng nén dữ liệu.

Hiện nay, có nhiều hàm cơ bản được sử dụng làm Wavelet mẹ cho các biến đổi Wavelet Wavelet mẹ này sinh ra tất cả các hàm Wavelet thông qua phép tịnh tiến và lấy tỷ lệ, từ đó xác định các đặc điểm của biến đổi Wavelet Do đó, việc chọn Wavelet mẹ phù hợp là rất quan trọng để đảm bảo hiệu quả cho từng ứng dụng cụ thể.

Biến đổi Wavelet Haar là loại biến đổi đơn giản nhất trong các phép biến đổi Wavelet, được thể hiện qua hàm ψ(t) như mô tả trong hình vẽ 3.16 Nhờ vào tính chất đơn giản của nó, biến đổi Haar được ứng dụng rộng rãi trong nén ảnh.

Hình 2-7 Hàm 󰇛󰇜 của biến đổi Haar Đặc tính của Haar wavelet: Độ rộng xác định = 1; Độ dài bộ lọc = 2; Số moment bằng 0 đối với hàm wavelet = 1

Yves Meyer là một trong những nhà khoa học tiên phong trong lĩnh vực phép biến đổi Wavelet, với phép biến đổi mang tên ông được sử dụng rộng rãi Phép biến đổi Wavelet Meyer là một hàm xác định theo miền tần số, cho phép phân tích tín hiệu hiệu quả hơn nhiều so với biến đổi Haar.

Dạng của hàm ψ(t) với biến đổi Meyer cho ở hình vẽ:

Hình 2-8 Hàm 󰇛󰇜của biến đổi Meyer

Cũng như Meyer, Daubechies là một nhà khoa học quan trọng trong nghiên cứu và phát triển phép biến đổi Wavelet Biến đổi Daubechies, một trong những phép biến đổi phức tạp nhất, đã khám phá ra Wavelet trực giao khoảng chặt, mang lại giá trị thực tiễn cho phân tích wavelet rời rạc Ứng dụng của biến đổi này rất đa dạng, trong đó biến đổi Wavelet được sử dụng trong JPEG2000 là một phần của họ biến đổi Wavelet Daubechies Tên gọi của họ Wavelet Daubechies được ký hiệu là dbN, trong đó N là thứ tự và db là tên họ của wavelet.

Dưới đây là một số hàm ψ(t) của họ biến đổi Wavelet Daubechies:

Hình 2-9 Hàm 󰇛󰇜của họ biến đổi Daubechies với       Đặc tính của DbN: Độ rộng xác định = 2N 1; – Độ dài bộ lọc = 2N; Số moment bằng 0 đối với hàm wavelets = N

 Biến đổi Wavelet song trực giao

Các wavelet thể hiện thuộc tính của pha tuyến tính, rất quan trọng cho việc tái tạo tín hiệu và hình ảnh Việc sử dụng hai wavelet, một cho phân tích và một cho tái tạo, thay vì chỉ một wavelet đơn lẻ, đã mang lại những đặc tính thú vị trong quá trình này.

Hình 2-10 M t vài hàm ộ 󰇛󰇜 của các cặp h biọ ến đổi Biorthogonal

Bior Nr và Nd có những đặc điểm nổi bật như độ rộng xác định là 2N r + 1 cho tổng hợp và 2N d + 1 cho phân tích Độ dài bộ lọc được tính bằng max(2N r , 2N d ) + 2, và bộ lọc này có tính đối xứng Đặc biệt, số moment của hàm wavelet là 0 với N r 1.

Xây dựng bởi I Daubechies theo đề nghị của R Coifman

Hình 2- Hàm 11 󰇛󰇜của họ biến đổi Coiflets

= 6N 1; 6N Đặc tính: Độ rộng xác định – Độ dài bộ lọc = ; Gần đối xứng; Số moment bằng 0 đối với hàm wavelets = 2N; Số moment bằng 0 đối với hàm tỷ lệ

Symlets là wavelet gần đối xứng, được đề nghị bởi Daubechies là điều chỉnh của họ db Đặc tính của hai họ là tương tự.

Hình 2-12 M t vào hàm ộ 󰇛󰇜 của họ ến đổ bi i Symlets

Wavelet này có hàm mức, nhưng rõ ràng

Hình 2-13 Hàm 󰇛󰇜 của biến đổi Morlet

 Biến đổi Wavelet Mexican Hat

Wavelet này không có hàm mức và là dẫn xuất của một hàm mà tỷ lệ với đạo hàm bậc hai của hàm mật độ xác suất Gauss

Hình 2-14 Hàm 󰇛󰇜 của biến đổi Mexican Hat

Biến đổi Wavelet hiện nay được sử dụng rộng rãi trong nhiều lĩnh vực, từ xử lý tín hiệu đến sinh trắc học Phạm vi ứng dụng của biến đổi Wavelet ngày càng được mở rộng, cho thấy tính linh hoạt và hiệu quả của phương pháp này trong các ngành công nghiệp khác nhau.

Một trong những ứng dụng nổi bật của biến đổi Wavelet là trong việc nén dấu vân tay của FBI Biến đổi Wavelet được sử dụng để nén ảnh dấu vân tay, giúp lưu giữ hiệu quả trong ngân hàng dữ liệu của FBI Trước đây, FBI đã lựa chọn biến đổi Cosine rời rạc (DCT), nhưng phương pháp này không hoạt động hiệu quả ở tỷ số nén cao, dẫn đến một số hiệu ứng chặn làm mất khả năng nhận diện các đường vân tay sau khi khôi phục Ngược lại, biến đổi Wavelet giữ lại chi tiết quan trọng trong dữ liệu, đảm bảo chất lượng hình ảnh tốt hơn.

Biến đổi Wavelet rời rạc giúp xác định thông tin quan trọng bằng cách phân tách chúng thành các biên độ lớn, trong khi thông tin ít quan trọng hơn thường nằm ở các biên độ nhỏ Nhờ vào việc loại bỏ các biên độ thấp, nén dữ liệu trở nên hiệu quả hơn Biến đổi Wavelet mang lại tỷ số nén cao mà vẫn đảm bảo chất lượng khôi phục tốt.

Wavelet là công cụ hiệu quả trong việc nén và phân tích các tín hiệu không dừng, đặc biệt là tín hiệu ảnh số và ứng dụng nén tiếng nói, dữ liệu Việc áp dụng các phép mã hóa băng con, băng lọc số nhiều nhịp và biến đổi Wavelet rời rạc tương ứng với loại tín hiệu cần phân tích có thể nâng cao hiệu quả nén tín hiệu một cách rõ rệt.

Ứng dụng Wavelet định hướng trong kỹ thuật nén ảnh

Giới thiệu

Trong thập kỷ qua, kỹ thuật nén ảnh dựa trên biến đổi wavelet đã phát triển mạnh mẽ, với biến đổi wavelet rời rạc (DWT) dần thay thế biến đổi Cosine rời rạc (DCT) Chuẩn JPEG2000, dựa trên biến đổi wavelet, không chỉ cung cấp hiệu quả nén cao hơn so với JPEG cũ mà còn mang lại lợi ích trong việc khôi phục chất lượng và độ phân giải cho các ứng dụng người dùng và mạng Biến đổi wavelet 2D thực hiện bằng hai bộ lọc một chiều theo hướng dọc và ngang, tạo ra ưu thế so với DCT 2D truyền thống Tuy nhiên, biến đổi wavelet thẳng gặp hạn chế trong việc đáp ứng đặc tính bất định hướng của ảnh, dẫn đến hiện tượng nhiễu lượng tử ở các hệ số cạnh theo nhiều hướng.

Để khai thác tối đa mối tương quan về hướng trong ảnh, phương pháp mã hóa ảnh dựa trên biến đổi wavelet định hướng là một giải pháp hiệu quả Phương pháp này giúp tối ưu hóa việc phân tích và xử lý hình ảnh, mang lại kết quả chính xác hơn trong việc nhận diện và phân loại đối tượng.

2 loại theo cách sử dụng và mã hoá thông tin hướng:

1) Bộ lọc định hướng và biến đổi: Các bộ lọc định hướng và biến đổi mang lại hiệu quả tốt trong biểu diễn dữ liệu đính hướng trong miền tần số Và do đó được áp dụng rộng rãi nhằm khai thác tính năng, nâng cao chất lượng ảnh, loại bỏ nhiễu

Tuy nhiên, nó không phù hợp với nén ảnh mã hoá entropy, không hiệu quả để khai thác thông tin hướng trong mỗi vùng wavelet.

2) Dự đoán hướng: Điểm cốt lõi ở đây là xung đột giữa biến đổi chung và đặc tính riêng từng vùng của ảnh Ảnh gốc thường có rất nhiều hướng Chia ảnh thành nhiền vùng nhỏ theo hướng tương quan có thể gây ảnh hưởng lớn đến vùng biên và hiệu quả mã hoá.

Chương này khám phá biến đổi wavelet định hướng, đặc biệt là biến đổi wavelet cho dự đoán dư thừa và biến đổi wavelet dựa trên cơ chế lifting tương thích (Adaptive Directional Lifting – ADL) Bằng cách so sánh các biến đổi wavelet riêng biệt với một số biến đổi wavelet định hướng áp dụng cho ảnh, chương sẽ chứng minh những ưu điểm nổi bật của biến đổi wavelet định hướng so với các phương pháp trước đây.

Tính chất bất đẳng hướng của ảnh và dư thừa dự đoán

Dư thừa dự đoán là các lỗi mã hóa ảnh, với đặc điểm của ảnh thay đổi từ vùng này sang vùng khác, dẫn đến sự thay đổi trong đặc tính dư thừa dự đoán trong mã hóa video Hình 3.1 so sánh ảnh gốc với ảnh dự đoán dư thừa bù chuyển động (MC-residual) và ảnh dự đoán dư thừa nâng cao độ phân giải (RE-residual) Kết quả cho thấy, ảnh MC-residual có lỗi dự đoán trong các vùng mượt và vùng có sự thay đổi nhỏ hơn so với các vùng có sự thay đổi lớn hoặc các cạnh Ngược lại, ảnh RE-residual có lỗi dự đoán trong các vùng mượt nhỏ hơn so với các vùng có sự thay đổi hoặc vùng xung quanh các cạnh.

Hình 3-1 nh gẢ ốc (có độ phân gi i CIF), nh MC-residual và nh RE-ả ả ả residual

Trong dự đoán dư thừa, lỗi dự đoán chủ yếu xảy ra ở các vùng chữ hoặc dọc theo các cạnh Một ví dụ đơn giản cho thấy rằng cấu trúc một chiều dọc theo các cạnh xuất hiện nhiều trong các vùng dư thừa Ở những vùng lân cận, cường độ của nhiều pixel gần bằng 0, ngoại trừ các pixel tại các cạnh Do đó, biến đổi 2 chiều với các hàm cơ bản hỗ trợ 2 chiều không phải là lựa chọn tốt nhất cho những vùng này Đề xuất sử dụng biến đổi dựa trên các hàm cơ bản hỗ trợ cấu trúc một chiều trong dư thừa dự đoán, đặc biệt là biến đổi DWT định hướng một chiều.

Nguyên lý biến đổi định hướng

Mã hoá video chứa nhiều loại thông tin dư thừa như dư thừa bù chuyển động (MC-residual), dư thừa nâng cao độ phân giải (RE-residual) và bù chênh lệch DC-residual Các biến đổi thường được áp dụng trong nén ảnh cũng được sử dụng trong nén dư thừa dự đoán, chẳng hạn như biến đổi Discrete Cosine Transform (DCT) trong chuẩn JPEG và MC-residuals trong chuẩn MPEG 2 Bên cạnh đó, Discrete Wavelet Transform (DWT) được áp dụng trong chuẩn nén ảnh JPEG2000 và các khung dư thừa dự đoán băng cao trong mã hoá wavelet liên ảnh.

45 tính khác Do đó, một hướng nghiên cứu mới được đặt ra nhằm nâng cao hiệu quả của phép biến đổi trong xử lý ảnh.

Gần đây, nhiều nhà nghiên cứu đã phát triển biến đổi wavelet để khai thác các đặc tính dị hướng trong ảnh Biến đổi wavelet rời rạc hai chiều (DWT) đã trở thành một kỹ thuật nén ảnh quan trọng trong vài thập kỷ qua Thông thường, DWT thẳng thực hiện hai biến đổi một chiều độc lập theo chiều ngang và chiều dọc, dẫn đến các moment của bộ lọc wavelet băng cao chỉ tồn tại theo hai hướng Tuy nhiên, biến đổi tách rời này không hiệu quả trong việc khôi phục các đặc tính dị hướng của ảnh, như cạnh và đường, do thiếu sự liên kết giữa chiều dọc và chiều ngang khi năng lượng của các đặc điểm này vượt quá các băng con.

Biến đổi wavelet thẳng đơn giản bao gồm hai biến đổi đôi wavelet một chiều (1D DWT) theo chiều dọc và chiều ngang, bắt đầu bằng việc lấy mẫu theo cột và sau đó theo hàng Quá trình này được lặp lại trong ảnh biến đổi, với lưu ý rằng một lần dịch bộ lấy mẫu con trong quá trình phân tách là một lần biến đổi dư thừa Biến đổi định hướng vẫn tách rời nhưng cho phép thực hiện biến đổi theo nhiều hướng hơn.

Bước đầu tiên là xác định các hướng trong không gian rời rạc, tuân theo định nghĩa về đường rời rạc Đường rời rạc được xác định bởi độ dốc và dịch chuyển theo phương trình đã được nêu.

Trong đó,   󰇛󰇜 biểu diễn độ dốc trong khoảng [0,1], và B là thông số dịch thực Định nghĩa này đảm bảo rằng tất cả các pixel đều thuộc về một dòng có độ dốc nhất định Các dòng có độ dốc nằm ngoài khoảng có thể được xác định thông qua phép đối xứng hoặc xoay không gian, cho phép truy cập vô hướng.

Chúng ta có khả năng lựa chọn bất kỳ hướng số nào thông qua phương trình đã nêu và thực hiện biến đổi wavelet 1D (hoặc bất kỳ biến đổi 1 chiều nào khác) theo hướng đó.

Quá trình biến đổi wavelet có thể lặp lại nhiều lần, cho phép chọn hướng mới ở mỗi lần lặp Cụ thể, biến đổi wavelet một chiều tạo ra hai băng con, trong đó băng thông cao không chứa thông tin chi tiết của đối tượng Ta có thể tiếp tục lặp lại quá trình này trên một hoặc cả hai băng con và chọn hướng khác Việc lặp lại nhiều lần sẽ tạo ra đa phân giải theo nhiều hướng khác nhau Cần lưu ý rằng, tùy thuộc vào biến đổi một chiều đã chọn và loại lặp, tín hiệu có thể chứa một lượng lớn biên độ định hướng từ biến đổi trực giao đến khung.

Khái niệm lifting

Biến đổi lifting được thực hiện qua 2 khâu: Predict và Update Giả sử, có tín hiệu

1 chiều a 0 Biến đổi lifting được thực hiện qua các bước sau:

1 Chia a0vào mẫu Even -1 và mẫu Odd -1

Các bước lặp đi lặp lại được thực hiện để xây dựng biến đổi đa mức, trong đó biến đổi ngược đơn giản chỉ cần đảo ngược hệ thống và thay đổi dấu kết hợp Các chuỗi chẵn và lẻ sẽ kết hợp để khôi phục tín hiệu gốc Hình 3.2 minh họa biến đổi thuận, với các hệ số a biểu diễn giá trị trung bình và các hệ số d biểu diễn sự khác biệt trong tín hiệu Hai tâm tương ứng với tần số băng thấp và băng cao của tín hiệu Đối với biến đổi wavelet Haar, cần thực hiện các bước cụ thể để đạt được kết quả mong muốn.

Biến đổi Haar là một phương pháp dễ thực hiện, cho phép xử lý tín hiệu đầu vào hoặc hình ảnh hiệu quả cả trong miền thời gian và miền tần số Tuy nhiên, kết quả của biến đổi Haar thường không cao do bước dự đoán đơn giản Mọi biến đổi wavelet đều có thể được trình bày và rút ra từ các bước lifting, cho thấy tính linh hoạt của các phương pháp này trong xử lý tín hiệu.

47 số biến đổi hiệu quả hơn như Daubechies hay song trực giao đối xứng đã được áp dụng.

Hình 3-2 Mô hình biến đổi lifting thu n ậ

Quá trình nén dữ liệu bao gồm hai bước chính: giải tương quan (decorrelation) và mã hoá Trong bước giải tương quan, không gian dữ liệu ảnh được tạo ra nhưng chưa có tác dụng nén Do đó, cần thực hiện bước nén sau mỗi bước nâng để giảm lượng dữ liệu Trong bước mã hoá, các bộ mã hoá entropy như mã hoá Huffman hoặc mã hoá số học được sử dụng để tối ưu hóa kích thước dữ liệu.

Hình 3-3 Bước dự đoán và Update trong Lifting

Lý thuyết và thuật toán

Thuật toán của cấu trúc Lifting thông thường như sau:

Thuật toán thuận for j = -1 to n –

*/ cho j có giá trị từ 1 đến - -n for each position k in aj+1

*/ với mỗi vị trí k trong a j+1 , tính:

(aj,k , dj,k} = split(aj+1,k) dj,k -= predict( aj,k) aj,k += update(dj,k)

Thuật toán nâng ngược for j = -n to -1 for each position k in a j+1 a j,k -= update( d j,k ) d j,k += predict( a j,k ) a j+1,k = merge(a j,k , d j,k } trong đó các hàm predict() và update() được xác định như trên

Số các mẫu có thể giảm bằng lấy mẫu con đơn giản từ tín hiệu đầu vào:  

  , với   là mẫu chẵn (2k) tại mức (0) của biến đổi và   là mẫu ở mức tiếp theo (1) Thông thường, các mẫu khác được phân chia như sau:

Trong đó   là sự khác biệt hay là hệ số wavelet.

Như đã đề cập ở phần trước, chúng ta tìm kiếm một cách biểu diễn gọn hơn cho a0,k

Nếu giá trị \( a_{p}^{k} \) không chứa thông tin, chúng ta có thể loại bỏ các giá trị này và chỉ giữ lại \( a_{-1,k} \) Điều này giúp tạo ra một biểu diễn gọn hơn mà vẫn có khả năng khôi phục lại \( a_{0,k} \) Tuy nhiên, tín hiệu thực tế lại không giống như vậy.

Trong trường hợp thực hiện bước dự đoán nhằm tìm kiếm các mẫu lẻ từ các mẫu chẵn, quá trình này được xây dựng dựa trên sự tương quan của tín hiệu tại mức 0 Để thực hiện điều này, chúng ta áp dụng hàm dự đoán P.

Chúng ta có thể thay thế dữ liệu gốc bằng một tập dữ liệu khác Điều này cho phép dự đoán các mẫu bị lỗi để tái tạo dữ liệu Tuy nhiên, việc tái tạo chính xác hoặc dự đoán từ dữ liệu gốc vẫn gặp khó khăn Chúng ta có thể thay thế dữ liệu bằng giá trị chênh lệch giữa nó và giá trị dự đoán P(d -1,k) Khi giá trị của dữ liệu gốc và dữ liệu dự đoán tương đương, sự khác biệt sẽ nhỏ hơn giá trị dữ liệu gốc Do đó, chúng ta có thể tính toán được kết quả.

Nếu tín hiệu tương quan và phù hợp với mô hình thì hầu hết các hệ số wavelet đều nhỏ.

Để khai thác hiệu quả sự dư thừa dữ liệu, cần thiết lập một tập hợp a-1,k và d-1,k nhằm đạt được mức tương quan tối ưu Do đó, chúng ta chia dữ liệu thành các mẫu chẵn và lẻ trong bước chia (split), thay vì phân chia tín hiệu thành hai nửa trái phải, nhằm tối ưu hóa lợi thế không gian thời gian.

Có thể dự đoán mẫu lẻ   bằng giá trị trung bình của các mẫu chẵn quanh nó ở mức trước và  Do đó, chúng ta có hàm dự đoán

Cơ chế dự đoán này giả định rằng tín hiệu được lấy mẫu qua các khoảng có độ dài 2 từ, sử dụng một hàm tuyến tính liên tục Khi tín hiệu phù hợp với mô hình, các hệ số wavelet sẽ có giá trị nhỏ hơn so với những tín hiệu không khớp.

Sau khi áp dụng quy trình, chúng ta thu được hai tập hợp là    và   Chúng ta có thể tiếp tục lặp lại bước này để tạo ra    và   từ   Từ mức j, quá trình này có thể được tiếp tục thực hiện.

50 chúng ta chuyển lên mức tiếp theo bằng cách chia tín hiệu vào các giá trị  và   từ  

Cuối cùng, chúng ta thay tín hiệu gốc bằng tập hợp {            } sau

Tín hiệu gốc sẽ được thay thế bằng một hệ số băng thấp cùng với một vài hệ số băng cao Nếu tín hiệu phù hợp với mô hình, chúng ta mong đợi các thành phần trong tập hợp này có biên độ nhỏ hơn.

Hình 3-4 Tính toán các h s wavelet trong Lifting ệ ố

Bước này giúp duy trì các đặc điểm chung của tín hiệu gốc trong quá trình lọc bỏ các yếu tố dư thừa Ví dụ, với nến tín hiệu là một ảnh 2 chiều, ta có thể tính giá trị trung bình của các pixel ở tất cả các mức tỷ lệ, dẫn đến hệ số cuối cùng tại tỷ lệ cuối cùng là giá trị pixel trung bình của toàn bộ ảnh gốc Do đó, hệ thống cần đảm bảo giữ cố định một số moments của hàm wavelet tại mỗi mức Số lượng các moment bị triệt tiêu sẽ được tính toán theo công thức cụ thể.

Tại mỗi tỷ lệ, cần duy trì các hệ số lifting ở tất cả các mức và sử dụng thông tin này để xác định hệ số cần thiết nhằm cập nhật các hệ số Các hệ số này đóng vai trò quan trọng trong quá trình tìm kiếm giá trị qua thuật toán đã đề cập.

Với mỗi   , xác định hệ số  để dự đoán 

Cập nhật các moment cho tất cả các giá trị ở mức đang xét theo phương trình: Moment mới bằng moment cũ cộng với hệ số nhân với độ lệch tương ứng Trong đó, chỉ số của hệ số và độ lệch được xác định rõ ràng, nhằm đảm bảo tính chính xác trong việc cập nhật.

Để xây dựng một hệ thống tuyến tính nhằm tìm các hệ số nâng cho các giá trị, cần đảm bảo rằng các moment bằng 0 ở tất cả các mức Các bước thực hiện bao gồm: đầu tiên, đặt giá trị của biến h s bằng 1 và tất cả các giá trị d khác bằng 0 Sau đó, áp dụng biến đổi ngược để xác định cách chia các hệ số d này vào các hệ số a và tạo ra hệ thống tuyến tính cho các biến số.

Hệ số lifting được ký hiệu là , trong khi moment thứ i được biểu thị bằng     Chỉ số liên quan đến hệ số tại mức đang xét là  , và ma trận moment có độ ủ ậ được ký hiệu là   Cần lưu ý rằng giá trị của  có thể thay đổi từ 1 đến đội t dài của tín hiệu Hệ số lifting sẽ ảnh hưởng đến các hệ số khác trong quá trình tính toán.

Với ở mỗi mức, thực hiện quỏ trỡnh như trờn để tại cỏc hệ số lifting ẹ.

Sau khi xây dựng được các hệ số lifting thực hiện bước , update Cho    và

Biến đổi Wavelet trong xử lý nén ảnh

Biến đổi Wavelet Haar là một trong những biến đổi Wavelet cơ bản nhất, có khả năng tạo ra các hình ảnh như ba bức đầu tiên trong hình 3.1, dẫn đến bức ảnh hoàn thiện của Rose Parks Hình ảnh này được tách ra từ một file ảnh gif tải về từ Internet Tất cả các tính toán và quá trình tái tạo, hiển thị các bức ảnh theo dạng này có thể được thực hiện bằng phần mềm Matlab.

Mỗi bức ảnh số trong hình 3.1 được biểu diễn toán học bằng một ma trận có kích thước 128x128, trong đó các giá trị số nằm trong một dải nhất định.

0 (đại diện cho màu đen) đến một số dương toàn bộ (đại diện cho màu trắng)

Bức ảnh cuối cùng được gọi là ảnh 5 bit, sử dụng 32 độ bóng khác nhau của màu xám Ma trận đặc biệt đã được áp dụng để biểu diễn ảnh này trong khoảng từ 0 đến 1984, với 31 bước tăng của 64.

53 những con số chính xác không quan trọng, chúng được chọn sao cho tránh các phần lẻ dư ra trong các phép tính toán sau đó).

Mỗi ma trận bao gồm các ô vuông nhỏ được làm bóng với mức xám không đổi, tùy thuộc vào giá trị số học của chúng Những ô vuông này được gọi là điểm ảnh (hay pixel) và có thể được nhận diện rõ hơn khi bức ảnh được phóng to, như thể hiện trong hình 3.2a.

Ví dụ chi tiết hơn về một hình ảnh 8-bit với kích thước 256x256 pixel, như bức chân dung của Nelson Mandela trong hình 3.2b, cho thấy rõ nét đặc trưng của hình ảnh này.

(illusion) của một bức ảnh được làm bóng một cách liên tục.

Hình 3-5 Rosa Parks (1955) và Nelson Mandela (1990)

Các ma trận xác định ảnh có kích thước 128 x 384 và 256 x 356 thành phần, cho thấy những thách thức trong việc lưu trữ trung gian Ảnh màu có kích thước lớn hơn, nhưng có thể được xử lý hiệu quả bằng cách giải nén thành 3 mảng "grayscale-like", tương ứng với các màu đỏ, xanh lá cây và xanh dương.

Cơ chế biến đổi này cho phép lưu trữ và truyền tải hiệu quả các mảng lớn số liệu Các ảnh gốc hoặc các phiên bản gần giống có thể được khôi phục bằng máy tính một cách hiệu quả Ví dụ, một ảnh 8x8 pixel có thể được xem xét, trong đó một vùng 6 ảnh nhỏ xung quanh mũi được trích xuất từ hình ảnh gốc Vùng ảnh này được đánh dấu rõ ràng để dễ dàng nhận diện.

Hình 3-6 Rosa Parks – Trích dẫn m t vùng nh nh nghiên c uộ ả ỏ để ứ

Hình ảnh này được biểu diễn bởi các dòng từ 60 đến 67 và các cột từ 105 đến

112 trong ma trận được xác định trong hình 3 Bây giờ ta có thể hiển thị và đặt tên 5 cho ma trận con này là ma trận P:

Trong hình 3.6b, trải căng ra (contrast stretched) được sử dụng để đánh dấu các biến tinh tế giữa nhiều điểm thay đổi khác nhau, như các giá trị nhỏ nhất và lớn nhất của ma trận, với giá trị 448 và 1600 tương ứng với màu đen và trắng, mà không thể nhận thấy trong hình 3.5a Để giải thích cách biến đổi Wavelet được áp dụng cho biến đổi này, trước tiên chúng ta sẽ mô tả phương pháp lấy trung bình (averaging) và tính vi phân (differencing) cho các chuỗi dữ liệu.

Chúng ta sẽ áp dụng kỹ thuật này để biến đổi toàn bộ ma trận bằng cách coi mỗi dòng như một chuỗi, sau đó tính trung bình và vi phân cho từng thành phần, tạo ra một ma trận mới Tiếp theo, chúng ta sẽ lặp lại quy trình tương tự với các cột để có được một ma trận mới Kết quả cuối cùng là một ma trận đã được biến đổi cả theo dòng lẫn cột.

Xem xét ma trận P ở trên, bảng dưới đây trình bày các dòng liên tiếp thể hiện kết quả của các bước biến đổi ban đầu, trung gian và cuối cùng.

B ng 3-1 Kả ết quả 3 bước biến đổi Wavelet tương ứng

Có 3 bước trong quá trình biến đổi vì chuỗi dữ liệu có độ dài 8=2 3 Dòng đầu tiên của bảng là chuỗi dữ liệu gốc (lấy dòng đầu tiên của ma trận P), trong đó có thể coi như 4 cặp số Bốn số đầu tiên trong dòng thứ 2 lần lượt là trung bình cộng của 4 cặp số trên Tương tự, 2 số đầu tiên của dòng thứ 3 lần lượt là trung bình cộng của 2 bộ 4 số dòng đầu tiên Số đầu tiên dòng thứ 4 là trung bình cộng của cả 8 số trong dòng đầu.

Các số được tô đậm trong bảng thể hiện độ sai khác của giá trị trung bình Bốn giá trị in đậm trong dòng thứ hai tương ứng với hiệu của bốn giá trị trung bình đầu tiên so với bốn thành phần đầu tiên trong mỗi cặp số, cụ thể là hiệu của 640, 1216, 1408, 1536 với 576, 1152, 1344, 1536, cho kết quả lần lượt là -64, -64, -64, 0 Những kết quả này được gọi là các hệ số chi tiết và được lặp lại ở các dòng tiếp theo trong bảng.

Trong bảng, số thứ 3 và thứ 4 của dòng 3 thể hiện hiệu số giữa 928, 1472 với 640, 1408, cho kết quả lần lượt là -288 và -64 Hai hệ số này cũng được lặp lại ở dòng cuối cùng Cuối cùng, số thứ 2 trong dòng cuối cùng là -272, đại diện cho hệ số chi tiết, phản ánh hiệu số giữa 1200 và 928.

Kết quả cuối cùng là một ma trận T 8x8 mới, gọi là ma trận biến đổi Wavelet Haar:

Ma trận chứa một giá trị đại diện cho giá trị trung bình tổng cộng ở góc trên bên trái, cùng với 63 hệ số chi tiết Một điểm đáng chú ý của biến đổi Wavelet là các vùng ít thay đổi trong dữ liệu gốc được biểu thị bằng các giá trị nhỏ hoặc gần như bằng 0 sau khi thực hiện biến đổi Các giá trị 0 trong ma trận T xuất hiện do sự hiện diện của các hệ số liền kề giống nhau trong ma trận gốc P, trong khi các giá trị -2, -4 và 4 trong T là kết quả của các hệ số liền kề gần giống nhau trong ma trận P.

Một ma trận có tỷ lệ các hệ số bằng 0 lớn được gọi là ma trận thưa (sparse) Biến đổi Wavelet của ảnh thường tạo ra ma trận thưa hơn so với ảnh gốc, giúp việc lưu trữ và truyền tải dữ liệu trở nên dễ dàng hơn Điều này là nhờ vào khả năng đặc biệt hóa các vùng dữ liệu và vùng có giá trị 0 Ví dụ, thay vì mô tả 10,000 hệ số của ma trận 100x100, ta có thể chỉ cần nói rằng “ma trận này có giá trị 7 tại vị trí (2,2) và (6,8), còn lại là 0”, điều này tiết kiệm thời gian và công sức hơn rất nhiều.

Biến đổi wavelet dựa trên cơ chế lifting

Lifting là một phương pháp thiết kế biến đổi wavelet, sử dụng một chuỗi bộ lọc gọi là bước lifting Trong quá trình này, tín hiệu ban đầu được chia thành các mẫu chẵn và lẻ, với các mẫu lẻ được dự đoán từ các mẫu chẵn Sự dư thừa trong quá trình dự đoán này được tận dụng để cải thiện các mẫu chẵn, tạo ra một cách tiếp cận hiệu quả trong phân tích tín hiệu.

Biến đổi tín hiệu băng thấp và băng cao có thể liên kết cho đến khi đạt được tín hiệu cuối cùng, với cơ chế luôn khả nghịch ở mọi mức độ Hình 3.10 b minh họa quá trình biến đổi ngược Các bộ lọc sử dụng trong dự đoán và bổ sung được gọi là bộ lọc phân tích và tổng hợp của DWT Kiểm tra kỹ lưỡng các bộ lọc cho thấy tất cả các mẫu lẻ đều được dự đoán từ giá trị trung bình và mở rộng.

Các pixel chẵn lân cận được bổ sung từ giá trị trung bình và mở rộng của hai pixel lẻ lân cận trong quá trình dư thừa dự đoán.

Hình 3-10 Biến đổi wavelet dựa trên cơ chế lifting

Biến đổi wavelet ADL

Sự khác biệt chính giữa lifting thông thường và ADL nằm ở khả năng dự đoán Trong khi lifting thông thường thực hiện dự đoán theo chiều dọc hoặc ngang, ADL lại tiến hành phân tích một cách sâu sắc hơn để đưa ra những dự đoán chính xác và hiệu quả hơn.

63 mỗi tương quan về không gian trong vùng khảo sát theo tất cả các hướng, sau đó thực hiện dự đoán theo hướng có lỗi dự đoán thấp nhất.

Giả ử s tín hi u hai chi u ệ ề 󰇛 󰇜 với    , đầu tiên, sử dụng biến đổi wavelet một chiều để chia tín hiệu thành các băng cao và thấp theo hướng dọc và ngang Mỗi biến đổi wavelet một chiều trở thành một bước trong quy trình lifting Như đã trình bày trước đó, quy trình lifting bao gồm ba bước chính: chia, dự đoán và cập nhật.

Tất cả các mẫu được chia thành 2 ph n: các m u ch n ầ ẫ ẵ  và l ẻ:

Trong quá trình dự đoán, các mẫu lẻ ở vị trí nguyên sẽ được xác định dựa trên các mẫu chẵn xung quanh Việc tính toán dự đoán dư thừa hoặc các hệ số băng con cao được thực hiện theo phương pháp nhất định.

Dự đoán giá trị  󰇛󰇜 là sự kết hợp tuyến tính của các hệ số chẵn lân cận, thể hiện mối tương quan chặt chẽ Như minh họa trong Hình 1, các pixel có sự tương quan cao nằm ở góc , với các pixel nguyên được đánh dấu là “ ”, pixel đơn là “+” và pixel phần tư là “x” Dự đoán 󰇛   󰇜 được xác định thông qua sự kết hợp tuyến tính của các mẫu chẵn, được chỉ ra theo chiều mũi tên trong Hình 1.

; ng s Trọ ố  cho bởi bộ ọ l c.

Lưu ý, không cần ph i l y m u ả ấ ẫ  󰇛  󰇛  󰇜      󰇜 t i các v trí ạ ị nguyên

Hàm đáp ứng xung h u hữ ạn tương quan trong miền là

Chỉ số a và b xác định giá trị giới hạn của bậc lọc wavelet FIR Do đó, bước dự đoán vẫn được tính toán từ các mẫu even, và ADL hoàn toàn có khả năng khôi phục chính xác các mẫu odd theo công thức (3.2).

Trong bước update, các mẫu even được thay th b i công th ế ở ức:

Hình 3-11 Bước dự đoán và update theo góc dọc trong biến đổi ADL a Bước dự đoán b Bước update

Lưu ý rằng góc luôn nằm tại vị trí nguyên, và bước cập nhật trong cơ chế ADL áp dụng với giá trị góc như trong bước dự đoán Chúng ta thực hiện dự đoán và cập nhật tại cùng một giá trị góc để tối ưu hóa thông tin phản hồi trong góc mã hóa Thực tế cho thấy việc sử dụng góc trong bước cập nhật bằng góc trong bước dự đoán là tối ưu nhất cho việc giảm thiểu các biến thể ảnh Thông thường, trong bước cập nhật của ADL, các mẫu được dự đoán như sau:

Trọng s ố   được cho b i b l c; ở ộ ọ 󰇛  󰇛󰇜    󰇜 có th không ể ph i là h s thông cao nguyên do giá tr ả ệ ố ị  Hàm đáp ứng xung h u hữ ạn tương quan trong mi n ề là

Chỉ số và xác định giới hạn hình trúc của bộ lọc wavelet FIR là rất quan trọng Khâu biên độ trong quá trình biến đổi ngược khá đơn giản Với các biến thể mẫu và cập nhật, chúng ta có thể khôi phục chính xác các mẫu chẵn Để khôi phục tín hiệu hai chiều một cách chính xác, cần đặt các mẫu dự đoán và cập nhật tại những vị trí nguyên.

Các hàm FIR c a Haar m r ng, b lủ ở ộ ộ ọc 5/3 và 9/7 được cho tương ứng như sau:

Có th ể coi Lifting thông thường là một trường hợp đặc biệt của Lifting ADL với

Biến đổi wavelet ADL theo phương ngang có thể tối ưu hóa hướng dự đoán trong phân tích lifting mà không yêu cầu cấu trúc giao với phương dọc Nghiên cứu này nhấn mạnh tính linh hoạt của biến đổi ADL, cho thấy biến đổi wavelet 1D là một thành phần quan trọng trong khâu lifting Đặc biệt, dự đoán không gian có thể ảnh hưởng đến khâu chia băng con nếu được áp dụng đúng cách.

   , bước phân tích lifting trướ đã xoá tương quan về hước ng

Biến đổi wavelet ADL hai chiều có khả năng phân tích thành nhiều mức độ khác nhau, tương tự như biến đổi 2D DWT thông thường Mặc dù không sử dụng phương pháp lifting, biến đổi này vẫn tạo ra các cấu trúc băng con tương tự như biến đổi wavelet 2D truyền thống Điều này là nhờ vào cách mà biến đổi wavelet ADL hai chiều chia các băng con thấp và cao theo cả hai hướng, tương tự như cách thực hiện của biến đổi wavelet thông thường, tạo ra các băng con LL, LH, HL và HH trong cùng một mức phân tích Để hiểu rõ hơn về hiệu quả của biến đổi wavelet ADL hai chiều, ta có thể quan sát Hình 2, trong đó băng con của ảnh đạt được từ phân tích ADL cho thấy rõ sự mờ ảo.

HL, ch s c dỉ có ọ ọc đầu tiên sau biến đổi dọc mang năng lượng đáng kể Dự đoán hướng tương thích xoá thành công dư thừa thống kê trong tất cả các hướng khác, biểu diễn thông qua các liệu dự đoán nhỏ ở ba hàng cuối của băng con HL Băng con.

HH mang những mẫu chữ ẩn chứa năng lượng và không chứa thông tin nhận biết cấu trúc tín hiệu, sau khi biến đổi thông thường theo hướng ngang và dọc.

Hình 3-12 nh g c (a) và nh k t qu Ả ố ả ế ả sau băng con LL (b), LH (c), HL (d), HH (e)

Hình 3-13 Phân vùng ảnh Barbara và hướng trong m i block ỗ

Bên cạnh những đường sắc nét, một số cấu trúc đường chéo tại tầng số cao và tầng số thấp trong băng con LH đã bị ảnh hưởng Điều này xảy ra do quá trình áp lực mực nước trong bước biến đổi, làm giảm độ phân giải không gian và không đáp ứng được yêu cầu định hướng dự đoán của cơ chế ADL Mặc dù vậy, năng lượng tín hiệu vẫn được chuyển vào băng con LH thấp hơn trong cơ chế lifting thông thường Để nhận thấy rõ ưu điểm của biến đổi ADL, chúng ta cần xem xét Hình 3.13.

Hình 3-14 So sánh nh x ả ửlý theo JPEG2000 và biến đổi ADL 2D 1 m c ứ

3.7.1 Nội suy pixelcon Để dự đoán hướng theo góc   b t kấ ỳ, cơ chế ADL c n các giá tr v ầ ị ề cường độ t i t ng v trí pixel thành ph n Nói cách khác, giá tr ạ ừ ị ầ ị   dùng trong công th c ứ

(3) and (6) không nh t thiêt ph i là s nguyên ấ ả ố Do đó, nội suy các pixel con tr ở thành m t vộ ấn đề

Để khôi phục hoàn toàn, các pixel nguyên dùng để nội suy pixel fraction góc ở phía phải là các mẫu không tham gia vào bước dự đoán Biểu thức nội suy được áp dụng trong trường hợp này nhằm tối ưu hóa quá trình.

 bi u di n các giá tr nguyên quanh ể ễ ị 󰇛  󰇜 và   là thông s lố ọc n i suy Áp d ng (3) và biộ ụ ến đổi trong (11), ta có:

Kỹ thuật nội suy Sinc là phương pháp phổ biến được áp dụng để thực hiện nội suy cho các tín hiệu Một thách thức trong nội suy pixel con là thiết kế bộ lọc tối ưu Khi mở rộng bộ lọc nội suy cho các bộ lọc FIR khác, chúng ta có thể thiết kế một bộ lọc nhằm giảm thiểu năng lượng băng con cao một cách hiệu quả.

Băng con Biến đổi Ảnh

Barbara Ảnh xe đạp Ảnh cafe Ảnh Foreman

B ng 3-2 Gả iá trị ệ ố trung bình trong băng h s con LH, HL và HH

Việc tối ưu có thể giải quyết bằng phương thức bình phương tối thiểu.

Các hệ số lọc …           đượ ối ưu cho ảnh đầc t u vào Trước đây, các h s tệ ố ối ưu phải gửi như thông tin phụ

Biến đổ i Wavelet 2- D dựa trên cơ chế Lifting kết hợp dự đoán định hướng (2D -dir- DWT) 72

Sau đây sẽ trình bày cách áp dựng biến đổi 2D DWT thẳng cho tín hiệu 2D sử dụng cơ chế lifting.

Liên kết biến đổi 1D DWT dựa trên cơ chế lifing theo chiều dọc và ngang

Biến đổi wavelet dựa trên cơ chế lifting kết hợp dự đoán định hướng thực hiện bằng cách chọn các pixel một cách thông minh, không nhất thiết theo chiều dọc hoặc ngang như trong biến đổi 2D DWT Việc dự đoán các pixel trong hàng lẻ sử dụng phân đoạn pixel hoặc pixel hoàn chỉnh từ hàng chẵn theo một hướng cụ thể Trong bước bổ sung, pixel trong hàng chẵn được bổ sung từ dư thừa dự đoán của hàng lẻ Sau khi lấy mẫu theo hướng dọc, các bước dự đoán và bổ sung tương tự được thực hiện theo hướng ngang, độc lập với tín hiệu băng thấp và băng cao Cuối cùng, tín hiệu băng thấp có thể được biến đổi lại bằng hệ lifting định hướng để đạt được phân tách băng con định hướng đa mức.

Có nhiều phương pháp để dự đoán định hướng, cho phép chúng ta dự đoán hoặc bổ sung pixel từ bất kỳ hàng chẵn hoặc lẻ nào Tuy nhiên, việc sử dụng các pixel lân cận sẽ mang lại hiệu quả dự đoán tốt hơn Có hai phương thức chính là lifting theo chiều ngang và lifting theo chiều dọc.

Hình 3-17 Các lựa chọn d ự đoán hướng

Biến đổi Wavelet 1 D dựa trên cơ chế lifting kết hợp dự đoán dư thừa(1D - -dir-DWT)

Biến đổi 1D DWT sử dụng cơ chế lifting kết hợp với dự đoán định hướng thông qua các bước lifting theo hướng dọc Phương pháp này giúp tối ưu hóa quá trình biến đổi, nâng cao hiệu quả trong việc xử lý tín hiệu.

Dư thừa dự đoán trong biến đổi DWT 1-D định hướng có hiệu quả tốt hơn so với DWT 2-D định hướng, vì các đặc tính của dư thừa dự đoán chặt chẽ hơn với các hàm cơ bản của DWT 1-D Năng lượng của dư thừa dự đoán thường tập trung dọc theo cạnh và biên của đối tượng có dạng 1 hướng, do đó, biến đổi với các hàm cơ bản hỗ trợ cấu trúc 1 hướng có khả năng thực hiện tốt hơn.

Mặc dù biến đổi 1D có khả năng nâng cao chất lượng nén dư thừa dự đoán, biến đổi 2D vẫn được ưa chuộng nhờ hiệu quả vượt trội ở một số khu vực trong dư thừa dự đoán Vì vậy, việc kết hợp cả hai loại biến đổi trong quá trình sử dụng là cần thiết, tức là áp dụng biến đổi phù hợp cho từng block cơ bản.

Mô phỏng và thực nghiệm

Tiêu đề	Nghiên Cứu Phân Tích Xử Lý Ảnh Bằng Phương Pháp Wavelet Định Hướng
Tác giả	Mai Thị Thu
Người hướng dẫn	PGS.TS. Nguyễn Hữu Trung
Trường học	Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành	Kỹ thuật truyền thông
Thể loại	Luận Văn Thạc Sĩ Kỹ Thuật
Năm xuất bản	2013
Thành phố	Hà Nội

Định dạng
Số trang	88
Dung lượng	13,31 MB

Nghiên cứu phân tích xử lý ảnh bằng phương pháp wavelet định hướng

Giới thiệu chung

Giới thiệu về nén ảnh

Độ phân giải thời gian – tần số và nguyên lý bất định

Kỹ thuật mã hoá dựa trên phép biến đổi

Tổ chức luận văn

Lý thuyết Wavelet

Giới thiệu chung về Wavelet

Biến đổi wavelet liên tục

Biến đổi Wavelet rời rạc ( Discrete wavelet transform)

Chuỗi Wavelet

Phân loại Wavelet

Ứng dụng Wavelet định hướng trong kỹ thuật nén ảnh

Giới thiệu

Tính chất bất đẳng hướng của ảnh và dư thừa dự đoán

Nguyên lý biến đổi định hướng

Khái niệm lifting

Biến đổi Wavelet trong xử lý nén ảnh

Biến đổi wavelet dựa trên cơ chế lifting

Biến đổi wavelet ADL

Biến đổ i Wavelet 2- D dựa trên cơ chế Lifting kết hợp dự đoán định hướng (2D -dir- DWT) 72

Biến đổi Wavelet 1 D dựa trên cơ chế lifting kết hợp dự đoán dư thừa(1D - -dir-DWT)

Mô phỏng và thực nghiệm

Nguyên lý biến đổi định hướng

Một số kết quả nghiên cứu thực nghiệm