Cơ sở lý thuyết công nghệ xử lý ảnh

Một phần của tài liệu Nghiên cứu, thiết kế hệ thống điều khiển thông minh cho rô bốt SHRIMP (Trang 51 - 58)

CHƯƠNG 2: NGHIÊN CỨU VỀ HỆ THỐNG CẢM BIẾN VÀ CAMERA QUAN SÁT CHO RÔ BỐT TỰ HÀNH

2.4 Camera quan sát và kỹ thuật xử lý ảnh

2.4.2 Cơ sở lý thuyết công nghệ xử lý ảnh

2.4.2.1 Khái niệm cơ bản

Hình ảnh tĩnh có thể được biểu diễn bởi hàm hai chiều f(x, y), trong đó, x và y là toạ độ không gian phẳng (2 chiều). Khi xét ảnh “đen trắng”, giá trị hàm f tại một điểm được xác định bởi toạ độ (x, y) được gọi là độ chói hay mức xám của ảnh tại điểm này. Nếu x, y và f là một số hiện hữu các giá trị rời rạc, lúc đó chúng ta có ảnh số. Xử lý ảnh số là quá trình biến đổi ảnh số trên máy tính. Như vậy, ảnh số được tạo ra bởi một số hữu hạn các điểm ảnh, mỗi điểm ảnh nằm tại một vị trí nhất định và có một giá trị nhất định. Một điểm ảnh trong một ảnh còn được gọi là pixel.

Có thể tạm phân biệt các hệ thống xử lý ảnh theo mức độ phức tạp của thuật toán xử lý như sau:

Xử lý ảnh mức thấp: đó là các quá trình biển đổi đơn giản như thực hiện các bộ lọc nhằm khử nhiễu trong ảnh, tăng cường độ tương phản hay độ nét của ảnh.

Trong trường hợp này, tín hiệu đưa vào hệ thống xử lý và tín hiệu ra là ảnh quang học.

Xử lý ảnh mức trung bình: quá trình xử lý phức tạp hơn, thường được sử dụng để phân lớp, phân đoạn ảnh, xác định và dự đoán biên ảnh, nén ảnh để lưu trữ hoặc truyền phát. Đặc điểm của các hệ thống xử lý ảnh mức trung bình là tín hiệu đầu vào là ảnh, còn tín hiệu đầu ra là các thành phần của tín hiệu gốc, hoặc luồng dữ liệu nhận được sau khi nén ảnh.

2.4.2.2 Lĩnh vực ứng dụng trong xử lý ảnh.

Xử lý ảnh có liên quan đến nhiều ngành khác như hệ thống thông tin, lý thuyết thông tin, lý thuyết thống kê, trí tuệ nhân tạo.. Xử lý ảnh tuy ra đời chưa lâu nhưng kể từ khi ra đời nó đã có ứng dụng rất lớn trong nhiều lĩnh vực khoa học kỹ thuật.

Có thể kể ra đây những ứng dụng của nó như sau: Trong y học nó có tác dụng làm nổi ảnh của các vùng bệnh hoặc các khớp xương trong phim chup X-quang, làm nổi ảnh của các tế bào ung thư trong chụp citi-cắt lớp hoặc là trong kỹ thuật mổ nội soi...Trong thiên văn học xử lý ảnh cho phép khôi phục lại các ảnh do tác động của khí quyển .Trong truyền hình nó giúp tăng cường độ phân giải mà không cần thay đổi cấu trúc bên trong của hệ thống truyền tải, nén ảnh trong quả trình truyền đi xa hoặc lưu trữ.

Trong kỹ thuật đặc biệt là kỹ thuật điều khiển tự động thì xử lý ảnh ngày càng đóng vai trò quan trọng:

Trong robot tự hành: Nó có thể giúp cho robot truy tìm được những vật thể mong muốn, nó có thể giúp robot tính toán chiều cao của vật thể khi kết hợp với 1 sensor khoảng cách, để từ đó tự động quyết định các phương pháp điều khiển thích hợp, nó có thể giúp phát hiện và kiểm soát các biên ảnh để tự động tránh các vật cản và dò tìm đường đi..v.v..

Trong điều khiển tự động trong công nghiệp: nó có thể thay thế cho một loạt các sesor màu sắc trong hệ thống phân loại sản phẩm nhờ vậy mà tiết kiệm được rất nhiều tiền bạc, không gian hệ thống, đầu vào ra của các chân điều khiển cho sesor màu sắc…Trong quá trình điều khiển cánh tay robot nhờ sự phân biệt được màu sắc kết hợp với kiểm soát biên ảnh của vật thể ta có thể điều khiển chính xác cánh tay robot gắp vật thể tự động trong nhận dạng đối tượng cần gắp có thể phân loại đối tượng trong 1 hệ thống sản xuất linh hoạt.

2.4.2.3 Các giai đoạn chính trong quá trình xử lý ảnh

Đây là giai đoạn đầu tiên và quan trọng nhất trong toàn bộ quá trình xử lý ảnh. Ảnh nhận được tại đây chính là ảnh gốc để đưa vào xử lý ở các giai đoạn sau, trường hợp ảnh gốc có chất lượng kém, hiệu quả của các bước xử lý tiếp theo sẽ bị giảm.

Thiết bị thu nhận có thể là camera, cảm biến hoặc thiết bị cảm biến quang điện bán dẫn CCD (charge – Coupled Devide).

Tiền xử lý ảnh:

Giai đoạn xử lý tương đối đơn giản nhằm nâng cao chất lượng ảnh để trợ giúp cho các quá trình xử lý nâng cao tiếp theo, ví dụ: tăng cường độ tương phản, làm nổi đường biên, khử nhiễu v.v…

Phân đoạn:

Đây là một trong những vấn đề khó giải quyết nhất trong lĩnh vực xử lý ảnh. Nếu thực hiện tách quá chi tiết thì bài toán nhận dạng các thành phần được tách trở nên phức tạp, còn ngược lại nếu quá trình phân đoạn được thực hiện quá thô hoặc phân đoạn sai thì kết quả nhận được cuối cùng sẽ không chính xác.

Biểu diễn và mô tả:

Là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh. Các vật thể sau khi phân đoạn có thể được mô tả dưới dạng chuỗi các điểm ảnh tạo nên ranh giới một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó. Phương pháp mô tả thông qua ranh giới vùng thường được sử dụng khi cần tập trung sự chú ý vào hình dạng bên ngoài của chi tiết như độ cong, các góc cạnh v.v. Biểu diễn vùng thường được sử dụng khi chúng ta quan tâm tới đặc tính bên trong của vùng ảnh như đường vân hay hình dạng

Nén ảnh:

Bao gồm các biện pháp giảm thiểu dung lượng bộ nhớ cần thiết để lưu trữ ảnh, hay giảm băng thông kênh truyền, cần thiết để truyền tín hiệu hình ảnh số.

Nhận dạng:

Là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô tả vật thể đó

Hình 2.7 Các giai đoạn chính trong quá trình xử lý ảnh

2.4.2.3 Màu sắc ảnh và các thông số đặc trưng của ảnh

Cảm nhận về màu sắc là kết quả của sự nhận biết chủ quan của mắt người dưới tác động của ánh sáng. Để giải thích cơ chế cảm nhận màu sắc của mắt người, các nhà khoa học đã đưa ra nhiều giả thuyết khác nhau, trong đó thuyết ba thành phần cảm thụ màu do nhà bác học Nga Lômônôxốp đưa ra măm 1756 được công nhận rộng rãi nhất. Theo thuyết này, các tế bào hình nón trên võng mạc có thể chia ra ba loại.

Mỗi loại tế bào đặc biệt nhạy cảm với những vùng phổ nhất định trong dải quang phổ - vùng sóng ngắn (màu xanh lam – B), vùng sóng trung (màu lục – G), vùng sóng dài (màu đỏ - R). Nếu kích thích riêng từng loại tế bào, mắt sẽ cảm nhận được các màu sắc bão hoà tương ứng. Khi quan sát hình ảnh không có những màu bão hoà, nguồn sáng của ánh sáng có chứa tất cả các thành phần quang phổ tác động cùng một lúc lên cả ba loại tế bào. Sóng điện từ có bước sóng khác nhau tác động lên tế bào không đồng đều, sự khác biệt về tỷ lệ kích thích tạo nên cảm nhận về màu sắc khác nhau. Thuyết ba thành phần cảm thụ màu được chúng minh qua nhiều thực nghiệm và phù hợp với luật pha trộn màu.

Trên phương diện sinh học (cảm giác chủ quan), ánh sáng được cảm nhận thông qua ba đại lượng chính là: độ sáng, màu sắc và độ bão hoà màu.

Độ sáng – phụ thuộc vào công suất của nguồn sáng.

Độ bão hoà màu là cường độ về sắc màu qua đó ta có thể phân biệt được màu đỏ thẫm hay màu đỏ nhạt. v.v.

Dựa trên những tính chất của hệ thị giác như độ phân giải, tính lưu ảnh và thuyết ba thành phần cảm nhận màu, để tạo ra cảm giác về một màu nào đó, ta có thể thực hiện pha trộn các màu cơ bản theo những phương pháp sau:

Phương pháp cộng màu quang học:

Phương pháp này dựa trên khả năng tổng hợp màu khi các nguồn bức xạ được chiếu lên một mặt phẳng. Các nguồn bức xạ có thể được rọi cùng một lúc hay nối tiếp nhau với một tốc độ tương đối lơn (còn gọi là phép trộn màu theo thời gian), khi đó ánh sáng thứ cấp phản xạ từ bề mặt của mặt phẳng trên sẽ mang lại cho người quan sát cảm nhận về màu sắc tổng hợp. Sắc độ của màu mới phụ thuộc vào tỷ lệ công suất của các bức xạ thành phần.

Hình 2.8 Trộn màu cơ bản Phương pháp trộn màu không gian:

Khi trộn màu không gian, các phần tử ảnh mang sắc màu cơ bản nằm độc lập với nhau trong không gian, nếu những phần tử này nằm gần nhau và có kích thước nhỏ thì mắt cảm nhận chúng như một điểm ảnh, màu sắc của điểm ảnh này phụ thuộc vào tỷ lệ công suất của các màu cơ bản. Hình dạng của các phần tử có thể là các điểm tròn hay vạch màu nhỏ. Tỷ lệ công suất của các màu cơ bản có thể thay đổi bằng cách thay đổi độ chói của các phần tử ảnh tham gia trộn màu hay thay đổi kích

Để tạo ra một màu mới, ngoài phương pháp cộng các màu đơn sắc, người ta có thể sử dụng phương pháp loại bỏ một số màu từ ánh sáng trắng. Đặc điểm của phương pháp trừ là độ chói của màu được tạo ra bao giờ cũng nhỏ hơn độ chói màu trắng ban đầu.

Hình 2.9 Biểu đồ màu RGB và đặc tuyến toạ độ màu trong hệ hệ toạ đọ RGB 2.4.2.5 Các vấn đề cơ bản trong xử lý ảnh

Phần tử ảnh hay điểm ảnh (pixel):

Ảnh trong thực tế là liên tục về không gian và giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải có quá trình số hoá ảnh. Trong quá trình số hoá, người ta biến đổi từ tín hiêu liên tục sang rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về mặt không gian) và lượng hoá thành phần giá trị mà về nguyên tắc mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này người ta sử dụng khái niệm pixel hay phần tử ảnh. Như vậy một ảnh là tập hợp của các pixel ảnh khi được số hoá nó thường được biểu diễn bởi mảng 2 chiều I(n,p) với n là dòng và p là số cột. Ta nói ảnh bao gồm n x p pixel ảnh và người ta thường ký hiệu I(x,y) để chỉ

Mức xám là kết quả mã hoá tương ứng với một cường độ sáng của mỗi điểm ảnh với 1 giá trị số kết quả của quá trình lượng hoá. Các mã hoá kinh điển thường dùng là 16, 32 và 64 mức Mã hóa 256 mức là phổ dụng nhất do lý do kỹ thuật. Vì 2^8 = 256 (0,1,2,...,255), nên với 256 mức mỗi pixel sẽ được mã hoá bởi 8 bit.

Biểu diễn ảnh:

Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh là pixel.

Nhìn chung có thể xem nó như là 1 hàm 2 biến chứa thông tin biểu diễn ảnh của một ảnh. Các mô hình biểu diễn cho ta một ảnh logic hay định lượng các tính chất của hàm này. Trong biểu diễn ảnh cần chú ý đến tính trung thực của ảnh hoặc là các tiêu chuẩn thông minh để đo chất lượng ảnh hoặc tính hiệu quả của kỹ thuật xử lý.

Một số mô hình hay được dùng trong biểu diễn ảnh: Mô hình toán học, mô hình thống kê. Trong mô hình toán học ảnh 2 chiều được biểu diễn nhờ các hàm 2 biến trực giao gọi là hàm cơ sở. Trong mô hình thống kê một điểm ảnh được coi như một phần tử của một tập hợp đặc trưng bởi các đại lượng như: Kỳ vọng toá học, Hiệp biến, phương sai...

Tăng cường và khôi phục ảnh:

Là bước quan trọng tạo tiền đề cho xử lý ảnh nó gồm một loạt các kỹ thuật như : lọc độ tương phản khử nhiễu nổi màu...khôi phục ảnh nhằm loại bỏ các suy giảm trong ảnh với 1 hệ thống tuyến tính.

Biến đổi ảnh:

Thuật ngữ biến đổi ảnh (Image Transform) thường dùng để nói tới một lớp các ma trận đơn vị và các kĩ thuật biến đổi ảnh. Cũng như các tín hiệu 1 chiều được biểu diễn bởi một chuỗi các hàm cơ sở, ảnh cũng có thể được biểu diễn bởi một chuỗi rời rạc các ma trận gọi là các ảnh cơ sở.

Phân tích ảnh:

Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của một ảnh để đưa ra một mô tả đây đủ về ảnh. Các kỹ thuật được sử dụng ở đây nhằm mục đích xác

Nhận dạng ảnh:

Là quá trình liên quan đến mô tả đối tượng mà người ta muốn đặc tả nào đó. Qua trình nhận dạng thường đi sau quá trình chọn các đặc tính chủ yếu của đối tượng.

Nó có hai kiểu mô tả đối tượng:

+ Mô tả tham số (nhận dạng theo tham số) + Mô tả theo cấu trúc (nhận dạng theo cấu trúc)

Trên thực tế người ta áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như nhận dạng vân tay, nhận dạng chữ viết(chứ cái và chữ có dấu).

Nhận dạng chữ in hoặc chữ đánh máy phục vụ cho việc tự động hoá đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tín. Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết kiểu chữ .v.v) phục vụ cho nhiều lĩnh vực

Ngoài ra hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng nơron đang được áp dụng và cho kết quả khả quan.

Nén ảnh:

Dữ liệu ảnh cung như các dữ liệu khác cũng cần phải truyền đi hoặc lưu trữ trên mạng do đó chúng cần phải được nén lại để làm giảm dung lượng.

Một phần của tài liệu Nghiên cứu, thiết kế hệ thống điều khiển thông minh cho rô bốt SHRIMP (Trang 51 - 58)

Tải bản đầy đủ (PDF)

(120 trang)