TỔNG QUAN
Tổng quan về lĩnh vực nghiên cứu
Content-Based Image Retrieval (CBIR), originating in 1992, focuses on retrieving images based on their visual content rather than metadata This method, also known as Visual Information Retrieval (VIR), utilizes various algorithms to analyze and match images, enhancing the efficiency of image searches By leveraging features such as color, texture, and shape, CBIR improves the accuracy of visual data retrieval, making it a vital tool in fields like digital libraries and online image databases.
Tra cứu thông tin trực quan là một lĩnh vực nghiên cứu mới trong công nghệ thông tin, nhấn mạnh tầm quan trọng của việc tương tác với nội dung hình ảnh Các yếu tố trực quan như màu sắc, kết cấu, hình dạng và bố cục không gian có vai trò quan trọng trong việc cảm nhận nội dung ảnh Những khái niệm cao cấp như ý nghĩa đối tượng và khung cảnh trong ảnh được sử dụng làm đầu mối để tìm kiếm hình ảnh tương tự trong cơ sở dữ liệu.
Các yếu tố mô tả nội dung liên quan đến đặc trưng cảm nhận như màu sắc, kết cấu, hình dạng và mối liên hệ không gian chuyển động Nguồn gốc của màu sắc bao gồm các yếu tố như đối tượng, vai trò và cảm giác liên quan Do đó, phân tích ảnh và nhận dạng trong thị giác máy tính đóng vai trò quan trọng trong hệ thống tra cứu thông tin trực quan, cho phép tự động trích xuất thông tin qua phân tích phân bố điểm ảnh và rút ra các đo lường nội dung trực quan.
Trong luận văn này, tác giả tập trung vào đặc trưng mức xám trong việc phát triển hệ thống tra cứu ảnh y khoa dựa trên nội dung Hệ thống này có các chức năng tiêu biểu nhằm tối ưu hóa quá trình tìm kiếm và truy xuất ảnh y khoa, giúp cải thiện độ chính xác và hiệu quả trong việc hỗ trợ chẩn đoán.
Hệ thống tra cứu ảnh dựa trên nội dung tiêu biểu không chỉ xử lý đa dạng nguồn thông tin như văn bản, hình ảnh và video, mà còn đáp ứng hiệu quả nhu cầu của người sử dụng Hệ thống này thực hiện phân tích toàn diện để cung cấp kết quả chính xác và phù hợp nhất.
CHƯƠNG 1 TỔNG QUAN cả các nội dung của nguồn thông tin cũng như các truy vấn sử dụng, và đem so sánh các nội dung này để tra cứu các thông tin liên quan Các chức năng chính của một hệ thống tra cứu ảnh bao gồm các thành phần và nội dung sau:
Hình 1.1: Mô hình hệ thống tra cứu ảnh dựa theo nội dung
Phân tích nội dung từ các nguồn thông tin và biểu diễn chúng một cách hợp lý là bước quan trọng để so sánh các truy vấn Quá trình này thường tốn nhiều thời gian vì cần xử lý từng thông tin nguồn (các ảnh) trong cơ sở dữ liệu một cách tuần tự Tuy nhiên, đây là bước thực hiện chỉ một lần.
Phân tích các truy vấn người dùng và chuyển đổi chúng thành định dạng phù hợp để so sánh với cơ sở dữ liệu nguồn là một bước quan trọng Quá trình này tương tự như bước trước, nhưng chỉ áp dụng cho hình ảnh truy vấn.
Phương pháp này định nghĩa cách so sánh các truy vấn tìm kiếm với thông tin trong cơ sở dữ liệu, nhằm tra cứu thông tin liên quan một cách hiệu quả.
Các kỹ thuật đánh chỉ số hiện đại có thể nhanh chóng tổ chức lại không gian đặc trưng, giúp tăng tốc quá trình đối sánh.
- Thực hiện các điều chỉnh cần thiết trong hệ thống dựa trên phản hồi từ người sử dụng hoặc các ảnh được tra cứu b Truy vấn người sử dụng
Có nhiều cách để gửi truy vấn trực quan, và một phương pháp tốt là phương pháp tự nhiên cho người dùng, đồng thời thu thập đủ thông tin để trích xuất kết quả có ý nghĩa Dưới đây là các phương pháp truy vấn phổ biến trong việc tra cứu ảnh dựa trên nội dung.
Truy vấn bởi ảnh mẫu (QBE – Query By Example) cho phép người sử dụng chỉ định một hình ảnh truy vấn để tìm kiếm các hình ảnh tương tự trong cơ sở dữ liệu Hình ảnh truy vấn có thể là ảnh thông thường, ảnh quét có độ phân giải thấp, hoặc phác thảo được tạo ra từ công cụ đồ họa Hệ thống này mang lại lợi ích lớn, vì nó cung cấp một phương pháp tự nhiên và dễ dàng cho người dùng khi tra cứu hình ảnh trong cơ sở dữ liệu.
Truy vấn bởi đặc trưng (QBF – Query By Feature) cho phép người dùng xác định các đặc trưng quan tâm trong việc tìm kiếm, chẳng hạn như tìm kiếm ảnh với góc phần tử trái chứa 25% pixel màu vàng Một ví dụ điển hình của hệ thống này là QBIC (Query by Image Content), nơi người dùng có thể thực hiện truy vấn thông qua các công cụ giao diện đồ họa chuyên dụng Hệ thống tra cứu ảnh dựa theo nội dung này mang lại trải nghiệm tìm kiếm trực quan và hiệu quả cho người sử dụng.
1 Flickner, M., Sawhney, H., Niblack, W., Ashley, J., Huang, Q., Dom, B., Gorkani, M., Hafner, J., Lee, D., Petkovic, D., Steele, D., and Yanker, P Query by image and video content: The QBIC project IEEE Computer,
CHƯƠNG 1 TỔNG QUAN chuyên nghiệp thì có thể thấy loại truy vấn này là bình thường, nhưng người sử dụng chung thì không
Các truy vấn dựa vào thuộc tính sử dụng chú thích văn bản do con người tạo ra làm khoá tra cứu chính Phương pháp này yêu cầu độ trừu tượng cao, điều mà khó có thể đạt được bằng các phương pháp tự động hoàn toàn, do ảnh chứa nhiều thông tin phức tạp không thể tóm tắt chỉ bằng một vài từ khoá Mặc dù phương pháp này nhanh chóng và dễ thực hiện, nhưng nó cũng mang lại độ chủ quan và nhập nhằng cao.
Nghiên cứu và thương mại hiện nay chủ yếu tập trung vào việc phát triển các hệ thống hiệu quả thông qua phương pháp QBE Trong luận văn này, tác giả áp dụng phương pháp QBE để xây dựng phần truy vấn người dùng, nhằm cải thiện việc tra cứu ảnh y khoa dựa trên nội dung và cấu trúc của ảnh.
Các kết quả nghiên cứu trong nước
Sự phát triển liên tục của thiết bị và kỹ thuật truy vấn hình ảnh đã làm nổi bật vai trò quan trọng của xử lý ảnh trong việc hỗ trợ truy vấn ảnh trong cơ sở dữ liệu Điều này giúp tăng tốc độ và độ chính xác của quá trình truy vấn nhờ vào các thuật toán truy vấn theo nội dung ngày càng tiên tiến và hoàn thiện.
Với những khả năng mạnh mẽ trong truy vấn ảnh theo nội dung, nhiều đề tài và công trình nghiên cứu trong nước đã được phát triển.
Luận án Truy vấn ảnh theo nội dung sử dụng trích đặc trưng trên nền wavelets
Nghiên cứu này tập trung vào việc sử dụng biến đổi wavelets để thiết kế đặc trưng ảnh và phát triển các thuật toán trích xuất đặc trưng ảnh Luận án đề xuất các giải thuật truy vấn ảnh có thể được áp dụng trong các công cụ truy vấn ảnh, nhằm cải thiện hiệu quả tìm kiếm và truy xuất thông tin từ hình ảnh.
Luận án nghiên cứu cải tiến phương pháp tra cứu ảnh bằng cách sử dụng đặc trưng màu và thông tin không gian, nhằm giải quyết các vấn đề như giảm không gian lưu trữ cho các lược đồ màu, tăng độ chính xác tra cứu, và giảm độ phức tạp tính toán Đề tài cũng kết hợp đặc trưng thị giác và ngữ nghĩa trong truy vấn thông tin thị giác dựa vào nội dung, đồng thời xem xét các vấn đề chọn lọc trong công nghệ thông tin và truyền thông.
Các nghiên cứu ở cấp độ luận văn Thạc sĩ đã tập trung vào việc phát triển các phương pháp kết hợp đặc trưng màu sắc, hình dạng và vị trí để truy vấn ảnh, cũng như ứng dụng thuật toán học máy trong việc trích chọn đặc trưng ảnh để tìm kiếm sản phẩm Ngoài ra, nghiên cứu cũng đã đề xuất phương pháp tra cứu ảnh dựa trên nội dung và xây dựng hệ thống tra cứu cây thuốc.
Ngoài ra, còn tồn tại một số sản phẩm phần mềm liên quan đến thị giác máy tính, điển hình là phần mềm truy vấn thông tin thị giác VIROS (Visual Information Retrieval Of).
The software suite for sports events includes SEClassification for event classification, SERetrieval for event information retrieval, and SESummarization for summarizing sports events Additionally, it features advanced facial recognition technology.
GAFAREC (Face recognition by GA), phần mềm phân tích tế bào CELLANA (Analyze of cells) của Khoa Công nghệ Thông tin – Đại học Khoa học Tự Nhiên TP.HCM
Các nghiên cứu hiện tại dựa trên những đặc trưng cụ thể của ảnh và mỗi phương pháp đều có những ưu điểm riêng Tuy nhiên, kết quả vẫn còn hạn chế do chưa kết hợp hiệu quả các phương pháp truy vấn, dẫn đến việc tối ưu tốc độ truy vấn, tính tùy biến và cải thiện cơ sở dữ liệu truy vấn chưa được thực hiện triệt để.
Các kết quả nghiên cứu ngoài nước
CHƯƠNG 1 TỔNG QUAN Ở nước ngoài, ta thấy có rất nhiều nhà cung cấp dịch vụ tìm kiếm nổi tiếng như
Google, Yahoo và Bing cung cấp dịch vụ tìm kiếm hình ảnh đa dạng cho người dùng Ngoài ra, các ứng dụng như Visualseek và BlobWorld cũng được nghiên cứu để phục vụ cho việc tra cứu hình ảnh trong các lĩnh vực chuyên biệt.
Về lĩnh vực liên quan đến ảnh y khoa, bài báo Detection of Lung Cancer Using
Bài viết "Phát hiện Ung thư phổi sử dụng tra cứu nội dung ảnh y khoa" tập trung vào việc phát hiện sớm ung thư phổi thông qua hệ thống truy vấn hình ảnh Computer Aided Diagnosis (CAD) Nghiên cứu này phân tích các nốt ung thư phổi từ ảnh chụp CT phần ngực bằng cách phân đoạn và khai thác từng vùng ảnh, giúp phân loại các trường hợp có và không có ung thư phổi Bài báo cũng trình bày các phương pháp và kỹ thuật hiện có để phát hiện ung thư phổi một cách hiệu quả.
Bên cạnh đó, có thể kể đến bài báo Content Based Image Retrieval For Medical
Bài viết "Truy vấn nội dung ảnh y khoa sử dụng bộ mô tả Fourier tổng quát" đã giới thiệu về bộ mô tả hình dạng Fourier tổng quát và cách thức truy vấn ảnh y khoa dựa trên bộ mô tả này Hiệu quả của việc truy vấn ảnh được đánh giá thông qua một cơ sở dữ liệu lớn với hơn 10.000 hình ảnh khác nhau từ các loại ảnh chụp như X-Quang, CT và MRI, và được đo lường bằng độ đo Euclid.
Hoặc bài báo Medical Image Retrieval By Combining Low Level Features And
DICOM Features trình bày một phương pháp kết hợp các đặc tính cấp thấp và ngữ nghĩa cao để truy vấn cơ sở dữ liệu ảnh y khoa Phương pháp này sử dụng thông tin ngữ nghĩa từ DICOM (Digital Imaging and Communications in Medicine) nhằm thực hiện tìm kiếm và lấy hình ảnh một cách hiệu quả.
Bài báo "Tìm kết cấu bằng mô tả văn bản, ví dụ trực quan và phản hồi liên quan" đã áp dụng 6 đặc tính Tamura trong truy vấn ảnh và kết hợp với một số thuật toán để phát triển hệ thống CBIR Hệ thống này nhằm chuẩn hóa nhận thức chủ quan của con người thông qua phản hồi liên quan, từ đó nâng cao độ chính xác cho việc truy vấn ảnh.
Ngoài ra, không thể không kể đến bài báo Textural Features Corresponding to
Nhận thức thị giác là cơ sở để tác giả định hình đề tài luận văn, thông qua việc kế thừa và áp dụng các tính toán từ 6 đặc trưng Tamura Đồng thời, nghiên cứu và sử dụng biểu đồ đa mức xám, cả ở cấp độ toàn cục và cục bộ, cũng được thực hiện để hỗ trợ cho quá trình này.
Một số hệ thống ứng dụng liên quan đến đề tài nghiên cứu
Ngoài những ứng dụng và dịch vụ tra cứu hình ảnh phổ biến, còn có một số hệ thống tra cứu ảnh theo nội dung mạnh mẽ và chuyên biệt, đáng được nhắc đến.
- Hệ thống QBIC của IBM:
QBIC là hệ thống truy vấn hình ảnh dựa trên nội dung thương mại đầu tiên, cho phép người dùng tìm kiếm hình ảnh thông qua các ảnh mẫu, phác thảo và bản vẽ tự tạo Hệ thống sử dụng kỹ thuật flood-fill tăng cường và một công cụ phác thảo hỗ trợ người dùng theo dõi các điểm biên của đối tượng dựa trên khái niệm “snakes” trong nghiên cứu thị giác máy tính Công cụ này tự động căn lề đường cong phác thảo với các điểm biên gần cạnh và tối đa hóa độ lớn gradient ảnh Sau khi nhận diện đối tượng, QBIC tính toán các đặc trưng như màu sắc, kết cấu, hình dạng và phác thảo của từng đối tượng và ảnh.
Hình 1.2: Hệ thống QBIC của IBM
Khi các đặc trưng được mô tả, QBIC sử dụng các độ đo tương tự để nhận diện các ảnh tương tự Trong quá trình tìm kiếm, QBIC phân biệt rõ ràng giữa "các ảnh" và "các đối tượng" Một ảnh có thể là một bức ảnh màu đầy đủ hoặc một khung hình đơn trong video, trong khi một đối tượng là phần cụ thể của ảnh đó QBIC tính toán các đặc trưng liên quan đến các đối tượng và các ảnh, và nó là một trong số ít hệ thống có khả năng nhận diện dựa trên bản miêu tả đánh chỉ số đặc trưng nhiều chiều.
- Hệ thống Virage của công ty Virage:
Virage là một máy tìm kiếm ảnh dựa vào nội dung, được phát triển tại liên hợp Virage, và tương tự như QBIC, nó hỗ trợ các truy vấn trực quan dựa trên màu sắc, cấu trúc, kết cấu và thông tin đường bao của đối tượng Tuy nhiên, Virage vượt trội hơn QBIC bởi khả năng hỗ trợ các kết hợp tùy ý của các truy vấn, cho phép người sử dụng điều chỉnh trọng số theo sở thích cá nhân Jeffrey và cộng sự đã đề xuất một khuôn khổ mở cho quản lý ảnh, phân loại các đặc trưng trực quan thành tổng quát (như màu sắc, hình dạng, kết cấu) và lĩnh vực cụ thể (như nhận dạng khuôn mặt và phát hiện khối u).
Hình 1.3: Kết quả tra cứu theo cấu trúc và màu sắc cụ bộ của hệ thống Virage
- Hệ thống RetrievalWare của tập đoàn công nghệ Excalibur:
RetrievalWare là một công cụ tìm kiếm hình ảnh dựa trên nội dung, được phát triển bởi tập đoàn công nghệ Excalibur Công nghệ tìm kiếm này sử dụng các đặc trưng như màu sắc, hình dạng, kết cấu, độ sáng, bố cục màu và tỷ lệ hướng của ảnh để thực hiện truy vấn Người dùng có khả năng điều chỉnh trọng số cho từng đặc trưng trong quá trình tìm kiếm, giúp nâng cao độ chính xác của kết quả.
- Hệ thống VisualSeek và WebSeek của đại học Columbia:
VisualSEEk và WebSEEk là hai sản phẩm tìm kiếm được phát triển tại Đại học Columbia, trong đó VisualSEEk tập trung vào tìm kiếm dựa trên đặc trưng trực quan và quan hệ không gian, còn WebSEEk chuyên về tìm kiếm văn bản và hình ảnh trên web WebSEEk bao gồm ba module chính: module thu thập ảnh/video, module phân loại chủ đề và đánh chỉ số, cùng với module tìm kiếm và duyệt, cho phép người dùng tra cứu dựa trên từ khóa và nội dung trực quan.
- Hệ thống Photobook của phòng thí nghiệm truyền thông MIT:
Photobook là một hệ thống tương tác được phát triển tại MIT Media Lab, cho phép người dùng dễ dàng duyệt và tìm kiếm ảnh Người sử dụng có thể tra cứu hình ảnh dựa trên các tiêu chí như màu sắc, hình dạng và kết cấu, mang lại trải nghiệm tìm kiếm hiệu quả và tiện lợi.
CHƯƠNG 1 TỔNG QUAN và có thể sinh ra một mẫu truy vấn dựa vào những ảnh mẫu được cung cấp bởi người sử dụng Cho phép người sử dụng trực tiếp đưa những yêu cầu truy vấn của họ với những lĩnh vực khác nhau, mỗi lĩnh vực thì họ có thể thu được những mẫu truy vấn tối ưu Trong phiên bản Photobook gần đây nhất của nó, Picard và cộng sự đã đề xuất gồm những người sử dụng trong lặp và chú thích tra cứu ảnh
- Hệ thống Netra của Đại học California, Thư viện ảnh Alexandria:
Netra là một hệ thống tra cứu ảnh nguyên mẫu, được phát triển trong dự án ADL, sử dụng thông tin màu sắc, kết cấu, hình dạng và vị trí không gian trong các vùng ảnh đã được phân đoạn Hệ thống này tìm kiếm và tra cứu các vùng tương tự từ cơ sở dữ liệu Các đặc trưng chính của Netra bao gồm phân tích kết cấu thông qua lọc Gabor, xây dựng từ điển ảnh dựa trên mạng neural và phân đoạn vùng dựa vào luồng biên.
Tính cấp thiết của đề tài
Trong những năm gần đây, mặc dù các nhà nghiên cứu đã nỗ lực phát triển hệ thống truy vấn ảnh, vẫn chưa có giải thuật nào được chấp nhận rộng rãi có khả năng diễn đạt đầy đủ các đặc điểm theo cách nhìn và hiểu của con người So với các nghiên cứu trước năm 2000, sự đa dạng trong các đặc trưng mô tả ảnh đã gia tăng đáng kể Các đề xuất hiện tại không chỉ cải tiến các đặc trưng cơ bản như histogram, texture và shape, mà còn phát triển các đặc trưng mới dựa trên các phép biến đổi như wavelets và contourlets, kết hợp với các mô hình toán học trong thiết kế hệ thống tra cứu ảnh dựa theo nội dung.
Trong luận văn này, tác giả nghiên cứu sử dụng các đặc trưng ảnh theo phương pháp Tamura kết hợp với biểu đồ Histogram cấu trúc đa mức xám để ứng dụng vào truy vấn ảnh Nghiên cứu đã đạt được những kết quả nhất định, và các giải thuật truy vấn đề xuất có thể được tích hợp vào các công cụ truy vấn ảnh.
Mục đích của đề tài
Chẩn đoán bệnh và thương tật là một quá trình phức tạp, đòi hỏi thời gian cùng với kiến thức và kinh nghiệm y khoa của bác sĩ Sự nhầm lẫn trong quá trình này có thể dẫn đến hậu quả nghiêm trọng Do đó, tác giả quyết định nghiên cứu và phát triển hệ thống dựa trên kiến thức về Xử Lý Ảnh để nâng cao độ chính xác trong chẩn đoán.
Hệ thống "Tra cứu ảnh y khoa dựa vào cấu trúc nội dung ảnh" được thiết kế nhằm hỗ trợ bác sĩ và bệnh nhân trong việc chẩn đoán bệnh và thương tật y tế một cách nhanh chóng và chính xác hơn Hệ thống này không chỉ tiết kiệm thời gian mà còn cho phép người dùng và nhà nghiên cứu xây dựng cơ sở dữ liệu phong phú về các bệnh lý thông qua các loại hình ảnh y khoa như ảnh chụp thông thường, X-quang, CT và MRI.
Nhiệm vụ của đề tài
Để đạt được mục tiêu nghiên cứu, tác giả đã thực hiện:
- Tìm hiểu và trình bày về tra cứu ảnh theo nội dung và tra cứu ảnh y khoa dựa trên cấu trúc nội dung
- Mô tả tổng quan về ảnh chụp X-quang, ảnh chụp cắt lớp CT và ảnh chụp cộng hưởng từ MRI
Khám phá các khái niệm về không gian màu và các đặc trưng của màu sắc, cùng với biểu đồ màu, là điều cần thiết để hiểu rõ hơn về cách mà màu sắc tương tác với nhau Đặc biệt, biểu đồ kết cấu đa mức xám đóng vai trò quan trọng trong việc phân tích và thể hiện sự chuyển tiếp của màu sắc, giúp người dùng dễ dàng nhận diện và áp dụng trong các lĩnh vực nghệ thuật và thiết kế.
- Tìm hiểu và trình bày kết cấu nội dung ảnh, đặc trưng, trong đó nhấn mạnh các đặc trưng Tamura
Trong bài viết này, chúng ta sẽ tìm hiểu khái niệm về xử lý ảnh và các độ đo thông dụng, đặc biệt là việc sử dụng khoảng cách Euclid để so sánh sự giống nhau giữa các hình ảnh Khái niệm này đóng vai trò quan trọng trong việc phân tích và nhận diện hình ảnh, giúp cải thiện hiệu quả trong nhiều ứng dụng thực tiễn.
- Xây dựng thuật toán trích xuất 6 đặc trưng Tamuara đó là: độ thô, độ tương phản, hướng, độ giống nhất, độ đồng đều và độ nhám
- Xây dựng thuật toán tính toán kết cấu mức xám toàn cục và mức xám cục bộ của ảnh
- Xây dựng thuật toán kết hợp các đặc trưng và kết cấu trên và lưu vào cơ sở dữ liệu cùng với ảnh
- Xây dựng thuật toán và chương trình mô phỏng để tra cứu ảnh
- Kết luận, đánh giá và phân tích các kết quả đạt được.
Giới hạn đề tài
Đề tài nghiên cứu chủ yếu tập trung vào việc tra cứu bệnh và thương tật thông qua ảnh tĩnh từ X-quang, CT và MRI 2 chiều đơn sắc Tuy nhiên, nghiên cứu này còn gặp một số hạn chế do thực tế hiện nay đã có sự phát triển của ảnh chụp CT 3 chiều và ảnh động.
Kiến thức về Xử Lý Ảnh hiện nay còn hạn chế và chưa sâu sắc, dẫn đến việc thuật toán trích xuất đặc trưng ảnh mất nhiều thời gian, đặc biệt với ảnh có kích thước lớn và độ phân giải cao Thời gian tra cứu ảnh cũng chịu ảnh hưởng đáng kể từ kích thước của cơ sở dữ liệu được truy vấn.
Luận văn này là một nghiên cứu độc lập, không liên kết với các cơ sở y tế, vì vậy các kết quả mô phỏng được đánh giá chủ quan dựa trên quan sát và tìm hiểu của tác giả Để nâng cao tính chính xác, cần có những đánh giá khách quan và góp ý xây dựng từ các chuyên gia y tế và bác sĩ.
Phương pháp nghiên cứu
Trong nghiên cứu này, tác giả áp dụng phương pháp phân tích ảnh bằng cách sử dụng 6 đặc tính Tamura, kết hợp với biểu đồ cấu trúc mức xám toàn cục và mức xám cục bộ để phân tích hình ảnh.
CHƯƠNG 1 TỔNG QUAN xây dựng vector đặc trưng của ảnh cần tra cứu Sau đó sử dụng độ đo Euclid để tìm kiếm trong cơ sở dữ liệu những ảnh có kết cấu nội dung giống nhất
Phương pháp nghiên cứu tài liệu bao gồm việc thu thập thông tin từ các bài báo và tạp chí kỹ thuật uy tín cả trong nước và quốc tế Đồng thời, nghiên cứu cũng kết hợp với các tài liệu điện tử như luận văn, đồ án và báo cáo khoa học liên quan đến lĩnh vực nghiên cứu.
Phương pháp phân tích: áp dụng phương pháp và kỹ thuật Xử Lý Ảnh để phân tích các đặc trưng của ảnh
Kết quả nghiên cứu sẽ được trình bày thông qua chương trình mô phỏng sử dụng giao diện đồ họa người dùng (GUIDE) với phần mềm MATLAB R2016a (© 1994-2016 The MathWorks, Inc., số giấy phép học thuật).
The system is activated by the user hsnguye2@asu.edu and operates on Windows 8.1 Enterprise, licensed by Microsoft Corporation It features an Intel® Core™ i5-4300 CPU running at 1.90GHz with a boost up to 2.50GHz, complemented by 4.00 GB of RAM.
Kết luận chương 1
Trong chương này, tác giả trình bày các kỹ thuật cơ bản về tra cứu ảnh dựa vào nội dung, bao gồm thông tin thị giác và chức năng của hệ thống tra cứu Tác giả cũng giới thiệu tổng quan về lĩnh vực nghiên cứu và nhấn mạnh các phương pháp cải thiện hiệu năng của hệ thống tra cứu ảnh, đặc biệt là trong việc xây dựng hệ thống tra cứu ảnh y khoa dựa trên cấu trúc nội dung ảnh, sử dụng đặc trưng Tamuara kết hợp với biểu đồ kết cấu mức xám.
CƠ SỞ LÝ THYẾT
Các khái niệm cơ bản về màu sắc
Màu sắc là cảm giác mang đến cho hệ thần kinh của người từ sự kết hợp tín hiệu của ba loại tế bào cảm thụ màu ở mắt người
Hình 2.1: Màu sắc (Nguồn: Wikipedia)
Trong tra cứu ảnh, màu sắc là đặc trưng trực quan quan trọng nhất và thường được sử dụng trong nhiều lĩnh vực Một ảnh màu thường có ba kênh màu, trong khi ảnh xám chỉ có một kênh và ảnh đa phổ có thể có nhiều hơn ba kênh Dữ liệu ba chiều từ ảnh màu không mô tả chính xác màu sắc mà chỉ cho biết vị trí của các pixel trong không gian màu Các pixel với giá trị (1,1,1) có thể hiển thị màu sắc khác nhau tùy thuộc vào không gian màu Do đó, mô tả đầy đủ của một ảnh màu cần thông tin không gian hai chiều để xác định vị trí pixel màu và dữ liệu màu ba chiều để xác định không gian màu mà pixel đó thuộc về.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Không gian màu là mô hình đại diện cho màu sắc thông qua giá trị độ sáng, xác định lượng thông tin màu được thể hiện Nó có thể là không gian 1, 2, 3 hoặc 4 chiều, trong đó mỗi chiều, hay còn gọi là thành phần, đại diện cho giá trị độ sáng Thành phần màu, hay kênh màu, cho phép mỗi pixel trong ảnh được biểu diễn trong không gian màu 3 chiều Các không gian màu phổ biến bao gồm RGB, CMY, CIE L*a*b, và HSV Hiện tại, vẫn chưa có sự đồng thuận về không gian màu nào là tốt nhất.
Hình 2.2: Không gian màu RGB
Không gian RGB là một hệ thống màu phổ biến trong hiển thị hình ảnh, được phát triển dựa trên cách mắt người cảm nhận màu sắc Nó bao gồm ba màu cơ bản: đỏ (Red), lục (Green) và lam (Blue), từ đó tạo ra các màu sắc khác nhau bằng cách kết hợp chúng với nhau RGB là định dạng chủ yếu cho ảnh số, nhờ vào khả năng tương thích cao với các màn hình hiển thị hiện nay.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT hình vi tính Tuy nhiên không gian màu RGB có một nhược điểm là cách mã hóa khác với cách mà con người cảm nhận về màu sắc Cho nên nó không phù hợp cho việc tìm kiếm ảnh
Không gian màu CMY, viết tắt của Cyan-Magenta-Yellow, được sử dụng chủ yếu trong in ấn Ba màu chính này tương ứng với ba màu mực in và được gọi là màu gốc để trừ Trong không gian CMY, mỗi màu được tạo ra thông qua việc hấp thụ độ sáng: Cyan hấp thụ ánh sáng đỏ, Magenta hấp thụ ánh sáng xanh lục, và Yellow hấp thụ ánh sáng xanh dương Công thức chuyển đổi từ không gian màu RGB sang CMY rất quan trọng trong quy trình in ấn.
Hình 2.3: Không gian màu CMY
Hệ thống màu CMY có thể được xem như một phiên bản đảo ngược của hệ thống màu RGB, với đặc điểm nổi bật là tính đơn giản và ứng dụng rộng rãi trong thực tế Tuy nhiên, giống như không gian màu RGB, CMY cũng gặp phải những hạn chế, khiến nó không phù hợp cho việc tra cứu ảnh dựa trên nội dung.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Mô hình L*a*b, được CIE đề xuất, dùng để lượng hóa sự khác biệt màu sắc dưới ánh sáng ban ngày và có khả năng thích nghi với các nguồn sáng khác Màu sắc được xác định qua hai tọa độ x và y, với độ sáng L* dựa trên cảm nhận giác quan, trong khi a* và b* là tọa độ màu Trong không gian màu này, các màu khác nhau theo một hướng duy nhất gần như tương đương Tuy nhiên, việc chuyển đổi sang không gian màu RGB là không tuyến tính, dẫn đến việc tách biệt giữa ánh sáng và màu sắc, mở ra khả năng tra cứu ảnh dựa trên nội dung.
Mô hình HSV (Hue, Saturation, Value), còn được gọi là HSB (Hue, Saturation, Brightness) định nghĩa một không gian màu gồm 3 thành phần tạo nên:
- Hue: là loại màu ( màu đỏ, xanh hay vàng, )
- Saturation: là độ thuần khiết của màu
- Value: là độ sáng của màu
Mô hình HSV, được phát triển bởi Ray Smith vào năm 1978, là một phép biến đổi phi tuyến từ không gian màu RGB Mô hình này giúp phân tách rõ ràng giữa màu sắc (H, S) và độ sáng (V), phù hợp với cách mà con người cảm nhận màu sắc.
Hình 2.4: Không gian màu HSV (a) và HSL (b)
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
2.1.3 Các đặc trưng về màu sắc
Biểu đồ màu là một tập hợp các bin, mỗi bin thể hiện số lượng pixel của một màu riêng biệt trong ảnh Đối với ảnh, biểu đồ màu H được định nghĩa dưới dạng một vector.
H={H[0], H[1], H[2], , H[i], H[N]} i: đại diện cho một màu trong biểu đồ màu và tương ứng với một pixel trong không gian màu
H[i]: là số điểm có màu i trong ảnh
N: là số bin trong biểu đồ màu hay số màu trong không gian màu được chấp nhận
Trong biểu đồ màu của ảnh, mỗi bin đại diện cho tổng số pixel có cùng màu Để so sánh các ảnh có kích thước khác nhau, biểu đồ màu cần được chuẩn hóa, với định nghĩa cụ thể cho biểu đồ màu chuẩn hóa.
𝑃 và P là tổng số các pixel trong ảnh
Một lượng tử hóa không gian màu lý tưởng yêu cầu các màu khác biệt không được gán vào cùng một bin màu, trong khi các màu tương tự nên được nhóm lại Việc sử dụng ít bin màu có thể dẫn đến việc các màu tương tự bị gán vào những bin giống nhau, nhưng cũng làm tăng khả năng các màu phân biệt bị gán chung bin, từ đó giảm thiểu thông tin của ảnh Ngược lại, việc sử dụng nhiều bin màu sẽ cải thiện khả năng phân loại các màu riêng biệt, giúp bảo tồn nhiều thông tin hơn về nội dung ảnh, nhưng cũng đồng nghĩa với việc tăng không gian lưu trữ và thời gian tính toán khoảng cách giữa các biểu đồ.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT vì thế cần phải có sự cân nhắc trong việc xác định bao nhiêu bin nên được sử dụng trong biểu đồ màu Một con số điển hình được tìm thấy trong các tài liệu liên quan là 64 Ưu điểm: Tính toán biểu đồ màu ít tốn chi phí, đơn giản, nhanh chóng Biểu đồ màu bất biến với một số phép hình học Affine: tịnh tiến, xoay, co giãn
Biểu đồ màu có nhược điểm là chỉ thể hiện phân bố màu toàn cục của ảnh mà không xem xét yếu tố cục bộ về vị trí, dẫn đến việc mất thông tin không gian về quan hệ giữa các màu Điều này có thể khiến nhiều ảnh khác nhau có cùng một biểu đồ màu Tuy nhiên, biểu đồ màu vẫn được ứng dụng rộng rãi trong phân đoạn video và tra cứu thông tin thị giác.
2.1.3.2 Vector liên kết màu (Color Coherence Vector)
Các véctơ liên kết màu (CCV) phân loại mỗi bin trong biểu đồ thành hai loại: liên kết, nếu nó thuộc về một vùng màu đồng nhất lớn, và không gắn kết, nếu nó không thuộc về vùng màu này.
Trong một bức ảnh, số lượng pixel gắn kết trong mỗi bin màu được ký hiệu là αi, trong khi số pixel không gắn kết được ký hiệu là βi Vector liên kết màu của bức ảnh được định nghĩa dưới dạng một véctơ bao gồm các cặp giá trị: [(α1, β1), (α2, β2), …, (αN, βN)].
Trong đó: [α 1 + β 1 , α 2 + β 2 , …, α N + β N ] là biểu đồ màu của ảnh
Cơ sở về Xử Lý Ảnh
2.2.1 Xử lý ảnh là gì?
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Quá trình xử lý ảnh là thao tác nhằm cải thiện ảnh đầu vào để đạt được kết quả mong muốn Kết quả đầu ra có thể là một bức ảnh chất lượng cao hơn hoặc một kết luận cụ thể.
Quá trình xử lý ảnh liên quan đến việc xem ảnh như một tập hợp các pixel, trong đó mỗi pixel đại diện cho cường độ sáng hoặc một đặc trưng tại một vị trí cụ thể của đối tượng trong không gian Điều này cho phép chúng ta coi ảnh như một hàm n biến P(c₁, c₂, , cₙ), đồng nghĩa với việc ảnh trong xử lý ảnh có thể được hiểu là ảnh n chiều.
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hình 2.8: Các bước cơ bản trong một hệ thống xử lý ảnh
3 Tham khảo: Xử Lý Ảnh (Giáo trình dành cho sinh viên ngành Điện – Điện Tử) [6] , TS Nguyễn Thanh Hải Nhà Ảnh XỬ LÝ ẢNH Ảnh “tốt hơn” Kết luận
Tiền xử lý Đối sánh rút ra kết luận
Trích chọn những đặc điểm
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT Ảnh số là một tập hợp của nhiều điểm ảnh, hay còn gọi là pixel Mỗi một pixel biểu diễn một màu sắc (ảnh màu) hay độ sáng (ảnh đen trắng) nhất định tại một điểm duy nhất Pixel được xem như là dấu hiệu hay cường độ sáng tại 1 toạ độ trong không gian của ảnh Các giá trị có thể có của các pixel của ảnh là mức xám và màu Ảnh được biểu diễn dưới dạng một ma trận 2 chiều với các pixel được xác định bởi cặp tọa độ (x, y) Giá trị độ sáng được số hóa trong xử lý ảnh được gọi là giá trị mức xám Một ảnh số có kích thước xác định gồm có M hàng và N cột gọi là ảnh có kích thước M × N và được biểu diễn dưới dạng mà trận như sau:
Trong đó: 𝑓(𝑥, 𝑦) là giá trị của pixel tại vị trí (𝑥, 𝑦)
Có 2 dạng quan trọng trong ảnh số được dùng với nhiều mục đích khác nhau là ảnh màu và ảnh đen trắng (hay còn gọi là ảnh xám), ngoài ra còn có ảnh nhị phân và ảnh chỉ số
2.2.3.1 Ảnh xám (gray image) Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng Người ta phân mức đen trắng đó thành L mức Nếu sử dụng số bit B = 8 bit để mã hóa mức đen trắng (hay mức xám) thì L được xác định:
L = 2 B (trong ví dụ ta có L = 2 8 = 256 mức)
Ảnh nhị phân chỉ có hai mức độ: mức 0 (màu tối) và mức 1 (màu sáng), với L = 2 và B = 1 Các phần tử trong ảnh nhị phân có thể được xem như các phần tử logic Ứng dụng chính của ảnh nhị phân là phân biệt đối tượng với nền hoặc xác định điểm biên so với các điểm khác.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Khi L lớn hơn 2, ảnh sẽ có đa mức xám, trong đó mỗi giá trị độ sáng của điểm ảnh được chuyển đổi thành một giá trị nguyên dương Khác với ảnh nhị phân mã hóa mỗi điểm ảnh trên 1 bit, ảnh đa mức xám sử dụng nhiều bit hơn Cụ thể, khi sử dụng 8 bit (1 byte) để biểu diễn mức xám, ta có thể tạo ra 256 mức xám, với mỗi mức được thể hiện bằng một số nguyên từ 0 đến 255 Trong đó, mức 0 đại diện cho cường độ đen nhất và mức 255 cho cường độ sáng nhất.
Các thang giá trị mức xám thông thường khác có thể là: 16, 32, 64, 128 mức
Hình 2.9: Sự thay đổi mức xám
Một ảnh màu được cấu thành từ nhiều pixel, mỗi pixel bao gồm ba màu cơ bản: đỏ, xanh lục và xanh dương, với giá trị từ 0 đến 255 Điều này có nghĩa là mỗi pixel yêu cầu 24 bits hay 3 bytes để lưu trữ Để kiểm tra, bạn có thể sử dụng phần mềm Paint trên Windows, tạo một ảnh kích thước 1024x1024 và lưu dưới định dạng BMP, kết quả sẽ cho thấy kích thước ảnh là 3MB.
2.2.3.3 Ảnh nhị phân (binary image)
Mỗi pixel trong ảnh nhị phân chỉ được biểu diễn bằng 1 bit, với giá trị 0 hoặc 1, tương ứng với màu đen và trắng Trong thực tế, khi xử lý trên máy tính, ảnh xám được sử dụng để đại diện cho ảnh nhị phân, trong đó 2 giá trị chính là 0 và 255.
2.2.3.4 Ảnh chỉ số (indexed image)
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Một ảnh chỉ số bao gồm ma trận dữ liệu X và ma trận bản đồ màu, được tạo ra từ một mảng màu giới hạn Mỗi pixel trong ảnh này có dữ liệu chỉ số, cho biết màu sắc tương ứng trong tập màu có sẵn.
Lena Sửderberg (Nguồn: Wikipedia) Hình 2.10: Ví dụ ảnh màu (a) được biến đối sang ảnh xám (b) và ảnh nhị phân (c)
2.2.4 Các thiết bị thu nhận ảnh
Các thiết bị thu nhận ảnh, như camera và scanner, có khả năng tạo ra ảnh đen trắng Chúng được chia thành hai loại chính tương ứng với hai định dạng ảnh phổ biến là Raster và Vector.
Common raster image capture devices include cameras, while vector image capture devices consist of sensors, digitizers, or conversions from raster images.
Nhìn chung các hệ thống thu nhận ảnh thực hiện 2 quá trình:
• Cảm biến: biến đổi năng lượng quang học thành năng lượng điện
• Tổng hợp năng lượng điện thành ảnh
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được nhúng trong các thiết bị kỹ thuật khác nhau Quá trình lưu trữ ảnh nhằm 2 mục đích:
• Giảm thời gian xử lý
Lưu trữ thông tin trong bộ nhớ ảnh hưởng lớn đến việc hiển thị, in ấn và xử lý ảnh Ảnh được xem như một tập hợp các điểm với kích thước đồng nhất; càng sử dụng nhiều pixel, bức ảnh sẽ càng đẹp, mịn màng và thể hiện chi tiết rõ ràng hơn Đặc điểm này được gọi là độ phân giải.
Việc chọn độ phân giải phù hợp phụ thuộc vào nhu cầu sử dụng và đặc điểm của từng bức ảnh, từ đó các bức ảnh thường được thể hiện qua hai mô hình cơ bản.
Các loại ảnh y khoa
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Tia X hay X quang hay tia Rửntgen được phỏt hiện bởi Wilhelm Rửntgen 4 vào năm 1895 là một dạng của sóng điện từ Nó có bước sóng trong khoảng từ 0,01 đến 10 nanômét tương ứng với dãy tần số từ 30 Petahertz đến 30 Exahertz và năng lượng từ 120 eV đến 120 keV Bước sóng của nó ngắn hơn tia tử ngoại nhưng dài hơn tia gamma
Tia X có khả năng xuyên qua nhiều vật chất nên thường được dùng trong chụp ảnh y tế Hình thái đơn giản nhất của ảnh X-Quang là hình chiếu 2D của cơ thể 3D được tạo ra trên phim chiếu xạ cơ thể với hạt photon X-ray Chế độ này được gọi là chiếu hình ảnh phẳng Mỗi tia của các hạt photon X-ray bị suy hao bởi các yếu tố phụ thuộc vào sự suy giảm tuyến tính hệ số dọc theo đường đi của các tia và tạo ra mức xám tương ứng tại các điểm trên phim hoặc các thiết bị đo được sử dụng
Hình 2.13: Ảnh tia X hay hình chiếu 2D của vậy thể 3D 5
Hình ảnh X-Quang là bản sao phẳng 2D của vật thể 3D, trong đó các chi tiết bên trong bị chồng chéo Màn phim kết hợp là bộ thu phổ biến nhất trong quá trình chụp ảnh X-Quang Các tia X phát ra từ vật thể 3D cần chụp sẽ tác động lên màn huỳnh quang, được làm từ hợp chất của các nguyên tố đất hiếm như lanthanum oxybromide.
4 Wilhelm Conrad Rửntgen (27/3/1845 – 10/2/1923), sinh ra tại Lennep, Đức, là một nhà vật lý, giỏm đốc Viện vật lý ở Đại học Würzburg
5 Tham khảo: Xử Lý Ảnh Y Sinh (Ngành Kỹ thuật y sinh) [7] , TS Nguyễn Thanh Hải, ThS NGô Quốc Cường Nhà
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT gadolinium oxysulfide, tia X được chuyển thành hạt photon ánh sáng có thể nhìn thấy được Một phim nhạy sáng được đặt tiếp xúc với màn hình ghi nhận kết quả, phim chứa một lớp nhũ bạc halogen với độ dày khoảng 10 um Độ sáng hoặc tối của phim phụ thuộc vào số lượng các photon ánh sáng đến phim
Hình 2.14: Hình chụp X-Ray ngực của một bệnh nhân
Kỹ thuật chụp cắt lớp điện toán (CT) là phương pháp chẩn đoán hình ảnh sử dụng tia X để tạo ra hình ảnh mặt cắt của các bộ phận cơ thể Chụp CT còn được gọi là CAT, viết tắt của Computed (Computerized).
Trong quá trình chụp CT, tia X được chiếu quanh vùng cần khảo sát để tạo ra hình ảnh ba chiều của cấu trúc bên trong cơ thể Máy tính thu thập thông tin này và tạo ra các hình ảnh riêng biệt, gọi là "lát cắt" Những hình ảnh này có thể được lưu trữ, xem trên màn hình hoặc in ra thành phim.
Có thể tạo nên các hình ảnh ba chiều của cơ quan trong cơ thể bệnh nhân bằng cách sắp xết từng lát cắt riêng lẻ lại với nhau
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Hình 2.15: Hình ảnh 2 lát cắt khi chụp CT vùng bụng
Chụp CT là phương pháp tạo ra hình ảnh chi tiết của cơ thể một cách nhanh chóng, bao gồm cả não, ngực và bụng Kỹ thuật này có thể được áp dụng để chẩn đoán và theo dõi nhiều tình trạng bệnh lý khác nhau.
Khảo sát các khối u, kể cả ung thư
Hướng dẫn bác sĩ phẫu thuật sinh thiết đúng vị trí
Hình chụp CT sử dụng tia X để chiếu xạ một mặt phẳng cắt ngang của cơ thể thay vì toàn bộ như trong chụp X-Quang thông thường Các tia X được đo tại nhiều vị trí và góc khác nhau xung quanh cơ thể, cho phép quét qua cơ thể Dựa trên nguyên tắc khôi phục hình ảnh từ các hình chiếu, hình chụp của một phần cơ thể được tính toán chính xác.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Hình 2.16: Mô tả chụp cắt lớp CT
Trong hình 2.16, chỉ mặt phẳng ngang cần thiết mới được chiếu xạ tia X, với hình chiếu của mặt phẳng cắt ngang 2D – PQRS thể hiện một hình 1D – P’Q’ Tuy nhiên, phương pháp chụp ảnh X-Quang và CT có nhược điểm là kỹ thuật bức xạ ion hóa có thể gây hại cho mô, và có giới hạn về cường độ bức xạ mà mỗi bệnh nhân có thể chịu được, đặc biệt là trong chụp X-Quang, CT sản khoa và nhi khoa.
Hình 2.17: Quá trình chụp CT (Nguồn: LA Times)
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT Ảnh CT được tái tạo từ việc ánh xạ hệ số suy hao tuyến tính từ đối tượng xử lý của hệ thống chụp CT Tỷ lệ cường độ sáng trong ảnh CT tính theo đơn vị Hounsfield 6 (HU) Hệ số suy hao tuyến tính trong ảnh CT gồm 1 khoảng rất rộng giá trị Hounsfield từ -1000 HU (không khí) tới trên +3000 HU (xương) cho nên rất khó quan sát ảnh nếu không biến đối chúng về dạng thang đo mức xám phù hợp độ phân giải trên màn hình vi tính hoặc lá phim
Hình 2.18: Mô tả quá trình ánh xạ ảnh CT
Chụp cộng hưởng từ gọi đầy đủ là "chụp cộng hưởng từ hạt nhân" hay MRI
Chụp Cộng Hưởng Từ (MRI) là kỹ thuật hình ảnh giúp quan sát các cơ quan trong cơ thể sống và lượng nước trong cấu trúc của chúng Phương pháp này dựa trên hiện tượng cộng hưởng từ hạt nhân, một hiện tượng vật lý đặc biệt.
Sir Godfrey Newbold Hounsfield (1919-2004) là một kỹ sư điện người Anh, nổi tiếng với việc phát triển kỹ thuật X-quang cắt lớp hỗ trợ bởi máy tính Ông cùng với Allan McLeod Cormack đã được trao giải Nobel Sinh lý và Y khoa năm 1979 cho những đóng góp quan trọng trong lĩnh vực này Phát minh của Hounsfield về máy chụp cắt lớp vi tính vào năm 1972 đã cách mạng hóa việc chẩn đoán y tế thông qua việc tạo ra hình ảnh CT chất lượng cao.
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Chụp MRI, được áp dụng trong chẩn đoán bệnh từ năm 1982, dựa trên hiện tượng cộng hưởng từ hạt nhân do Bloch và Purcell phát hiện vào năm 1952 Khác với chụp X-Quang sử dụng năng lượng phóng xạ tia X, chụp MRI sử dụng năng lượng vô tuyến điện, mang lại những ưu điểm vượt trội trong việc chẩn đoán.
Mọi vật thể được cấu tạo từ nguyên tử, trong đó hạt nhân gồm proton mang điện tích dương và neutron không mang điện Electron, với điện tích âm, quay quanh hạt nhân, tạo nên sự cân bằng điện tích trong nguyên tử trung hòa Tất cả các hạt đều chuyển động, với neutron và proton quay quanh trục của chúng, trong khi electron cũng quay quanh hạt nhân Sự quay này tạo ra mômen góc gọi là spin, và các hạt mang điện tích khi chuyển động sẽ sinh ra từ trường Proton, do có điện tích dương và quay, tạo ra một mômen từ giống như nam châm nhỏ Trong điều kiện bình thường, các momen từ này phân tán và triệt tiêu lẫn nhau, do đó không ghi nhận được tín hiệu Tuy nhiên, khi đặt vật thể vào từ trường mạnh, các momen từ sẽ định hướng song song và đối song song.
Hình 2.19: Định hướng phân tán của các momen từ
7 Felix Bloch và Edward Mills Purcell, Giải Nobel Vật lý năm 1952 về “các phương pháp mới cho phép đo
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Hình 2.19 minh họa định hướng phân tán của các momen từ, với hình trái thể hiện điều kiện bình thường và hình phải cho thấy các momen từ định hướng song song và đối song song dưới tác dụng của từ trường ngoài Proton sắp xếp song song (mũi tên đỏ) có trạng thái năng lượng thấp, trong khi sắp xếp đối song song (mũi tên xanh) có trạng thái năng lượng cao Số lượng vectơ từ sắp xếp song song cùng chiều với từ trường máy nhiều hơn so với vectơ ngược chiều, dẫn đến vectơ từ hóa thực có hướng của vectơ từ trường máy, tạo nên trạng thái cân bằng Trong trạng thái này, không có tín hiệu nào được ghi nhận, nhưng khi trạng thái cân bằng bị xáo trộn, tín hiệu sẽ được hình thành.
Kết luận chương 2
Trong chương 2, tác giả đã trình bày các khái niệm cơ bản về xử lý ảnh, bao gồm các loại ảnh, thiết bị thu ảnh và các đặc trưng của ảnh y khoa phổ biến hiện nay Chương này cũng đề cập đến các phương pháp quét ảnh, với trọng tâm là xử lý ảnh xám, do hầu hết các loại ảnh y khoa hiện nay chủ yếu là ảnh xám Tác giả tập trung vào việc xử lý và trích xuất các đặc trưng dựa trên mức xám của ảnh để đạt được kết quả chính xác.