Giới thiệu
Lý thuyết tập mờ và tập mờ phức là công cụ toán học quan trọng để xử lý các khái niệm không chắc chắn Chương đầu tiên của luận án trình bày tổng quan về lý thuyết tập mờ và các nghiên cứu liên quan đến hệ suy diễn mờ cùng hệ mờ phức Nội dung chương cung cấp cái nhìn tổng quát về sự phát triển của các hệ suy diễn dựa trên lý thuyết tập mờ phức, đồng thời giới thiệu các bộ dữ liệu và thước đo đánh giá hiệu năng của các hệ suy diễn trên tập mờ phức.
Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định
Con người đưa ra quyết định dựa trên các quy luật rút ra từ kinh nghiệm sống, thông qua quá trình học để tìm ra phương án tốt nhất Hệ mờ, với khả năng gần gũi với suy luận tự nhiên và khả năng học, đã được nghiên cứu và ứng dụng thành công trong việc làm cho "máy học thông minh hơn" Để hỗ trợ ra quyết định, nhiều phương pháp như cây quyết định, trí tuệ nhân tạo, hệ chuyên gia và hệ mờ đã được áp dụng Tuy nhiên, việc lựa chọn phương pháp phù hợp phụ thuộc vào từng bài toán cụ thể, bao gồm đối tượng, mục tiêu và dữ liệu liên quan.
Hệ mờ, với khả năng làm việc với biến ngôn ngữ và gần gũi với suy luận tự nhiên của con người, là một công cụ mạnh mẽ trong các hệ hỗ trợ ra quyết định Nó có khả năng học hỏi và tổng kết tri thức để hình thành hệ luật, cung cấp các lựa chọn thay thế và đẩy nhanh quá trình quyết định đầu ra mong muốn.
Dữ liệu huấn luyện Sinh luật
Tổng hợp các luật mờ
Dữ liệu vào Dự báo Ra quyết định
Hình 1.1: Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định
Quy trình sử dụng hệ mờ trong các hệ hỗ trợ ra quyết định bắt đầu từ việc áp dụng một quy trình sinh luật dựa trên dữ liệu mẫu huấn luyện để tạo ra hệ thống các luật mờ Hệ thống này tập hợp các quy luật và kiến thức được trích rút từ dữ liệu huấn luyện Khi có đầu vào mới, từng luật sẽ được áp dụng và các đầu ra sẽ được tính toán Kết quả từ các luật sẽ được tổng hợp để tạo ra một giá trị chung, và cuối cùng, giá trị này sẽ được điều chỉnh và chuẩn hóa để đưa ra quyết định cuối cùng.
Tổng quan các nghiên cứu liên quan
Hệ suy diễn mờ
Suy diễn là quá trình kết nối tri thức hiện có để tạo ra tri thức mới, phụ thuộc vào cách biểu diễn tri thức và không có phương pháp suy diễn chung cho tất cả Hệ suy diễn mờ (FIS) là một khung tính toán dựa trên lý thuyết tập mờ, thường được sử dụng trong các quá trình hỗ trợ ra quyết định Hệ này đặc biệt hiệu quả khi đối mặt với tri thức không đầy đủ, bất định hoặc không chính xác.
Hệ FIS bao gồm ba thành phần chính: bộ mờ hóa, bộ cơ sở luật và bộ giải mờ Cấu trúc cơ bản của hệ suy diễn mờ được mô tả như trong Hình 1.2.
- Giao diện mờ hóa: chuyển đổi các lớp đầu vào thành các biên độ phù hợp với các giá trị ngôn ngữ.
Cơ sở trí thức bao gồm hai thành phần chính: cơ sở dữ liệu, nơi định nghĩa các hàm thuộc của các tập mờ được sử dụng trong các luật mờ, và bộ luật, bao gồm các luật mờ theo cấu trúc IF – THEN.
- Đơn vị thực thi: thực hiện các hoạt động suy diễn trong các luật
- Giao diện giải mờ: chuyển đổi các giá trị kết quả mờ của hệ suy diễn ra các lớp đầu ra rõ.
Hình 1.2: Sơ đồ tổng quan của hệ suy diễn mờ Các bước suy diễn mờ:
• Mờ hóa các biến đầu vào: ta cần mờ hóa những giá trị rõ bởi hàm thuộc mờ để tham gia vào quá trình suy diễn
• Áp dụng các toán tử mờ (AND hoặc OR) cho các giả thiết của từng luật.
• Áp dụng phép kéo theo để tính toán giá trị các giá trị từ giả thiết đến kết luận của từng luật.
• Áp dụng toán tử gộp để kết hợp các kết quả trong từng luật thành một kết quả duy nhất cho cả hệ.
• Giải mờ kết quả tìm được cho ta một kết quả rõ.
Các phương pháp suy diễn mờ được chia thành ba loại chính: hệ suy diễn mờ Mamdani, hệ suy diễn mờ Sugeno (còn gọi là hệ suy diễn mờ Takagi – Sugeno) và hệ suy diễn mờ Tsukamoto.
1.3.1.1 Hệ suy diễn mờ Mamdani
Hệ suy diễn mờ Mamdani [49] là hệ có phương pháp suy diễn mờ đầu tiên được xây dựng bằng cách sử dụng lý thuyết tập mờ.
Hình 1.3: Hệ thống suy diễn Mamdani với hai đầu vào và hai luật
Hệ suy diễn mờ Mamdani được mô tả trong Hình 1.3, bao gồm hai biến đầu vào x và y, cùng với một biến đầu ra z Mỗi đầu vào có hai hàm thành viên tương ứng, được ký hiệu là {A1, A2} cho biến x và {B1, B2} cho biến y, trong khi đầu ra được ký hiệu là {C1, C2}.
Luật thứ k được biểu diễn dưới dạng: k: IF x là A k i và y là B j k THEN z là C l k, với k = 1, , R; i = 1, , N; j = 1, , M và l = 1, , L Ở đây, N, M, L là số lượng hàm thuộc hai biến đầu vào và biến đầu ra Trong hệ suy diễn này, phương pháp giải mờ phổ biến là lấy cực đại và tính toán điểm trọng tâm.
1.3.1.2 Hệ suy diễn mờ Tagaki- Sugeno
Xét theo luật mờ Mamdani ở mục trên, nếu ở phần kết luận ta thay các tập mờ
Luật mờ Takagi-Sugeno được xây dựng dựa trên một hàm của các biến đầu vào Trong hệ suy diễn Sugeno, các luật được biểu diễn dưới dạng: k: IF x là A k và y là B j THEN z k = f (x, y).
Cũng giống như Mamdani, k = 1, , R; i = 1, , N và j = 1, , M trong đó
N, M là số lượng hàm thuộc cho biến đầu vào.
Hình 1.4: Hệ suy diễn mờ Tagaki- Sugeno với hai đầu vào và hai luật
Phương pháp giải mờ thường được sử dụng đối với hệ suy diễn Tagaki- Sugeno là toán tử tính độ mạnh trung bình.
Hệ suy diễn Tagaki-Sugeno được đánh giá có hiệu quả tính toán cao hơn so với hệ suy diễn Mamdani, do đó thường được áp dụng cho các kỹ thuật thích ứng trong xây dựng mô hình mờ Những kỹ thuật này cho phép tùy chỉnh các hàm thuộc, nhằm đạt được mô hình tối ưu cho từng loại dữ liệu.
Hệ suy diễn Sugeno nổi bật với hiệu quả tính toán, khả năng tương thích tốt với các kỹ thuật tuyến tính và tối ưu hóa, cùng với sự phù hợp cho phân tích toán học Tuy nhiên, một hạn chế của hệ suy diễn mờ Takagi-Sugeno là thiếu phương pháp trực quan hiệu quả để xác định các hệ số p, q và r Hơn nữa, trong hệ suy diễn Takagi-Sugeno, đầu ra chỉ được thể hiện một cách rõ ràng.
1.3.1.2 Hệ suy diễn mờ Tsukamoto
Trong hệ suy diễn Tsukamoto (hình 1.5), luật if – then được biểu diễn có dạng như sau: k: IFxisA k i andyisB j k THENz k = f (x, y).
Hình 1.5: Hệ suy diễn mờ Tsukamoto với hai đầu vào và hai luật
Trong hệ suy diễn này, các luật được biểu diễn qua một tập mờ với hàm thuộc monotonical Kết quả suy diễn của từng luật được xác định là giá trị rõ ràng và được tính toán dựa trên độ mạnh của luật Cuối cùng, giá trị trung bình đầu ra của từng luật sẽ cho ra kết quả tổng hợp.
Hệ suy diễn Tsukamoto cho ra kết quả rõ ràng với giá trị trung bình, giúp quá trình giải mờ diễn ra nhanh chóng Tuy nhiên, hiệu quả của hệ suy diễn mờ Tsukamoto không cao bằng hai hệ Mamdani và Sugeno, vì vậy nó ít được sử dụng trong thực tế.
Các hệ phát triển dựa trên tập mờ phức
Kể từ khi Ramot giới thiệu lý thuyết tập mờ phức vào năm 2002, nhiều nhà nghiên cứu đã chú ý và phát triển các hệ thống dựa trên nền tảng này Tập mờ phức được xem là khái niệm cơ bản trong các hệ thống thông minh, giúp giải quyết các vấn đề liên quan đến dữ liệu có tính chu kỳ hoặc cần thông tin bổ trợ, điều mà các tập mờ truyền thống thường không thể diễn tả đầy đủ.
1.3.2.1 Hệ logic mờ phức của Ramot
Khái niệm về tập mờ phức, được giới thiệu bởi Ramot và cộng sự, mở rộng tập mờ thường sang miền mặt phẳng phức Năm 2003, Ramot phát triển logic mờ phức, một mô hình logic mới sử dụng tập mờ phức Hệ thống logic mờ phức thực hiện phép ánh xạ không tuyến tính giữa vec tơ dữ liệu đầu vào và đầu ra, tương tự như các hệ thống logic mờ thông thường Đặc trưng của hệ thống này là tập hợp các luật mờ, trong đó phép kéo theo mờ phức được mô tả qua câu lệnh If-then Nhìn chung, hệ thống mờ phức tương tự như hệ thống mờ thông thường nhưng thay thế tập mờ và phép kéo theo mờ bằng biến đổi phức tương ứng.
Hệ thống mờ phức được minh họa chỉ rõ trong hình 1.6 như sau:
Hình 1.6: Hệ thống logic mờ do Ramot đề xuất
Tương tự như hệ thống mờ thông thường, hệ thống logic mờ phức do Ramot đề xuất bao gồm ba giai đoạn:
Giai đoạn đầu tiên trong quá trình này là module mờ hóa, có chức năng chuyển đổi đầu vào rõ thành tập đầu vào mờ Các tập mờ này có thể bao gồm hoặc không bao gồm phần phức, tùy thuộc vào từng ứng dụng cụ thể.
Giai đoạn thứ hai trong quy trình là giai đoạn của module Suy diễn mờ phức, sử dụng cơ sở luật mờ phức để chuyển đổi dữ liệu đầu vào mờ thành đầu ra mờ Phương thức suy diễn mờ được áp dụng theo mô hình Modus Ponens, với đầu ra được tính theo công thức kéo theo mờ phức Sau đó, thông qua toán tử tổ hợp vectơ, đầu ra mờ phức từ từng luật được kết nối lại, tạo thành một tập đầu ra mờ phức được ký hiệu là B∗.
Phép kộo theo mờ phức (cú hàm thuộc mờ phức, ký hiệu A→B (x, y)) được Ramot áp dụng trong Hệ suy diễn mờ phức Kết quả của tập mờ phức B ∗ có hàm thuộc mờ phức được biểu diễn là B ∗ (y) = r B ∗ (y) e jω B ∗ (y), trong đó r B ∗ (y) = sup x∈U.
Hàm f [g (ω A ∗ (x) , (ω A (x) + ω B (y)))] được sử dụng để tính toán phép giao giữa hai thành phần pha của tập mờ Tùy thuộc vào ứng dụng cụ thể, có thể lựa chọn các hàm f và g khác nhau để tối ưu hóa kết quả.
Trong module suy diễn mờ phức, phép toán tổ hợp vec tơ được sử dụng để tổ hợp các luật và đưa ra kết quả cuối cùng Mối tương tác giữa các luật là kết quả trực tiếp của việc kết hợp giữa phép tổ hợp vec tơ và phép kéo theo mờ phức.
Giai đoạn giải mờ là giai đoạn cuối cùng thực hiện việc giải mờ tập đầu ra mờ phức thành một đầu ra rõ Một cách tiếp cận khả thi đối với giải mờ tập đầu ra mờ phức là bỏ qua thành phần pha mà chỉ quan tâm đến thành phần biên độ của tập mờ phức Trong mô hình hệ logic mờ phức của Ramot thì bất kì phương pháp giải mờ nào áp dụng được đối với hệ logic mờ truyền thống đều có thể được áp dụng ở giai đoạn Giải mờ này.
Như vậy, Ramot và cộng sự đã đưa ra một hệ thống tổng quát dựa trên khái niệm tập mờ phức Hệ thống này vẫn giữ được những ý nghĩa của hệ thống logic mờ thông thường và thêm vào đó là các tính chất của tập mờ phức Tuy nhiên, nhóm tác giả mới chỉ đưa ra mô hình tổng quát và ví dụ minh họa chứ chưa áp dụng một hệ suy diễn mờ rõ ràng nào trong hệ thống.
Hệ thống CANFIS [51] là hệ thống do nhóm tác giả Li và Jang đề xuất với với tên gọi là Hệ suy diễn mờ nơron thích nghi phức CANFIS (Complex Neuro-Fuzzy Inference System) Đây được coi là một mở rộng của Hệ suy diễn nơ ron mờ thích nghi với các biến đầu vào là vec tơ phức và đầu ra là số phức Tập các biến đầu vào mờ được định nghĩa như các biến phức, và các tham số tùy chỉnh trong hệ thống đều là giá trị phức (ví dụ như tâm của tập mờ đầu vào, vec tơ trọng số của hàm đầu ra).
Hệ thống CANFIS được cấu trúc gồm năm lớp, trong đó ba lớp đầu tiên được gọi là lớp mờ hóa, có nhiệm vụ cung cấp giá trị độ mạnh cho từng luật mờ Lớp thứ tư thực hiện suy diễn, đưa ra giá trị đầu ra tương ứng với mỗi luật Cuối cùng, lớp thứ năm tổng hợp kết quả bằng cách kết nối các giá trị đầu ra của từng luật để tạo ra giá trị đầu ra cuối cùng.
Hình 1.7 minh họa cụ thể ví dụ về hệ thống CANFIS với ba biến đầu vào.
Layer 1 Layer 2 Layer 3 Layer 4 Layer 5 x 1 m 11 m 11 m 11 m 11 x 2 m 21 m 22 m 23 m 24 x 3 m 31 m 32 m 33 m 3 4 x 3 x 1 x 2 y
Hình 1.7: Kiến trúc của hệ thống CANFIS
Hệ thống CANFIS được sử dụng phổ biến trong viễn thông cho các tín hiệu phức và không tuyến tính Tuy nhiên, việc áp dụng hàm mờ loại 1 riêng biệt cho phần thực và phần ảo của các giá trị đầu vào dẫn đến việc giảm thiểu ý nghĩa của hệ thống suy diễn trong miền phức Sự tách biệt này không chỉ làm giảm tính ứng dụng mà còn gia tăng số lượng luật và độ phức tạp tính toán của hệ thống.
Hệ thống ANCFIS, được đề xuất bởi nhóm tác giả Chen và cộng sự vào năm 2010, tương tự như kiến trúc mạng nơ ron giá trị phức Mạng nơ ron này cho phép dữ liệu đầu vào và đầu ra là các giá trị phức, bên cạnh việc chấp nhận các giá trị thực và nhị phân Ngoài ra, các trọng số trong mô hình có thể là giá trị phức hoặc giá trị thực.
Mô hình ANCFIS được đề xuất để áp dụng cho dữ liệu chuỗi thời gian, chỉ yêu cầu một biến đầu vào, tức là một giá trị trong chuỗi dữ liệu Điều này làm nổi bật tính tự nhiên của tập mờ phức, tuy nhiên, cần phải phân đoạn dữ liệu theo chuỗi thời gian để phù hợp với thành phần pha và biên độ của tập mờ phức trong bài toán đã được đề xuất.
Mô hình hệ thống ANCFIS được cải tiến bằng cách thêm một lớp bổ sung, sử dụng tín hiệu giá trị phức trong phần lớn mô hình mạng và áp dụng hàm kích hoạt khác nhau tại các nút Trong giai đoạn xác định, cần thiết lập hàm thuộc giá trị phức cho từng đoạn chuỗi thời gian và hàm thuộc cho tập mờ phức Giai đoạn trước yêu cầu cập nhật các tham số a, b, c và d cho tập mờ phức thông qua thuật toán tối ưu Gradient descent Nhóm tác giả đã lựa chọn thực nghiệm toán tử L2 norm, tích chập giá trị thực và tích chập với giá trị phức cho giai đoạn trước, trong khi thuật toán tối ưu đàn kiến ACO được áp dụng cho giai đoạn sau của hệ thống.
Các vấn đề còn tồn tại cần giải quyết của hệ CFIS hiện nay
Nghiên cứu về hệ suy diễn phát triển từ tập mờ phức cho thấy rằng các hệ thống hiện tại chưa phản ánh đúng bản chất của hệ thống phức thực sự Nhiều hệ thống chỉ sử dụng thành phần biên độ trong quyết định mà bỏ qua thành phần pha, như trong hệ thống logic mờ phức tổng quát của Ramot, dẫn đến việc không đủ yếu tố xử lý dữ liệu chuỗi thời gian Điều này làm giảm tính chính xác của mô hình, khiến nó trở thành hệ suy diễn mờ thông thường Mô hình ANCFIS của Man và Chen cũng gặp vấn đề tương tự khi sử dụng phép tích vô hướng cho các giá trị phức, dẫn đến việc không thể đại diện cho tính tuần hoàn của các thành phần Do đó, ANCFIS không thực sự là một hệ thống phức khi đầu ra không phản ánh đúng tính chất của các giá trị phức.
The authors subsequently developed and enhanced the ANCFIS model into two advanced systems: the Randomized Adaptive-Network Based Fuzzy Inference System (RANCFIS) and the Fast Adaptive-Network Based Fuzzy Inference System (FANCFIS) However, both systems did not improve the complexity significance of the original ANCFIS but instead focused on refining the learning aspects of the ANCFIS model.
Các hệ thống phát triển dựa trên lý thuyết tập mờ phức, như hệ logic mờ phức của Ramot và các phiên bản ANFIS, được áp dụng để xử lý dữ liệu chuỗi thời gian hoặc các bộ dữ liệu có yếu tố tuần hoàn và biến đổi theo thời gian Các hệ FIS và ANFIS đều cung cấp hai phương thức xử lý chung để cải thiện hiệu quả phân tích dữ liệu.
• Các hệ thống thường bỏ qua thông tin liên quan đến yếu tố thành phần pha,
Để tối ưu hóa dữ liệu đầu vào, cần tách biệt thành phần biên độ và pha bằng cách sử dụng hai tập mờ riêng biệt Việc này có thể dẫn đến mất mát thông tin, làm cho kết quả suy diễn không đáng tin cậy nếu thông tin về thành phần pha bị bỏ qua Hơn nữa, việc xử lý riêng biệt các thông tin về biên độ và pha có thể gây sai lệch thông tin và làm giảm hiệu năng tính toán Điều này cũng dẫn đến việc tăng thời gian tính toán do số lượng bộ cần xử lý gia tăng.
Cơ sở lý thuyết
Tập mờ
Theo lý thuyết cổ điển, khi phân tích mối quan hệ giữa một phần tử và một tập hợp, chúng ta chỉ có hai giá trị: 1 (nếu phần tử thuộc tập hợp) và 0 (nếu không thuộc) Các tập hợp này được gọi là tập rõ.
Cho tậpX 6= 0, tập rõA ⊆ X được xác định bởi hàm thuộc sau: z 7→ χ A (z)) =
(1.1) trong đóX là không gian nền (tập nền).
Khái niệm tập mờ được giáo sư Lotfi A Zadeh giới thiệu vào năm 1965 nhằm mô tả các khái niệm "tập hợp chưa rõ ràng" trong nghiên cứu những yếu tố chưa xác định Theo định nghĩa 1.1, A được coi là một tập mờ trên không gian nền X nếu A được xác định bởi hàm A: X → [0, 1], trong đó x được ánh xạ tới A(x).
Tập mờ phức
Tập mờ phức (Complex Fuzzy Set - CFS) và logic mờ phức (Complex Fuzzy Logic - CFL) là những khái niệm được Ramot và các cộng sự giới thiệu, nhằm mở rộng lý thuyết tập mờ và logic mờ Một tập mờ phức A trên không gian nền U được định nghĩa bởi hàm giá trị phức, có dạng A(x) = r_A(x) e^(jω_A(x)), trong đó j = √-1.
Trong đó, r A (x) là biên độ, ω A (x) là pha của hàm thuộc mờ phức và với điều kiện r A (x) ∈ [0, 1] , ω A (x) ∈ (0, 2π]
Một tập mờ phức được xác định bởi hàm giá trị phức A(x), với phạm vi giá trị nằm trên đường tròn đơn vị trong không gian phức Thành phần pha cung cấp thông tin bổ sung liên quan đến chu kỳ không gian hoặc thông tin thời gian trong tập mờ, đã được xác định bởi thành phần biên độ.
Theo Ramot, tập mờ phức là công cụ mô hình hóa hiệu quả cho các vấn đề và đối tượng có sự thay đổi theo thời gian, chẳng hạn như phần pha biểu diễn ý nghĩa thay đổi theo ngữ cảnh, cũng như cho những vấn đề có yếu tố chu kỳ và định kỳ.
Khác với tập mờ, phạm vi của hàm thuộc chỉ giới hạn trong khoảng [0,1], tập mờ phức mở rộng phạm vi đến vòng tròn đơn vị trong mặt phẳng phức Điều này cho thấy tập mờ phức cung cấp nền tảng toán học để biểu diễn hàm thuộc dưới dạng số phức Do đó, tập mờ có thể được xem là một trường hợp cụ thể của tập mờ phức khi thành phần pha bằng 0.
Hình 1.8 minh họa cách biểu diễn hàm thuộc mờ phức thông qua đồ thị 3 chiều, với không gian nền được xem là trục thứ ba Trụ màu xanh trong hình thể hiện giới hạn của các lớp mờ phức trên không gian nền U.
Hình 1.8: Biểu diễn của hàm thuộc mờ phức
Tuy nhiên khái niệm về tập mờ phức này khác với các khái niệm do Buckley
Các tập mờ phức giữ lại đặc điểm không chắc chắn dưới dạng biên độ, đồng thời bổ sung thành phần pha để thể hiện các thuộc tính dạng sóng.
Các ví dụ sau sẽ minh họa rõ hơn tập mờ phức và ý nghĩa khái niệm thành phần biên độ, thành phần pha của tập mờ phức.
Năng lượng mặt trời có thể được đánh giá thông qua số lượng vết đen mặt trời, với nhiều vết đen tương ứng với mức năng lượng cao và ít vết đen cho thấy mức năng lượng thấp Theo các chuyên gia, chu kỳ 11 năm của mặt trời bao gồm giai đoạn cực đại và cực tiểu, do đó, để xác định mức năng lượng mặt trời trong tháng, cần xem xét không chỉ số lượng vết đen trung bình mà còn cả chu kỳ năng lượng Ví dụ, vào năm 2000, số lượng 50 vết đen được xem là cực đại, nhưng đến năm 2015, con số này chỉ đạt một phần tư của chu kỳ tăng trưởng năng lượng mặt trời.
Để thể hiện thông tin liên quan đến hoạt động năng lượng mặt trời theo từng tháng, có thể định nghĩa nó như một tập mờ phức, bao gồm thành phần biên độ và pha Thành phần biên độ phản ánh số lượng vết đen mặt trời, trong khi thành phần pha cung cấp thông tin về vị trí tháng trong chu kỳ quay của mặt trời Việc sử dụng tập mờ truyền thống chỉ cho phép biểu diễn số lượng điểm đen của mặt trời, trong khi thông tin về vị trí trong chu kỳ quay vẫn còn mơ hồ và không rõ ràng.
Khi một nhà đầu tư muốn đầu tư vào một công ty thông qua việc mua cổ phiếu trên thị trường chứng khoán New York, họ cần tối ưu hóa thời gian mua hàng và tối đa hóa lợi nhuận bằng cách mua cổ phiếu khi giá còn thấp Để đạt được điều này, nhà đầu tư thường tìm đến sự tư vấn của chuyên gia, người sẽ cung cấp các dữ liệu cần thiết để hỗ trợ quyết định đầu tư.
- Giá cổ phiếu hiện tại của công ty liên quan đến đánh giá tổng thể về hiệu suất của công ty.
Thị trường chứng khoán hiện tại thường hoạt động theo chu kỳ định kỳ, chẳng hạn như theo dõi chỉ số S&P mỗi 4 năm Do đó, thông tin về giai đoạn hiện tại của thị trường chứng khoán rất quan trọng đối với các nhà đầu tư, giúp họ đưa ra quyết định đầu tư chính xác hơn.
Theo lý thuyết tập mờ, nhà đầu tư có thể sử dụng một tập mờ để mô tả tình hình giá cổ phiếu hiện tại, ví dụ như gán giá trị "giá thấp" Tuy nhiên, thông tin về giai đoạn thực tại của thị trường chứng khoán không được thể hiện đầy đủ trong đó Để mô tả rõ hơn về đầu tư cổ phiếu và phản ánh chính xác thông tin từ chuyên gia, khái niệm tập mờ phức có thể được áp dụng Tập mờ phức với thành phần biên độ biểu thị giá cổ phiếu hiện tại tương ứng với hiệu suất công ty và thành phần pha thể hiện giai đoạn hiện tại của thị trường chứng khoán.
Các phép toán trên tập mờ phức
Trong phần này luận án tập trung trình bày về các phép toán trên tập mờ phức.
Phần bù của tập mờ phức
ChoAtập mờ phức với hàm thuộc mờ phức tương ứng là:à A (x) = r A (x)e jω A (x) Định nghĩa 1.3([36]) phần bù của tập mờ phức A ( kí hiệu A ) có thể được xác định như sau:
Theo [36], phép toán phần bù mờ phức có thể có các dạng như sau:
Ví dụ 1.1 Cho tập mờ phức A = 0.6e j1.2π x + 1.0e j2π y + 0.8e j1.6π z
Phép hợp và phép giao của hai tập mờ phức
Ramot [36] đã đề cập đến phép hợp và phép giao trong tập mờ phức, cùng với các toán tử được áp dụng cho thành phần pha của cấp độ thuộc mờ phức.
Cho hai tập mờ phức A và B với hàm thuộc mờ phức tương ứng là A(x) = rA(x)e^jωA(x) và B(x) = rB(x)e^jωB(x) Các phép toán trên tập mờ phức được định nghĩa, trong đó phép hợp hai tập mờ phức A và B (ký hiệu A ∪ B) được xác định theo định nghĩa 1.4.
Với phép⊕có thể là phép t-đối chuẩn, ví dụ nhưr A∪B (x) = max {r A (x), r B (x)}. Định nghĩa 1.5 ([36]) Phép giao hai tập mờ phức A và B (kí hiệu A ∩ B ) được xác định bởi
Phép ⊗ đại diện cho hàm t-chuẩn, chẳng hạn như toán tử Min hoặc phép nhân đại số Khi A và B là các giá trị thực, cả hai toán tử max và min đều có thể được áp dụng trong trường hợp này.
Ramot [36] đề xuất rằng trong phép hợp và phép giao của tập mờ phức, các giá trị thành phần pha ω A∩B (x) và ω A∪B (x) có thể được lựa chọn dựa trên ngữ cảnh ứng dụng Các phép toán áp dụng cho ω A∩B (x) cũng tương tự như vậy và có thể có nhiều dạng khác nhau.
Ví dụ 1.2 Cho 2 tập mờ phức A và B được định nghĩa trên không gian nền U như sau:
Phép hợp giữa hai tập mờ phức (sử dụng hàm max- min) được tính toán như sau:
Thứ tự trong tập các số phức
Vào năm 2011, Azam và cộng sự đã giới thiệu không gian metric giá trị phức và định nghĩa thứ tự từng phần trên tập các số phức Theo đó, cho hai số phức z1 và z2, thứ tự từng phần trong C được xác định khi z1 ≤ z2 nếu và chỉ nếu Re(z1) ≤ Re(z2) và Im(z1) ≤ Im(z2) Điều này có nghĩa là z1 ≤ z2 nếu thỏa mãn một trong bốn điều kiện cụ thể.
• Re (z 1 ) = Re (z 2 ) và Im (z 1 ) = Im (z 2 ) ,
• Re (z 1 ) < Re (z 2 ) và Im (z 1 ) = Im (z 2 ) ,
• Re (z 1 ) = Re (z 2 ) và Im (z 1 ) < Im (z 2 ) ,
• Re (z 1 ) < Re (z 2 ) và Im (z 1 ) > Im (z 2 )
Logic mờ phức
Logic mờ phức là mô hình được phát triển để kết hợp ưu điểm của logic mờ truyền thống với những đặc điểm nổi bật của tập mờ phức Điểm nổi bật của logic mờ phức là các luật được xây dựng có sự liên kết chặt chẽ, với mối quan hệ giữa các thành phần được thể hiện qua phép kéo theo mờ phức Điều này tạo ra một tương tác độc đáo và sự phụ thuộc giữa các luật, từ đó hình thành một hệ thống mới gọi là hệ logic mờ phức.
Hệ logic mờ phức, giống như hệ logic mờ truyền thống, được xây dựng dựa trên các luật suy diễn, nhưng đầu ra của mỗi luật là một tập mờ phức Việc tính toán thành phần pha trong hệ logic mờ phức rất quan trọng để xác định kết quả đầu ra cuối cùng Trong khi đó, hệ logic mờ truyền thống chỉ cần xem xét thành phần biên độ hay mức độ thuộc Đặc điểm này của hệ logic mờ phức là hệ quả trực tiếp từ các tính chất của số phức và không thể thực hiện song song như trong tập mờ truyền thống.
Hệ logic mờ phức cần giữ lại những ưu điểm của tập mờ truyền thống, đồng thời tiếp thu lợi ích từ lý thuyết số phức Mô hình này kết hợp ưu điểm của cả hai lĩnh vực, mang lại hiệu quả cao hơn trong việc xử lý thông tin mờ.
- Mô hình phải duy trì được khả năng duy nhất của logic mờ để nắm bắt được cả dữ liệu số và tri thức ngôn ngữ.
Xây dựng hệ thống sử dụng logic mờ phức cần đảm bảo duy trì mối quan hệ đơn giản và trực quan, mặc dù các cấp độ hàm có tính chất phức tạp.
- Hệ thống logic mờ phức sẽ dựa trên những luật tăng trưởng “song song”, do đó đạt được yêu cầu tính toán hiệu quả.
Hệ logic mờ phức tương tự như hệ logic mờ thông thường, nhưng tập trung vào việc thực hiện mờ hóa vấn đề thông qua định nghĩa các luật mờ Quá trình này bao gồm suy diễn mờ và giải mờ để đạt được kết quả cuối cùng Tất cả các tập mờ trong hệ logic mờ phức đều được đặc trưng bởi hàm thuộc giá trị phức.
Hệ logic mờ phức sử dụng các luật được xây dựng dựa trên tập mờ phức để phát triển một hệ thống logic mờ phức Các luật này thường được diễn đạt dưới dạng câu lệnh if-then, giúp xác định các mối quan hệ và quy tắc trong việc xử lý thông tin không chắc chắn.
Trong lý thuyết mờ, mối quan hệ giữa hai biến X và Y được thể hiện qua luật “X là A thì Y là B”, với X nhận giá trị từ không gian U và A là một tập mờ phức trên U Tương tự, Y nhận giá trị từ không gian V và B là một tập mờ phức trên V Luật này mô tả một quan hệ kéo theo mờ phức giữa hai tiền đề mờ không có điều kiện, trong đó tiền đề p được thể hiện bằng cụm “X là A” và q được mô tả bằng “Y là B”.
Quan hệ kéo theo mờ phức được mô tả bởi hàm thuộc giá trị phức, ký hiệu là A→B(x, y) Theo lý thuyết của tập mờ phức, hàm thuộc được chia thành hai phần: thành phần biên độ và thành phần pha Thành phần biên độ, ký hiệu bởi A→B(x, y), là cấp độ hàm thuộc có giá trị thực, cho biết mức độ thực của quan hệ kéo theo, chẳng hạn như mức độ tăng trưởng của luật.
Thành phần pha (kí hiệu bởi ω A→B (x, y)) là yếu tố quan trọng trong việc kết hợp pha trong phép kéo theo Mặc dù ảnh hưởng của nó đến kết quả là không lớn, nhưng khi nhiều quan hệ kéo theo được xem xét đồng thời trong hệ logic mờ phức, thành phần pha trở thành một tham số cần thiết.
Ramot [44] đã đề xuất hàm kéo theo cho hệ logic mờ phức, được mô tả bằng công thức: à A→B (x, y) = à A (x) ã à B (y) = r A (x) r B (y) e j(ω A (x)+ω B (x)) Ý nghĩa của hàm kéo theo mờ phức tương tự như hàm kéo theo mờ, nhưng điểm khác biệt là hàm thuộc trong công thức là hàm thuộc mờ phức Lưu ý rằng trong phép kéo theo mờ phức, có sự ảnh hưởng của phép tích lên thành phần biên độ của A.
Phép tích đại số trong logic mờ phức tương tự như cách giải thích biên độ trong tập mờ thường, với thành phần biên độ chính tương đương với hàm thuộc giá trị thực Điều này giải thích tại sao phép tích đại số thường được ưa chuộng trong logic mờ phức.
Độ đo mờ và độ đo mờ phức
Trong những năm gần đây, lý thuyết về độ đo mờ và độ đo mờ phức đã thu hút sự chú ý đáng kể từ các nhà khoa học và nghiên cứu cả trong và ngoài nước, đặc biệt trong việc phát triển và ứng dụng cho các hệ thống hỗ trợ ra quyết định Định nghĩa 1.7 mô tả một độ đo mờ phức, ký hiệu ρ, được định nghĩa trên tập hợp F ∗ (U) và thỏa mãn các tính chất nhất định cho các phần tử A, B và C thuộc F ∗ (U).
VớiF ∗ (U )là tập các tập mờ phức trongU
Dựa vào khái niệm của tập mờ phức do Ramot đề xuất, Alkouri và cộng sự
Khoảng cách giữa các tập mờ phức được định nghĩa trong Định nghĩa 1.8([64]), với một số đề xuất cụ thể về các khoảng cách này.
(ii) Khoảng cách Euclidean e CF (A, B) = v u u t
(iii) Khoảng cách Hamming tiêu chuẩn l CF (A, B) = 1
(iv) Khoảng cách Euclidean tiêu chuẩn q CF (A, B ) = v u u t
Zhang và các cộng sự đã giới thiệu khái niệm về cân bằng δ giữa hai tập mờ phức A và B, đồng thời đề xuất một độ đo khoảng cách giữa chúng Theo định nghĩa, A và B được coi là cân bằng δ khi (A, B) ≤ 1 − δ, với δ nằm trong khoảng từ 0 đến 1 Hơn nữa, khoảng cách giữa hai tập mờ phức A và B được xác định dựa trên hàm thuộc mờ phức tương ứng của chúng, cho thấy sự tương quan và độ khác biệt giữa các tập này.
Dữ liệu thực nghiệm
Bộ dữ liệu chuẩn
Đây là các bộ dữ liệu chuẩn lấy từ kho dữ liệu học máy UCI, bao gồm các bộ dữ liệu sau:
Bộ dữ liệu ung thư vú Wisconsin (WBCD) được thu thập từ Bệnh viện Đại học Wisconsin, Madison, Mỹ, chứa thông tin của 699 bệnh nhân Trong số này, 458 bệnh nhân được chẩn đoán mắc u lành tính, trong khi 241 bệnh nhân được xác định là mắc ung thư.
Dữ liệu về bệnh tiểu đường được thu thập từ kho dữ liệu của Đại học Y Virginia, bao gồm 391 bệnh nhân người Mỹ gốc Phi tại miền trung Virginia, nhằm mục đích nghiên cứu và dự đoán bệnh tiểu đường.
Bộ dữ liệu đo chất lượng rượu vang bao gồm thông tin về các mẫu rượu đỏ và trắng từ miền Bắc Bồ Đào Nha Mục tiêu của bộ dữ liệu này là mô hình hóa chất lượng rượu dựa trên các thực nghiệm hóa lý, nhằm phân loại chất lượng rượu một cách chính xác.
Bộ dữ liệu Hình ảnh tim thai CardiotocoGraphy (CTG) bao gồm 2126 hình ảnh tim thai được xử lý tự động, cho phép đo lường các đặc điểm chẩn đoán quan trọng Những hình ảnh này đã được phân loại thành 10 lớp dữ liệu bởi các bác sĩ sản khoa chuyên nghiệp, đảm bảo tính chính xác và độ tin cậy trong việc chẩn đoán.
Bộ dữ liệu Rối loạn nhịp tim (Arrhythmia) được thu thập nhằm mục đích nghiên cứu, giúp phân biệt sự hiện diện của rối loạn nhịp tim và phân loại nó vào một trong 13 lớp khác nhau.
Tóm tắt về các bộ dữ liệu chuẩn BenchMark được mô tả trong Bảng 1.1, cụ thể như sau:
Bảng 1.1: Các bộ dữ liệu thực nghiệm chuẩn Benchmark
Số thứ tự Bộ dữ liệu Số thuộc tính
Số bản ghi Số nhãn
1 Bộ dữ liệu ung thư vú - WBCD 9 680 2
2 Bộ dữ liệu tiểu đường - Diebetes 5 390 2
3 Bộ dữ liệu Chất lượng rượu - Wine 11 1599 6
4 Bộ dữ liệu ảnh chụp tim thai - CTG 19 2126 10
5 Bộ dữ liệu Rối loạn nhịp tim-Arrhythmia 36 452 13
Bộ dữ liệu thực- Bệnh gan Liver
Để chẩn đoán bệnh, bác sĩ cần thu thập thông tin từ quá trình thăm khám và kết quả xét nghiệm Ứng dụng này tập trung vào việc hỗ trợ chẩn đoán bệnh gan thông qua việc khai thác dữ liệu từ các kết quả xét nghiệm men gan.
Chẩn đoán viêm gan và xơ gan dựa vào kết quả xét nghiệm cho thấy aminotransferase tăng từ 1,5 đến 5 lần, thường dưới 10 lần giới hạn bình thường và kéo dài trên 6 tháng Các chỉ số ALP và GGT có thể tăng nhẹ, trong khi bilirubin, albumin và INR thường ở mức bình thường trừ khi bệnh đã tiến triển hoặc nặng Siêu âm, chụp cắt lớp hoặc chụp cộng hưởng từ có thể chỉ ra tình trạng viêm gan mạn tính thông qua các dấu hiệu thay đổi cấu trúc gan Biểu hiện mô học của viêm gan mạn là sự thâm nhiễm tế bào viêm đơn nhân, chủ yếu là tế bào lympho, ở mức độ cho phép.
Dữ liệu về bệnh gan được thu thập từ hồ sơ bệnh án tại Bệnh viện Gang Thép và Bệnh viện Đa khoa Thái Nguyên, bao gồm kết quả xét nghiệm sinh hóa máu, công thức máu và chẩn đoán từ bác sĩ NCS đã tiến hành trích chọn các thuộc tính liên quan đến bệnh viêm gan từ những kết quả xét nghiệm này, với các thuộc tính cụ thể được xác định để phục vụ cho nghiên cứu.
Bảng 1.2: Các thuộc tính dữ liệu đầu vào trong tập dữ liệu bệnh gan Liver
Số thứ tự Thuộc tính Mô tả
1 Tuổi (Age) Tuổi tính đến ngày xét nghiệm
2 Giới tính (Gender) 0: nam; 1: nữ
3 3 AST Chỉ số men AST
4 ALT Chỉ số men ALT
7 TB Chỉ số Total Bilirubin
8 DB Chỉ số Direct Bilirubin
9 DB/TB Tỷ số DB/TB
Tập dữ liệu nghiên cứu về bệnh gan bao gồm 4156 bệnh nhân đến khám và điều trị do rối loạn men gan, trong đó có 1202 bệnh nhân được chẩn đoán mắc bệnh viêm gan.
Các độ đo đánh giá thực nghiệm
Mục đích của bài viết là đánh giá các độ đo được sử dụng để phân tích mô hình hệ suy diễn mờ phức trong bối cảnh hỗ trợ ra quyết định Kết quả phân loại sẽ được trình bày rõ ràng và cụ thể, nhằm cung cấp cái nhìn sâu sắc về hiệu quả của mô hình này.
- TP: số lượng mẫu của lớp Positive được phân loại đúng là Positive
- TN: số lượng mẫu của lớp Negative được phân loại đúng là Negative
- FP: số lượng mẫu của lớp Negative bị phân loại nhầm thành Positive
- FN: số lượng mẫu của lớp Positive bị phân loại nhầm thành Negative
• Độ chính xác (Accuracy): là tỉ lệ giữa số mẫu được phân loại đúng trên tổng số mẫu.
• Độ đo Precision và Recall Chỉ số độ đo Precision và recall được tính theo công thức sau: precision = T P
• Thời gian thực hiện - Time(s): tổng thời gian thực hiện (giây) của hệ thống phân loại
Kết Chương 1
Ra quyết định đóng vai trò quan trọng trong cuộc sống, dẫn đến nhiều nghiên cứu và ứng dụng với các kỹ thuật khác nhau nhằm đưa ra quyết định chính xác Trong bối cảnh công nghệ phát triển nhanh chóng, dữ liệu ngày càng lớn và thường không chính xác, việc xử lý các vấn đề không rõ ràng trở nên cần thiết Lý thuyết thống kê, xác suất và lý thuyết mờ đã được áp dụng để giải quyết những vấn đề này, trong đó hướng tiếp cận mờ, đặc biệt là hệ suy diễn mờ, đang thu hút sự chú ý của nhiều nhà khoa học Tuy nhiên, các hệ suy diễn mờ thường gặp khó khăn khi xử lý dữ liệu có yếu tố chu kỳ hoặc định kỳ Để khắc phục điều này, Ramot đã phát triển lý thuyết CFS, hệ logic mờ phức, được nhiều nhà nghiên cứu áp dụng để giải quyết các bài toán có yếu tố chu kỳ và yếu tố bổ sung.
Trong Chương 1 của luận án, chúng tôi trình bày tổng quan về bài toán ra quyết định qua tiếp cận hệ suy diễn mờ, đặc biệt là các hệ thống mờ phức Nội dung chương cũng đề cập đến lý thuyết về CFS và các hệ thống dựa trên lý thuyết tập mờ phức, tạo nền tảng cho các chương tiếp theo Mặc dù có nhiều nghiên cứu trước đó, nhưng các hệ thống phát triển từ lý thuyết CFS vẫn thiếu ý nghĩa phức thực sự, điều này tạo động lực cho định hướng nghiên cứu của luận án.
- Nghiên cứu các lý thuyết về tập mờ phức, logic mờ phức và độ đo dựa trên tập mờ phức;
- Phát triển hệ suy diễn theo mô hình FIS dựa trên lý thuyết tập mờ phức;
- Nghiên cứu các phương pháp cải tiến hệ suy diễn dựa trên tập mờ phức đã đề xuất.
Cuối chương, luận án giới thiệu các bộ dữ liệu thực nghiệm và các thước đo được sử dụng để đánh giá kết quả trong các chương tiếp theo.
Chương 2 XÂY DỰNG HỆ SUY DIỄN
Giới thiệu
Logic mờ là một nhánh của lý thuyết tập hợp mờ, nhằm mô phỏng suy nghĩ và lý luận của con người để cải thiện quá trình ra quyết định trong điều kiện không chắc chắn hoặc dữ liệu mơ hồ Hệ thống suy diễn mờ (FIS) được định nghĩa là một ánh xạ phi tuyến tính dựa trên suy luận mờ Sự phát triển nhanh chóng của tập mờ đã thúc đẩy sự tiến bộ của FIS, bao gồm các hệ thống phổ biến như Mamdani, Sugeno và Tsukamoto Từ khi ra đời, FIS đã được ứng dụng thành công trong nhiều bài toán thực tiễn, giúp các nhà ra quyết định đưa ra những quyết định chính xác và phù hợp thông qua việc giải quyết các vấn đề hỗ trợ ra quyết định.
Nhiều nhà nghiên cứu đã phát triển hệ suy diễn mờ theo mô hình Mamdani và hệ ANFIS, ứng dụng cho các vấn đề thực tiễn như đánh giá rủi ro môi trường, chẩn đoán bệnh, nâng cao độ tương phản của ảnh và đánh giá hiệu suất của công ty.
Hệ thống ANFIS dựa trên Mamdani đã thu hút sự quan tâm của nhiều nhà khoa học, như Borkar và cộng sự, những người đã áp dụng mô hình này để phát triển hệ thống giám sát hiệu suất cho thiết bị trao đổi nhiệt dạng ống, cho thấy hiệu quả vượt trội so với ANFIS thông thường Ngoài ra, Chai và Zhang cũng giới thiệu mô hình ANFIS Mamdani trong việc đánh giá lưu lượng giao thông, chứng minh rằng mô hình này không chỉ có thời gian tính toán nhanh hơn mà còn cho sai số thử nghiệm thấp hơn so với ANFIS truyền thống.
Mặc dù FIS (Hệ thống suy diễn mờ) được sử dụng rộng rãi, nhưng hầu hết các hệ thống này đều dựa trên các mô hình mờ cơ bản như Mamdani, Sugeno và Tsukamoto, thường áp dụng trên miền số thực Tuy nhiên, trong thực tế, nhiều kết quả có thể gặp biến động không mong muốn và cần các yếu tố bổ sung để cải thiện độ chính xác, đặc biệt là với những dữ liệu có tính chu kỳ như lượng mưa hoặc thông tin hỗ trợ trong chẩn đoán bệnh Do đó, cần thiết phải phát triển phương pháp thể hiện thông tin bổ trợ và chu kỳ Năm 2002, Ramot đã giới thiệu lý thuyết CFS, trong đó khái niệm "pha" được đưa ra để biểu diễn thông tin thời gian và chu kỳ trong dữ liệu CFS cho phép mô hình hóa các hiện tượng và sự kiện theo thời gian, giúp làm rõ tổng thể trong một ngữ cảnh cụ thể.
Hệ logic mờ phức đầu tiên được giới thiệu bởi Ramot, phát triển từ hệ thống logic mờ thông thường bằng cách thay thế tập mờ và phép kéo theo mờ bằng biến đổi phức tương ứng Nghiên cứu của Man và cộng sự kết hợp phương pháp học quy nạp với hệ suy diễn trong tập phức Chen và cộng sự đã giới thiệu phiên bản học nhúng với mạng mờ nơ ron trên tập CFS, mang tên Hệ thống suy diễn mờ phức nơ ron thích nghi (ANCFIS) Hai cải tiến về tốc độ tính toán của hệ ANCFIS cũng đã được nhóm tác giả Yazdanbakhsh và Dick giới thiệu.
Mặc dù đã có nhiều hệ thống phát triển dựa trên tập mờ phức, nhưng chúng vẫn chưa phản ánh đúng bản chất của hệ thống suy diễn mờ phức thực sự Nhiều hệ thống chỉ sử dụng thành phần biên độ trong quyết định, bỏ qua thành phần pha, như trong hệ logic mờ phức của Ramot, dẫn đến thiếu sót khi xử lý dữ liệu chuỗi thời gian có tính lặp lại Điều này làm giảm giá trị của mô hình suy diễn mờ phức, khiến nó trở thành hệ suy diễn mờ thông thường Mô hình ANCFIS của Man và Chen lại coi các giá trị đầu vào phức như giá trị thực, dẫn đến việc thu được giá trị vô hướng từ phép tích vô hướng, điều này không chính xác nếu đầu vào là giá trị phức, vì tích vô hướng của hai số phức sẽ là một giá trị phức Vì vậy, ANCFIS không thực sự là hệ thống phức khi đầu ra không thể đại diện cho tính tuần hoàn của các thành phần.
Các nghiên cứu về hệ Fuzzy Inference System (FIS) như Mamdani, Sugeno và Tsukamoto thường chỉ xử lý các hiện tượng không theo chu kỳ hoặc không có yếu tố bổ sung Khi đối mặt với dữ liệu có yếu tố thời gian và chu kỳ, các hệ mờ và ANFIS thường áp dụng hai phương thức chính: bỏ qua thông tin về thành phần pha hoặc xử lý riêng biệt biên độ và pha bằng hai tập mờ khác nhau Cả hai phương thức này đều dẫn đến mất mát thông tin và giảm độ tin cậy của kết quả Việc bỏ qua thông tin thành phần pha có thể gây ra độ tin cậy thấp, trong khi xử lý riêng biệt có thể làm sai lệch thông tin và giảm hiệu năng tính toán Hơn nữa, thời gian tính toán cũng sẽ tăng do số lượng bộ cần xử lý gia tăng.
Dựa trên các nghiên cứu hiện có về mô hình hệ suy diễn mờ Mamdani và mô hình Hệ logic mờ phức do Ramot đề xuất, luận án chọn mô hình Mamdani làm nền tảng cho Module Suy diễn mờ phức Trong chương này, luận án trình bày Hệ suy diễn mờ phức theo mô hình Mamdani và chi tiết các thành phần của hệ thống Bên cạnh đó, luận án cũng giới thiệu các toán tử t-chuẩn và t-đối chuẩn mờ phức nhằm bổ sung lý thuyết cho tập mờ phức.
Đề xuất toán tử t-chuẩn và t- đối chuẩn mờ phức
Toán tử t-chuẩn và t-đối chuẩn
Toán tử t-chuẩn và t-đối chuẩn là những thành phần quan trọng trong việc phát triển các phép toán của lý thuyết mờ Bài viết này sẽ giới thiệu một số khái niệm cơ bản về phép toán t-chuẩn và t-đối chuẩn, tạo nền tảng cho việc áp dụng toán tử trong lý thuyết tập mờ phức Định nghĩa 2.1 ([73, 74]) chỉ ra rằng một hàm T : [0, 1] × [0, 1] → [0, 1] được coi là hàm t-chuẩn nếu nó đáp ứng bốn điều kiện cụ thể.
0, nếu max(x, y) < 1 Định nghĩa 2.2 ([73, 74]) Một hàm S : [0, 1] × [0, 1] → [0, 1] được gọi là phép t-đối chuẩn nếu nó thỏa mãn bốn điều kiện sau đây:
Bốn T-đối chuẩn cơ bản
Toán tử t-chuẩn và t-đối chuẩn mờ phức
Dựa trên lý thuyết về phép toán t-chuẩn và t-đối chuẩn, bài viết này đề xuất phát triển các phép toán đó trong khuôn khổ lý thuyết tập mờ phức Cụ thể, ánh xạ J : [0, 1] × [0, 1] → [0, 1] được định nghĩa trên mặt phẳng đơn vị phức, chứa tập hợp các số phức Phép J được gọi là phép t-chuẩn mờ phức nếu thỏa mãn các điều kiện nhất định đối với mọi giá trị p, q, r ∈ [0, 1], trong đó p, q, r là các hàm thuộc mờ phức với p = p 1 e jω 1 , q = q 1 e jω 2 , r = r 1 e jω 3.
Định nghĩa 2.4 giới thiệu ánh xạ J∗: [0, 1] × [0, 1] → [0, 1], trong đó [0, 1] đại diện cho mặt phẳng đơn vị phức chứa các số phức Phép J∗ được gọi là phép t-đối chuẩn mờ phức nếu thỏa mãn các điều kiện đối với mọi giá trị p, q, r thuộc [0, 1], với p, q, r tương ứng là các hàm mờ phức được biểu diễn dưới dạng p = p1 e jω1, q = q1 e jω2, và r = r1 e jω3.
Hàm t-chuẩn mờ phức J(p, q) được gọi là hàm toán tử t-chuẩn mờ phức Archimedean nếu nó liên tục và thỏa mãn điều kiện |J(p, p)| < p cho mọi p trong khoảng (0, 1) Khi một toán tử t-chuẩn mờ phức Archimedean tăng chặt với mọi p, q trong (0, 1), nó được gọi là toán tử t-chuẩn mờ phức Archimedean chặt Tương tự, hàm t-đối chuẩn mờ phức J*(p, q) được xem là hàm toán tử t-đối chuẩn mờ phức Archimedean nếu nó cũng liên tục và thỏa mãn |J*(p, p)| < p cho mọi p trong (0, 1) Nếu một toán tử t-đối chuẩn mờ phức Archimedean tăng chặt với mọi p, q trong (0, 1), nó sẽ được gọi là toán tử t-đối chuẩn mờ phức Archimedean chặt.
Ví dụ 2.1 Có thể mở rộng toán tử Zadeh sang toán tử T mờ phức như sau:
Ví dụ 2.2 Một vài toán tử T mờ phức sau:
Ví dụ 2.3 Cho 1 = 1.e j0 và 0 = 0.e j0 , toán tử t-chuẩn mờ phức Lukasiewics là:
= [(p 1 + q 1 ) ∧ 1] ã e j(ω 1 +ω 2 ) Định lý 2.1 Toán tử T-chuẩn J và T- đối chuẩn J ∗ phải thỏa mãn các tính chất sau:
Bổ đề 2.1 Giả sử J 1 (p, q) = min (p, q) và J 1 ∗ (p, q) = max (p, q) thì ta có:
Tính chất phân phối → tính nuốt → tính lũy đẳng → { J=J 1
J ∗ = J 1 ∗ Định nghĩa 2.7 Cho N : [0, 1] × [0, 1] → [0, 1] , N được gọi là hàm phủ định nêú nó thỏa mãn tính chất sau:
Hàm phủ định N được xác định là chặt khi nó liên tục và giảm chặt, tức là N(p) < N(q) nếu p > q với mọi p, q thuộc khoảng [0, 1] Ngoài ra, hàm phủ định N cũng được coi là mạnh nếu thỏa mãn điều kiện N(N(p)) = p với mọi p trong khoảng [0, 1].
Toán tử phủ định Zadeh có thể được chuyển đổi thành toán tử phủ định phức theo công thức N(p) = 1 − p Định lý 2.2 chỉ ra rằng toán tử t-chuẩn J, toán tử t-đối chuẩn J ∗ và toán tử phủ định cần tuân thủ các quy luật nhất định.
(ii) Luật loại trừ trung bình: J (p, N (p)) = 0 và J ∗ (p, N (p)) = 1
Bổ đề 2.2 Nếu toán tử phủ định N là mạnh thì hai điều kiện về luật loại trừ trung bình trong định lý 2.2 là tương đương.
Bổ đề 2.3 Nếu toán tử phủ định N là mạnh thì
Ví dụ minh họa hỗ trợ ra quyết định
Trong phần này, luận án giới thiệu ứng dụng của toán tử t-chuẩn và t-đối chuẩn trong hỗ trợ ra quyết định Quy trình này bao gồm các bước quan trọng để tối ưu hóa quá trình ra quyết định.
Bước 1 Xây dựng ma trận ra quyết định mờ
Trong quá trình hỗ trợ ra quyết định với m phương án Υ (i = 1, 2, , m) và n tiêu chí Λ k (k = 1, 2, , n), người ra quyết định xây dựng ma trận ra quyết định Γ = (y ik ) m×n, trong đó y ik thể hiện mức độ ưa thích của phương án Υ i đối với tiêu chí Λ k Trọng số của các tiêu chí được biểu diễn bằng các số mờ phức CFNs α k = à α k e j ( ω αk).
, (k = 1, 2, , n), với à α k là thành phần biờn độ hay mức độ thớch của người ra quyết định đối với tiêu chíΛ k vàω α k là thành phần pha.
Bước 2 Biến đổi ma trận quyết định Γ = (y ik ) m×n thành ma trận chuẩn hóa
D = (λ ik ) m×n , với λ ik = y ik max ∀i,k y ik , i = 1, , m; k = 1, , n Bước 3 Sử dụng các toán tử trong ví dụ 2.3 để tính toán t-chuẩn mờ phức Lukasiewicz
Bước 4: Tổng hợp các cấp độ thuộc phức.
Bước 5: Xem xét điểm cao nhất là ứng cử viên cho thứ hạng tốt nhất.
Bộ dữ liệu thực bệnh Viêm gan được thu thập tại Bệnh viện Gang thép Thái Nguyên và Bệnh viện đa khoa Thái Nguyên, với các bệnh nhân đến kiểm tra chức năng gan qua 8 chỉ số: AST, ALT, AST/ALT, GGT, Albumin, Total Bilirubin, Direct Bilirubin và tỷ lệ DB/TB Dựa trên kết quả xét nghiệm này, bác sĩ có thể yêu cầu bệnh nhân thực hiện các xét nghiệm bổ sung để cải thiện độ chính xác trong chẩn đoán.
Bước đầu tiên trong việc xây dựng ma trận ra quyết định mờ là dựa vào bộ dữ liệu có sẵn Theo ý kiến của các chuyên gia trong lĩnh vực chẩn đoán bệnh viêm gan, có bốn tiêu chí cơ bản cần xem xét để đưa ra quyết định chính xác.
Tiêu chí 1 (C1): Chỉ số AST và ALT tăng và AST cao hơn ALT
Tiêu chí 2 (C2): Chỉ số Albumin giảm trong khi AST và ALT tăng
Tiêu chí 3 (C3): Tỷ lệ DB/TB nhỏ hơn 20%
Tiêu chí 4 (C4): Tỷ lệ DB/TB trong khoảng 20-50%
Các yêu cầu kiểm tra (kí hiệu E1, E2 và E3) sau cần thực hiện:
E1: Kiểm tra HbsAg, HbeAg và viêm gan C
E2: Kiểm tra chức năng gan gồm PT, APTT và tỷ lệ INR
E3: Xét nghiệm Hemolysis là bước đầu tiên trong chẩn đoán bệnh viêm gan, dựa vào ý kiến của các chuyên gia và khảo sát thực tế từ bệnh nhân Quy trình này bao gồm ma trận ra quyết định tương ứng với các tiêu chí và yêu cầu xét nghiệm của bác sĩ để xác định tình trạng viêm gan Ma trận ra quyết định cho vấn đề chẩn đoán bệnh viêm gan được trình bày trong Bảng 2.1.
Bảng 2.1: Ma trận ra quyết định dựa trên các mẫu dữ liệu
Từ bảng ma trận ra quyết định trên các mẫu dữ liệu, chúng ta áp dụng hàm mờ Gauss để thực hiện quá trình mờ hóa, nhằm xử lý dữ liệu có dạng tương ứng với phần thực và phần ảo.
Do đó, ma trận kết quả thu được như trong Bảng 2.2.
Trong đóA i ,P i tương ứng là giá trị biên độ và giá trị pha của tiêu chí C i
Bảng 2.2: Ma trận quyết định mờ
Vectơ trọng số của các tiêu chí thu được:((0.5, 0.4) , (0.6, 0.3) , (0.3, 0.4) , (0.2, 0.6)). Bước 2: Tiến hành chuẩn hóa ma trận ra quyết định mờ
Chuẩn hóa ma trận quyết định mờ theo công thức sau:
A 0 i = max{A A i i ,i=1, ,n} ; P i 0 = max{P P i i ,i=1, ,n} với mọii = 1, , n. Kết quả thu được ma trận quyết định chuẩn hóa như Bảng 2.3 sau:
Bảng 2.3: Ma trận chuẩn hóa
Bước 3 Tính toán t-chuẩn mờ phức
Sử dụng toán tử trong ví dụ 2.3 để tính toán t-chuẩn mờ phức Lukasiewicz, kết quả thu được sẽ được tổng hợp thành một ma trận quyết định mờ như thể hiện trong Bảng 2.4.
Bảng 2.4: Ma trận quyết định mờ
Bước 4 Tổng hợp các cấp độ thuộc phức
Giải mờ kết quả trong Ma trận quyết định mờ, ta thu được ma trận quyết định cuối cùng có trong Bảng 2.5.
Bước 5: Dựa vào bảng ma trận, kết quả được xác định bằng cách chọn các kiểm tra yêu cầu tương ứng, là những giá trị lớn nhất (được bôi đậm) trong mỗi tiêu chí.
Kết quả từ ví dụ số về toán tử t-chuẩn và t-đối chuẩn mờ phức trong bài toán hệ hỗ trợ ra quyết định đã được bác sĩ xác minh là hợp lý.
Bảng 2.5: Ma trận quyết định kết quả
Việc áp dụng các toán tử t-chuẩn và t-đối chuẩn mờ phức trong hỗ trợ ra quyết định đã giúp đơn giản hóa và nâng cao hiệu quả của quá trình ra quyết định.