Luận văn ứng dụng hệ luật mờ cho điều khiển lò nhiệt từ phân cụm trừ dữ liệu

TỔ NG QUAN V Ề PHÂN C Ụ M D Ữ LI Ệ U

Khái ni ệ m và m ụ c tiêu c ủ a phân c ụ m d ữ li ệ u

Phân cụm dữ liệu (PCDL) là một phương pháp quan trọng trong việc khám phá cấu trúc của dữ liệu, cho phép hình thành các nhóm từ tập dữ liệu lớn Qua đó, PCDL hỗ trợ phân tích sâu hơn cho từng cụm dữ liệu, giúp phát hiện và khai thác thông tin tiềm ẩn, hữu ích cho quá trình ra quyết định.

PCDL là một phương pháp xử lý thông tin quan trọng và phổ biến, giúp khám phá mối liên hệ giữa các mẫu dữ liệu bằng cách tổ chức chúng thành các cụm.

PCDL, hay Phát hiện Cụm Dữ liệu Lớn, là một kỹ thuật trong khai phá dữ liệu (KPDL) nhằm tìm kiếm và phát hiện các mẫu dữ liệu tự nhiên, tiềm ẩn trong tập dữ liệu lớn Kỹ thuật này giúp cung cấp thông tin và tri thức hữu ích, hỗ trợ quá trình ra quyết định hiệu quả.

PCDL là quá trình phân chia dữ liệu thành các cụm, trong đó các phần tử trong cùng một cụm có sự tương đồng, trong khi các phần tử ở các cụm khác nhau lại khác biệt Số lượng cụm dữ liệu có thể được xác định trước dựa trên kinh nghiệm hoặc tự động thông qua các phương pháp phân cụm.

Trong PCDL, hai hoặc nhiều đối tượng được nhóm lại thành một cụm khi chúng chia sẻ một định nghĩa chung về khái niệm hoặc khi chúng gần gũi với các khái niệm mô tả đã được xác định trước.

Trong học máy, PCDL (Phát hiện Cấu trúc Dữ liệu) được coi là một vấn đề học không giám sát, nhằm tìm kiếm cấu trúc trong tập dữ liệu mà không có thông tin trước về lớp hay tập huấn luyện Trong nhiều trường hợp, việc phân lớp dữ liệu có thể mang lại những hiểu biết quan trọng.

Trong học có giám sát, Phân Chia Dữ Liệu Lớp (PCDL) đóng vai trò quan trọng trong việc phân lớp dữ liệu PCDL khởi tạo các lớp phân loại bằng cách xác định nhãn cho các nhóm dữ liệu, giúp cải thiện độ chính xác của mô hình học máy.

Trong KPDL, nghiên cứu các phương pháp phân tích cụm hiệu quả và hiệu suất cao trong cơ sở dữ liệu lớn là rất quan trọng Mục tiêu chính bao gồm khả năng mở rộng của các phương pháp phân cụm, hiệu quả trong việc xử lý các hình dạng phức tạp, và áp dụng các kỹ thuật cho nhiều kiểu dữ liệu có kích thước lớn Ngoài ra, nghiên cứu cũng tập trung vào các phương pháp cho PCDL tường minh và dữ liệu dạng số hỗn hợp trong CSDL lớn PCDL được ứng dụng rộng rãi trong nhiều lĩnh vực như nhận dạng mẫu, phân tích dữ liệu, xử lý ảnh và nghiên cứu thị trường.

Hình 1.1 mô tả thực hiện phân cụm của tập dữ liệu giám sát nhiệt độ lò thành 3 cụm

Hình 1.1 Ví dụ phân cụm của tập dữ liệu giám sát nhiệt độ lò thành 3 cụm

Trong phân cụm dữ liệu lớn (PCDL), một vấn đề thường gặp là sự xuất hiện của dữ liệu "nhiễu" do quá trình thu thập không chính xác hoặc không đầy đủ Để khắc phục tình trạng này, cần xây dựng chiến lược tiền xử lý dữ liệu nhằm loại bỏ hoặc giảm thiểu "nhiễu" trước khi tiến hành phân tích Dữ liệu "nhiễu" có thể bao gồm các đối tượng không chính xác hoặc thiếu thông tin về một số thuộc tính Một trong những kỹ thuật phổ biến để xử lý nhiễu là thay thế dữ liệu không chính xác bằng các giá trị phù hợp hơn.

3 giá trị của các thuộc tính của đối tượng “nhiễu” bằng giá trị thuộc tính tương ứng của đối tượng dữ liệu gần nhất

Dò tìm phần tử ngoại lai là một hướng nghiên cứu quan trọng trong PCDL, giúp xác định các đối tượng dữ liệu "khác thường" so với dữ liệu khác trong CSDL Chức năng này nhằm ngăn chặn ảnh hưởng của những đối tượng không tuân theo các hành vi hoặc mô hình dữ liệu đến quá trình và kết quả của PCDL Việc khám phá các phần tử ngoại lai đã được phát triển và ứng dụng hiệu quả trong nhiều lĩnh vực như viễn thông và dò tìm gian lận thương mại.

Tóm lại, PCDL là một vấn đề khó vì người ta phải đi giải quyết các vần đề con cơ bản như sau:

- Xây dựng hàm tính độ tượng tự

- Xây dựng các tiêu chuẩn phân cụm

- Xây dựng mô hình cho cấu trúc cụm dữ liệu

- Xây dựng thuật toán phân cụm và xác lập các điều kiện khởi tạo

- Xây dựng các thủ tục biểu diễn và đánh giá kết quả phân cụm

Theo các nghiên cứu, hiện chưa có phương pháp phân cụm tổng quát nào có thể giải quyết hoàn toàn tất cả các dạng cấu trúc cụm dữ liệu Các phương pháp phân cụm cần có cách thức biểu diễn cấu trúc khác nhau, và mỗi cách thức này sẽ yêu cầu một thuật toán phân cụm phù hợp PCDL vẫn là một vấn đề mở và khó khăn, vì cần giải quyết nhiều vấn đề cơ bản một cách toàn diện và phù hợp với nhiều dạng dữ liệu khác nhau Đặc biệt, dữ liệu hỗn hợp đang ngày càng gia tăng trong các hệ quản trị dữ liệu, tạo ra những thách thức lớn cho các nhà nghiên cứu.

4 lớn trong lĩnh vực KPDL trong những thập kỷ tiếp theo và đặc biệt trong lĩnh vực KPDL bằng phương pháp phân cụm dữ liệu

Mục tiêu của phân cụm dữ liệu là xác định bản chất của các nhóm trong tập dữ liệu chưa được gán nhãn Để đánh giá một cụm tốt, cần có tiêu chí rõ ràng để phân định các đặc điểm và mối quan hệ giữa các điểm dữ liệu.

Không có tiêu chuẩn tuyệt đối nào cho việc đánh giá "tốt" trong phân cụm, vì điều này phụ thuộc vào kết quả cụ thể Người sử dụng cần xác định tiêu chí phù hợp để đảm bảo rằng các kết quả phân cụm đáp ứng yêu cầu của họ Ví dụ, một mối quan tâm có thể là tìm kiếm đại diện cho các nhóm đồng nhất nhằm mục đích rút gọn dữ liệu.

"Các cụm tự nhiên" đề cập đến việc mô tả các thuộc tính chưa biết trong kiểu dữ liệu tự nhiên hoặc tìm kiếm các đối tượng khác thường thông qua việc dò tìm phần tử ngoại lai.

Các ứ ng d ụ ng c ủ a phân c ụ m d ữ li ệ u

Phân cụm dữ liệu là một công cụ quan trọng trong một số ứng dụng Sau đây là một số ứng dụng của nó:

Giảm dữ liệu là quá trình phân nhóm một lượng lớn dữ liệu (N) thành m cụm dễ nhận diện, trong đó m nhỏ hơn nhiều so với N Mỗi cụm sẽ được xử lý như một đối tượng đơn, giúp tối ưu hóa việc quản lý và phân tích dữ liệu.

Để kiểm tra tính tự nhiên của dữ liệu, cần rút ra các giả thuyết liên quan và áp dụng chúng vào nhiều tập dữ liệu khác nhau.

Kiểm định giả thuyết là quá trình phân cụm để xác định xem có tồn tại một tập dữ liệu nào đó phù hợp với các giả thuyết đã đề ra hay không Ví dụ, để kiểm tra giả thuyết về việc "các công ty lớn đầu tư ra nước ngoài", ta áp dụng kỹ thuật phân cụm trên một tập đại diện lớn các công ty Mỗi công ty được đặc trưng bởi các yếu tố như quy mô, hoạt động quốc tế và khả năng hoàn thành dự án Nếu sau khi phân cụm, một nhóm công ty có đặc điểm tương đồng được hình thành, điều đó sẽ hỗ trợ cho giả thuyết ban đầu.

Năm công ty lớn với vốn đầu tư ra nước ngoài đã củng cố giả thuyết này thông qua kỹ thuật phân cụm, bất chấp khả năng hoàn thành các dự án của họ.

Dự đoán dựa trên các cụm là quá trình phân tích dữ liệu thành các nhóm đặc trưng Khi gặp một dạng mới chưa biết, chúng ta sẽ xác định khả năng thuộc về cụm nào và dự đoán một số đặc điểm của dạng này dựa trên các đặc trưng chung của cụm.

Cụ thể hơn, phân cụm dữ liệu đã được áp dụng cho một số ứng dụng điển hình trong các lĩnh vực sau:

Trong lĩnh vực thương mại, phân cụm đóng vai trò quan trọng trong việc giúp các thương nhân nhận diện các nhóm khách hàng có đặc điểm tương đồng Bằng cách phân tích các mẫu giao dịch trong cơ sở dữ liệu khách hàng, thương nhân có thể xác định và đặc tả những nhóm khách hàng quan trọng này.

Trong lĩnh vực sinh học, phân cụm là phương pháp quan trọng để xác định các loại sinh vật, phân loại các gen có chức năng tương đồng và nhận diện các cấu trúc trong các mẫu sinh học.

Phân tích dữ liệu không gian ngày càng trở nên cần thiết do khối lượng lớn dữ liệu từ hình ảnh vệ tinh, thiết bị y học và hệ thống thông tin địa lý (GIS) Việc kiểm tra chi tiết các dữ liệu này là một thách thức đối với người dùng Phân cụm có thể hỗ trợ tự động trong việc phân tích và xử lý dữ liệu không gian, giúp nhận dạng và chiết xuất các đặc tính hoặc mẫu dữ liệu quan trọng trong cơ sở dữ liệu không gian.

 Lập quy hoạch đô thị: Nhận dạng các nhóm nhà theo kiểu và vị trí địa lý, … nhằm cung cấp thông tin cho quy hoạch đô thị

 Nghiên cứu trái đất: Phân cụm để theo dõi các tâm động đất nhằm cung cấp thông tin cho nhận dạng các vùng nguy hiểm

 Địa lý: Phân lớp các động vật và thực vật và đưa ra đặc trưng của chúng

Web Mining là một phương pháp hiệu quả để phân cụm, giúp khám phá các nhóm tài liệu quan trọng và có ý nghĩa trong môi trường Web Các lớp tài liệu này đóng vai trò quan trọng trong việc khai thác tri thức từ dữ liệu, hỗ trợ quá trình tìm kiếm và phân tích thông tin.

Các yêu c ầ u c ủ a phân c ụ m d ữ li ệ u

Việc lựa chọn thuật toán phân cụm phù hợp là yếu tố quan trọng trong quá trình giải quyết vấn đề phân cụm Sự lựa chọn này phụ thuộc vào đặc điểm của dữ liệu, mục tiêu ứng dụng thực tế và mức độ ưu tiên giữa chất lượng cụm và tốc độ thực hiện thuật toán.

Hầu hết các nghiên cứu và phát triển thuật toán PCDL đều nhằm thỏa mãn các yêu cầu cơ bản sau:

Nhiều thuật toán phân cụm thường hoạt động hiệu quả với các tập dữ liệu nhỏ, nhưng khi đối mặt với cơ sở dữ liệu lớn chứa hàng triệu đối tượng, kết quả phân cụm có thể bị ảnh hưởng Để phát triển các thuật toán phân cụm có khả năng mở rộng cao cho các cơ sở dữ liệu lớn, cần nghiên cứu và cải tiến các phương pháp nhằm tối ưu hóa hiệu suất và độ chính xác khi xử lý khối lượng dữ liệu lớn.

Thuật toán phân cụm có khả năng thích nghi linh hoạt với nhiều kiểu dữ liệu khác nhau, bao gồm dữ liệu số, nhị phân, định danh và hạng mục Điều này cho phép nó áp dụng hiệu quả cho các tập dữ liệu hỗn hợp, nâng cao khả năng phân tích và xử lý thông tin.

Khám phá các cụm dữ liệu với hình dạng đa dạng là điều cần thiết, vì nhiều cơ sở dữ liệu chứa các cụm có hình thù khác nhau như hình lõm, hình cầu và hình que Để nhận diện các cụm tự nhiên, thuật toán phân cụm cần phải có khả năng phát hiện và phân loại các cụm dữ liệu với hình dạng bất kỳ.

Để xác định các tham số đầu vào cho thuật toán phân cụm, cần có một lượng tri thức tối thiểu, vì các giá trị đầu vào này thường có ảnh hưởng lớn đến kết quả phân cụm Việc lựa chọn các giá trị đầu vào phù hợp trở nên phức tạp, đặc biệt là khi làm việc với các cơ sở dữ liệu lớn.

Thuật toán PCDL ít nhạy cảm với thứ tự dữ liệu đầu vào, nghĩa là khi xử lý cùng một tập dữ liệu với các thứ tự khác nhau trong nhiều lần thực hiện, kết quả phân cụm vẫn không bị ảnh hưởng đáng kể.

Khả năng thích nghi với dữ liệu nhiễu cao là một yếu tố quan trọng trong phân cụm dữ liệu Hầu hết các dữ liệu trong KPDL thường chứa lỗi, dữ liệu không đầy đủ và dữ liệu rác Thuật toán phân cụm không chỉ hiệu quả trong việc xử lý dữ liệu nhiễu mà còn giúp duy trì chất lượng phân cụm, tránh sự nhạy cảm với nhiễu.

Các tham số đầu vào có ít ảnh hưởng đến kết quả phân cụm, nghĩa là sự thay đổi của các giá trị tham số này không tạo ra biến động lớn trong kết quả cuối cùng.

- Thích nghi với dữ liệu đa chiều: Thuật toán có khả năng áp dụng hiệu quả cho dữ liệu có số khác chiều nhau

Phân cụm cần phải dễ hiểu, dễ cài đặt và khả thi cho người sử dụng, với kết quả rõ ràng và dễ lý giải Sự giải thích về ý nghĩa và ứng dụng của phân cụm là rất quan trọng Nghiên cứu cách để ứng dụng đạt được mục tiêu sẽ ảnh hưởng đến việc lựa chọn các phương pháp phân cụm phù hợp.

Nghiên cứu về phân tích phân cụm bắt đầu bằng việc xem xét các kiểu dữ liệu khác nhau và ảnh hưởng của chúng đến các phương pháp phân cụm Tiếp theo, chúng tôi phân loại các kiểu dữ liệu này trong các phương pháp phân cụm Cuối cùng, chúng tôi tiến hành nghiên cứu chi tiết từng phương pháp để hiểu rõ hơn về cách thức hoạt động của chúng.

Bài viết này trình bày 8 phương pháp phân cụm, bao gồm các phương pháp phân hoạch, phân cấp, dựa trên mật độ, dựa trên lưới và dựa trên mô hình Ngoài ra, chúng tôi cũng khám phá sự phân cụm trong không gian đa chiều và các biến thể của những phương pháp này.

Nh ữ ng k ỹ thu ậ t ti ế p c ậ n trong phân c ụ m d ữ li ệ u

Kỹ thuật phân cụm có nhiều phương pháp và ứng dụng thực tế, với hai mục tiêu chính là nâng cao chất lượng các cụm được khám phá và tối ưu tốc độ thực hiện của thuật toán Các phương pháp phân cụm hiện nay có thể được phân loại theo những cách tiếp cận chủ yếu khác nhau.

1.4.1 Phương pháp phân cụm phân hoạch Ý tưởng chính của kỹ thuật này là phân hoạch một tập hợp dữ liệu có n phần tử cho trước thành k nhóm dữ liệu sao mỗi phần tử dữ liệu chỉ thuộc về một nhóm dữ liệu có tối thiểu ít nhất một phần tử dữ liệu Số các cụm được thiết lập là các đặc trưng được lựa chọn trước Phương pháp này là tốt cho việc tìm các cụm hình cầu trong không gian Euclidean Ngoài ra, phương pháp này cũng phụ thuộc vào khoảng cách cơ bản giữa các điểm để lựa chọn các điểm dữ liệu nào có quan hệ là gần nhau với mỗi điểm khác và các điểm dữ liệu nào không có quan hệ hoặc có quan hệ là xa nhau so với mỗi điểm khác Tuy nhiên, phương pháp này không thể xử lý các cụm có hình dạng kỳ quặc hoặc các cụm có mật độ các điểm dầy đặc Các thuật toán phân hoạch dữ liệu có độ phức tạp rất lớn khi xác định nghiệm tối ưu toán cục cho vấn đề PCDL, do nó phải tìm kiếm tất cả các cách phân hoạch có thể được Chính vì vậy, trên thực tế thường đi tìm giải pháp tối ưu cục bộ cho vấn đề này bằng cách sử dụng một hàm tiêu chuẩn để đánh giá chất lượng của cụm cũng như để hướng dẫn cho quá trình tìm kiếm phân hoạch dữ liệu Với chiến lược này, thông thường bắt đầu khởi

Các thuật toán phân cụm phân hoạch bắt đầu bằng cách tạo ra một phân hoạch ban đầu cho tập dữ liệu thông qua phương pháp ngẫu nhiên hoặc Heuristic Sau đó, chúng liên tục tinh chỉnh phân hoạch này cho đến khi đạt được một kết quả mong muốn, phù hợp với các ràng buộc đã đề ra Mục tiêu của các thuật toán này là cải thiện tiêu chuẩn phân cụm bằng cách tính toán độ tương tự giữa các đối tượng dữ liệu và sắp xếp các giá trị này Cuối cùng, thuật toán sẽ lựa chọn một giá trị từ dãy sắp xếp để tối thiểu hóa hàm tiêu chuẩn Ý tưởng chính của phương pháp này là áp dụng chiến lược ăn tham (Greedy) để tìm kiếm nghiệm tối ưu cục bộ.

Các thuật toán phân cụm phân hoạch, bao gồm k-means, k-medoids, PAM, CLARA và CLARANS, là những thuật toán tiên phong trong lĩnh vực Khoa học Dữ liệu và được ứng dụng rộng rãi trong thực tế.

Thuật toán K-means là một trong những phương pháp phân cụm phổ biến, dựa trên khoảng cách giữa các đối tượng để xác định cụm Người dùng cần chọn một giá trị k, đại diện cho số lượng cụm mong muốn, và sau đó chọn ngẫu nhiên k đối tượng làm tâm cụm ban đầu Tiếp theo, thuật toán tính toán khoảng cách giữa từng đối tượng và các tâm cụm, từ đó phân loại chúng vào cụm phù hợp Quá trình này lặp đi lặp lại cho đến khi các tâm cụm ổn định K-means có nhiều phiên bản khác nhau, phụ thuộc vào hàm tính khoảng cách được sử dụng Thuật toán này hoạt động hiệu quả với các cụm có hình dạng cầu và tròn, nhưng lại nhạy cảm với nhiễu và các phần tử ngoại lai.

Thuật toán K-medoids là một phương pháp phân cụm khác biệt so với K-means, nhằm xác định trọng tâm của cụm một cách hiệu quả hơn Bằng cách sử dụng các đối tượng thực tế trong cụm, K-medoids giúp giảm thiểu ảnh hưởng của nhiễu và các phần tử ngoại lai, mang lại kết quả chính xác hơn trong việc phân tích dữ liệu.

Trong phương pháp K-medoid, phần tử trung tâm của mỗi cụm được gọi là medoid, và nó được lựa chọn dựa trên các hàm chi phí nhằm cải thiện chất lượng phân cụm khi có phần tử mới được thêm vào Cách tiếp cận này giúp giảm thiểu tác động của nhiễu và các phần tử ngoại lai, tuy nhiên, nó cũng làm tăng thời gian tính toán so với phương pháp K-means.

Một biến thể của K-medoids là PAM (Partitioning Around Medoids), trong đó lựa chọn medoid dựa trên điều kiện sai số bình phương tối thiểu Mặc dù chất lượng phân cụm của PAM tốt, nhưng thời gian thực hiện lâu hơn so với K-means và K-medoids PAM không phù hợp cho các tập dữ liệu lớn.

Để xử lý các tập dữ liệu lớn mà các thuật toán trước đó không thể đáp ứng, thuật toán CLARA (Clustering LARge Applications) và CLARANS (Clustering LARge Applications based upon RANdomize Search) đã được đề xuất Cả hai thuật toán này đều sử dụng phương pháp trích mẫu, tức là chỉ lấy một phần dữ liệu để phân tích, giúp đại diện cho toàn bộ tập dữ liệu Quy trình xử lý trên tập mẫu của CLARA tương tự như PAM, trong khi CLARANS có sự khác biệt ở chỗ không hoàn toàn phụ thuộc vào một mẫu cố định, mà thực hiện trích mẫu sau mỗi lần lặp Tuy nhiên, một thách thức lớn vẫn tồn tại: làm thế nào để đảm bảo rằng các phần tử trong mẫu thực sự đại diện cho toàn bộ tập dữ liệu, vấn đề này vẫn đang được các nhà khoa học máy tính nghiên cứu.

1.4.2 P hương pháp phân cụ m phân c ấ p

Phương pháp này tạo ra một phân cấp dựa trên các đối tượng dữ liệu đang được phân tích Cụ thể, nó sắp xếp một tập dữ liệu thành một cấu trúc cây, với cây phân cấp được xây dựng thông qua kỹ thuật đệ quy Cây phân cụm sẽ giúp tổ chức và phân loại dữ liệu một cách hiệu quả.

Có hai phương pháp xây dựng 11, bao gồm hòa nhập nhóm (tiếp cận Bottom-Up) và phân chia nhóm (tiếp cận Top-Down).

Phương pháp Bottom-Up là một kỹ thuật phân cụm bắt đầu từ các đối tượng dữ liệu riêng lẻ, sau đó nhóm chúng lại dựa trên độ đo tương tự, chẳng hạn như khoảng cách giữa các trung tâm nhóm Quá trình này tiếp tục cho đến khi tất cả các nhóm được hợp nhất thành một nhóm duy nhất, đại diện cho mức cao nhất trong cấu trúc phân cấp, hoặc cho đến khi các điều kiện kết thúc được thỏa mãn Cách tiếp cận này áp dụng chiến lược tham lam trong quá trình phân cụm.

Phương pháp Top-Down là một kỹ thuật phân cụm bắt đầu từ việc nhóm tất cả các đối tượng dữ liệu vào một cụm lớn Qua từng vòng lặp, phương pháp này chia nhỏ cụm thành các cụm con dựa trên các giá trị đo lường tương tự, cho đến khi mỗi đối tượng dữ liệu trở thành một cụm riêng biệt hoặc khi đạt được điều kiện dừng nhất định Cách tiếp cận này áp dụng chiến lược chia để trị trong quá trình phân cụm.

Sau đây là minh họa chiến lược phân cụm phân cấp Bottom up và Top down:

Trong thực tế, nhiều trường hợp áp dụng kết hợp cả hai phương pháp phân cụm phân hoạch và phân cụm phân cấp, cho phép cải tiến kết quả từ phương pháp phân cấp thông qua bước phân cụm phân hoạch Hai phương pháp này là những phương pháp cổ điển trong phân tích cụm dữ liệu, với nhiều thuật toán cải tiến đã được phát triển và áp dụng rộng rãi trong khai thác dữ liệu Các thuật toán tiêu biểu bao gồm AGNES, DIANA, BIRCH, CURE, ROCK, và Chemeleon.

1.4.3 P hương pháp phân cụ m d ự a trên m ậ t độ

Phương pháp phân cụm dựa trên hàm mật độ xác định nhóm các đối tượng theo số lượng lân cận của chúng Mật độ xác định được định nghĩa là số lượng đối tượng lân cận của một đối tượng dữ liệu trong một ngưỡng nhất định Khi một cụm dữ liệu mới được hình thành, số lượng đối tượng lân cận phải vượt qua ngưỡng đã được xác định trước Phương pháp này có khả năng phát hiện các cụm dữ liệu với nhiều hình dạng khác nhau, dựa vào mật độ của các đối tượng.

Bottom up Bước 1 Bước 2 Bước 3 Bước 4 b d c e a a b d e c d e a b c d e

Top down Bước 4 Bước 2 Bước 1 Bước 0

XÂY DỰ NG H Ệ LU Ậ T M Ờ T Ừ PHÂN C Ụ M TR Ừ

Phân c ụ m tr ừ d ữ li ệ u

Phương pháp phân cụm trừ (subtractive clustering - SC) xác định các tâm cụm dựa trên mật độ tiềm năng của các điểm lân cận trong một tập hợp dữ liệu gồm n điểm.

Hàm tính mật độ cho một điểm dữ liệu là:

P i : Mật độ các điểm bao quanh điểm dữ liệu thứ i r a : là một hằng số dương hay còn gọi là bán kính cụm

: khoảng cách Euclid giữa điểm dữ liệu thứ i với các điểm bao quanh

Sau khi tính toán mật độ của tất cả các điểm dữ liệu, chúng ta chọn điểm có mật độ lớn nhất làm tâm cụm đầu tiên, ký hiệu là x1* Tâm cụm này có mật độ là P1*, và từ đó, chúng ta tiếp tục xác định các tâm cụm tiếp theo.

Tính lại mật độ cho các điểm dữ liệu theo công thức:

Và rb thường được chọn là r b = 1.5r a và tiếp tục chọn điểm có mật độ lớn nhất làm tâm cụm thứ 2

Trong trường hợp tổng quát khi đã có k tâm cụm thì mật độ của các điểm dữ liệu còn lại được tính theo công thức:

Sử dụng hai điểm cận để xác định tâm cụm, với cận dưới là e * P_ref và cận trên là e * P_ref, trong đó P_ref là mật độ của tâm cụm thứ k Hằng số chấp nhận e và hằng số từ chối e thường được chọn lần lượt là 0.5 và 0.15 Một tâm cụm mới sẽ được chọn nếu điểm đó có mật độ lớn hơn cận trên Ngược lại, nếu điểm có mật độ lớn nhất nhỏ hơn cận dưới, thuật toán sẽ dừng lại.

Nếu điểm có mật độ lớn nhất nằm giữa hai cận, khoảng cách từ điểm đó đến các tâm cụm đã xác định sẽ quyết định liệu điểm đó có trở thành tâm cụm mới hay không.

Các bước thực hiện thuật toán phân cụm trừ mờ như sau:

Bước 1: Khởi tạo r a , h với b a r h = r , e và e

Bước 2: Tính mật độ cho các điểm dữ liệu theo công thức (2.1) Chọn điểm có mật độ lớn nhất làm tâm cụm đầu tiên, ký hiệu là P k * = m i = n ax 1 P i với k = 1, trong đó P k * đại diện cho mật độ của tâm cụm thứ nhất.

Bước 3: Tính toán lại mật độ cho các điểm dữ liệu còn lại theo công thức (2.2) Bước 4: Gọi x * là điểm có mật độ lớn nhất là P *

- Nếu P * > e P r ef : x * là một tâm cụm mới và tiếp tục bước 3

- Ngược lại nếu P * < e - P r ef : chuyển sang bước 5

- Gọi dmin là khoảng cách nhỏ nhất giữa x * và các tâm cụm trước đó

* min ef 1 r a d P r + P ³ : x * là một tâm cụm mới và tiếp tục bước 3

Chọn x * có mật độ P * lớn nhất và tiếp tục bước 4

Bước 5: Đưa ra các cụm kết quả

Khi đó bậc hay độ thuộc của một điểm đối với một tâm cụm được xác định theo công thức:

2.2 Xây dựng hệ luật mờ từ dữ liệu vào/ra của hệ thống

Mỗi cụm trong hệ thống thể hiện các phần hành vi nhất định và được mô tả bằng luật IF – THEN Số lượng cụm tương ứng với số lượng luật trong hệ thống Các cụm này sẽ được chiếu lên không gian đầu vào để xây dựng các luật.

Hình 2.1 Luật được hình thành qua phép chiếu vào không gian đầu vào X và khi không gian đầu vào là hai biến luật có dạng:

R 1 : If x 1 is A 1 1 and x 2 is A 2 1 then y 1 = p 0 1 + p 1 1 x 1 + p 2 1 x 2

R K : If x 1 is A 1 K and x 2 is A 2 K then y 1 = p 0 K + p 1 K x 1 + p 2 K x 2

Hai biến đầu vào x1 và x2 cùng với biến đầu ra yk (với k = 1, 2, …, K) đại diện cho chỉ số của luật k Các tập mờ A1k và A2k (với k = 1, 2, …, K) được tạo ra bằng cách chiếu các cụm vào không gian đầu vào, trong khi p ik (với i = 1, 2; k = 1, 2, …) thể hiện các giá trị liên quan trong quá trình này.

K) là các tham số hồi quy kết quả

Như vậy là từ tập dữ liệu vào ra (x 1t , x 2t , y t ) với t = 1, 2, …, m Ta có thể viết:

 Dưới dạng ma trận, đầu ra hệ thống là:      Y  X P

Trong đó ma trận đầu vào X được xác định là:

Với ma trận đầu ra được biết là: Y  y 1 , , y m  T

Khi đó ma trận P xác định là theo bình phương cực tiểu:

Giả sử rằng với 30 điểm dữ liệu được phân cụm trừ thành 4 cụm như hình 2.2:

Hình 2.2 Dữ liệu được phân cụm trừ , tâm cụm là điểm đơn

Ví dụ với 30 điểm dư liệu đầu vào/ra ta có bảng 2.1: Điểm X y Điểm x Y

Bảng 2.1 Luật mờ được xây dựng từ phân cụm trừ SC

Với ra = 1, theo (2.4) xác định độ thuộc của các điểm với tâm các cụm (chia các điểm thành 4 cụm như hình 2.2

40 Điểm QS Cụm 1 Cụm 2 Cụm 3 Cụm 4

Bảng 2.2 Các cụm được xây dựng qua phân cụm trừ

Vậy ta có tâm các cụm có tọa độ tương ứng là:

QS Cụm 1 Cụm 2 Cụm 3 Cụm 4

Bảng 2.3 Tọa độ tâm các cụm

Chương trình Matlab sau đây cho ta số lượng các luật, hàm thuộc đầu vào và hàm tuyến tính đầu ra theo hệ mờ TS

Dữ liệu từ bảng 2.1 x=[0 0.17 0.29 0.42 58 71 84 29 42 58 71 17 29 42 42 58 58 58 71 71 71 71 71 71 71 71 71 83 83 83] y=[0 0 0 0 0 0 0 05 03 1 02 55 75 6 75 47 5 55 2 47 5 5 68 7 72 75 45 75 69 75] trndata=[x(2:30); x(1:29)]'; datout=y(1:29)' figure hold on subplot(2,1,1), plot(trndata); subplot(2,1,2), plot(datout);

%Chuong trinh tu day la SUBSTRACTIVE CLUSTERING /

%//////////////////////////////////////////////// chkdatin=trndata; fismat=genfis2(trndata,datout,0.8); fuzout=evalfis(trndata,fismat); ruleview(fismat) ruleedit(fismat)

%showrule(fismat) getfis(fismat,'output',1,'mf',1) getfis(fismat,'output',1,'mf',2) figure subplot(2,1,1); gensurf(fismat);

Title('Ham thuoc dau vao 1 cho phan cum tru')

%subplot(223); subplot(2,2,3) plotmf(fismat,'input',2); fTitle('Ham thuoc dau vao 2 cho phan cum tru')

Hình 2.3 Số lượng luật hình thành qua phân cụm trừ từ bảng dữ liệu 2.1

Hình 2.4 Mặt suy diễn và hàm thuộc đầu vào của bảng dữ liệu 2.1

De gr ee o f m em be rs hi p in1cluster1 in1cluster2 in1cluster3 in1cluster4 Ham thuoc dau vao 1 cho phan cum tru

De gr ee o f m em be rs hi p in2cluster1 in2cluster2 in2cluster3 in2cluster4

Ham thuoc dau vao 2 cho phan cum tru

2.3 Xem xét, đánh giá hệ luật điều khiển mờđược tạo qua lý thuyết tập mờ

Thông qua phân cụm trừ trong xử lý số liệu, chúng ta đã xây dựng hệ luật mờ theo Sugeno Số lượng luật hình thành phụ thuộc vào bán kính phân cụm được chọn Nếu bán kính quá nhỏ, số lượng luật sẽ tăng, gây khó khăn trong việc tính toán và xử lý trong thời gian cắt mẫu, đặc biệt với các hệ điều khiển cần phản ứng nhanh Ngược lại, nếu bán kính quá lớn, số luật sẽ giảm, ảnh hưởng đến độ chính xác của hệ thống.

Chương 3 ỨNG DỤNG HỆ LUẬT MỜ CHO ĐIỀU KHIỂN LÒ

NHIỆT TỪ PHÂN CỤM TRỪ DŨ LIỆU 3.1 Phát biểu bài toán

Khi xây dựng hệ điều khiển mờ, bước đầu tiên quan trọng là thiết lập các luật điều khiển mờ Các luật này được biểu diễn dưới dạng các quy tắc cụ thể.

Nếu Thì (3.1)

Luật điều khiển mờ dạng (3.1) thường được phát triển từ kinh nghiệm của các chuyên gia trong lĩnh vực điều khiển hoặc từ dữ liệu thu thập được từ các quá trình công nghệ Các chuyên gia lâu năm trong ngành hoặc những người có nhiều kinh nghiệm có thể cung cấp những hệ thức hữu ích Để xây dựng hệ luật này, việc phân cụm từ dữ liệu là cần thiết, nhằm xác định mối quan hệ giữa tín hiệu đầu vào và đầu ra trong các quá trình công nghệ.

Hệ điều khiển mờ tổng quát điều khiển cho các đối tượng được biểu diễn trên hình 3.1

Hình 3.1 Sơ đồ tổng quát hệ điều khiển mờ xây dựng từ dữ liệu y (k) r (k) u (k) Đọc dữ liệu đưa vào phân cụm trừ

Hệ thống suy diễn mờ

Giải mờ Đối tượng điều khiển

Trên hình 3.1, bộ điều khiển mờ cho điều khiển qua trinh bao gồm các thành phần sau:

Cơ sở tri thức bao gồm hai thành phần chính: cơ sở dữ liệu và cơ sở luật Cơ sở luật được hình thành từ quá trình phân cụm trừ dữ liệu, với số lượng luật tương ứng với số cụm được tạo ra Việc tạo ra các luật này được thực hiện thông qua các hàm trong MATLAB Cơ sở dữ liệu chứa các dữ liệu cần thiết để thực hiện phân cụm và loại bỏ các dữ liệu chuyển tiếp trong quá trình xây dựng luật.

Đọc dữ liệu đầu vào để thực hiện phân cụm trừ là một bước quan trọng trong việc xây dựng hệ luật Bộ quan sát này giúp theo dõi và phân tích dữ liệu ra vào của hệ thống, từ đó tạo điều kiện thuận lợi cho việc phát triển các quy tắc hiệu quả.

Đối tượng điều khiển trong nghiên cứu này là lò nhiệt, được mô hình hóa bằng các phương trình toán học cụ thể Mục tiêu là phân tích và điều khiển hiệu quả hoạt động của lò nhiệt, tương tự như các hệ thống khác như động cơ hay máy bay.

- Thành phần mờ hóa và giải mờ

Các số liệu từ đầu ra của đối tượng điều khiển được đọc qua phản hồi âm để xác định sai lệch điều khiển và sau đó được mờ hóa Quá trình mờ hóa dựa trên các quy tắc trong hệ tri thức mờ nhằm tạo ra tập mờ đầu ra Cuối cùng, thông qua quá trình giả mờ, các giá trị thực được thu nhận.

- Hệ thống suy diễn mờ Đây là quá trình lập luận xấp xỉ theo tiếp cận của lập luận tiến của trí tuệ nhân tạo

Các tín hiệu trên hình 3.1 bao gồm:

- r(k): là tín hiệu đặt ở thời điểm k Ví dụ, ta muốn đặt nhiệt độ cần là 70 0 C chẳng hạn

- y(k): là tín hiệu ra ở thời điểm k từ đối tượng điều khiển

- u(k): là tín hiệu điều khiển được đưa vào để điều khiển lò nhiệt ở thời điểm k

Thu th ậ p d ữ li ệ u và h ệ lu ậ t xây d ự ng t ừ phân c ụ m tr ừ

3.2 Mô hình động học của hệ thống lò nhiệt

Một mô hình hệ động học có thể được biểu diễn như sau :

Trong đó: x (k) là biến trạng thái u (k) là biến đầu vào k là thời điểm ta xét

Tương tự như vậy, chúng ta có hệ động học vào/ra của một hệ thống được miêu tả như sau : y (k+1) = f(y (k) , y (k-1) , y (k-ny+1) , u (k) , u (k-1) , ,u (k-nu+1) ) (3.3)

Trong đó : y (k ) ,…, y (k-ny+1) là các biến ra ở các thời điểm k u (k ) ,…, u (k-ny+1) là các biến vào ở các thời điểm k

Và như vậy hệ mờ thể hiện cho hệ động học (3.3) sẽ có dạng ở luật thứ i như sau :

Nếu y(k) là A_i1 và y(k-1) là A_i2 y(k-n_y-1) là A_in, cùng với u(k) là B_i1 và u(k-1) là B_i2 u(k-n_u-1) là B_in, thì y(k+1) được xác định bởi phương trình C_i (3.4) Áp dụng cho hệ thống nhiệt, phương trình động học của hệ thống nhiệt được biểu diễn như sau: y(k+1) = a*y(k) + b/(1 + exp(0.5*y(k) - r))*u(k) + (1 - a)*y_0 (3.5), với a = exp(-p*T_s) và b = (q/p)(1 - exp(p*T_s)) Các tham số được xác định như sau: T_s%; r@; y_0%; p = 1.00151*10^(-4); q = 8.6797*10^(-3).

3.3 Thu thập dữ liệu và hệ luật từ phân cụm trừ.

3.3.1 Thu thập dữ liệu vào ra của hệ thống

Dữ liệu cho thành phần phân cụm trừ được thu thập từ đầu vào hệ điều khiển u(k) và đầu ra y(k) Quá trình thu thập dữ liệu này diễn ra theo một quy trình cụ thể.

Với phương trình động học của đối tượng điều khiển như (3.5); tín hiệu u(k) đầu vào cho chạy từ (0 - 5) ta sẽ được đầu ra y(k) trong 100 điểm quan sát (QS)

Bảng 3.1 Dữ liệu thu thập từ đầu vào/ra của hệ thống điều khiển lò nhiệt Điểm

56.0884 56.6922 57.2951 57.8971 58.4982 59.0984 59.6976 60.2960 60.8935 61.4901 62.0857 Bảng dữ liệu được thu thập trên có thể biểu diễn trên đồ thị hình 3.2

Hình 3.2 Đồ thị biểu diễn số liệu thu thập được ở bảng 3.1

3.3.2 Hệ luật mờ cho điều khiển lò nhiệt từ phân cụm trừ

1) Hệcơ sở luật (hệ cơ sở tri thức)

Hệ cơ sở luật, hay còn gọi là hệ cơ sở tri thức, thường được phát triển thông qua sự tham vấn của các chuyên gia điều khiển và công nghệ Tuy nhiên, trong thực tế, việc xây dựng hệ tri thức còn có thể thực hiện qua quá trình xử lý dữ liệu, bao gồm các điểm QS và u(k).

- Chọn các biến vào ra, cấu trúc của luật, các phương pháp mờ hóa và giải mờ

- Xác định các giá trị ngôn ngữ như ‘lớn’, ‘nhỏ’, ‘rất lớn’, ‘rất nhỏ’ để từ đó xác định hàm thuộc

- Tạo dựng hệ luật mờ

2) Hệ luật mờ cho điều khiển lò nhiệt

Hệ luật điều khiển mờ được tự động tạo ra từ chương trình matlab có dạng như sau:

Hình 3.3 Hệ luật mờ hình thành sau khi phân cụm trừ

Từ hình vẽ trên ta thấy:

Luật 1: Nếu đầu vào 1 là cụm 1 và đầu vào 2 là cụm 1 thì đầu ra 1 là ra1 cụm1

Luật 2: Nếu đầu vào 1 là cụm 2 và đầu vào 2 là cụm 2 thì đầu ra 1 là ra1 cụm2 Luật 3: Nếu đầu vào 1 là cụm 3 và đầu vào 2 là cụm 3 thì đầu ra 1 là ra1 cụm3

Luật 6: Nếu đầu vào 1 là cụm 6 và đầu vào 2 là cụm 6 thì đầu ra 1 là ra1 cụm6 Luật 7: Nếu đầu vào 1 là cụm 7 và đầu vào 2 là cụm 7 thì đầu ra 1 là ra1 cụm7

Giả thiết hàm thuộc của đầu vào in1 và in2 có hình dạng chuông, với in1 = 41,2 và in2 = 40,8, đầu ra out1 đạt giá trị 2,73, thể hiện qua đồ thị màu xanh.

Hình 3.4 Hệ luật mờ cho điều khiển nhiệt độ

Trong mục 2.2, thành phần phân cụm trừ sẽ hình thành hệ luật mờ theo dạng Takagi - Sugeno (TS) Mô hình luật TS được biểu diễn dưới dạng cụ thể như sau:

R i : If x is A i then y i =f i (x) i =1, 2, ,k (3.6) Dạng hàm f i (x) thường được chọn là hàm tuyến tính (3.6) có thể viết là:

R i : If x is A i then y i =a T i x + b i i =1, 2, ,k (3.7) Trong đó các thông số ai và bi là chưa biết

Sử dụng quá trình suy diễn mờ với đầu ra là một tập mờ đơn điệu ta có:

R i : If x is A i then y i = b i i =1, 2, ,k (3.8.a) Triển khai (3.8.a) ra ta có thể viết:

R i : If x 1 is A i1 and x 2 is A i2 and then y i = b i (3.8.b)

Từ (3.8.b),quá trình suy diễn mờ của hệ mờ TS có dạng:

Và nếu y i = b i thì mô hình là đơn điệu

Trong đó: w = μ Ai1 (x 1 )^ μ Ai2 (x 2 ) ^μ Aip (x p ), 1 ≤ i ≤ k

Giả sử hệ luật TS có 2 luật mờ như sau :

Hình 3.5 hàm liên thuộc của luật Điều khiển theo TS y 

53 Ánh xạ vào/ ra của hệ mờ khi hàm đầu ra là y =f(x) và y = kx + q

Hình 3.6 Mô hình đơn giản với các hàm thuộc hình thang và tam giác cho ánh xạ vào/ ra Giả sử hàm đầu ra có dạng:

Hình 3.7 Mô hình TS xấp xỉ từng đoạn cho hàm phi tuyến f(x)

(3.11) Các thông số ai, bi có thể xác định được qua : x x μ 1

Hình 3.8 Mặt suy diễn và các hàm thuộc đầu vào của hệ điều khiển

Mô ph ỏ ng h ệ th ống điề u khi ể n lò nhi ệ t s ử d ụ ng h ệ lu ậ t m ờ t ừ phân

3.4.1 Các ch ức năng chương trình

Luận văn đì sử dụng phần mềm lập trình Matlab xây dựng chương trình ứng dụng phân cụm dữ liệu trừ trong việc đo và điều khiển nhiệt độ

Công cụ Matlab được thực hiện qua các bước sau:

- Xây dựng cấu trúc dữ liệu

- Xử lò tập dữ liệu trước khi huấn luyện

D eg re e of m em be rs hi p in1cluster1 in1cluster2 in1cluster3 in1cluster4 in1cluster5 in1cluster6 in1cluster7 Ham thuoc dau vao 1 cho phan cum tru

D eg re e of m em be rs hi p in2cluster1 in2cluster2 in2cluster3 in2cluster4 in2cluster5 in2cluster6 in2cluster7

Ham thuoc dau vao 2 cho phan cum tru

- Khởi tạo mẫu và huấn luyện

- Phân tích kết quả để đưa ra các nhận xét

3.4.2 Chương trình mô phỏ ng h ệ điề u khi ể n lò nhi ệ t Để điều khiển lò nhiệt trên cơ sở tự động xây dựng hệ luật mờ theo (3.4) chúng ta xuất phát từ dữ liệu thu thập được qua bảng 3.1 Từ bảng 3.1 ta sử dụng kỹ thuật phân cụm trừ để tạo ra luật điều khiển Chương trình điều khiển lò nhiệt viết trên phần mềm matLab như sau:

% CHUONG TRINH DIEU KHIEN LO NHIET

% DE TAI DIEU KHIEN LO NHIET

% SU DUNG PHAN CUM DU LIEU TRU

Ts;p=1.00151*10^(-4);q=8.6797*10^(-3);r@;y0%;y(1)=y0; a=exp(-p*Ts);b=(q/p)*(1-exp(-p*Ts));

%Chuong trinh tu day la DATASET /

%//////////////////////////////// for k=1:120 u(k)=rand(1,1)*5; y(k+1)=a*y(k)+b/(1+exp(0.5*y(k)-r))*u(k)+(1-a)*y0; end; trndata=[y(2:101); y(1:100)]'; datout=u(1:100)' figure hold on subplot(2,1,1), plot(trndata); subplot(2,1,2), plot(datout);

%Chuong trinh tu day la SUBSTRACTIVE CLUSTERING /

%//////////////////////////////////////////////// chkdatin=trndata; fismat=genfis2(trndata,datout,0.5); % ham phan cum tru fuzout=evalfis(trndata,fismat); ruleview(fismat)

%showrule(fismat) getfis(fismat,'output',1,'mf',1) getfis(fismat,'output',1,'mf',2) figure subplot(2,1,1); gensurf(fismat);

%hold on plotmf(fismat,'input',1);

%subplot(223); subplot(2,2,3) plotmf(fismat,'input',2);

%plotmf(fismat,'output',1); trnRMSE=norm(fuzout-datout)/sqrt(length(fuzout)); chkfuzout=evalfis(chkdatin,fismat);

%chkRMSE=norm(chkfuzout-chkdatout)/sqrt(length(chkfuzout))

The algorithm processes data through a series of conditional statements, adjusting values based on predefined thresholds For each iteration from 1 to 179, it evaluates a fuzzy inference system using reference values and updates the output accordingly If the output exceeds a specified limit, it is capped at that limit The subsequent value is calculated using a combination of previous values and parameters, ensuring a smooth transition The results are visualized in a series of plots, showcasing the output, reference data, and fuzzy control signals, with additional details presented in subplots for further analysis.

Title('Ham thuoc dau vao 1')

%subplot(223); subplot(2,2,2); plotmf(fismat2,'input',2);

Title('Ham thuoc dau vao 2') hold off

%blackbg; subplot(2,2,3); hold on; grid;

Title('Response-blue,desired-red'); hold off;

%blackbg; subplot(2,2,4); hold on; grid; plot(u(1:180),'b'); plot((ref(1:180)-y(1:180)),' r');

Title('Control-blue - and Error-red - '); hold off;

Quá trình điều khiển nhiệt độ của lò nhiệt được mô phỏng bằng phần mềm MatLab trên hình 3.9

Hình 3.9 Đáp ứng ra (xanh) bám theo tín hiệu yêu cầu (đỏ)

Sampling time step kT0 (giay)

Te m pe ra tu re (d eg re e)

Khi nhiệt độ trong lò thấp hơn 35°C, tín hiệu điều khiển sẽ được kích hoạt để tăng nhiệt độ lên đạt mức 35°C Khi nhiệt độ đạt yêu cầu, tín hiệu điều khiển sẽ được ngắt để duy trì nhiệt độ ổn định tại mức đã đặt.

Khi nhiệt độ trong lò cần đạt 500°C, tín hiệu điều khiển (đường màu xanh) được kích hoạt để tăng nhiệt độ đến mức mong muốn, tiệm cận với nhiệt độ đặt (đường màu đỏ) Sau khi đạt được nhiệt độ này, tín hiệu điều khiển sẽ được ngắt để duy trì nhiệt độ ổn định trong lò.

Khi nhiệt độ trong lò cần đạt 800 °C, tín hiệu điều khiển sẽ được kích hoạt để tăng nhiệt độ đến mức này, gần với nhiệt độ đặt (đường màu đỏ) Sau khi đạt được 800 °C, tín hiệu điều khiển sẽ được ngắt để duy trì nhiệt độ ổn định trong lò.

Ta có hệ luật như sau:

Bảng 3.2 Cơ sở luật – Các luật ngôn ngữ

NL NM NS ZE PS PM PL

PL PL PL PL PL

PM PM PM PM PL

PS PS PS PS PM PL

ZE NL NM NS ZE PS PM PL

Hình 3.10 Đáp ứng ra (xanh) bám theo tín hiệu yêu cầu (đỏ)

Tín hiệu ra tiệm cận với tín hiệu yêu cầu được xây dựng dựa trên 25 luật điều khiển mờ, được thu thập từ các chuyên gia Những luật này được hình thành thông qua quá trình phân cụm trừ, giúp cải thiện độ chính xác và hiệu quả trong việc điều khiển.

Sampling time step kT0 (giay)

Te m pe ra tu re (d eg re e)

Kết quả mô phỏng trong hình 3.11 cho thấy sự tương đồng khi số luật áp dụng tương ứng với các luật của chuyên gia được liệt kê trong bảng 3.2, nơi chứa 25 luật được xây dựng từ việc thu thập tri thức của các chuyên gia [9] Quá trình mô phỏng được minh họa trong hình 3.10, và các kết quả đầu ra trong hình 3.11a và 3.11b là hoàn toàn giống nhau.

K ế t lu ậ n

Phương pháp mới sử dụng hệ luật mờ từ phân cụm với độ chính xác cao đã được phát triển, áp dụng các thuật toán của hệ luật Mandani Phương pháp này đơn giản và dễ thực hiện thông qua phần mềm Matlab Nghiên cứu dựa trên dữ liệu vào ra cho phép so sánh với các phương pháp hiện có của các chuyên gia Kết quả từ nghiên cứu cho thấy tỷ lệ chính xác của phương pháp tiếp cận này tương đương với các phương pháp của chuyên gia trong lĩnh vực.

KẾT LUẬN VÀ KIẾN NGHỊ

Bản luận văn đã đáp ứng đầy đủ các yêu cầu của đề tài, đảm bảo tiêu chí của luận văn thạc sỹ Các kết quả đạt được từ nghiên cứu đã được trình bày một cách rõ ràng và có hệ thống.

1 Đã nghiên cứu tổng quan về phân cụm dữ liệu

2 Xây dựng được hệ luật mờ từ phân cụm trừ dữ liệu

3 Ứng dụng hệ luật mờ cho điều khiển lò nhiệt từ phân cụm trừ dữ liệu

Kết quả của luận văn chỉ dừng lại ở nghiên cứu lý thuyết và mô phỏng trên phần mềm Matlab Để có thể ứng dụng vào thực tiễn, luận văn cần được hoàn thiện về lý thuyết và kiểm nghiệm trên mô hình thực tế, từ đó mới có khả năng áp dụng vào sản xuất.

Tiêu đề	Ứng Dụng Hệ Luật Mờ Cho Điều Khiển Lò Nhiệt Từ Phân Cụm Trừ Dữ Liệu
Tác giả	Lương Thanh Hưởng
Trường học	Đại Học Thái Nguyên
Chuyên ngành	Kỹ Thuật Điều Khiển Và Tự Động Hóa
Thể loại	Luận Văn Thạc Sĩ
Năm xuất bản	2020
Thành phố	Thái Nguyên

Định dạng
Số trang	73
Dung lượng	1,19 MB