5. Phương pháp luận nghiên cứu
3.5 Đánh giá chung các phương pháp
Phương pháp IG-ANFIS cho độ chính xác là 94.44%, phương pháp cây phân lớp cho độ chính xác là 91.69%, phương pháp mạng nơ ron nhân tạo ANN cho độ chính xác 96.87%, phương pháp Nạve Bayes cho kết quả chính xác 96.86%, tuy nhiên phương pháp này chỉ hiệu quả khi số đầu vào là ít.
4 KẾT LUẬN VÀ BÀN LUẬN
Học máy nói chung và phân lớp nói riêng là một lĩnh vực nghiên cứu rất tiềm năng cho các ứng dụng trong chẩn đoán bệnh nối chung, tuy nhiên không có một phương pháp phân lớp nào là tốt nhất nó phù hợp với tất cả các tập dữ liệu hay các bệnh, mà phải tuỳ theo ứng dụng cụ thể nên chọn ra phương pháp phù hợp nhất.
Mạng ANN và Nạve Bayes cho kết quả tốt hơn, nhƣng mạng Nạve Bayes chỉ phù hợp khi số các đầu vào là ít, nên việc lựa chọn mạng Nạve Bayes nên kết hợp với việc giảm số đầu vào ( giảm số chức năng ) bằng các thuật toán ví dụ nhƣ PCA.
ANN hiện đang đƣợc sử dụng trong nghiên cứu y sinh nhƣ bệnh tim (cardiology), thần kinh (neurology), ung thƣ (oncology), rối loạn về dạ dầy, ruột (gastroenterology).
Ƣu điểm của ANN chính là chúng thực hiện từ các mẫu huấn luyện mà không cần đến các luật do các chuyên gia tìm ra nhƣ ANFIS, vì thế ANN đƣợc tự động hóa hoàn toàn quá trình đưa ra quyết định mà không bị ảnh hưởng bởi các yếu tố do con người gây ra như cảm súc, sự thiếu tập trung hay thiếu kinh nghiệm. ANN chỉ ra độ tin cậy tốt khi việc huấn luyện đƣợc hoàn thành.
Phương pháp ANFIS cũng cho kết quả hứa hẹn tuy nhiên khi số đầu vào lớn thì việc tính toán sẽ tăng lên làm cho việc chẩn đoán mất rất nhiều thời gian chờ đợi, để giải quyết vấn đề này có thể sử dụng các siêu máy tính khi đó chi phí sẽ tăng thêm, hơn nữa do yếu tố công nghệ nên tốc độ xử lý của máy tính cũng chỉ ở một mức độ giới hạn. Theo kinh nghiệm nên kết hợp một số các phương pháp phân lớp lại với nhau để có thể nâng cao độ chính xác.
Cuối cùng mục đích chính của sự nghiên cứu này là tham gia vào nỗ lực nâng cao chất lƣợng của dịch vụ y tế.
Công nghệ đƣợc nghiên cứu là một trong các giải pháp để giải quyết cho vấn đề thiếu hụt trầm trọng các nguồn lực chăm sóc sức khỏe ( bác sĩ, nhà nghiên cứu y tế..).
Bản luận văn này đã trình bày những thách thức mà rất nhiều nước trên thế giới đang
đang sử dụng các công nghệ để giải quyết nhu cầu đang ngày một lớn lên trong các dịch vụ chăm sóc sức khoẻ.
Tuy nhiên quá trình sử dụng công nghệ trong các dịch vụ chăm sóc sức khoẻ là một quá trình tổng hợp gồm nhiều giai đoạn và nhiều bước.
Chúng ta cần phải có sự nghiên cứu tới tất cả các khía cạnh liên quan để có thể triển khai đƣợc công nghệ mới.
Cần có thêm những sự nghiên cứu về sự phối hợp các phương pháp của học máy và trí tuệ nhân tạo trong việc xử lý dữ liệu để tìm ra đƣợc giải pháp tốt hơn.
Công việc hiện tại của bản luận văn này chỉ tập trung vào việc xây dựng mạng phân lớp, tuy nhiên các công việc tương lai có thể tập trung vào việc nâng cao độ chính xác và tăng tốc độ xử lý và giảm chi phí tính toán, và nghiên cứu với một số bệnh khác nhƣ bệnh thận, ung thƣ tuỵ.
5 TÀI LIỆU THAM KHẢO
1 ANFIS Matlab
2Arzucan, O., Supervised and Unsupervised Machine Learning Technique for
Text Document Categorization, in Graduate Program in Computer Engineering. 2004, Bogazici University.
3.Ashraf, M., et al., A New Approach for Constructing Missing Features
Values. International Journal of Intelligent Information Processing, 2012. 3(1): p. 110 4. Hian, K. and T. Gerald, Data Mining Applications in Healthcare. Journal of
Healthcare Information Management, 2005. 19(2): p. 64-72.
5.Howell, D. Treatment of Missing Data. 2009.
6.General Information About Male Breast Cancer. 2012 [sighted 2012 30/12/2012];
7.Gershenson, C., Artificial neural networks for beginners. arXiv preprint cs, 2003.
8.Giarratano, J. and G. Riley, Expert Systems Principles and Programming. 2 ed. Vol. 1.
1994, Boston: PWS Publishing Company
9. Giarratano, J. and G. Riley, Expert Systems Principles and Programming. 2 ed. Vol. 1. 1994, Boston: PWS Publishing Company
10. Grossberg, S., Adaptive Resonance Theory, in Encyclopedia of Cognitive Science. 2006, John Wiley & Sons, Ltd.
11.Grzymala-Busse, J.W. and W.J. Grzymala-Busse, Handling Missing Attribute Values Data Mining and Knowledge Discovery Handbook, O. Maimon and 12. Gunter, D.T. and P.N. Terry, The Emergence of National Electronic Health
Record Architectures in the United States and Australia: Models, Costs, and Questions. J Med Internet Res, 2005. 7(1).
13.Jang, R. and J. Shing, ANFIS: Adaptive-Network-based Fuzzy Inference 14.Jang, R. and J. Shing, ANFIS: Adaptive-Network-based Fuzzy Inference
15.Javed, K., et al., Classification and diagnostic prediction of cancers using gene expression profiling and artificial neural networks. Nature Medicine, 2001. 7: p. 673 - 16. Kotsiantis, S., Supervised Machine Learning: a Review of Classification
17. Kohavi, R., D. Sommerfield, and J. Dougherty, Data Mining using MLC++ -- 18. Kohavi, R. and G.H. John, Wrappers for feature subset selection. Artif. Intell., 1997. 97(1-2): p. 273-324.
19.Kononenko, I., Estimating attributes: Analysis and extensions of RELIEF, in Machine Learning ECML-94. 1994.
20. Kononenko, I., I. Bratko, and E. Roskar. Experiments in automatic learning of medical diagnostic rules. in International School for the Synthesis of
Expert’s Knowledge Workshop, Bled, Slovenia. 1984.
21.NEHTA Blueprint. 2010 [sighted 2010 01/10/2010]; Available from:
http://www.nehta.gov.au.
22. Neural_Network_Design_M.Hagan
23.Mammography Screening Can Reduce Deaths from Breast Cancer. 2002 [sighted 2011 20/05/ 2011]; Available from: http://www.iarc.fr/en/media centre/pr/2002/pr139.html.
24. Marlin, B., Missing Data Problems in Machine Learning, in Department of Computer Science. 2008, University of Toronto: Canada
25.Mitchell, T.M., Machine Learning. 2005: McGraw Hill.
26. Lal, T., et al., Embedded Methods, in Feature Extraction, I. Guyon, et al., (Editors). 2006, Springer Berlin Heidelberg. p. 137-165.
27. Larose, D., Discovering Knowledge in Data: An Introduction to Data Mining.
2005, New Jersey: John Wiley & Sons, Inc.
28. Langley, P. and S. Sage, Induction of Selective Bayesian Classifiers. ;In UAI(1994). Proceedings of the Tenth Annual Conference on Uncertainty in Artificial Intelligence, 1994: p. 399-406.
29. Quinlan, J.R., Induction of decision trees. Machine Learning, 1986. 1(1): p. 81-106.
30.Rokach, L., Data mining with decision trees: theory and applications. Vol. 69. 2007:
World scientific.
31.Rokach, L. and O. Maimon, eds. Data Mining and Knowledge Discovery Handbook.
Second ed. 2010, Springer Science and Business
32.Rokach, L. and O. Maimon, eds. Data Mining With Decision Trees. 2008, World Scientific Publishing.
33. Rubin, D.B., Inference and missing data. Biometrika, 1976. 63(3): p. 581-592.
34.Saeys, Y., I. Inza, and P. Larraủaga, A review of feature selection techniques in bioinformatics. Bioinformatics, 2007. 23(19): p. 2507-2517
35. Santhakumaran, F.P., An Algorithm to Reconstruct the Missing Values for Diagnosing the Breast Cancer. Global Journal of Computer Science and
Technology, 2010. 10(2): p. 25-28
36.Setiono, R., Generating Concise and Accurate Classification Rules for Breast Cancer Diagnosis. Artificial Intelligence in Medicine, 2000. 18(3): p. 205-219.
37.Tan, P.-N., M. Steinbach, and V. Kumar, Introduction to Data Mining. 2006:
Addison-Wesley
38.Tarca, A.L., et al., Machine Learning and Its Applications to Biology. PLoS Comput Biol, 2007. 3(6).
39.Thrun, S.B., et al., The Monk's Problems-A Performance Comparison of Different Learning Algorithms. 1991, Carnegie Mellon University:
Pittsburgh, PA
40.Thirumuruganathan, S. A Detailed Introduction to k-Nearest Neighbor (k-NN) Algorithm. 2010.
41.UCI Machine Learning Repository [sighted 2010; Available from:
http://archive.ics.uci.edu/ml/about.html
42.Vijayasankari, S. and K. Ramar, Enhancing Classifier Performance Via