Chẩn đoán bệnh ưng thư vú bằng phương pháp ANN

Một phần của tài liệu Học máy và phân loại trong xử lý tín hiệu y sinh và chẩn đoán bệnh (Trang 83 - 88)

5. Phương pháp luận nghiên cứu

3.4 Chẩn đoán bệnh ưng thư vú bằng phương pháp ANN

Chương này sẽ trình bày chi tiết việc ứng dụng mạng nơ ron lan truyền ngược vào việc chuẩn đoán bệnh ung thƣ vú.

 Mô hình toán học của mạng nơ ron nhân tạo

Nơ ron là đơn vị hàm chức năng nền tảng cơ bản của mạng nơ ron nhân tạo. Nó bao gồm các hàm tổng và hàm hoạt hoá cho các tương tác giữa các khớp nối, các triggering cho mục đích kích thích các mối quan hệ giữa các nơ ron.

Mạng trí tuệ nhân tạo là một kiến trúc kiểu graph đƣợc kết nối một cách dầy đặc bao gồm các đơn vụ xử lý không tuyến tính nhƣ là các nút mạng, và một bộ các tham số mạng hay còn gọi là các trọng số.

Mạng nơ ron nhân tạo có khẳ năng phân lớp dựa vào số lớp trong mạng.

Hình 3-13 Mô hình mạng nơ ron nhân tạo ANN đơn giản 3.4.2 Thuật toán lan truyền ngƣợc (Back Propagation)

Trong một mạng truyền thẳng, các tham số đầu vào đƣợc truyền thẳng vào mạng, mạng sẽ xử lý những tham số này cùng với các trọng số và một đầu ra có liên quan với các tham số đó được tạo ra và không có đường phản hồi.

Trong khi đó việc triển khai thuật toán lan truyền ngƣợc đầu ra đƣợc tạo ra là đáp ứng thực tế của mạng sẽ được so sánh với đáp ứng được xác định tương ứng với miền lớp tham số đầu vào đã biết (target). Hiệu giữa đáp ứng thực tế và đáp ứng đã biết (target) chính là sai số. Sai số đƣợc lan truyền ngƣợc tới mạng và các trọng số của mạng đƣợc điều chỉnh theo luật điều chỉnh sai số được [22 ]. Có nhiều phương pháp khác nhau để hiệu chỉnh các trọng số.

Véc tơ trọng số chính là sự kiến thức của mạng trong quá trình học. Vector trọng số là một không gian nhiều chiều. Véc tơ trọng số có thể thường được thay đổi trong một dải mà vẫn đảm bảo được đúng giá trị. Giới hạn của dải này được gọi là đường biên của kiến thức.

Một thể hiện đƣợc sử dụng để huấn luyện một mạng nơ ron bao gồm một mẫu đầu vào và một nhãn lớp. Sai số đƣợc tính toán trực tiếp liên quan tới việc điều chỉnh trọng số ở lớp cuối cùng, trong khi đó lớp đứng trước các lớp ẩn điều chỉnh các tham số trọng số của

nó dưới dạng ảnh hưởng tổng của các trọng số và điều chỉnh các nút của lớp tiếp theo để giảm sự ảnh hưởng tiêu cực của việc điều chỉnh trọng số từ lớp ra tới lớp ẩn.

Quá trình đó đƣợc gọi là quá trình học, mục đích của quá trình học là đƣa vec tơ kiến thức tới đường biên phù hợp. Một đường biên để giới hạn việc hiệu chỉnh các trọng số đƣợc áp đặt.

Vì vậy các kiến thức mạng trước đó được khoanh vùng dự trữ lại và vùng còn lại đƣợc sử dụng cho việc định nghĩa lại các kiến thức.

Một tham số độc lập quan trọng khác của mạng nơ ron là tốc độ học, nó điều khiển tốc độ của quá trình học.

Mỗi khi mạng nơ ron kết thúc quá trình học, nó có thể xử lý các mẫu đầu vào mới để phân lớp đầu ra.

3.4.3 Phương pháp thực hiện

Cấu hình mạng ANN đề xuất có dạng

Hình 3-14 Mạng ANN đề xuất

Mạng ANN sẽ đƣợc huấn luyện bằng cách:

Tập dữ liệu đƣợc sử dụng trong nghiên cứu lấy từ WBC, nó có 318 thể hiện (bản ghi), mỗi thể hiện có 9 thuộc tính. Cơ sở dữ liệu đƣợc chia thành 2 tập con một cách ngẫu nhiên, một tập dùng cho huấn luyện mạng 80%, một tập để kiểm tra mạng 20%.

Một tập các thuộc tính của thể hiện nó được trích chọn từ cơ sở dữ liệu có từ trước

 Từng bộ thử nên sử dụng một tập các thể hiện đƣợc lựa chọn một cách ngẫu nhiên khác nhau để cho mục đích kiểm tra.

 Mạng nơ ron sử dụng tập dữ liệu từ WBC

 Số lần lặp dùng để mô phỏng được định nghĩa bởi người dùng trong quá trình chạy ứng dụng.

Việc xây dựng kiến trúc và tối ƣu một mô hình mạng nơ ron tuân thủ các tiêu chuẩn sau:

 Dự trữ một số các thể hiện để kiểm tra

 Mỗi lần thử nên sử dụng một tập các thể hiện đƣợc lựa chọn một cách ngẫu nhiên khác nhau cho mục đích kiểm tra.

 Mạng nên đƣợc tối ƣu để có đƣợc kết quả đầu ra tốt nhất.

 Phân tích các kết quả để đánh giá sự thành công và thất bại trong quá trình triển khai.

 Kết thúc nếu mạng thành công trong việc dự đoán lành tính và ác tính.

 Nhận ra các vùng để cải thiện.

3.4.4 Triển khai thuật toán

Một mô hình tiên đoán mạng nơ ron đƣợc tạo ra bao gồm các thành phần thuật toán sau:

1. Lớp đầu vào logic: Nó nhận đầu vào và kích thích việc kích hoạt các nơ ron.

2. Hàm tansig: là hàm truyền trong lớp ẩn 3. Hàm purelin: là hàm truyền cho lớp ra

4. Hàm huấn luyện: là hàm trainlm đƣợc áp dụng để tăng tốc độ chuẩn đoán và đảm bảo sự hội tụ giúp cho để tối ƣu hoá quá trình huấn luyện mạng.

5. Hàm hardlim đầu ra thực của mạng

Tuỳ theo việc mong muốn để thành công hơn trong việc tiên đoán ác tính, độ chính xác được nâng lên để nhận ra các trường hợp danh giới như bệnh ác tính.

 Phân tích phẩm chất mạng nơ ron

Mạng nơ ron bị giới hạn theo các rằng buộc khác nhau nhƣ số các lớp ẩn, số các nút mạng trong lớp ẩn, tốc độ học, những rằng buộc này phải giải quyết đồng thời để thu nhận được để có được một mô hình cấu trúc mạng hiệu quả với sai số bình phương trung bình (RMS) nhỏ.

Việc huấn luyện đƣợc thực hiện để thu nhận đƣợc sai số RMS nhỏ với số lần lặp bị giới hạn chặn trên để tránh rơi vào vòng lặp vô tận.

Một lưu ý là vấn đề (over fitting) yêu cầu độ trùng khớp quá chặt. Việc tăng số lượng các lớp sẽ làm tăng over fitting.

Thực nghiệm đã chỉ ra rằng nhiều mạng phức tạp yêu cầu nhiều việc huấn luyện để có phẩm chất tốt hơn, nhƣng nếu huấn luyện nhiều thì mạng bắt đầu nhớ và mạng có phẩm chất tốt nhƣng làm hạ mức dữ liệu thẩm định của các nút mạng trong lớp ẩn.

Sau quá trình thử nghiệm một mô hình mạng bao gồm một lớp ẩn có 25 nút mạng đƣợc lựa chọn với tốc độ học 0.05. Tốc độ học là một tham số rất quan trọng, nó ảnh hưởng cao hơn so với cấu hình mạng. Tốc độ học thấp hơn sẽ tránh được hiệu ứng over fitting nhƣng tốc độ học cao hơn thì tốc độ hội tụ sẽ nhanh hơn.

Việc huấn luyện mạng đạt đƣợc kết quả tốt nhất sau 6 lần lặp với sai số là 3.13%.

3.4.5 Đánh giá kết quả

Kết quả của việc huấn luyện mạng Nơ ron nhân tạo sẽ tạo ra các tham số của mạng, từ cầu trúc mạng và các tham số của mạng ta thực hiện việc đƣa tập dữ liệu kiểm tra vào để đánh giá độ chính xác bằng phương pháp sai số bình phương trung bình (root mean square-mse) và kết quả là mse = 0.0313, độ chính xác chẩn đoán của mạng là 96,87%.

3.4.6 Kết luận

Kiến thức của mạng nơ ron đƣợc xác định bằng việc các nơ ro đƣợc kết nối nhƣ thế nào và các trọng số của nó bằng bao nhiêu. Luật lan truyền ngƣợc chỉ ra làm thế nào để điều chỉnh trọng số của mạng chứ không làm thay đổi cấu trúc của mạng

Giả sử có hai tập A và B, việc huấn luyện trên tập thể hiện A sau đó huấn luyện lại trên tập thể hiện B, khi đó kiến thức về tập A có thể bị mất. Để học một thể hiện mới trong khi vẫn giữ các kiến thức đã có, mạng lan truyền ngƣợc phải đƣợc huấn luyện trên tập thể hiện mới và đồng thời vẫn giữ các kiến thức đã có với tập thể hiện cũ.

Một phần của tài liệu Học máy và phân loại trong xử lý tín hiệu y sinh và chẩn đoán bệnh (Trang 83 - 88)

Tải bản đầy đủ (PDF)

(94 trang)