1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

60 11 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Học Máy Để Phân Loại Ung Thư Vú
Tác giả Vũ Huy Hoàng
Người hướng dẫn PGS TS. Lê Đức Hậu
Trường học Trường Đại Học Thủy Lợi
Chuyên ngành Công Nghệ Thông Tin
Thể loại Đồ Án Tốt Nghiệp
Năm xuất bản 2022
Thành phố Hà Nội
Định dạng
Số trang 60
Dung lượng 1,2 MB

Cấu trúc

  • CHƯƠNG 1 GIỚI THIỆU (15)
    • 1.1 Đặt vấn đề (15)
    • 1.2 Nội dung (16)
  • CHƯƠNG 2 CƠ SỞ LÝ THUYẾT (16)
    • 2.1 Học máy (18)
      • 2.1.1 Giới thiệu (18)
      • 2.1.2 Vai trò của học máy (18)
      • 2.1.3 Phân loại và ứng dụng học máy (19)
      • 2.1.4 Ứng dụng của học máy (21)
      • 2.1.5 Thuật tốn Nạve Bayes (23)
      • 2.1.6 Thuật toán SVM (Support Vector Machine) (26)
      • 2.1.7 Chuẩn hóa dữ liệu (30)
      • 2.1.8 Phương pháp đánh giá (33)
    • 2.2 Python với học máy (39)
      • 2.2.1 Giới thiệu về ngôn ngữ lập trình Python (39)
      • 2.2.2 Python với học máy (40)
  • CHƯƠNG 3 PHÂN TÍCH VÀ GIẢI QUYẾT BÀI TOÁN (17)
    • 3.1 Bối cảnh bài toán (42)
    • 3.2 Thu thập và xử lý dữ liệu (43)
      • 3.2.1 Tổng quan về dữ liệu (43)
      • 3.2.1 Tiền xử lý dữ liệu (0)
      • 3.2.2 Chia dữ liệu (48)
      • 3.2.3 Huấn luyện (0)
  • CHƯƠNG 4 Kết quả thực nghiệm (17)
  • KẾT LUẬN (58)
  • TÀI LIỆU THAM KHẢO (60)

Nội dung

GIỚI THIỆU

Đặt vấn đề

Trong những năm gần đây, ung thư, đặc biệt là ung thư vú, đã trở thành một gánh nặng lớn cho nhiều quốc gia, bao gồm cả Việt Nam Ung thư vú là loại ung thư phổ biến nhất ở phụ nữ Việt Nam, chiếm khoảng 1/3 số ca ung thư mới được chẩn đoán Tỷ lệ mắc ung thư vú đang có xu hướng gia tăng, nhưng tỷ lệ tử vong đang giảm nhờ vào những tiến bộ trong chẩn đoán và điều trị, đặc biệt là trong việc phát hiện bệnh sớm Việc phát hiện sớm giúp bác sĩ có phương pháp điều trị hiệu quả, từ đó giảm thiểu nguy cơ tử vong cho bệnh nhân Ung thư vú hiện là bệnh ung thư đứng thứ hai trong số các loại ung thư được chẩn đoán nhiều nhất.

Ung thư vú là loại ung thư phổ biến nhất ở phụ nữ và đứng thứ hai trong số các nguyên nhân gây tử vong do ung thư Tuy nhiên, ung thư vú hiếm khi xảy ra ở nam giới.

Ung thư vú bắt nguồn từ sự phát triển của các khối u ác tính trong các tế bào vú, chủ yếu ảnh hưởng đến phụ nữ từ 40 tuổi trở lên Bệnh xảy ra khi các tế bào trong các tuyến sản xuất sữa (thùy) phân chia bất thường Để nâng cao độ chính xác trong chẩn đoán ung thư vú, cần có hệ thống phát hiện hỗ trợ máy tính (CAD) sử dụng phương pháp học máy, giúp phát hiện bệnh ở giai đoạn đầu Phát hiện sớm ung thư vú có thể cải thiện tỷ lệ sống sót nhờ vào khả năng điều trị hiệu quả hơn.

Xuất phát từ những vấn đề thực tiễn về ung thư vú, cần có những giải pháp cụ thể để giải quyết Với kiến thức hiện có, tôi đã tìm hiểu và nghiên cứu các phương pháp nhằm tìm ra giải pháp hiệu quả Do đó, tôi chọn đề tài “Ứng dụng của học máy để phân loại ung thư vú” cho ĐATN của mình.

Nội dung

Các nội dung chính được trình bày trong báo cáo này:

 Tìm hiểu các kiến thức liên quan về học máy, các công cụ xử lý dữ liệu và xây dựng ứng dụng.

 Nghiên cứu các thuật tốn: Thuật tốn Nạve Bayes, Thuật tốn SVM (Support Vector Machine)

 Đánh giá và xác định thuật toán tốt nhất.

Cấu trúc của báo cáo:

CƠ SỞ LÝ THUYẾT

Học máy

Trong bối cảnh cuộc cách mạng công nghiệp lần thứ 4, trí tuệ nhân tạo (AI) đã trở thành xu hướng công nghệ chủ chốt mà các doanh nghiệp toàn cầu đang đẩy mạnh đầu tư và phát triển Bài viết này sẽ tập trung vào lĩnh vực học máy, một nhánh quan trọng của AI, cùng với việc nghiên cứu và ứng dụng một số thuật toán trong đề tài nghiên cứu này.

Học máy, một nhánh của trí tuệ nhân tạo, tập trung vào việc phát triển các kỹ thuật cho phép hệ thống tự động học từ dữ liệu nhằm giải quyết các vấn đề cụ thể Quá trình này bao gồm phân tích dữ liệu và áp dụng các thuật toán, giúp máy móc rút ra quy tắc từ lượng lớn thông tin Qua đó, máy sẽ cải thiện hiệu suất và phát triển khả năng tự động phán đoán hoặc dự đoán.

2.1.2 Vai trò của học máy

Machine learning đóng vai trò quan trọng trong việc giúp doanh nghiệp hiểu rõ hơn về xu hướng hành vi của khách hàng và các mô hình kinh doanh, đồng thời thúc đẩy phát triển sản phẩm mới Các công ty hàng đầu như Facebook, Google và Uber đã tích hợp học máy vào hoạt động cốt lõi của mình Điều này đã biến machine learning thành một yếu tố cạnh tranh nổi bật cho nhiều doanh nghiệp.

Hình 2.1 Các phương pháp học máy phổ biến hiện nay 2.1.3 Phân loại và ứng dụng học máy

Máy học cổ điển được phân loại dựa trên cách mà thuật toán cải thiện độ chính xác trong dự đoán, với bốn phương pháp chính: học có giám sát, học không giám sát, học bán giám sát và học tăng cường Lựa chọn loại dữ liệu thuật toán của các nhà khoa học phụ thuộc vào mục tiêu dự đoán cụ thể của họ.

 Học có giám sát (supervised learning)

Trong học có giám sát, máy tính học cách mô hình hóa các mối quan hệ dựa trên dữ liệu được gán nhãn Sau khi tìm hiểu cách mô hình hóa hiệu quả, các thuật toán được huấn luyện sẽ áp dụng cho các bộ dữ liệu mới Các thuật toán học tập có giám sát thường được sử dụng cho nhiều tác vụ khác nhau.

+) Phân loại nhị phân: Chia dữ liệu thành hai loại

+) Phân loại nhiều lớp: Lựa chọn giữa nhiều hơn hai loại câu trả lời.

+) Mô hình hồi quy: Dự đoán các giá trị liên tục xi

+) Kết hợp: Kết hợp các dự đoán của nhiều mô hình học máy để tạo ra dự đoán chính xác.

 Học không giám sát (unsupervised learning).

Trong học không giám sát, máy tính nhận dữ liệu không có nhãn và sử dụng các thuật toán để phân tích và mô tả cấu trúc của dữ liệu Các thuật toán học tập không giám sát hiệu quả cho nhiều nhiệm vụ khác nhau.

+) Phân cụm: Tách tập dữ liệu thành các nhóm dựa trên sự giống nhau.

+) Phát hiện bất thường: Xác định các điểm dữ liệu bất thường trong tập dữ liệu

+) Khai thác liên kết: Xác định các tập hợp các mục trong tập dữ liệu thường xuyên xảy ra cùng nhau.

+) Giảm kích thước: Giảm số lượng biến trong tập dữ liệu

 Học bán giám sát (Semi-supervised learning)

Cách tiếp cận học máy này kết hợp giữa học có giám sát và không giám sát, cho phép các nhà khoa học dữ liệu cung cấp thuật toán với dữ liệu đào tạo gắn nhãn, trong khi mô hình có khả năng tự khám phá và phát triển hiểu biết riêng về tập dữ liệu Phương pháp học bán giám sát được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau.

+) Dịch máy: Dạy thuật toán dịch ngôn ngữ dựa trên ít hơn một từ điển từ đầy đủ.

+) Phát hiện gian lận: Xác định các trường hợp gian lận khi bạn chỉ có một vài ví dụ tích cực.

Dán nhãn dữ liệu là một quy trình quan trọng, cho phép các thuật toán được đào tạo trên tập dữ liệu nhỏ tự động áp dụng nhãn dữ liệu cho các tập lớn hơn Điều này giúp tăng cường hiệu quả và độ chính xác trong việc xử lý dữ liệu lớn.

 Học tăng cường (Reinforcement learning)

Học tăng cường là một phương pháp phổ biến mà các nhà khoa học dữ liệu sử dụng để dạy máy hoàn thành các quy trình phức tạp với các quy tắc rõ ràng Họ lập trình thuật toán cho một nhiệm vụ cụ thể và cung cấp tín hiệu tích cực hoặc tiêu cực dựa trên hiệu suất của thuật toán Quan trọng là, thuật toán tự quyết định các bước cần thực hiện trong quá trình thực hiện nhiệm vụ Học tập củng cố thường được áp dụng trong nhiều lĩnh vực khác nhau.

+) Robot: Robot có thể học cách thực hiện các nhiệm vụ trong thế giới vật chất bằng cách sử dụng kỹ thuật này.

+) Trò chơi video: Học tập củng cố đã được sử dụng để dạy bot chơi một số trò chơi điện tử.

Quản lý nguồn lực là yếu tố quan trọng trong việc tối ưu hóa hiệu quả hoạt động của doanh nghiệp Với nguồn lực có hạn và mục tiêu rõ ràng, việc học củng cố sẽ hỗ trợ doanh nghiệp trong việc lập kế hoạch phân bổ nguồn lực một cách hợp lý, từ đó nâng cao khả năng đạt được các mục tiêu đề ra.

2.1.4 Ứng dụng của học máy

Học máy có nhiều ứng dụng thực tế, trong đó hai lĩnh vực chính là khai phá dữ liệu và nhận dạng mẫu.

Khai phá dữ liệu là quá trình áp dụng kỹ thuật học máy vào các cơ sở dữ liệu lớn nhằm phát hiện quy luật và tri thức tiềm ẩn trong dữ liệu, cũng như dự đoán thông tin quan trọng trong tương lai.

Nhận dạng mẫu là việc áp dụng kỹ thuật học máy để phát hiện các quy luật trong dữ liệu, chủ yếu là hình ảnh và âm thanh Một ví dụ điển hình của bài toán này là xác định danh tính của một người trong ảnh chụp khuôn mặt.

Khai phá dữ liệu và nhận dạng mẫu có nhiều điểm tương đồng, nhưng khác nhau chủ yếu ở lĩnh vực ứng dụng và kỹ thuật sử dụng Khai phá dữ liệu thường liên quan đến dữ liệu thương mại, trong khi nhận dạng mẫu chủ yếu áp dụng cho dữ liệu âm thanh và hình ảnh, đặc biệt trong các kỹ thuật công nghệ.

Sau đây là một số ví dụ ứng dụng cụ thể của học máy: xiii

+) Nhận dạng ký tự: phân loại hình chụp ký tự thành các loại, mỗi loại ứng với một ký tự tương ứng

Phát hiện và nhận dạng khuôn mặt người là quá trình xác định vùng chứa khuôn mặt trong ảnh và nhận diện chính xác danh tính của người đó từ những hình ảnh đã lưu trữ trước đó Điều này cho phép phân loại ảnh thành các nhóm tương ứng với từng cá nhân khác nhau.

+) Lọc thư rác, phân loại văn bản: dựa trên nội dung thư điện tử, chia thư thành loại

“thư rác” hay “thư bình thường”; hoặc phân chia tin tức thành các thể loại khác nhau như “xã hội”, “kinh tế”, “thể thao” …

PHÂN TÍCH VÀ GIẢI QUYẾT BÀI TOÁN

Bối cảnh bài toán

Theo Tổ chức Y tế Thế giới (WHO), vào năm 2008, toàn cầu ghi nhận 12,6 triệu ca mắc ung thư, dẫn đến 7,5 triệu ca tử vong Đến năm 2015, con số người mắc ung thư tăng lên khoảng 90,5 triệu, với 14,1 triệu ca mới mỗi năm và 8,8 triệu ca tử vong, chiếm 15,7% Tại Mỹ và các nước phát triển, tỷ lệ tử vong do ung thư chiếm khoảng 25%, với khoảng 0,5% dân số được chẩn đoán ung thư hàng năm.

Hiện nay, toàn cầu có 23 triệu người đang mắc ung thư Mỗi năm có hơn 14 triệu người mắc mới và 8,2 triệu người tử vong.

Ung thư phổi là loại ung thư phổ biến nhất, chiếm tỉ lệ 12,4% trong tổng số các loại ung thư Sau ung thư phổi, các loại ung thư khác bao gồm ung thư dạ dày, vú, đại trực tràng, gan, tiền liệt tuyến và cổ tử cung Đặc biệt, tỷ lệ mắc ung thư phổi ở nam giới cao nhất tại Đông Âu với 53,5 ca trên 100.000 dân và Đông Nam Á với 50,5 ca trên 100.000 dân.

Nữ giới, tỉ lệ mắc cao nhất ở Bắc Mỹ (33,8/100.000) và bắc Âu (23,7/100.000)

Việt nam cũng là một trong số nước có tỷ lệ mắc ung thư cao trên thế giới (thuộc nhóm 2)

Tìm hiểu về tình hình ung thư tại Việt Nam, bao gồm thực trạng chẩn đoán và điều trị, cũng như các nguyên nhân gây bệnh, là cần thiết để phát triển các giải pháp hiệu quả nhằm hạn chế sự gia tăng của ung thư trong cộng đồng.

Ung thư vú là loại ung thư phổ biến nhất và đứng thứ hai trong nguyên nhân gây tử vong do ung thư ở phụ nữ, trong khi rất hiếm gặp ở nam giới Để hiểu rõ về bệnh ung thư vú, cần nắm vững cấu trúc giải phẫu của vú, chủ yếu bao gồm mô mỡ, dây chằng, mô liên kết, mạch bạch huyết và các hạch, mạch máu Vú nữ có từ 12 đến 20 thùy, mỗi thùy tạo thành các tiểu thùy nhỏ có chức năng sản xuất sữa, được kết nối bằng các ống dẫn để mang sữa tới núm vú.

Ung thư vú phổ biến nhất là ung thư ống dẫn, hay còn gọi là ung thư biểu mô ống động mạch, chiếm hơn 80% tổng số ca bệnh Trong khi đó, ung thư biểu mô tiểu thùy chỉ chiếm hơn 10% Phần còn lại của các trường hợp ung thư vú có đặc điểm của cả hai loại ung thư trên hoặc có nguồn gốc không rõ ràng.

Việc ứng dụng các thuật toán học máy trong chẩn đoán ung thư, đặc biệt là ung thư vú, ngày càng trở nên cần thiết Chẩn đoán chính xác tình trạng khối u là ác tính hay lành tính đóng vai trò quan trọng trong việc điều trị sớm bệnh ung thư vú Xuất phát từ thực tế này, tôi đã bắt đầu nghiên cứu và tìm kiếm giải pháp cho các vấn đề liên quan đến bài toán chẩn đoán.

Kết quả thực nghiệm

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT

Trong những năm gần đây, trí tuệ nhân tạo (AI) đã trở thành biểu tượng của cuộc cách mạng công nghiệp 4.0 Sự phát triển nhanh chóng của công nghệ đã khiến AI trở thành xu hướng đầu tư và phát triển hàng đầu của các doanh nghiệp toàn cầu Bài viết này sẽ tập trung vào học máy, một lĩnh vực quan trọng của AI, cùng với một số thuật toán sẽ được nghiên cứu và ứng dụng trong đề tài nghiên cứu này.

Học máy, một nhánh của trí tuệ nhân tạo, tập trung vào việc phát triển các kỹ thuật giúp hệ thống tự động "học" từ dữ liệu để giải quyết các vấn đề cụ thể Quá trình này bao gồm phân tích dữ liệu và sử dụng các thuật toán để máy móc có thể tự động học từ lượng lớn thông tin Qua việc phân tích và tìm ra quy tắc từ dữ liệu, máy sẽ cải thiện hiệu suất và phát triển khả năng tự động phán đoán hoặc dự đoán.

2.1.2 Vai trò của học máy

Machine learning đóng vai trò quan trọng trong việc cung cấp cái nhìn sâu sắc về xu hướng hành vi khách hàng và mô hình hoạt động kinh doanh, đồng thời hỗ trợ phát triển sản phẩm mới Các công ty hàng đầu như Facebook, Google và Uber đã tích hợp học máy vào hoạt động của họ, biến nó thành một yếu tố cạnh tranh nổi bật Việc áp dụng machine learning đã giúp nhiều doanh nghiệp tạo ra lợi thế cạnh tranh đáng kể trên thị trường.

Hình 2.1 Các phương pháp học máy phổ biến hiện nay 2.1.3 Phân loại và ứng dụng học máy

Máy học cổ điển được phân loại dựa trên cách thức mà thuật toán cải thiện độ chính xác trong dự đoán Có bốn phương pháp chính: học có giám sát, học không giám sát, học bán giám sát và học tăng cường Lựa chọn loại dữ liệu cho thuật toán phụ thuộc vào mục tiêu dự đoán của các nhà khoa học.

 Học có giám sát (supervised learning)

Học có giám sát là phương pháp mà máy tính học cách mô hình hóa các mối quan hệ từ dữ liệu được gán nhãn Sau khi xác định được phương pháp mô hình hóa hiệu quả, các thuật toán được huấn luyện sẽ áp dụng cho các bộ dữ liệu mới Các thuật toán học tập có giám sát thường được sử dụng cho nhiều tác vụ khác nhau.

+) Phân loại nhị phân: Chia dữ liệu thành hai loại

+) Phân loại nhiều lớp: Lựa chọn giữa nhiều hơn hai loại câu trả lời.

+) Mô hình hồi quy: Dự đoán các giá trị liên tục xi

+) Kết hợp: Kết hợp các dự đoán của nhiều mô hình học máy để tạo ra dự đoán chính xác.

 Học không giám sát (unsupervised learning).

Trong học không giám sát, máy tính sử dụng dữ liệu không có nhãn để tự tìm hiểu và phân tích cấu trúc của dữ liệu Các thuật toán học tập không giám sát rất hiệu quả cho nhiều tác vụ, bao gồm phân nhóm, phát hiện bất thường và giảm chiều dữ liệu.

+) Phân cụm: Tách tập dữ liệu thành các nhóm dựa trên sự giống nhau.

+) Phát hiện bất thường: Xác định các điểm dữ liệu bất thường trong tập dữ liệu

+) Khai thác liên kết: Xác định các tập hợp các mục trong tập dữ liệu thường xuyên xảy ra cùng nhau.

+) Giảm kích thước: Giảm số lượng biến trong tập dữ liệu

 Học bán giám sát (Semi-supervised learning)

Cách tiếp cận học máy này kết hợp giữa học có giám sát và không giám sát, cho phép các nhà khoa học dữ liệu cung cấp thuật toán với dữ liệu đào tạo gắn nhãn, trong khi mô hình có khả năng tự khám phá và phát triển hiểu biết riêng về tập dữ liệu Phương pháp học bán giám sát được ứng dụng trong nhiều lĩnh vực khác nhau.

+) Dịch máy: Dạy thuật toán dịch ngôn ngữ dựa trên ít hơn một từ điển từ đầy đủ.

+) Phát hiện gian lận: Xác định các trường hợp gian lận khi bạn chỉ có một vài ví dụ tích cực.

Dán nhãn dữ liệu là quá trình giúp các thuật toán học cách áp dụng nhãn cho các tập dữ liệu lớn hơn một cách tự động, bắt đầu từ việc đào tạo trên các tập dữ liệu nhỏ.

 Học tăng cường (Reinforcement learning)

Các nhà khoa học dữ liệu sử dụng học tăng cường để dạy máy thực hiện quy trình nhiều bước với các quy tắc rõ ràng Họ lập trình thuật toán để hoàn thành nhiệm vụ và cung cấp tín hiệu tích cực hoặc tiêu cực khi máy tìm cách thực hiện Thuật toán chủ yếu tự quyết định các bước cần thực hiện trong quá trình này Học tập củng cố thường được áp dụng trong nhiều lĩnh vực khác nhau.

+) Robot: Robot có thể học cách thực hiện các nhiệm vụ trong thế giới vật chất bằng cách sử dụng kỹ thuật này.

+) Trò chơi video: Học tập củng cố đã được sử dụng để dạy bot chơi một số trò chơi điện tử.

Quản lý nguồn lực hiệu quả là chìa khóa để doanh nghiệp đạt được mục tiêu xác định Với nguồn lực hữu hạn, việc học củng cố giúp doanh nghiệp lập kế hoạch phân bổ nguồn lực một cách hợp lý, tối ưu hóa hiệu suất và đảm bảo sự phát triển bền vững.

2.1.4 Ứng dụng của học máy

Học máy có nhiều ứng dụng thực tiễn đa dạng, trong đó hai lĩnh vực nổi bật nhất là khai phá dữ liệu và nhận dạng mẫu.

Khai phá dữ liệu là quá trình ứng dụng các kỹ thuật học máy vào cơ sở dữ liệu lớn nhằm phát hiện quy luật và tri thức ẩn chứa trong dữ liệu Qua đó, nó giúp dự đoán những thông tin quan trọng trong tương lai.

Nhận dạng mẫu là việc áp dụng kỹ thuật học máy để phát hiện các quy luật trong dữ liệu, chủ yếu là dữ liệu hình ảnh và âm thanh Một trong những bài toán cụ thể trong nhận dạng mẫu là xác định nhãn cho đầu vào, chẳng hạn như nhận diện khuôn mặt, nhằm xác định danh tính của người trong ảnh.

Khai phá dữ liệu và nhận dạng mẫu có nhiều điểm tương đồng trong nghiên cứu và ứng dụng, nhưng khác nhau chủ yếu ở lĩnh vực ứng dụng và kỹ thuật Khai phá dữ liệu thường liên quan đến dữ liệu thương mại, trong khi nhận dạng mẫu chủ yếu áp dụng cho dữ liệu âm thanh và hình ảnh, đặc biệt trong các lĩnh vực kỹ thuật.

Sau đây là một số ví dụ ứng dụng cụ thể của học máy: xiii

+) Nhận dạng ký tự: phân loại hình chụp ký tự thành các loại, mỗi loại ứng với một ký tự tương ứng

Phát hiện và nhận dạng khuôn mặt là quá trình xác định vùng chứa khuôn mặt trong hình ảnh và nhận diện người đó trong số những người đã được lưu trữ trước đó Điều này giúp phân loại hình ảnh thành các nhóm tương ứng với từng cá nhân khác nhau.

+) Lọc thư rác, phân loại văn bản: dựa trên nội dung thư điện tử, chia thư thành loại

“thư rác” hay “thư bình thường”; hoặc phân chia tin tức thành các thể loại khác nhau như “xã hội”, “kinh tế”, “thể thao” …

Ngày đăng: 14/10/2022, 22:16

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] "Wikipedia", [Online], Available: https://vi.wikipedia.org/wiki/H%E1%BB%8Dc_m%C3%A1y Sách, tạp chí
Tiêu đề: Wikipedia
[2] "m2tech", [Online], Available : https://m2tech.buyit.vn/hoc-may-machine-learning-la-gi-ung-dung-cua-hoc-may/ Sách, tạp chí
Tiêu đề: m2tech
[4] "Wordpress", [Online], Available : https://neralnetwork.wordpress.com/2018/05/11/thuat-toan-support-vector-machine-svm/ Sách, tạp chí
Tiêu đề: Wordpress
[5] "Viblo", [Online], Available : https://viblo.asia/p/support-vector-machine-trong-hoc-may-mot-cai-nhin-don-gian-hon-XQZkxoQmewA Sách, tạp chí
Tiêu đề: Viblo
[6] "vimentor.com", [Online], Available : https://www.vimentor.com/vi/lesson/tien-xu-ly-du-lieu-trong-linh-vuc-hoc-may-phan-3 Sách, tạp chí
Tiêu đề: vimentor.com
[7] "Viblo", [Online], Available : https://viblo.asia/p/confusion-matrix-ma-tran-nham-lan-ma-tran-loi-V3m5WQB7ZO7 Sách, tạp chí
Tiêu đề: Viblo
[8] "hoctructuyen123", [Online], Available : http://hoctructuyen123.net/cac-phuong-phap-danh-gia-mot-mo-hinh-phan-lop-du-lieu Sách, tạp chí
Tiêu đề: hoctructuyen123
[9] "Openplanning.net", [Online], Available : https://openplanning.net/11385/gioi-thieu-ve-python Sách, tạp chí
Tiêu đề: Openplanning.net
[12] "ichi.pro", [Online], Available : https://ichi.pro/vi/tien-xu-ly-du-lieu-voi-python-62761617448240 Sách, tạp chí
Tiêu đề: ichi.pro
[13] "tek4.vn", [Online], Available : https://tek4.vn/khoa-hoc/machine-learning-co-ban/training-set-va-testing-set Sách, tạp chí
Tiêu đề: tek4.vn
[14] D. Graffox, "IEEE Citation Reference," Sep. 2009. [Online]. Available: http://www.ieee.org/documents/ieeecitationref.pdf Sách, tạp chí
Tiêu đề: IEEE Citation Reference
[19] P. J. Denning, "Editorial: Plagiarism in the Web," Communications of the ACM, vol. 98, no. 12, p. 29, Dec. 1995 Sách, tạp chí
Tiêu đề: Editorial: Plagiarism in the Web
[3] N.T.HOP, [Online], Available : https://viblo.asia/p/thuat-toan-phan-lop-naive-bayes-924lJWPm5PM Link
[10] tecktrending.com, [Online], Available : https://tecktrending.com/thu-vien-python-cho-khoa-hoc-du-lieu/ Link
[11] Benhvien103, [Online], Available : http://www.benhvien103.vn/thuc-trang-va-cap-nhat-ung-thu-tai-viet-nam/ Link
[15] Apr. 2011. [Online]. Available: http://libinfo.uark.edu/reference/citingyoursources.asp Link
[16] [Online]. Available: http://www.ijssst.info/info/IEEE-Citation-StyleGuide.pdf. [Accessed 2 5 2011] Link
[18] N. Wells, 2007. [Online]. Available: http://www.nissawells.com/samples/w-manual.pdf Link
[22] T. Doe, Dec. 2011. [Online]. Available: http://grad.uark.edu/dean/thesisguide.php Link
[23] Cornell University Library PSEC Documentation Committee, Feb. 2010. [Online]. Available: http://www.library.cornell.edu/resrch/citmanage/apa Link

HÌNH ẢNH LIÊN QUAN

Hình 2.1 Các phương pháp học máy phổ biến hiện nay 2.1.3 Phân loại và ứng dụng học máy - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Hình 2.1 Các phương pháp học máy phổ biến hiện nay 2.1.3 Phân loại và ứng dụng học máy (Trang 19)
Hình 2.2 Minh họa siêu phẳng trong SVM - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Hình 2.2 Minh họa siêu phẳng trong SVM (Trang 27)
Hình 2.3 Vấn đề chọn siêu phẳng trong SVM - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Hình 2.3 Vấn đề chọn siêu phẳng trong SVM (Trang 28)
Hình 2.4 Margin trong vấn đề chọn siêu phẳng - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Hình 2.4 Margin trong vấn đề chọn siêu phẳng (Trang 29)
Hình 2.5 Minh họa về Precision và Recall - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Hình 2.5 Minh họa về Precision và Recall (Trang 39)
Bảng 3.2 Bảng chi tiết dữ liệu - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Bảng 3.2 Bảng chi tiết dữ liệu (Trang 43)
Hình 3.6 Phân bổ của dữ liệu vào 2 lớp - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Hình 3.6 Phân bổ của dữ liệu vào 2 lớp (Trang 46)
Hình  3.1 TÌm tham số tốt nhất cho học máy - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
nh 3.1 TÌm tham số tốt nhất cho học máy (Trang 49)
Hình 3.7 Mô hình huấn luyện tổng quát - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Hình 3.7 Mô hình huấn luyện tổng quát (Trang 51)
Hình 3.9 Mô hình huấn luyện với thuật toán SVM - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Hình 3.9 Mô hình huấn luyện với thuật toán SVM (Trang 53)
Hình 4.10 Chia dữ liệu - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Hình 4.10 Chia dữ liệu (Trang 54)
Bảng 4.3 Bảng kết quả chẩn đoán u lành tính B dựa theo việc đánh giá bằng Precision và - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Bảng 4.3 Bảng kết quả chẩn đoán u lành tính B dựa theo việc đánh giá bằng Precision và (Trang 56)
Bảng 4.5 Bảng kết quả đánh giá dựa theo độ chính xác - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú
Bảng 4.5 Bảng kết quả đánh giá dựa theo độ chính xác (Trang 57)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w