1. Trang chủ
  2. » Luận Văn - Báo Cáo

ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM

81 53 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Website Bán Mỹ Phẩm Ứng Dụng Kỹ Thuật Khai Phá Dữ Liệu
Tác giả Phạm Văn Điến, Nguyễn Văn Long
Người hướng dẫn ThS. Trần Thanh Hùng
Trường học Trường Đại Học Công Nghiệp Hà Nội
Chuyên ngành Hệ Thống Thông Tin
Thể loại đồ án tốt nghiệp
Năm xuất bản 2013
Thành phố Hà Nội
Định dạng
Số trang 81
Dung lượng 2,84 MB

Cấu trúc

  • LỜI NÓI ĐẦU

  • TÓM TẮT ĐỒ ÁN

  • DANH SÁCH HÌNH VẼ

  • DANH SÁCH BẢNG BIỂU

  • CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU

    • 1.1. Khai phá dữ liệu là gì?

      • 1.1.1. Khái niệm

      • 1.1.2. Ví dụ minh họa

    • 1.2. Một số phương pháp khai thác dữ liệu phổ biến

      • 1.2.1. Học máy (Machine Learning)

      • 1.2.2. Phương pháp hệ chuyên gia

      • 1.2.3. Phát kiến khoa học

      • 1.2.4. Phương pháp thống kê

    • 1.3. Tình hình ứng dụng khai phá dữ liệu

  • CHƯƠNG 2. CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU

    • 2.1. Mô hình mạng Neuron

      • 2.1.1. Giới thiệu về mạng nơron nhân tạo

      • 2.1.2. Nơron sinh học và nơron nhân tạo

      • 2.1.3. Các kiểu mô hình mạng nơron

      • 2.1.4. Mạng nhiều tầng truyền thẳng (MLP)

      • 2.1.5. Huấn luyện và xây dựng mạng Neuron

    • 2.2. Khai phá dữ liệu với tập phổ biến

      • 2.2.1. Định nghĩa về tập phổ biến

      • 2.2.2. Luật kết hợp

      • 2.2.3. Thuật toán: Apriori 

      • 2.2.4. Thuật toán: Apriori cải tiến

    • 2.3. Thuật toán gom cụm K-Mean

      • 2.3.1. Giới thiệu về kỹ thuật phân cụm trong Khai phá dữ liệu (Clustering Techniques in Data Mining)

      • 2.3.2. Thuật Toán K-Means

      • 2.3.3. Ví dụ minh họa thuật toán K-Mean:

    • 2.4. Thuật toán tìm kiếm chuỗi gần đúng

  • CHƯƠNG 3. PHÂN TÍCH THIẾT KẾ HỆ THỐNG

    • 3.1. Khảo sát

    • 3.2. Định nghĩa bài toán

    • 3.3. Xác định các ca sử dụng và tác nhân

      • 3.3.1. Danh sách các ca sử dụng

      • 3.3.2. Danh sách các tác nhân tham gia ca sử dụng

    • 3.4. Biểu đồ ca sử dụng tổng quát

    • 3.5. Đặc tả các ca sử dụng

      • 3.5.1. Ca sử dụng : Cập Nhật Tài Khoản

      • 3.5.2. Ca sử dụng : Đặt hàng online

      • 3.5.3. Ca sử dụng: Đăng ký tài khoản

      • 3.5.4. Ca sử dụng : Xem sản phẩm

      • 3.5.5. Ca sử dụng : Tìm kiếm sản phẩm

      • 3.5.6. Ca sử dụng : Báo cáo thống Kê

      • 3.5.7. Ca sử dụng : Quản Lý Người dùng

      • 3.5.8. Ca sử dụng : Quản lý đơn hàng

      • 3.5.9. Ca sử dụng : Quản Lý Nhà cung cấp

      • 3.5.10. Ca sử dụng : Quản lý hàng

      • 3.5.11. Ca sử dụng: Quản lý tin tức

      • 3.5.12. Ca sử dụng: Đăng nhập

      • 3.5.13. Ca sử dụng: Đăng xuất

      • 3.5.14. Đặc tả ca sử dụng: Quản lý quyền

    • 3.6. Cơ sở dữ liệu vật lý và giao diện web

    • 3.7. Ứng dụng mô hình giải thuật vào bài toán

      • 3.7.1. Ứng dụng mạng neuron để dự báo cho bài toán bán

      • 3.7.2. Ứng dụng giải thuật k-mean cho bài toán

      • 3.7.3. Ứng dụng của giải thuật apriori vào bài toán

      • 3.7.4. Ứng dụng của giải thuật tìm kiếm vào bài toán

  • KẾT LUẬN

  • TÀI LIỆU THAM KHẢO

Nội dung

Xét theo xu hướng trên thế giới, các ứng dụng website có thể PR bán hàng trên nền tảng công nghệ thông tin được xem là một xu hướng phát triển mới được ưa chuộng bởi nó có thể phân tích được hành vi con người, có thể dựa trên các hành vi phân tích đó mà tư vấn gợi ý cho các khách hàng mua bán hàng theo xu hướng đám đông, ví dụ như các trang Thương mại điện tử đã thành công lớn như amazon.com, facebook, google, alibaba,... Song nhìn về thực tế ở Việt Nam cho đến nay, chúng ta mới chỉ thấy tư vấn tự động trong các trang thương mại điện tử hiện nay xuất hiện một các nhỏ lẻ trên các trang bán hàng, chưa đưa ra được một cách tiếp cận khách hàng một cách hệ thống, chưa phân tích sâu được hành vi khách hàng để tiếp thị quảng cáo tự động… Hầu hết các công ty thương mại điện tử hiện nay của Việt Nam hầu như chưa có khả năng tư vấn bán hàng (tiếp thị chéo) một cách bài bản cho các khách hàng, chưa phân tích được các nguồn hàng một cách tự động, chưa tư vấn tự động cho khách hàng được.

QUAN VỀ KHAI PHÁ DỮ LIỆU

Khai phá dữ liệu là gì?

Khai phá dữ liệu, ra đời vào cuối thập kỷ 80, là một tập hợp các kỹ thuật nhằm phát hiện thông tin giá trị tiềm ẩn trong các kho dữ liệu lớn Quá trình này liên quan đến việc phân tích dữ liệu và áp dụng các phương pháp để nhận diện các mẫu hình có tính chính quy.

(regularities) trong tập dữ liệu.

Năm 1989, Fayyad, Piatestsky-Shapiro và Smyth đã giới thiệu khái niệm Phát hiện tri thức trong cơ sở dữ liệu (KDD), mô tả toàn bộ quá trình tìm ra tri thức hữu ích từ các tập dữ liệu lớn Trong đó, khai phá dữ liệu là một bước quan trọng, sử dụng các thuật toán đặc biệt để chiết xuất các mẫu hoặc mô hình từ dữ liệu.

1.1.2 Ví dụ minh họa Để minh họa hoạt động cũng như mẫu chiết xuất được của quá trình khai phá dữ liệu, trong chương này chúng ta sẽ dùng chủ yếu một ví dụ đơn giản như đã cho trên

Hình 2.2 mô tả một tập dữ liệu hai chiều với 23 điểm mẫu, mỗi điểm đại diện cho một khách hàng đã vay ngân hàng Trục hoành thể hiện thu nhập, trong khi trục tung thể hiện tổng dư nợ của khách hàng Dữ liệu được phân loại thành hai nhóm: dấu x cho khách hàng bị vỡ nợ và dấu o cho khách hàng có khả năng trả nợ Tập dữ liệu này cung cấp thông tin quan trọng cho các tổ chức tín dụng trong việc quyết định cho vay, ví dụ như quy tắc “Nếu thu nhập < t đồng thì khách hàng vay sẽ bị vỡ nợ” như thể hiện trong Hình 2.2.

Một số phương pháp khai thác dữ liệu phổ biến

Khai phá dữ liệu không phải là một khái niệm mới mà thực chất dựa trên các phương pháp cơ bản đã được biết đến từ trước Điều này cho thấy rằng việc áp dụng các kỹ thuật phân tích dữ liệu hiện có vẫn giữ vai trò quan trọng trong quá trình khai thác thông tin.

Cho vay Không cho vay

Phân lớp dữ liệu khách hàng khác biệt so với các phương pháp khác, và khai phá dữ liệu mang lại nhiều ưu thế vượt trội Bài viết này sẽ phân tích và giải thích lý do tại sao khai phá dữ liệu lại hiệu quả hơn trong việc xử lý và phân tích thông tin khách hàng.

Mặc dù đã có nhiều nỗ lực cải tiến phương pháp học máy để phục vụ khai phá dữ liệu, nhưng sự khác biệt trong thiết kế và đặc điểm của cơ sở dữ liệu đã khiến những phương pháp này trở nên không phù hợp Hiện tại, phần lớn các phương pháp khai phá dữ liệu vẫn dựa trên nền tảng của học máy, điều này sẽ được phân tích rõ hơn trong các phần sau.

Trong quản trị cơ sở dữ liệu, cơ sở dữ liệu là tập hợp dữ liệu được tổ chức logic trong một hoặc nhiều tệp, giúp lưu trữ, sửa đổi và truy xuất thông tin dễ dàng Trong cơ sở dữ liệu quan hệ, dữ liệu được sắp xếp thành các bảng với các bản ghi có độ dài cố định, mỗi bản ghi chứa một danh sách có thứ tự các giá trị trong các trường Thông tin về tên và giá trị của các trường được lưu trong thư viện dữ liệu (data dictionary) Hệ thống quản trị cơ sở dữ liệu chịu trách nhiệm quản lý các thủ tục để lấy, lưu trữ và xử lý dữ liệu.

Trong học máy, cơ sở dữ liệu đề cập đến tập hợp các mẫu được lưu trữ trong tệp, thường là các vector đặc điểm có độ dài cố định Thông tin về tên đặc điểm và dãy giá trị của chúng cũng được lưu trữ, tương tự như trong từ điển dữ liệu Các thuật toán học máy sử dụng tập dữ liệu cùng với thông tin kèm theo làm đầu vào và đầu ra, thể hiện kết quả của quá trình học, ví dụ như một khái niệm.

So với cơ sở dữ liệu thông thường, học máy có khả năng áp dụng cho cơ sở dữ liệu nhờ vào việc học từ các bản ghi trong tệp dữ liệu, thay vì chỉ học từ tập mẫu.

Phát hiện tri thức trong cơ sở dữ liệu gặp nhiều thách thức, bao gồm tính động, sự không đầy đủ, nhiễu và kích thước lớn hơn so với các tập dữ liệu học máy thông thường Những yếu tố này khiến nhiều thuật toán học máy trở nên kém hiệu quả Do đó, trong quá trình khai phá dữ liệu, cần đầu tư nhiều công sức để vượt qua những khó khăn và phức tạp trong cơ sở dữ liệu.

1.2.2 Phương pháp hệ chuyên gia

Các hệ chuyên gia tập trung vào việc thu thập tri thức từ các chuyên gia con người để giải quyết các bài toán cụ thể Các kỹ thuật thu thập tri thức giúp suy diễn các quy luật từ các ví dụ và giải pháp mà chuyên gia đưa ra Điểm khác biệt so với khai phá dữ liệu là các ví dụ từ chuyên gia thường có chất lượng cao hơn và chỉ bao gồm các trường hợp quan trọng Ngoài ra, các chuyên gia cũng xác nhận giá trị và tính hữu dụng của các mẫu phát hiện Tương tự như các công cụ quản trị cơ sở dữ liệu, các phương pháp này cần sự tham gia của con người trong quá trình phát hiện tri thức.

Khai phá dữ liệu khác biệt với phát kiến khoa học ở chỗ nó ít có chủ tâm và điều khiển hơn Dữ liệu khoa học thường được thu thập từ các thí nghiệm nhằm loại bỏ tác động của các tham số không mong muốn, trong khi các cơ sở dữ liệu thương mại thường chứa lượng thông tin dư thừa để phục vụ mục đích tổ chức Sự dư thừa này, hay còn gọi là sự lẫn lộn, có thể hiện hữu rõ ràng hoặc ẩn chứa trong các mối quan hệ dữ liệu Các nhà khoa học có khả năng tái hiện các thí nghiệm và nhận ra thiết kế ban đầu có thể không phù hợp, trong khi các nhà quản lý cơ sở dữ liệu lại không có khả năng thiết kế lại các trường dữ liệu và thu thập lại thông tin.

Một câu hỏi hiển nhiên là khai phá dữ liệu khác gì so với phương pháp thống kê.

Từ nhiều năm nay, con người đã sử dụng phương pháp thống kê một cách rất hiệu quả để đạt được những mục đích của mình.

Mặc dù các phương pháp thống kê cung cấp nền tảng lý thuyết vững chắc cho phân tích dữ liệu, nhưng chỉ dựa vào thống kê thuần túy là không đủ Thứ nhất, phương pháp thống kê chuẩn không phù hợp với nhiều loại dữ liệu có cấu trúc trong các cơ sở dữ liệu Thứ hai, thống kê hoàn toàn dựa vào dữ liệu mà không tận dụng tri thức sẵn có trong lĩnh vực Thứ ba, kết quả phân tích thống kê có thể phong phú nhưng khó làm rõ Cuối cùng, các phương pháp thống kê cần sự hướng dẫn từ người dùng để xác định cách thức và địa điểm phân tích dữ liệu.

Sự khác biệt chính giữa khai phá dữ liệu và thống kê là khai phá dữ liệu được sử dụng bởi người dùng cuối thay vì các nhà thống kê Khai phá dữ liệu tự động hóa quy trình thống kê một cách hiệu quả, giảm bớt khối lượng công việc cho người dùng và tạo ra công cụ dễ sử dụng hơn Nhờ vào khai phá dữ liệu, việc dự đoán và kiểm tra mà trước đây rất tốn công sức giờ đây có thể được thực hiện tự động trên máy tính.

Tình hình ứng dụng khai phá dữ liệu

Khai phá dữ liệu vẫn còn nhiều thách thức cần nghiên cứu, nhưng tiềm năng của nó đã được chứng minh qua sự phát triển của nhiều ứng dụng hữu ích.

Khai phá dữ liệu đã được ứng dụng thành công trong "cơ sở dữ liệu thị trường" (database marketing), giúp phân tích cơ sở dữ liệu khách hàng và tìm kiếm các mẫu để lựa chọn khách hàng tương lai Theo tạp chí Business Week, hơn 50% nhà bán lẻ đang sử dụng hoặc có ý định sử dụng phương pháp này (Berry 1994) Kết quả cho thấy doanh số thẻ tín dụng American Express đã tăng từ 15% đến 20% (Berry 1994) Ngoài ra, khai phá dữ liệu còn được áp dụng trong phân tích chứng khoán, báo cáo thay đổi dữ liệu, và phát hiện gian lận Ví dụ, hệ thống phát hiện gian lận trong dịch vụ y tế đã được phát triển bởi Major và Riedinger tại Travelers Insurance năm 1992, và Internal Revenue Service cũng đã xây dựng hệ thống chọn thuế để kiểm toán Hệ thống Nestor FDS (Blanchard 1994) sử dụng mạng neuron để phát hiện gian lận trong thẻ tín dụng.

Các ứng dụng của khai phá dữ liệu trong khoa học cũng được phát triển Ta có thể đưa ra một số ứng dụng trong khoa học như:

Hệ thống SKICAT, được phát triển bởi JPL/Caltech, hỗ trợ các nhà thiên văn trong việc tự động nhận diện các vì sao và dải thiên hà trong các khảo sát lớn, từ đó phục vụ cho việc phân tích và phân loại.

 Phân tử sinh học: Hệ thống tìm kiếm các mẫu trong cấu trúc phân tử (Conklin, Fortier, và Glasgow 1993) và trong các dữ liệu gen (Holder, Cook, và Djoko 1994).

Mô hình hóa các thay đổi thời tiết cho phép tự động phát hiện các hiện tượng như lốc và gió xoáy trong các tập dữ liệu lớn từ mô phỏng và quan sát (Stolorz et al 1994).

CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU

Mô hình mạng Neuron

2.1.1 Giới thiệu về mạng nơron nhân tạo

2.1.1.1 Mạng nơron nhân tạo là gì? Định nghĩa: Mạng nơron nhân tạo, Artificial Neural Network (ANN) gọi tắt là mạng nơron, neural network, là một mô hình xử lý thông tin phỏng theo cách thức xử lý thông tin của các hệ nơron sinh học Nó được tạo lên từ một số lượng lớn các phần tử (gọi là phần tử xử lý hay nơron) kết nối với nhau thông qua các liên kết (gọi là trọng số liên kết) làm việc như một thể thống nhất để giải quyết một vấn đề cụ thể nào đó

Mạng nơron nhân tạo được cấu hình cho các ứng dụng như nhận dạng mẫu và phân loại dữ liệu thông qua quá trình học từ tập mẫu huấn luyện Quá trình học này chủ yếu là việc điều chỉnh trọng số liên kết giữa các nơron để cải thiện hiệu suất của mạng.

2.1.1.2 Lịch sử phát triển mạng nơron

Nghiên cứu về bộ não con người đã có lịch sử hàng nghìn năm Với sự phát triển của khoa học và công nghệ, đặc biệt là trong lĩnh vực điện tử hiện đại, việc nghiên cứu các nơron nhân tạo trở nên tự nhiên Sự kiện quan trọng đánh dấu sự ra đời của mạng nơron nhân tạo diễn ra vào năm

Năm 1943, nhà thần kinh học Warren McCulloch và nhà toán học Walter Pitts đã công bố một bài báo mô tả cách hoạt động của các nơron, đồng thời xây dựng một mạng nơron đơn giản bằng mạch điện Trong mô hình của họ, các nơron được coi là thiết bị nhị phân với ngưỡng cố định, cho phép tạo ra các hàm logic cơ bản như "a OR b" và "a AND b".

Năm 1949, Donald Hebb đã xuất bản cuốn sách "Organization of Behavior," trong đó ông chứng minh rằng các nơron nhân tạo ngày càng hiệu quả hơn mỗi khi chúng được sử dụng.

Hiện nay, nghiên cứu ứng dụng mạng nơron đã trở nên phổ biến trong việc giải quyết các vấn đề thực tiễn Số lượng ứng dụng mạng nơron ngày càng tăng và ngày càng hoàn thiện, bao gồm các lĩnh vực như xử lý ngôn ngữ, nhận dạng kí tự, nhận dạng tiếng nói, nhận dạng mẫu, xử lý tín hiệu và lọc dữ liệu.

2.1.3 So sánh mạng nơron với máy tính truyền thống

Các mạng nơron tiếp cận vấn đề khác biệt so với máy tính truyền thống, vốn dựa vào phương pháp giải thuật Trong khi máy tính truyền thống thực hiện một chuỗi các chỉ lệnh rõ ràng để giải quyết vấn đề đã biết, các chỉ lệnh này cần được chuyển đổi thành chương trình ngôn ngữ bậc cao và mã máy để máy tính có thể hiểu.

Máy tính chỉ hoạt động hiệu quả khi có các bước cụ thể được chỉ định rõ ràng, điều này hạn chế khả năng của chúng trong việc giải quyết các vấn đề đã được hiểu biết Nếu máy tính có thể thực hiện những nhiệm vụ mà con người không biết cách thực hiện một cách chính xác, chúng sẽ trở nên hữu ích hơn rất nhiều.

Mạng nơron hoạt động tương tự như bộ não con người, được cấu thành từ nhiều phần tử xử lý kết nối với nhau để giải quyết các vấn đề cụ thể Chúng học theo mô hình và không thể được lập trình cho một nhiệm vụ nhất định, do đó việc lựa chọn mẫu dữ liệu phải được thực hiện cẩn thận Nếu không, quá trình này có thể tốn thời gian và dẫn đến kết quả không chính xác, vì mạng tự tìm ra cách giải quyết vấn đề mà không thể dự đoán trước.

Các mạng nơron và máy tính truyền thống không đối đầu mà hỗ trợ lẫn nhau Một số nhiệm vụ phù hợp hơn với máy tính truyền thống, trong khi những nhiệm vụ khác lại thích hợp hơn với mạng nơron Nhiều nhiệm vụ yêu cầu kết hợp cả hai phương pháp để đạt hiệu quả tối ưu, thường là sử dụng máy tính truyền thống để giám sát mạng nơron.

2.1.2 Nơron sinh học và nơron nhân tạo

Bộ não con người chứa khoảng 100 tỷ nơron và tham gia vào khoảng 1 triệu tỷ kết nối, với mỗi đường truyền dài hơn một mét Các nơron không chỉ có nhiều đặc điểm chung với tế bào khác trong cơ thể mà còn sở hữu khả năng độc đáo trong việc nhận, xử lý và truyền tín hiệu điện hóa qua các đường mòn nơron, hình thành nên hệ thống giao tiếp phức tạp của bộ não.

Hình 2: Cấu trúc của một nơron sinh học điển hình

Mỗi nơron sinh học có 3 thành phần cơ bản:

• Các nhánh vào hình cây ( dendrites)

• Thân tế bào (cell body)

Các nhánh hình cây của nơron truyền tín hiệu vào thân tế bào, nơi tín hiệu được tổng hợp và xử lý trước khi được truyền ra qua sợi trục sang nơron khác Điểm kết nối giữa sợi trục của nơron này với nhánh hình cây của nơron khác được gọi là synapse Sự liên kết giữa các nơron và độ nhạy của mỗi synapse phụ thuộc vào quá trình hóa học phức tạp Một số cấu trúc nơron được xác định trước khi sinh, trong khi một số khác phát triển qua quá trình học Trong suốt cuộc đời, các liên kết mới được hình thành và một số liên kết cũ bị hủy bỏ.

Nơron sinh học hoạt động bằng cách nhận tín hiệu đầu vào, xử lý chúng và tạo ra tín hiệu đầu ra Tín hiệu đầu ra này sau đó được truyền đến các nơron khác như tín hiệu đầu vào.

Dựa trên những hiểu biết về nơron sinh học, con người đã phát triển nơron nhân tạo nhằm tạo ra một mô hình có khả năng tương đương với bộ não.

Một nơron là đơn vị xử lý thông tin cơ bản trong mạng nơron, với cấu trúc đặc trưng được thể hiện trong hình ảnh dưới đây.

Hình 3: Nơron nhân tạo Các thành phần cơ bản của một nơron nhân tạo bao gồm:

♦ Tập các đầu vào: Là các tín hiệu vào (input signals) của nơron, các tín hiệu này thường được đưa vào dưới dạng một vector N chiều

Khai phá dữ liệu với tập phổ biến

2.2.1 Định nghĩa về tập phổ biến

Mẫu phổ biến là các tập hợp item, dãy hành vi hoặc cấu trúc mà xuất hiện thường xuyên trong dữ liệu, như ví dụ về sữa và bánh mì Một dãy tuần tự phổ biến có thể là "mua máy tính, sau đó là máy camera kỹ thuật số và thẻ nhớ" Các cấu trúc như đồ thị, cây và lưới cũng có thể trở thành mẫu cấu trúc phổ biến nếu chúng xuất hiện thường xuyên Việc tìm kiếm các mẫu phổ biến này rất quan trọng trong việc khai thác luật kết hợp, mối quan hệ và giải quyết các bài toán phân loại, phân nhóm Do đó, khai thác mẫu phổ biến là một vấn đề quan trọng trong lĩnh vực Data Mining và là chủ đề hấp dẫn trong nghiên cứu.

Cho I = {I1, I2,….,Im} là một tập các items Cho D là bộ dữ liệu có liên quan đến bài toán, và là một tập trong CSDL giao dịch Mỗi giao dịch T là một tập các items và T⊆I Mỗi giao dịch có một định danh, được gọi là TID Cho A là tập các items. Một giao dịch T được gọi là chứa A khi và chỉ khi A ⊆ T

Một luật kết hợp cú dạng A=>B, với A ⊂ I, B ⊂ I và A ∩ B = ỉ Luật A=>B ngầm chứa trong D với độ đo support s, trong đó s là tỷ lệ các giao dịch trong D chứa

Trong xác suất, A ∪ B được biểu thị bằng P(A ∪ B) Luật A=>B có độ tin cậy (confidence) c trong tập D, được định nghĩa là tỷ lệ giữa các giao dịch trong D có chứa A cũng chứa B, được diễn tả bằng xác suất P(B | A) Cụ thể, độ hỗ trợ (support) của luật A=>B được tính bằng P(A ∪ B) và độ tin cậy (confidence) của luật A=>B là P(B | A).

Các luật thỏa mãn cả hai ngưỡng min_sup và min_conf được gọi là luật mạnh Chúng ta thống nhất sử dụng độ đo trong khoảng từ 0% đến 100% thay vì từ 0 đến 1.0.

Một tập hợp các mục được gọi là itemset, trong đó một itemset chứa k mục được gọi là k-itemset Ví dụ, tập {computer, antivirus_software} là một 2-itemset Độ phổ biến của một itemset được xác định bằng số lượng giao dịch chứa itemset đó, thường được biết đến với tên gọi là support count hoặc count của itemset.

Nếu độ đo support count của một tập hợp itemset I đạt ngưỡng min_sup đã định, thì I được coi là một tập phổ biến Tập phổ biến với k-items được ký hiệu là Lk.

Từ (3.3), ta có: supp ( ) sup _ ( )

( ) ( | ) sup ( ) sup _ ( ) ort A B port count A B confidence A B P B A port A port count A

Phương trình (3.4) cho thấy rằng độ đo confidence của luật A=>B có thể được tính từ độ đo support count của A và A ∪ B Khi đã xác định được độ đo support counts của A, B và A ∪ B, ta có thể đánh giá sức mạnh của hai luật kết hợp A=>B và B=>A Do đó, việc khai thác các luật kết hợp có thể được chuyển thành bài toán khai thác các tập phổ biến.

Thuật toán Apriori là một phương pháp hiệu quả để tìm kiếm các tập item phổ biến trong dữ liệu Nó sử dụng cách tiếp cận lặp đi lặp lại theo cấp độ, dựa trên việc phát sinh các ứng viên từ các tập hợp item đã biết.

D, cơ sở dữ liệu của các giao tác; min_sup, ngưỡng độ hỗ trợ tối thiểu.

Output: L, các tập item phổ biến trong D.

(4) for each giao tác t  D // quét D để đếm

(5) Ct = subset(Ck, t); // lấy các tập con của t mà là các ứng viên

(6) for each ứng viên c  Ct

(9) Lk = {c  Ck|c.count  min_sup}

(11) return L = kLk; procedure apriori_gen(Lk-1:tập (k-1) item phổ biến)

(1) for each tập item l1  Lk-1

(2) for each tập item l2  Lk-1

(4) c = l1 kết l2; // bước kết: phát sinh các ứng viên

(5) if has_infrequent_subset(c, Lk-1) then

(6) delete c; // bước xén tỉa: loại bỏ các ứng viên không đạt

(9) return Ck; procedure has_infrequent_subset(c: ứng viên tập k item;

Lk-1: các tập (k-1) item phổ biến); // sử dụng kiến thức trước

(1) for each tập con (k-1) s of c

Figure 3.4 Thuật toán Apriori để khám phá các tập item phổ biến để khai thác các luật kết hợp kiểu Boolean.

Chẳn hạn với I= {A1,A2,A5},các tập con của I:

{A1}, {A2}, {A5}, {A1,A2},{A1,A5},{A2,A5} sẽ có các luật sau

Ví dụ: Giả sử ta có có sở dữ liệu giao dịch (Transaction Database -TDB) như sau :Bảng biểu 2: Sơ đồ minh họa thuật toán apriori

Thuật toán Apriori khai phá luật kết hợp được mô tả qua các bước sau

Ta có frequent itemsets I ={B,C,E}, với min_conf % ta có 2 luật kết hợp là

Giả sử có cơ sở dữ liệu giao dịch bán hàng gồm 5 giao dịch như sau:

Thuật toán Apriori tìm các luật kết hợp trong giao dịch bán hàng trên như sau:

Kết quả ta có các luật kết hợp sau (với min_sup= 40%, min_confp%)

R4: Baby Powder => Diaper (support @%,confidence = 100%)

Dựa trên kết quả từ các luật được sinh ra từ giao dịch bán hàng, chúng ta nhận thấy có những luật hợp lý như Baby Powder => Diaper, một số luật cần phân tích thêm như Milk => Beer, và cũng có những luật khó tin như Diaper => Beer Những ví dụ này cho thấy rằng có thể xuất hiện các luật không thực tế do kích thước của cơ sở dữ liệu giao dịch (transaction database) hay còn gọi là dữ liệu huấn luyện (training data) rất nhỏ.

Thuật toán Apriori được sử dụng để phát hiện các luật kết hợp khẳng định (Positive Rule X=>Y) trong các quy tắc kết hợp nhị phân (Binary Association Rules) Tuy nhiên, thuật toán này không có khả năng phát hiện các luật kết hợp phủ định (Negative Association Rule), ví dụ như các kết hợp dạng khác.

Khai thác các luật kết hợp dạng phủ định, như "Khách hàng mua mặt hàng A thường không mua mặt hàng B" hoặc "Nếu ủng hộ quan điểm A thì thường không ủng hộ quan điểm B", mang lại ứng dụng rộng rãi và thú vị, đặc biệt trong lĩnh vực Marketing, Chăm sóc sức khỏe và Phân tích mạng xã hội.

2.2.4 Thuật toán: Apriori cải tiến

Thuật toán gom cụm K-Mean

2.3.1 Giới thiệu về kỹ thuật phân cụm trong Khai phá dữ liệu (Clustering

Phân cụm là một kỹ thuật quan trọng trong khai phá dữ liệu, thuộc nhóm các phương pháp Unsupervised Learning trong Machine Learning Kỹ thuật này nhằm mục đích nhóm các đối tượng thành các cụm (clusters) sao cho các đối tượng trong cùng một cụm có sự tương đồng (similar) cao, trong khi các đối tượng thuộc các cụm khác lại có sự khác biệt (dissimilar) rõ rệt.

Phân cụm nhằm mục đích khám phá bản chất bên trong các nhóm dữ liệu, với các thuật toán phân cụm tạo ra các cụm khác nhau Tuy nhiên, không có tiêu chí nào được coi là tốt nhất để đánh giá hiệu quả của phân tích phân cụm, vì điều này phụ thuộc vào mục đích cụ thể như giảm dữ liệu hoặc xác định các cụm tự nhiên.

Kỹ thuật phân cụm có thể áp dụng trong rất nhiều lĩnh vực như:

Trong lĩnh vực marketing, việc xác định các nhóm khách hàng như khách hàng tiềm năng và khách hàng giá trị là rất quan trọng Phân loại và dự đoán hành vi của khách hàng sẽ giúp công ty tối ưu hóa chiến lược kinh doanh, từ đó nâng cao hiệu quả sử dụng sản phẩm và dịch vụ.

 Biology: Phận nhóm động vật và thực vật dựa vào các thuộc tính của chúng;

 Libraries: Theo dõi độc giả, sách, dự đoán nhu cầu của độc giả…;

Bảo hiểm và dịch vụ tài chính đóng vai trò quan trọng trong việc phân nhóm các đối tượng sử dụng, từ đó dự đoán xu hướng của khách hàng Việc hiểu rõ nhu cầu và hành vi của người tiêu dùng giúp các doanh nghiệp tối ưu hóa chiến lược tiếp thị và cung cấp dịch vụ Đồng thời, công nghệ cũng hỗ trợ phát hiện gian lận tài chính, bảo vệ quyền lợi của cả doanh nghiệp và khách hàng.

 WWW: Phân loại tài liệu (document classification); phân loại người dùng web (clustering weblog);…

Các kỹ thuật phân cụm được phân loại như sau (xem hình)

Hình 7: Các kỹ thuật phân cụm

K-Means là thuật toán rất quan trọng và được sử dụng phổ biến trong kỹ thuật phân cụm Tư tưởng chính của thuật toán K-Means là tìm cách phân nhóm các đối tượng (objects) đã cho vào K cụm (K là số các cụm được xác đinh trước, K nguyên dương) sao cho tổng bình phương khoảng cách giữa các đối tượng đến tâm nhóm (centroid ) là nhỏ nhất.

Thuật toán K-Means được mô tả như sau

Bảng biểu 3: Sơ đồ thuật toán K-Mean

Thuật toán K-Means thực hiện qua các bước chính sau:

1 Chọn ngẫu nhiên K tâm (centroid) cho K cụm (cluster) Mỗi cụm được đại diện bằng các tâm của cụm.

2 Tính khoảng cách giữa các đối tượng (objects) đến K tâm (thường dùng khoảng cách Euclidean)

3 Nhóm các đối tượng vào nhóm gần nhất

4 Xác định lại tâm mới cho các nhóm

5 Thực hiện lại bước 2 cho đến khi không có sự thay đổi nhóm nào của các đối tượng

2.3.3 Ví dụ minh họa thuật toán K-Mean:

Giả sử ta có 4 loại thuốc A,B,C,D, mỗi loại thuộc được biểu diễn bởi 2 đặc trưng X và

Y như sau Mục đích của ta là nhóm các thuốc đã cho vào 2 nhóm (K=2) dựa vào các đặc trưng của chúng.

Bước đầu tiên trong quá trình phân nhóm là khởi tạo tâm (centroid) cho hai nhóm Chúng ta giả sử chọn A làm tâm của nhóm thứ nhất với tọa độ c1(1,1) và B làm tâm của nhóm thứ hai với tọa độ c2(2,1).

Hình 8: Ví dụ minh họa thuật toán K-Mean

Bước 2 Tính khoảng cách từ các đối tượng đến tâm của các nhóm (Khoảng cách Euclidean)

Mỗi cột trong ma trận khoảng cách (D) đại diện cho một đối tượng, với cột đầu tiên tương ứng với đối tượng A, cột thứ hai với đối tượng B, và tiếp tục như vậy Hàng đầu tiên của ma trận thể hiện khoảng cách giữa các đối tượng và tâm của nhóm thứ nhất (c1), trong khi hàng thứ hai biểu diễn khoảng cách đến tâm của nhóm thứ hai (c2).

Ví dụ, khoảng cách từ loại thuốc C=(4,3) đến tâm c1(1,1) là 3.61 và đến tâm c2(2,1) là 2.83 được tính như sau:

Bước 3 Nhóm các đối tượng vào nhóm gần nhất

Ta thấy rằng nhóm 1 sau vòng lặp thứ nhất gồm có 1 đối tượng A và nhóm 2 gồm các đối tượng còn lại B,C,D.

Bước 5 là tính lại tọa độ các tâm cho các nhóm mới dựa trên tọa độ của các đối tượng trong nhóm Đối với nhóm 1 chỉ có một đối tượng A, tọa độ tâm nhóm 1 giữ nguyên là c1(1,1) Tâm nhóm 2 sẽ được tính toán dựa vào các đối tượng trong nhóm.

Bước 6 Tính lại khoảng cách từ các đối tượng đến tâm mới

Bước 7 Nhóm các đối tượng vào nhóm

Bước 8 Tính lại tâm cho nhóm mới

Bước 8 Tính lại khoảng cách từ các đối tượng đến tâm mới

Bước 9 Nhóm các đối tượng vào nhóm

Ta thấy G 2 = G 1 (Không có sự thay đổi nhóm nào của các đối tượng) nên thuật toán dừng và kết quả phân nhóm như sau:

Thuật toán K-Means nổi bật với tính đơn giản, dễ hiểu và dễ cài đặt Tuy nhiên, nó có một số hạn chế, bao gồm việc hiệu quả của thuật toán phụ thuộc vào việc xác định số lượng nhóm K trước và chi phí tính toán khoảng cách có thể lớn khi số cụm tăng lên.

K và dữ liệu phân cụm lớn

Thuật toán tìm kiếm chuỗi gần đúng

Sự tương tự giữa hai chuỗi ký tự thường được đo bằng các phương pháp như dãy con chung dài nhất, xâu con chung dài nhất và khoảng cách Edit Tuy nhiên, những phương pháp này chỉ hiệu quả trong trường hợp có lỗi xảy ra do các ký tự bị xóa, chèn hoặc thay thế, và chúng đều chú trọng đến trật tự của các ký tự Điều này dẫn đến việc các phương pháp hiện tại chưa đáp ứng đầy đủ nhu cầu tìm kiếm thông tin tương tự trong các hệ thống xử lý văn bản.

Trong ứng dụng thực tế, mỗi từ được coi là một "ký tự hình thức" Ví dụ, với câu "Hà Nội là thủ đô của nước Việt Nam", ta có thể hình thức hóa thành P = abcdefghk, trong khi chuỗi S "Đất nước Việt Nam chúng ta có thủ đô là Hà Nội" được hình thức hóa thành lghkmnodecab Khi tính độ tương tự giữa hai chuỗi này theo các phương pháp kinh điển, kết quả cho thấy độ dài của dãy con chung dài nhất là 3, từ đó độ tương tự được tính là 3/12.

Khoảng các Edit: 15 (số phép xóa chèn hay thay thế ký tự để biến đổi chuỗi P thành S)

Khoảng cách Hamming chỉ có thể được sử dụng cho hai chuỗi có độ dài tương đương, vì vậy nó không thể áp dụng để đo độ tương tự giữa hai chuỗi khác nhau.

Mặc dù độ tương tự giữa P và S rất nhỏ, về mặt ngữ nghĩa, chúng lại rất gần nhau Các tình huống tương tự thường gặp trong thực tế bao gồm việc tìm kiếm tên người nước ngoài như 'C.J.Date' và 'Date.C.J', hay 'Christian Charras' và 'Charas C.' Ngoài ra, còn có sự sai khác do biến đổi hình thái từ và cấu trúc câu, ví dụ như 'approximate searching' và 'search approximately' Một số trường hợp cũng cho thấy thứ tự ghép từ khác nhau nhưng vẫn mang ý nghĩa gần giống nhau, như 'toán logic' và 'logic toán'.

Độ tương tự giữa các chuỗi từ có thể được đánh giá thông qua hình thức thống kê, cho phép nhận diện các cụm từ như “lung linh” và “linh lung” hay “toán giải tích” và “giải tích toán”, dù thứ tự từ có thể thay đổi nhưng vẫn giữ nguyên nghĩa.

Khoảng cách Levenshtein là một khái niệm quan trọng trong khoa học máy tính, thể hiện sự khác biệt giữa hai chuỗi ký tự Nó được định nghĩa là số bước tối thiểu cần thiết để chuyển đổi chuỗi S thành chuỗi T thông qua ba phép biến đổi cơ bản.

 thay kí tự này bằng kí tự khác.

Khoảng cách Levenshtein, được đặt theo tên Vladimir Levenshtein vào năm 1965, là một khái niệm quan trọng trong việc đo lường sự tương đồng và khác biệt giữa hai chuỗi ký tự Nó thường được ứng dụng trong các chương trình kiểm tra lỗi chính tả, như spellchecker của WinWord Chẳng hạn, khoảng cách Levenshtein giữa hai từ "kitten" và "sitting" là 3, nghĩa là cần ít nhất 3 phép biến đổi để chuyển đổi từ này sang từ kia.

3 sittin -> sitting (thêm kí tự "g") Để tính toán Khoảng cách Levenshtein, ta sử dụng thuật toán quy hoạch động, tính toán trên mảng 2 chiều (n+1)*(m+1), với n, m là độ dài của chuỗi cần tính. Sau đây là đoạn mã (S, T là chuỗi cần tính khoảng cách, n, m là độ dài của chuỗi S, T): int LevenshteinDistance(char s[1 m], char t[1 n])

// d is a table with m+1 rows and n+1 columns declare int d[0 m, 0 n] for i from 0 to m d[i, 0] := i for j from 0 to n d[0, j] := j for i from 1 to m for j from 1 to n

{ if s[i] = t[j] then cost := 0 else cost := 1 d[i, j] := minimum( d[i-1, j] + 1, // trường hợp xoá d[i, j-1] + 1, // trường hợp thêm d[i-1, j-1] + cost // trường hợp thay thế

Bảng biểu 4: Giá trị bảng so sánh chuối kí tự

PHÂN TÍCH THIẾT KẾ HỆ THỐNG

Khảo sát

MYPHAMTHUHANG.COM là cửa hàng chuyên cung cấp mỹ phẩm, nước hoa và thời trang, hoạt động theo hình thức bán buôn và bán lẻ Cửa hàng tọa lạc tại số 457 đường Xuân Đỉnh, xã Xuân Đỉnh, huyện Từ Liêm, Hà Nội Để biết thêm thông tin, quý khách có thể liên hệ qua số điện thoại 046.2580955 hoặc email miskao96@ymail.com.

Cửa hàng, được thành lập vào tháng 9 năm 2011, cung cấp đa dạng các mặt hàng thời trang và mỹ phẩm từ bình dân đến cao cấp của nhiều thương hiệu khác nhau Tuy nhiên, cửa hàng chỉ tập trung vào kinh doanh bán buôn một số loại hàng nhất định Sau một năm hoạt động ổn định, hiện tại cửa hàng đang có nhu cầu tin học hóa quy trình kinh doanh để nâng cao hiệu quả làm việc.

Cửa hàng cung cấp đa dạng các mặt hàng thời trang, nước hoa, mỹ phẩm, bao gồm các sản phẩm như sau:

Ngành hàng mỹ phẩm bao gồm nhiều loại sản phẩm đa dạng, từ sản phẩm trang điểm như phấn phủ, kem nền, mascara, son môi, đến sản phẩm chăm sóc da như sữa rửa mặt, nước hoa hồng, và kem dưỡng da Ngoài ra, còn có các sản phẩm chăm sóc cá nhân như sữa tắm, sữa dưỡng thể, và lăn khử mùi Ngành này cũng cung cấp sản phẩm chăm sóc tóc như dầu gội, dầu xả, và gel tạo kiểu tóc Bên cạnh đó, các sản phẩm chăm sóc tay chân như kìm cắt móng và sơn móng, cũng như sản phẩm chăm sóc răng miệng như nước súc miệng và kem đánh răng, đều là những phần quan trọng trong ngành mỹ phẩm.

Ngành hàng nước hoa bao gồm nhiều sản phẩm đa dạng như nước hoa nam, nước hoa nữ, nước hoa đôi, nước hoa mini và nước hoa trẻ em Ngoài ra, còn có các sản phẩm chăm sóc cá nhân có hương thơm như sữa dưỡng thể, lăn khử mùi, phấn thơm và sữa tắm.

Ngành hàng thời trang bao gồm các sản phẩm như túi xách nữ, ví nữ, ví nam, dây lưng, trang sức, đồng hồ, trang phục lót và khăn quàng cổ Thông tin sản phẩm thời trang cần có mã sản phẩm, tên, kiểu dáng, màu sắc, chất liệu, kích thước, thương hiệu, giá nhập, giá bán và xuất xứ Ngành hàng nước hoa cung cấp thông tin về mã sản phẩm, tên, mùi hương, kiểu dáng, dung tích, màu sắc, thành phần, thương hiệu, xuất xứ, giá nhập và giá bán Đối với ngành hàng mỹ phẩm, thông tin bao gồm mã sản phẩm, tên, thành phần, trọng lượng, mùi hương, màu sắc, kiểu dáng, thương hiệu, xuất xứ, giá nhập và giá bán.

Tại cửa hàng, sản phẩm được trưng bày một cách có tổ chức trong tủ kính, phân loại rõ ràng theo từng nhóm Nước hoa được sắp xếp trong tủ treo tường, với nước hoa nam ở bên trái và nước hoa nữ ở bên phải Các sản phẩm trang điểm được bày trên tủ ba tầng ở giữa cửa hàng: tầng 1 cho son môi và các sản phẩm nhỏ, tầng 2 cho phấn mắt và kem nền, và tầng 3 cho các sản phẩm lớn hơn Thời trang như túi xách và ví được trưng bày riêng trong tủ đứng, với ví nam và nữ ở các tầng khác nhau, trong khi thắt lưng được treo bên cạnh tủ túi xách.

Mỗi sản phẩm đều được ghi rõ thông tin cần thiết như tên sản phẩm, dung tích, công dụng, hướng dẫn sử dụng, ngày sản xuất, hạn sử dụng, nhà phân phối, nơi sản xuất, tên hãng và giá bán niêm yết bởi cửa hàng.

Cửa hàng quản lý hàng hóa hiệu quả bằng cách ghi chép thông tin sản phẩm vào sổ Các thông tin quan trọng được lưu trữ bao gồm mã sản phẩm, tên sản phẩm, thương hiệu, xuất xứ, giá bán, giá khuyến mại, số lượng và loại sản phẩm.

Hầu hết các sản phẩm đều được gán một mã sản phẩm theo quy định của nhà sản xuất, và mã này thường được in trực tiếp trên bao bì Tuy nhiên, một số sản phẩm không có mã, do đó cửa hàng sẽ tự tạo mã cho các sản phẩm này.

The store offers a diverse range of products from various brands, including cosmetics from well-known names like AVON, ORIFLAME, ESSANCE, NARIS, OHUI, SKINFOOD, THE FACE SHOP, E’Z UP, MISO, POND’S, ETUDE, LOREAL, NIVEA, ROHTO, VOV, AMWAY, DAVINES, TONYMOLY, XMEN, JOHNSON, and MAYBELLINE Additionally, it features fragrance brands such as SOPHIE, AVON, ORIFLAME, and JOHNSON, as well as fashion brands like SOPHIE and ALAMODE.

Các sản phẩm đến từ nhiều quốc gia như Philippines, Thụy Điển, Hàn Quốc, Trung Quốc, Việt Nam và Thái Lan Mặc dù thuộc cùng một thương hiệu, những mặt hàng này có thể được sản xuất tại các quốc gia khác nhau.

Hầu hết các sản phẩm đều có giá bán do nhà phân phối quy định, và cửa hàng chỉ bán với mức giá không vượt quá giá niêm yết Đối với những sản phẩm không có giá niêm yết, cửa hàng sẽ tham khảo giá từ các cửa hàng khác và so sánh với các mặt hàng tương tự để đưa ra mức giá hợp lý Khi nhà phân phối có chương trình khuyến mại, cửa hàng sẽ áp dụng đúng theo chương trình đó để phục vụ khách hàng Bên cạnh đó, để kích cầu tiêu dùng, cửa hàng cũng giảm giá cho những sản phẩm tồn kho, bán chậm hoặc có hạn sử dụng ngắn trong các dịp lễ tết.

Nhiều khách hàng có cơ hội mua hàng với giá rẻ hơn, đặc biệt là những khách hàng quen thuộc, bạn bè, người thân, hoặc những người mua nhiều sản phẩm cùng lúc Ngoài ra, khách hàng thường xuyên quay lại cũng có thể nhận được ưu đãi giảm giá Trong một số trường hợp, việc mặc cả cũng có thể dẫn đến mức giá thấp hơn để làm hài lòng khách hàng, với mức giảm giá tối đa lên đến 10%.

Mỗi tháng, cửa hàng tiến hành nhập hàng từ các nhà cung cấp dựa trên mức tiêu thụ, lợi nhuận, chương trình khuyến mãi và thời điểm trong năm Trong quá trình nhập hàng, mức độ tiêu thụ được coi là tiêu chí quan trọng nhất, giúp cửa hàng đảm bảo số lượng hàng hóa phù hợp với nhu cầu của khách hàng.

Khi cần nhập hàng, người quản lý sẽ liên hệ với nhân viên phân phối để lấy thông tin về hàng hóa và chương trình khuyến mại từ nhà cung cấp Thông thường, người quản lý yêu cầu nhân viên gặp trực tiếp để kê đơn hàng, bao gồm các thông tin như tên hàng, số lượng, đơn giá và khuyến mại.

Định nghĩa bài toán

Cửa hàng MYPHAMTHUHANG.COM cần xây dựng một hệ thống phần mềm kinh doanh hoàn toàn mới, vì hiện tại chưa có phần mềm hỗ trợ nào Hệ thống này sẽ được phát triển dựa trên các mô hình bán hàng hiện có từ những cơ sở kinh doanh khác, đồng thời kết hợp với nhu cầu cụ thể của cửa hàng.

Hệ thống bán hàng (HBH) là phần mềm thiết yếu giúp lưu trữ và xử lý thông tin trong hoạt động kinh doanh của cửa hàng Nó bao gồm các chức năng quản lý như nhập xuất hàng, quản lý khách hàng, nhân viên, báo cáo, mặt hàng và nhà cung cấp.

Tăng cường tự động hóa quy trình bán hàng giúp ghi nhận nhanh chóng các thông tin như loại sản phẩm, mô tả, số lượng, giá bán và thành tiền, từ đó đáp ứng tốt hơn nhu cầu của khách hàng Việc phân tích và xử lý kết quả bán hàng một cách nhanh chóng và chính xác hỗ trợ doanh nghiệp trong việc ra quyết định kinh doanh Hệ thống tự động kiểm kê hàng hóa trong kho giúp theo dõi các mặt hàng bán chạy và tồn kho, từ đó đưa ra các quyết định kịp thời nhằm tối ưu hóa hoạt động kinh doanh.

Cập nhật thông tin cửa hàng nhanh chóng, chính xác và đồng bộ giúp nâng cao hiệu quả bán hàng Việc thực hiện mua sắm trực tuyến mang lại sự tiện lợi cho khách hàng, cho phép họ mua sắm mà không cần đến siêu thị, từ đó tiết kiệm thời gian và công sức.

Xác định các ca sử dụng và tác nhân

3.3.1 Danh sách các ca sử dụng

Hệ thống có 14 ca sử dụng:

9 Quản lý nhà cung cấp

10 Quản lý đơn đặt hàng

3.3.2 Danh sách các tác nhân tham gia ca sử dụng

Người dùng: khi khách hàng đăng kí thành công thì sẽ trở thành người dùng của hệ thống, người dùng thực hiện được những thao tác như sau:

- Đăng nhập: Người dùng thực hiện thao tác đăng nhập bằng cách chọn chức năng

Khi người dùng nhấn vào “đăng nhập”, một form sẽ xuất hiện để họ nhập tên đăng nhập và mật khẩu Hệ thống sẽ kiểm tra tính hợp lệ của tài khoản; nếu tên đăng nhập và mật khẩu khớp, người dùng sẽ nhận thông báo đăng nhập thành công Ngược lại, nếu thông tin không chính xác, hệ thống sẽ yêu cầu nhập lại cho đến khi đăng nhập thành công.

- Đăng xuất: Khi người dùng muốn đăng xuất khỏi tài khoản phải chọn chức năng

Khi người dùng chọn "đăng xuất", hệ thống sẽ hiển thị thông báo xác nhận để hỏi có muốn thoát không Nếu người dùng nhấn "có", hệ thống sẽ cho phép đăng xuất và đưa người dùng trở lại trang chủ Ngược lại, nếu chọn "không", trạng thái đăng nhập cuối cùng của người dùng sẽ được giữ nguyên.

Để cập nhật thông tin cá nhân, người dùng có thể thay đổi các thông tin linh động như số điện thoại, địa chỉ cư trú và mật khẩu tài khoản Để thực hiện, hãy chọn chức năng "cập nhật thông tin cá nhân" hoặc "thay đổi mật khẩu", sau đó nhấn nút "lưu" để hoàn tất quá trình thay đổi.

“hủy” nếu không muốn thay đổi nữa.

- Xem thông tin: từ trang chủ của chương trình người dùng có thể xem thông tin như: xem thông tin sản phẩm, xem tin tức

Người dùng có thể dễ dàng tìm kiếm thông tin sản phẩm bằng cách nhập từ khóa vào ô tìm kiếm và nhấn nút “tìm kiếm” Ngay lập tức, hệ thống sẽ hiển thị danh sách các sản phẩm phù hợp với yêu cầu của người dùng.

Đặt hàng online rất đơn giản: người dùng chỉ cần chọn nút mua hàng bên cạnh sản phẩm muốn mua để thêm vào giỏ hàng Sau khi hoàn tất việc chọn sản phẩm, hãy chuyển đến trang quản lý giỏ hàng để xem và chỉnh sửa nếu cần Cuối cùng, nhấn nút gửi đơn đặt hàng để hoàn tất quá trình mua sắm.

Khách hàng là những người dùng tạm thời truy cập vào hệ thống, với các chức năng cơ bản như đăng ký, xem và tìm kiếm sản phẩm.

Nhân viên: là tác nhân kế thừa từ người dùng, là những người được hệ thống phục vụ để thực hiện thêm các chức năng sau:

- Quản lý sản phẩm: thực hiện thêm, sửa, xóa sản phẩm

- Quản lý nhà cung cấp: thực hiện các nghiệp vụ thêm, sửa, xóa thông tin nhà cung cấp

- Quản lý tin tức: thực hiện các nghiệp vụ thêm, sửa, xóa tin tức

- Quản lý đơn đặt hàng: thực hiện các nghiệp vụ thêm, sửa, xóa thông tin các đơn đặt hàng

Người quản trị: Quản trị là người dùng của hệ thông (vì thế nó có quyền của người dùng) và nó thực hiện thêm các chức năng sau:

Quản lý quyền trong hệ thống sẽ được thực hiện dựa trên chức năng của từng người dùng, bao gồm nhân viên, quản lý và khách hàng Bảng phân quyền sẽ ghi rõ mã chức vụ, tên chức vụ và danh sách các quyền mà từng đối tượng có thể thao tác trên hệ thống.

Quản lý người dùng bao gồm các chức năng như thêm, sửa và xóa người dùng, cũng như kiểm tra thông tin tài khoản từ cơ sở dữ liệu Thông tin người dùng cần được quản lý bao gồm mã người dùng và tên, đảm bảo tính chính xác và an toàn cho hệ thống.

Nhà quản lý là người kế thừa thông tin từ người dùng và được cấp quyền truy cập hệ thống để xem các báo cáo thống kê, bao gồm hàng nhập, hàng xuất, hàng tồn và doanh thu Nhờ vào những dữ liệu này, nhà quản lý có thể đưa ra các quyết định kinh doanh chính xác và hiệu quả.

Biểu đồ ca sử dụng tổng quát

Hình 9: Biểu đồ ca sử dụng tổng quát

Đặc tả các ca sử dụng

3.5.1 Ca sử dụng : Cập Nhật Tài Khoản

 Tên gọi: Cập nhật tài khoản

Người dùng có thể dễ dàng sửa đổi thông tin cá nhân của mình, bao gồm địa chỉ, số điện thoại và mật khẩu, khi có nhu cầu thay đổi.

 Các tác nhân: Người Dùng (bao gồm Khách Hàng, Nhân Viên, Người Quản Lý, Người Quản Trị)

 Tiền điều kiện: Người dùng đã đăng nhập hệ thống

Khi người dùng nhấn vào nút “tài khoản”, hệ thống sẽ hiển thị trang tài khoản cá nhân, nơi họ có thể cập nhật thông tin tài khoản hoặc thay đổi mật khẩu.

Khi người dùng chọn chức năng cập nhật thông tin, hệ thống sẽ hiển thị các thông tin như Tên đăng nhập, Họ, Tên, Ngày sinh, Số CMND, Email, Địa chỉ cư trú và Điện thoại Người dùng có thể thay đổi mọi thông tin ngoại trừ tên đăng nhập Sau khi thực hiện thay đổi, người dùng cần nhấn nút lưu; hệ thống sẽ kiểm tra tính hợp lệ của thông tin Nếu thông tin hợp lệ, hệ thống sẽ cập nhật vào cơ sở dữ liệu và thông báo cập nhật tài khoản thành công, đồng thời hiển thị thông tin vừa cập nhật Nếu không hợp lệ, hệ thống sẽ thông báo lỗi Trong trường hợp người dùng không muốn tiếp tục cập nhật, họ có thể nhấn nút hủy để quay về trang tài khoản mà không có thay đổi nào được thực hiện.

Khi người dùng chọn chức năng thay đổi mật khẩu, hệ thống sẽ yêu cầu nhập mật khẩu cũ, mật khẩu mới và xác nhận mật khẩu mới Sau khi nhập, hệ thống sẽ kiểm tra tính hợp lệ của thông tin, bao gồm việc xác minh mật khẩu cũ và đảm bảo mật khẩu mới trùng khớp với xác nhận Nếu thông tin hợp lệ, hệ thống sẽ cập nhật vào cơ sở dữ liệu và thông báo thành công; nếu không, hệ thống sẽ hiển thị thông báo lỗi tương ứng.

3.5.2 Ca sử dụng : Đặt hàng online

+ Tên gọi: Đặt hàng online

+ Mục đích: người dùng có thể đặt hàng khi họ muốn mua

 Tiền điều kiện: Người dùng đã đăng nhập hệ thống

 Hậu điều kiện: Đơn hàng được lưu trữ vào cơ sở dữ liệu

Khi người dùng muốn mua sản phẩm từ danh sách, họ chỉ cần nhấn nút mua hàng tương ứng Hệ thống sẽ hiển thị trang giỏ hàng với các thông tin chi tiết như tên sản phẩm, số lượng, giá tiền, khuyến mại và tổng tiền đơn hàng Tại trang giỏ hàng, người dùng có thể xem danh sách sản phẩm đã chọn, cập nhật giỏ hàng, gửi đơn hàng hoặc hủy giỏ hàng nếu cần.

Nếu người dùng muốn mua thêm sản phẩm, họ chỉ cần nhấn nút "tiếp tục mua hàng" Sau đó, hệ thống sẽ chuyển hướng đến trang danh sách sản phẩm để người dùng có thể tiếp tục lựa chọn.

Để cập nhật giỏ hàng, người dùng có thể trực tiếp chỉnh sửa số lượng sản phẩm trong danh sách giỏ hàng Nếu muốn hủy một sản phẩm, người dùng chỉ cần nhấn vào nút X tương ứng với sản phẩm đó Sau khi hoàn tất chỉnh sửa, người dùng hãy nhấn nút “Cập nhật” để hệ thống tiến hành cập nhật lại danh sách sản phẩm trong giỏ hàng.

- Khi người dùng chắc chắn với danh sách sản phẩm trong giỏ hàng thì click vào nút

Hệ thống hiển thị trang thông tin đặt hàng bao gồm thông tin người đặt hàng bên trái và yêu cầu nhập thông tin giao hàng bên phải, bao gồm: Tên người nhận, Địa chỉ giao hàng, Điện thoại, Ngày nhận và Yêu cầu Sau khi hoàn tất thông tin giỏ hàng, người dùng nhấn nút “Đặt hàng” để xác nhận gửi đơn hàng Nếu chọn “Đồng ý”, hệ thống sẽ lưu đơn đặt hàng vào cơ sở dữ liệu và thông báo đặt hàng thành công Ngược lại, nếu không muốn tiếp tục gửi đơn hàng, người dùng có thể chọn “Hủy” để không lưu đơn và quay lại trang đặt hàng.

3.5.3 Ca sử dụng: Đăng ký tài khoản

+ Tên gọi: Đăng kí tài khoản

+ Mục đích: gúp khách hàng đăng kí tài khoản để trở thành thành viên của hệ thống(tên đang nhập, mật khẩu)

 Các tác nhân: Khách hàng

 Tiền điều kiện: Khách hàng đã truy cập hệ thống

 Hậu điều kiện: khách hàng có một tài khoản (tên đăng nhập, mật khẩu) để đăng nhập hệ thống và đặt hàng

Khi khách hàng muốn mua hàng trên hệ thống, họ cần đăng ký tài khoản bằng cách nhấn nút “Đăng Kí” Trang đăng ký yêu cầu nhập thông tin như Tên đăng nhập, Họ tên, Ngày sinh, Số CMND, Email, Địa chỉ cư trú, Điện thoại, Mật khẩu và mã bảo vệ, trong đó các ô có dấu (*) là bắt buộc Sau khi điền đầy đủ thông tin và đồng ý với các thỏa thuận, khách hàng nhấn “Đăng ký” Hệ thống sẽ kiểm tra tính hợp lệ của thông tin; nếu hợp lệ, thông tin sẽ được lưu trữ và thông báo đăng ký thành công sẽ được hiển thị, đồng thời chuyển hướng về trang sản phẩm Nếu thông tin không hợp lệ, hệ thống sẽ thông báo lỗi tương ứng Nếu khách hàng quyết định không muốn đăng ký nữa, họ có thể nhấn nút hủy, và thông tin sẽ không được lưu trữ.

3.5.4 Ca sử dụng : Xem sản phẩm

 Tên gọi: Xem sản phẩm

 Mục đích: Hiển thị thông tin sản phẩm cho người dùng xem

 Các tác nhân: Người dùng, khách hàng

 Tiền điều kiện: Người dùng đã truy cập hệ thống

 Hậu điều kiện: Người dùng xem được ảnh cùng với thông tin chi tiết của sản phẩm

Người dùng có thể dễ dàng truy cập vào menu danh mục sản phẩm để xem danh sách các loại sản phẩm có sẵn Sau khi chọn loại sản phẩm mong muốn, hệ thống sẽ hiển thị tất cả các sản phẩm thuộc loại đó Để xem thông tin chi tiết về một sản phẩm cụ thể, người dùng chỉ cần nhấp vào tên hoặc ảnh của sản phẩm, và hệ thống sẽ cung cấp thông tin chi tiết như mã sản phẩm, tên sản phẩm, ảnh sản phẩm, thông tin, giá bán, khuyến mại và mô tả.

(from Use Case Vi ew)

3.5.5 Ca sử dụng : Tìm kiếm sản phẩm

 Tên gọi: Tìm Kiếm sản phẩm

 Mục đích: Hiển thị danh dách sản phẩm người dùng cần tìm kiếm

 Các tác nhân: Người dùng, khách hàng

 Tiền điều kiện: Người dùng truy cập vào hệ thống

 Hậu điều kiện: Hiển thị kết quả tìm kiếm mà người dùng mong muốn

Khi người dùng muốn tìm kiếm sản phẩm trong hệ thống, họ chỉ cần nhập thông tin sản phẩm vào ô từ khóa và nhấn nút “Tìm kiếm” Ngay lập tức, hệ thống sẽ hiển thị danh sách các sản phẩm liên quan đến từ khóa đã nhập.

Khi hệ thống không tìm thấy thông tin phù hợp với từ khóa mà người dùng đã nhập, nó sẽ hiển thị thông báo "không có sản phẩm nào được tìm thấy."

3.5.6 Ca sử dụng : Báo cáo thống Kê

+ Tên gọi: Báo cáo thống kê

+ Mục đích: Báo cáo thống kê danh sách sản phẩm bán chạy, nhập, xuất, tồn, doanh thu ……

+ Tác nhân: Người Quản Lý

 Tiền điều kiện: Người Quản Lý đã đăng nhập hệ thống

Nếu thống kê được thực hiện thành công, Người Quản Lý có khả năng chọn tiêu chí thống kê, và hệ thống sẽ tự động liệt kê danh sách thống kê dựa trên lựa chọn đó.

Người Quản Lý có thể truy cập chức năng THỐNG KÊ để hiển thị trang tra cứu thống kê Tại đây, Người Quản Lý sẽ chọn các tiêu chí thống kê như doanh thu và mặt hàng để thu thập thông tin cần thiết.

Người dùng có thể chọn thời gian thống kê, bao gồm thời gian bắt đầu và kết thúc, hoặc theo quý, tháng Sau khi nhấn nút thống kê, hệ thống sẽ hiển thị thông tin tương ứng Quản lý có thể lưu và in báo cáo nếu cần, và hệ thống sẽ tự động tạo phiếu thống kê.

 Ngoại lệ: Nếu trong quá trình chọn tiêu chí thống kê, Người Quản Lý hủy bỏ việc thống kê thì chức năng Thống kê kết thúc

3.5.7 Ca sử dụng : Quản Lý Người dùng

 Tên gọi: Quản lý người dùng

 Mục đích: Cập nhật thông tin người dùng

 Tác nhân: Người quản trị

 Tiền điều kiện: Người quản trị đã đăng nhập hệ thống

 Hậu điều kiện: Sau khi thực hiện ca Quản lý Người dùng:

Nếu thực hiện Thêm Người dùng thì Người dùng sẽ được cấp mới tài khoản

Nếu thưc hiện Cập nhật Người dùng thì thông tin Người dùng được cập nhật

NẾu thực hiện Loại bỏ Người dùng thì tài khoản của Người dùng sẽ bị xóa

Cơ sở dữ liệu vật lý và giao diện web

Trang 3:Trang chi tiết sản phẩm

Ứng dụng mô hình giải thuật vào bài toán

3.7.1 Ứng dụng mạng neuron để dự báo cho bài toán bán

Hàng tuần, cửa hàng nhập mỹ phẩm để bán, nhưng việc xác định số lượng nhập mỗi loại là một thách thức Nhập quá ít có thể dẫn đến thiếu hàng, trong khi nhập quá nhiều sẽ gây tồn kho và lỗ vốn Giải pháp hiệu quả cho vấn đề này là sử dụng mạng neuron để dự báo lượng mỹ phẩm cần nhập cho tuần tới Mỗi tuần, cửa hàng thống kê số lượng bán của từng loại mỹ phẩm trong tuần đó Mạng neuron MLP với thuật toán lan truyền ngược sai số sẽ được áp dụng, với đầu vào là số lượng bán của mỗi loại trong 9 tuần trước Mạng neuron sẽ có 9 đầu vào và 1 đầu ra dự báo lượng bán cho tuần tới Qua thực nghiệm, số nút lớp ẩn tối ưu là 5 và tốc độ học 0.1 mang lại tốc độ hội tụ nhanh nhất Mỗi loại mỹ phẩm sẽ được khởi tạo một mạng neuron riêng.

Để đảm bảo đầu ra của mạng neuron nằm trong khoảng (0,1) khi sử dụng hàm truyền simon, cần chuẩn hóa đầu vào dữ liệu về cùng khoảng này Trước khi đưa tập số liệu vào mạng neuron để học, chúng ta cần chuẩn hóa giá trị của tập số liệu theo công thức: X=(x-x_min)/(x_max-x_min) Sau khi tính toán được giá trị đầu ra, chúng ta có thể chuyển đổi nó trở lại bằng công thức: x=X*(x_max-x_min)+x_min.

Giá trị dự báo phải là 1 số nguyên dương Ta sẽ ép kiểu số nguyên cho x

Xác định dữ liệu đầu vào, và đầu ra mong muốn để tiến hành huấn luyện cho mạng noron.

Trước khi tiến hành dự báo, các dữ liệu đầu vào cần được xử lý và đạt tiêu chuẩn yêu cầu Cụ thể, dữ liệu đầu vào về giá trị 9 tuần của sản phẩm phải được chuẩn hóa ở dạng (1,0).

 Đầu ra mong muốn : giá trị dự báo trong khoảng (0,1)

Xác định cấu trúc mạng

- Mạng neural được xây dựng dựa trên phương pháp học có giám sát.

- Bài toán lựa chọn mạng Feed – forward 3 lớp với cấu trúc như sau:

- Số neural lớp đầu vào là 9 neural

- Số neural lớp ẩn là 5 neural

- Số neural lớp ra là 1 neural

Thuật toán huấn luyện mạng

Mạng feed- forward sử dụng giải thuật lan truyền ngược sai số Back Propagation.

-Lan truyền xuôi đầu vào qua mạng.

Sử dụng các công thức :

Công thức chung tính đầu ra của một noron thứ i tại lớp thứ k: public void forward(double[] x)

Tính toán sai lệch giữa đầu ra thực và đầu ra mong muốn của noron thứ k tại đầu ra. public void back(double[] x, double[] t)

{ for (int j = 1; j

Ngày đăng: 22/12/2021, 09:11

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[4]. Cannady, J., 1998, “Artificial Neural Networks for Misuse Detection,”Proceedings, National Information Systems Security Conference (NISSC’98), October, Arlington, VA Sách, tạp chí
Tiêu đề: Artificial Neural Networks for Misuse Detection
[5]. A.Sung &amp; S.Mukkamala, "Identifying important features for intrusion detection using SVM and neural networks,” in symposium on application and the Internet Sách, tạp chí
Tiêu đề: Identifying important features for intrusiondetection using SVM and neural networks
[6]. K.M.Faroun, A.Boukelif, "Neural network learning improvement using K- means clustering algorithm to detect network intrusions”, April17, 2006,http://www.dcc.ufla.br/infocomp/artigos/v5.3/art04.pdf Sách, tạp chí
Tiêu đề: Neural network learning improvement using K-means clustering algorithm to detect network intrusions
[7]. Xiao-Yan YANG, Kun GAO, Wei-gang ZHANG, “Study of Intrustion Detection System Based on Improved BP Neural Networks”, school of Computer Science and Information Technology, Zhejiang Wanli University Sách, tạp chí
Tiêu đề: Study of IntrustionDetection System Based on Improved BP Neural Networks
[9]. Hua Jiang, Junhu Ruan, “The Application of Genetic Neural Network in Network Intrusion Detection”, School of Economics and Management, Hebei University of Engineering, Handan, China Sách, tạp chí
Tiêu đề: The Application of Genetic Neural Network inNetwork Intrusion Detection
[18] “Hidden Markov Model for Information Extraction”, Trương Công Nguyên Thanh Báo cáo Seminar công nghệ tri thức, Đại học CNTT HCM Sách, tạp chí
Tiêu đề: Hidden Markov Model for Information Extraction
[10]. Genevieve Orr, Nici Schraudolph and Fred Cummins http://www.willamette.edu/~gorr/classes/cs449/intro.html Link
[11]. Christos Stergiou and Dimitrios Siganos. Neural Networks.http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html Link
[1]. ZHENG, H.L. Yang: Implementation of Intrusion Detection Classifier System Based on the BP Network, Journal of Hefei University of Technology (2003) Khác
[2]. GUO, C.Y., YU X.L.: An Intrusion Detection Model Based on Neural Network, Journal of Taiyuan University of Technology (2001) Khác
[3]. WANG, X.D.,SHE, K.: Intelligent IDS Based on BP Neural Network, Journal of Chendou University of Information Technology (2005) Khác
[8]. Arvind Rapaka, Alexander Novokhodko, Donald Wunsch,”Intrusion Detection Using Radial Basic Function Network on Sequences of System Calls”, Applied Computational Intelligence Laboratory, University of Missouri-Rolla Department of Electrical and Computer Engineering Khác
[12]. Nikola K. Kasabov. Foundations of Neural Networks, Fuzzy Systems, and Knowledge Engineering. Massachusetts Institute of Technology Khác
[13]. Daniel Delic, Hans-J. Lenz, and Mattis Neiling. Improving the Quality of Association Rule Mining by Means of Rough Sets. First International Workshop on Soft Methods in Probability and Statistics SMPS 2002 , Warsaw (Poland) September 9- Khác
[14]. Jiye Li. Rough Set Based Rule Evaluations and Their Applications. PhD thesis, University of Waterloo, Ontario, Canada, pp.41-111,2007 Khác
[15]. Mika Klemettinen, Heikki Mannila, Pirjo Ronkainen, Hannu Toivonen, and A.Inkeri Verkamo. Finding interesting rules from large sets of discovered association rules. Third International Conference on Information and Knowledge Management (CIKM’94), pages 401–407. ACM Press, 1994 Khác
[16]. R. Agrawal and R. Srikant, Fast Algorithms for Mining Association Rules, In Proceedings of the International Conference on Very Large Databases, 1994, pp. 487- 499 Khác
[17]. Bài nghiên cứu khoa học: Neural networks - kỹ thuật và ứng dụng nâng cao hiệu năng của hệ thống phát hiện xâm nhập – Phan Thanh Nam Khác
[19]. Luận văn cao học: Ứng dụng mạng noron truyền thẳng trong dự báo dữ liệu - Trần Đức Minh viện Công nghệ thông tin, Viện khoa học và công nghệ Việt Nam Khác

HÌNH ẢNH LIÊN QUAN

Hình 1: Phân lớp dữ liệu khách hàng - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
Hình 1 Phân lớp dữ liệu khách hàng (Trang 8)
Hình 2: Cấu trúc của một nơron sinh học điển hình Mỗi nơron sinh học có 3 thành phần cơ bản:  • Các nhánh vào hình cây ( dendrites)  - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
Hình 2 Cấu trúc của một nơron sinh học điển hình Mỗi nơron sinh học có 3 thành phần cơ bản: • Các nhánh vào hình cây ( dendrites) (Trang 15)
Hình 3: Nơron nhân tạo - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
Hình 3 Nơron nhân tạo (Trang 16)
Hình 4: Mạng tự kết hợp - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
Hình 4 Mạng tự kết hợp (Trang 18)
2.1.3. Các kiểu mô hình mạng nơron - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
2.1.3. Các kiểu mô hình mạng nơron (Trang 18)
Mô hình mạng nơron được sử dụng rộng rãi nhất là mô hình mạng nhiều tầng truyền thẳng (MLP: Multi Layer Perceptron) - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
h ình mạng nơron được sử dụng rộng rãi nhất là mô hình mạng nhiều tầng truyền thẳng (MLP: Multi Layer Perceptron) (Trang 19)
Hình 7: Các kỹ thuật phân cụm - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
Hình 7 Các kỹ thuật phân cụm (Trang 34)
Hình 8: Ví dụ minh họa thuật toán K-Mean - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
Hình 8 Ví dụ minh họa thuật toán K-Mean (Trang 36)
Bảng biểu 4: Giá trị bảng so sánh chuối kí tự - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
Bảng bi ểu 4: Giá trị bảng so sánh chuối kí tự (Trang 42)
Hình 9: Biểu đồ ca sử dụng tổng quát - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
Hình 9 Biểu đồ ca sử dụng tổng quát (Trang 53)
Hình 11: Minh họa giải thuật áp dụng vào bài - ỨNG DỤNG CÁC GIẢI THUẬT KHAI THÁC DỮ LIỆU TRONG XÂY DỰNG TRANG THƯƠNG MẠI ĐIỆN TỬ Ở VIỆT NAM
Hình 11 Minh họa giải thuật áp dụng vào bài (Trang 76)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w