Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 23 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
23
Dung lượng
655 KB
File đính kèm
code.rar
(8 MB)
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC ——–*——– BÁO CÁO HỌC PHẦN HỆ HỖ TRỢ QUYẾT ĐỊNH ĐỀ TÀI: HỆ HỖ TRỢ MARKETING Nguyễn Thị Liên - 20162356 Lớp: Toán Tin K61 Giảng viên hướng dẫn: Thầy Lê Chí Ngọc Hà Nội - 2020 Mục lục Lời nói đầu Khảo sát trạng 1.1 Giới thiệu 1.2 Mô tả liệu 1.3 Phương pháp nghiên cứu Phân tích hệ thống 11 2.1 Sơ đồ phân cấp chức 11 2.2 Biểu đồ usecase 12 2.3 Biểu đồ luồng liệu 13 2.3.1 Biểu đồ mức ngữ cảnh 13 2.3.2 Biểu đồ mức đỉnh 13 Thiết kế hệ thống 14 3.1 Sơ đồ kiến trúc hệ thống 14 3.2 Giao diện người dùng 15 3.3 Ngôn ngữ viết chương trình 18 Kết luận 20 Tài liệu tham khảo 21 Chỉ mục 22 Lời nói đầu Trong thập niên gần đây, với tác động mạnh mẽ từ thay đổi phát triển ngành công nghệ thông tin, hệ thống liệu phục vụ cho lĩnh vực kinh tế - xã hội ngày mở rộng Sự bùng nổ mặt khối lượng đặt yêu cầu cấp thiết nhằm tạo công cụ để chuyển đổi liệu thành hiểu biết có ích Từ đó, hàng loạt lĩnh vực nghiên cứu tổ chức kho liệu, kho thơng tin, phân tích xử lý liệu, đời, số phân cụm liệu Các kỹ thuật áp dụng phân cụm liệu phần lớn kế thừa từ lĩnh vực thống kê, máy học, nhận dạng, Đến có nhiều ứng dụng việc phân cụm liệu cho việc giải vấn đề lĩnh vực tài chính, sinh học, địa lý, cơng nghệ thơng tin, Vì lý nêu trên, em định lựa chọn tìm hiểu nghiên cứu đề tài "Hệ hỗ trợ marketing " sử dụng thuật toán K-means phương pháp Elbow để phân cụm liệu với mục đích phân khúc khách hàng để đưa sách marketing phù hợp cho nhà quản lí Nội dung báo cáo em gồm chương: Chương 1: Khảo sát trạng Chương 2: Phân tích hệ thống Chương 3: Thiết kế hệ thống Em xin chân thành cảm ơn thầy Lê Chí Ngọc giúp em hồn thành báo cáo này! Chương Khảo sát trạng 1.1 Giới thiệu Phân khúc khách hàng (Customer segmentation) q trình phân nhóm khách hàng dựa đặc điểm chung hành vi, thói quen mua sắm sử dụng dịch vụ họ để công ty, doanh nghiệp tiếp thị cho nhóm khách hàng đưa phương pháp phân cụm (Clustering methods) thống kế học máy không giám sát (Unsupervised learning) Các thuật toán dùng K-means Elbow vốn thuật toán tiếng ứng dụng thành công nhiều lĩnh vực marketing, sinh học, thư viện, bảo hiểm, tài Mục đích việc phân cụm tìm phân khúc thị trường có ý nghĩa Phân tích khách hàng nhánh quan trọng việc phân tích liệu kinh doanh Tìm hiểu hành vi, ghi nhận thói quen mua sắm, nắm bắt sở thích khách hàng, v.v doanh nghiệp đầu tư nhằm tạo lợi cạnh tranh lâu dài Các doanh nghiệp hoạt động hướng tới mục tiêu lợi nhuận Lợi nhuận có ảnh hưởng quan trọng đến tăng trưởng phát triển doanh nghiệp Trong lĩnh vực bán lẻ, khách hàng có vai trò quan trọng việc tăng lợi nhuận Cần chế để chăm sóc khách hàng đưa chiến lược marketing phù hợp giúp tối đa lợi nhuận Bởi doanh nghiệp thường phải phân chia khách hàng thành nhóm có đặc điểm tương tự nhau, từ đưa chiến lược sản xuất, tiếp thị sản phẩm nhằm đáp ứng tốt nhu cầu mua sắm,tăng doanh thu công ty 1.2 Mô tả liệu Bộ liệu gồm 2264 ghi trường liệu thu thập từ trung tâm siêu thị Hình 1.1 Dữ liệu phân tích Ta có thơng tin cụ thể trường liệu sau: • khach hang : Mã khách hàng • thit-ca-trung: Tổng số tiền khách hàng chi tiêu cho nhóm sản phẩm thịt-cá-trứng • rau-cu-qua: Tổng số tiền khách hàng chi tiêu cho nhóm sản phẩm rau-củ-quả • cham soc ca nhan: Tổng số tiền khách hàng chi tiêu cho nhóm sản phẩm chăm sóc cá nhân • thuc pham kho: Tổng số tiền khách hàng chi tiêu cho nhóm sản phẩm thực phẩm khơ • uong: Tổng số tiền khách hàng chi tiêu cho nhóm sản phẩm đồ uống • hoa pham: Tổng số tiền khách hàng chi tiêu cho nhóm sản phẩm hóa phẩm 1.3 Phương pháp nghiên cứu Phương pháp nghiên cứu đề tài phương pháp phân cụm Phân cụm kỹ thuật Machine Learning phổ biến để phân tích liệu sử dụng nhiều lĩnh vực marketing,y tế, sinh học nghiên cứu kinh tế,tài Mục tiêu phân cụm tìm nhóm liệu tương đồng.Tuy nhiên, khơng có tiêu chí xem tốt để đánh giá hiệu phân cụm, điều phụ thuộc vào mục đích phân cụm Trong báo cáo này, em sử dụng phương pháp phân cụm phổ biến thuật toán K-means thuật toán Elbow để thực đề tài • Thuật tốn K-means K-means thuật toán quan trọng sử dụng phổ biến kỹ thuật phân cụm Tư tưởng thuật tốn K-means tìm cách phân nhóm đối tượng cho vào K cụm (K số cụm xác đinh trước, K nguyên dương) cho tổng bình phương khoảng cách đối tượng đến tâm nhóm nhỏ Ý tưởng: Với số cụm k cho trước, ta thực vòng lặp toán tối ưu: + Với tâm cụm cho trước (được chọn ngẫu nhiên), gắn nhãn cho điểm liệu cho khoảng cách từ điểm đến tâm nhãn nhỏ + Với điểm liệu nhãn, tìm tâm cụm nhãn cho khoảng cách từ tâm cụm đến điểm cụm nhỏ Thuật toán dừng tâm cụm sau vịng lặp liền khơng có thay đổi • Thuật toán Elbow Sử dụng thuật toán Elbow để lựa chọn số cụm phân tối ưu k cho liệu dựa số WSS (within cluster sum of square) - tổng khoảng cách từ điểm liệu đến tâm nhóm mà chúng gắn nhãn Chỉ số WSS - nhỏ xem độ tốt phù hợp liệu nhóm phân Tuy nhiên, việc lựa chọn số WSS dựa tùy chọn người, thông thường ta chọn vị trí k mà biến thiên WSS trước sau không lớn Hình 1.2 Thuật tốn Elbow 10 Chương Phân tích hệ thống 2.1 Sơ đồ phân cấp chức Hình 2.1 Sơ đồ phân cấp chức 11 2.2 Biểu đồ usecase Hình 2.2 Biểu đồ usecase 12 2.3 2.3.1 Biểu đồ luồng liệu Biểu đồ mức ngữ cảnh Hình 2.3 Biểu đồ mức ngữ cảnh 2.3.2 Biểu đồ mức đỉnh Hình 2.4 Biểu đồ mức đỉnh 13 Chương Thiết kế hệ thống 3.1 Sơ đồ kiến trúc hệ thống Hình 3.1 Sơ đồ kiến trúc hệ thống 14 3.2 Giao diện người dùng • Trang đăng nhập, tạo tài khoản Hình 3.2 Trang đăng nhập, tạo tài khoản • Trang chủ hệ thống Hình 3.3 Trang chủ 15 • Phân tích Hình 3.4 Phân cụm khách hàng Hình 3.5 Thống kê số lượng khách theo nhóm Hình 3.6 Giá trị trung bình nhóm hàng 16 Hình 3.7 Thơng tin khách hàng • Nhận xét Qua q trình phân tích thử nghiệm cách sử dụng thuật tốn K-means Elbow ta tìm số cụm thích hợp tương ứng với phân khúc khách hàng khác nhau.Từ tìm số phân khúc có ý nghĩa như: • Phân cụm : khách hàng tập trung vào mặt hàng chăm sóc cá nhân phẩm hóa phẩm • Phân cụm 1: khách hàng tập trung vào mặt hàng thịt cá trứng rau củ Đây khách hang chi trả cho mặt hang mà họ quan tâm mức trung bình nhiều! • Phân cụm 2: khách hàng mua đồ siêu thị mua với số tiền nhỏ Cụm ta cần quan tâm để họ mua nhiều 17 • Phân cụm 3: Đây khách hàng chi trả mức trung bình nhiều! Và ta cần có chiến lược giữ chân khách hàng cụm này! 3.3 Ngơn ngữ viết chương trình HTML HTML từ viết tắt HyperText Markup Language (ngôn ngữ đánh dấu siêu văn bản) dùng mô tả cấu trúc trang Web tạo loại tài liệu xem trình duyệt HTML tạo phát triển tổ chức W3C (World Wide Web Consortium) Hiện phiên HTML HTML5 với nhiều tính ưu việt so với phiên cũ CSS CSS (Cascading Style Sheets) ngôn ngữ định dạng sử dụng để mơ tả trình bày trang Web, bao gồm màu sắc, cách bố trí phơng chữ CSS cho phép chúng hiển thị nội dung tương thích loại thiết bị có kích thước hình khác nhau, chẳng hạn hình lớn, hình nhỏ điện thoại hay máy tính CSS độc lập với HTML sử dụng với ngôn ngữ đánh dấu xây dựng dựa XML CSS tuân theo chuẩn chung W3C quy định JavaScript JavaScript ngôn ngữ nhỏ nhẹ chạy mơi trường máy chủ lưu trữ (ví dụ: trình duyệt web), JavaScript kết nối với đối 18 tượng môi trường để cung cấp kiểm sốt chương trình chúng JavaScript cho phép thực hành động tạp trang web đồ tương tác v.v Javascript hỗ trợ tất trình duyệt Firefox, Chrome, v.v chí trình duyệt thiết bị di động có hỗ trợ Bootstrap Bootstrap framework cho phép thiết kế website reponsive nhanh dễ dàng Bootstrap bao gồm HTML templates, CSS templates Javascript tạo thành phần có sẵn như: typography, forms, buttons, tables, navigation, modals, image carousels nhiều thứ khác Trong bootstrap có thêm plugin Javascript giúp cho việc thiết kế reponsive dễ dàng nhanh chóng Django Django framework cho phép xây dựng trang web ngôn ngữ bậc cao Python Django xử lý nhiều vấn đề thường gặp việc phát triển web Do đó, người lập trình tập trung phát triển ứng dụng web nhanh chóng dễ dàng Python Python ngơn ngữ lập trình thơng dịch, hướng đối tượng ngôn ngữ bậc cao, ngữ nghĩa động Python hỗ trợ module gói, khuyến khích chương trình module hóa tái sử dụng mã Trình thơng dịch Python thư viện chuẩn mở rộng có sẵn dạng mã nguồn dạng nhị phân miễn phí cho tất tảng phân phối tự 19 Kết luận Trên nội dung báo cáo đề tài "Hệ hỗ trợ marketing" Trong báo cáo em phương pháp phân cụm thiết kế hệ thống phân cụm khách hàng phục vụ cho nhu cầu nhà quản lý, giúp quản lý cách hiệu quả, phương pháp để phân cụm, phân tích usecase, biểu đồ, cách thiết kế hệ thống Tuy đơn giản sử dụng với mục đích để minh họa, đánh giá đặc tính khách hàng hệ thống có tiềm phát triển lớn để phục vụ yêu cầu cao nhà quản lý Tuy nhiên, lực trình độ có hạn, nên q trình thực trình bày báo cáo khơng tránh khỏi thiếu sót Em kính mong nhận góp ý thầy để báo cáo hoàn thiện Em xin chân thành cảm ơn! 20 Tài liệu tham khảo [1] Nguyễn Văn Chức, Thuật toán K-Means với toán phân cụm liệu May 12, 2008 [2] Richard A.Johnson, Dean W.Wichern, Applided Multivariate Statistical Analysis, 6th Edition, Prentice Hall, New Jersey, 2007 21 Chỉ mục Bootstrap, 19 CSS, 18 Django, 19 Elbow, 6, 9, 17 HTML, 18 JavaScript, 18 K-means, 6, 9, 17 Phân cụm, 6, Python, 19 22 ... giải vấn đề lĩnh vực tài chính, sinh học, địa lý, cơng nghệ thơng tin, Vì lý nêu trên, em định lựa chọn tìm hiểu nghiên cứu đề tài "Hệ hỗ trợ marketing " sử dụng thuật toán K-means phương pháp Elbow... tất tảng phân phối tự 19 Kết luận Trên nội dung báo cáo đề tài "Hệ hỗ trợ marketing" Trong báo cáo em phương pháp phân cụm thiết kế hệ thống phân cụm khách hàng phục vụ cho nhu cầu nhà quản lý,... thực hành động tạp trang web đồ tương tác v.v Javascript hỗ trợ tất trình duyệt Firefox, Chrome, v.v chí trình duyệt thiết bị di động có hỗ trợ Bootstrap Bootstrap framework cho phép thiết kế website