1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo giữa kỳ lý thuyết và kỹ thuật phân tích dữ liệu khách hàng

31 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Báo Cáo Giữa Kỳ Lý Thuyết Và Kỹ Thuật Phân Tích Dữ Liệu Khách Hàng
Tác giả Nguyễn Thị Cõm Giang, Phạm Thị Quý Nhàn, Trương Thị Hiếu Ly, Hồ Thị Thựy Dung, Nguyễn Thị Thanh Ngõn Lờ, Quang Đăng Khoa
Người hướng dẫn Th.Š Tạ Nguyệt Phương
Trường học Đại Học Đà Nẵng
Chuyên ngành Quản Trị Quan Hệ Khách Hàng
Thể loại báo cáo
Năm xuất bản 2024
Thành phố Đà Nẵng
Định dạng
Số trang 31
Dung lượng 2,8 MB

Nội dung

Qua việc tông hợp và phân tích đữ liệu khách hàng, doanh nghiệp có thê nhận thức rõ hơn về người tiêu dùng, từ đó định hình được chiến lược kinh doanh, tối ưu hóa trải nghiệm khách hàng

Trang 1

LY THUYET VA KY THUAT PHAN TICH DU LIEU KHACH HANG

DAI HOC DA NANG TRUONG DAI HOC KINH TE KHOA THUONG MAI DIEN TU

BAO CAO GIUA KY

Nguyễn Thị Thanh Ngân

Lê Quang Đăng Khoa

Trang 2

LỜI MỞ ĐẦU

Trong thời đại kinh doanh số hiện đại, sự thay đổi không ngừng trong hành vi

và nhụ cầu của khách hàng đã tạo ra một bối cảnh cạnh tranh vô củng khốc liệt giữa các doanh nghiệp Đề tồn tại và phát triển trong một môi trường đây thách thức như vậy, việc nắm bắt và đáp ứng nhu câu thị trường là không thể phủ nhận Đề làm được điều đó, các doanh nghiệp hiện nay phải thay đổi cách suy nghĩ về CRM Nó không chỉ là một chiến lược mà còn là một yếu tố quyết định cho sự thành công của mọi doanh nghiệp

CRM không chỉ đơn thuần là việc thu thập đữ liệu về khách hàng, mà còn là trung tâm của việc thâu hiểu hành vi và nhu cầu của người tiêu dùng Qua việc tông hợp và phân tích đữ liệu khách hàng, doanh nghiệp có thê nhận thức rõ hơn về người tiêu dùng, từ đó định hình được chiến lược kinh doanh, tối ưu hóa trải nghiệm khách hàng và tăng cường hiệu suất hoạt động

Trong bối cảnh cạnh tranh khốc liệt của thị trường và dần chuyên đổi số hóa trên các nền tảng thương mại điện tử, khả năng phân tích đữ liệu từ CRM trở thành một công cụ quan trọng giúp doanh nghiệp định hình chiến lược kinh doanh, tối ưu hóa trải nghiệm khách hàng và tăng cường hiệu suất hoạt động

Ở bài báo cáo này, nhóm 3 sẽ nghiên cứu sâu hơn về cơ sở lý thuyết liên quan đến CRM phân tích và nghiên cứu về kỹ thuật REM phân tích dữ liệu khách hàng Từ việc phân tích các nhóm khách hàng và hiểu được xu hướng, hành vi của khách hàng

đề dự đoán va đưa ra các chiên lược trong tương lai gan

Trang 3

MỤC LỤC

1 Cơ sở lý thuyết Tổng quan về CRM định hướng dữ liệu - CRM phân tích

a CRM

b CRM phan tich

2 Vai trò của CRM phân tích đối với CRM tác nghiệp và CRM chiến lược

a Đối với CRM chiến lược

b Đối với CRM tác nghiệp

3 Quy trình khai phá dữ liệu trong CRM

a Kỹ thuật khai phá dữ liệu có hướng

- Cây quyết định

- Hỏi quy logistic

- Hỏi quy bội

- Mạng lưới thần kinh (còn gọi là mạng thần kinh nhân tạo hoặc ANN)

b Kỹ thuật khai phá dữ liệu vô hướng

- Phân cụm theo cấp bậc

- Phân cụm K-means

- Phân cụm hai bước

- Phân tích nhân tố

4 Trí tuệ nhân tạo, học máy và học sâu trong CRM

a AT- Artificial Intelligence

b ANN - Artificial Neural Network

Trang 4

1 Cơ sở lý thuyết Tổng quan về CRM định hướng dữ liệu - CRM phân tích

a CRM

CRM là một hệ thống thông tin tích hợp được sử dụng đề lập kế hoạch, lên lịch

và kiêm soát các hoạt động trước và sau bán hàng trong một tổ chức CRM bao gồm tất cả các khía cạnh của việc giao dịch với khách hàng tiềm năng và khách hàng, bao gồm trung tâm cuộc gọi, lực lượng bán hàng, tiếp thị, hỗ trợ kỹ thuật và dịch vụ tại hiện trường Mục tiêu chính của CRM là cải thiện khả năng tăng trưởng và lợi nhuận lâu dài thông qua sự hiểu biết tốt hơn về hành vi của khách hàng CRM nhằm mục đích cung cấp phản hỏi hiệu quả hơn và cải thiện khả năng tích hợp để đánh giá tốt hon lợi tức đầu tư (ROI) trong các lĩnh vực này

Hệ thống CRM giúp nhiều chức năng kinh doanh như kho dữ liệu, tự động hóa lực lượng bán hàng, khai thác đữ liệu, hỗ trợ ra quyết định và các công cụ báo cáo Như thê hiện trong hình dưới , chủ yếu có ba loại CRM: hệ thống vận hành, phân tích

và chiến lược (hoặc hợp tác: Collaborative) Hệ thông CRM tác nghiệp sử dụng tự động hóa tiếp thị, tự động hóa lực lượng bán hàng và tự động hóa dịch vụ Hệ thống CRM phân tích được sử dụng đề phân tích dữ liệu khách hàng và hệ thống CRMI chiến lược được sử dụng để quản lý và tích hợp các kênh truyền thông và các điểm tiếp xúc tương tác với khách hàng

Quy trinh CRM

OPERATIONAL CRM

+ T T —+#— I 4 Refined Business Access

Trang 5

thập, lưu trữ, xử lý, điễn giải và báo cáo đữ liệu khách hàng để nâng cao giá trị của cả khách hàng và công ty

CRM phân tích có thế giải quyết nhiều vấn đề kinh doanh, như tăng doanh số bán hàng, cung cấp phản hôi tốt hơn cho các thắc mắc của khách hàng qua điện thoại, email và thư trực tiếp Nó cũng giúp các công ty xác định những khách hàng mang lại lợi nhuận cao nhất và tác động đến họ đề có được sản phẩm hoặc dịch vụ của họ, cũng như tìm kiếm khách hàng trong tương lai Internet đã buộc các công ty phải chuyên trọng tâm tiếp thị của họ từ quy trình tiếp thị đại chúng truyền thống sang một cách tiếp cận mới để tiếp thị từng người một Người tiêu dùng ngày nay ngày cảng tính ví

và thông thái hơn, đo đó các công ty buộc phải cung cấp sản phâm và dịch vụ của mình theo nhu cầu của khách hàng Dữ liệu liên quan đến khách hàng có thế được tìm thấy trong một số kho lưu trữ của toàn doanh nghiệp: đữ liệu bán hàng (lịch sử mua hàng), dữ liệu tài chính (lịch sử thanh toán, điểm tín dụng), đữ liệu tiếp thị (phản hồi chiến dịch, đữ liệu chương trình khách hàng thân thiết) và đữ liệu dịch vụ Dữ liệu nội

bộ này có thể được thêm vào dữ liệu từ các nguồn bên ngoài, bao gồm các đối tác kinh doanh mà các công ty có thỏa thuận chia sẻ dữ liệu (tủy thuộc vào sự chấp nhận của khách hàng) và các tô chức bên thứ ba như các công ty nghiên cứu cung cấp dữ liệu địa lý nhân khẩu học và phong cách sống Đây là những bộ dữ liệu có cấu trúc điển hình được lưu giữ trong cơ sở dữ liệu quan hệ Việc thu thập dữ liệu hành vi và nhân khâu học của khách hàng cũng giúp đảm bảo nhắm mục tiêu chính xác, đây là mục tiêu chính của CRM phân tích

CRM phân tích cung cấp những hiểu biết sâu sắc hỗ trợ hoạt động và chiến lược thông minh Các quyết định của CRM, bao gồm câu trả lời cho các câu hỏi như

“Chúng ta nên phục vụ khách hàng nào?” và “Chúng ta nên đưa ra ưu đãi gì?” Từ quan điêm của khách hàng, CRM phân tích có thể cung cấp các giải pháp kịp thời, tùy chỉnh và phù hợp cho các vấn đề của khách hàng, từ đó Theo quan điểm của công ty, CRM phân tích mang lại triển vọng cho các chương trình cross-sell và up-sell mạnh

mẽ hơn cũng như các chương trình giữ chân khách hàng và thu hút khách hàng hiệu quả hơn Trong môi trường doanh nghiệp với doanh nghiệp (B2B), CRM phân tích có thể đặc biệt hữu ích vì nó có thể giúp quản lý các kế hoạch định giá phức tạp, các hợp đồng khách hàng khác nhau và nhiều giao dịch Cả công ty mua và bán đều có thể được hưởng lợi thông qua việc cải thiện hiệu quả và đơn giản hóa quy trình mua sắm

Trang 6

bằng cách sử dụng sản phẩm mục tiêu cung cấp cổng thông tin kinh doanh được cá nhân hóa và danh mục tủy chỉnh

2 Vai trò của CRM phân tích đối với CRM tác nghiệp và CRM chiến lược CRM liên kết các chức năng front-office và back-office với khách hàng CRM

là sự kết hợp của nhiều phương pháp quản lý tập trung vào khách hàng khác nhau, giúp xây đựng mối quan hệ lâu dài với khách hàng

Front Office | Back Office Peeler Analytical

Customer

x ` Data

` §trategy P

|

Mỗi quan hệ giữa CRM phân tích và CÑM tác nghiệp

CRM phân tích, còn được gọi la “back-office” cua CRM, chiu trach nhiém tim hiểu khách hàng thông qua việc thu thập và phân tích đữ liệu khách hàng băng cách sử dụng các ứng dụng dựa trên công nghệ khác nhau như phân tích ban hàng, phân tích

hồ sơ khách hàng, phân tích chiến dịch, phân tích liên hệ với khách hàng, phân tích

lòng trung thành cũng như phân tích lợi nhuận, trong khi CRM tác nghiệp - hay con gọi là “front-ofice” của CRM, chịu trách nhiệm hỗ trợ các tương tác giữa tô chức và khách hàng bằng cách củng cô niềm tin, tăng cường dịch vụ cho khách hàng, và CRM chiến lược - đề cập đến các chiến lược được tô chức sử dụng để xác định những khách hàng mang lại lợi nhuận và biến họ thành khách hàng trung thành bằng cách phát triển chiến lược kinh đoanh

Dữ liệu khách hàng là một yếu tố rất quan trọng trong việc quản trị quan hệ khách hàng Việc sử dụng thông tin khách hàng bằng cách thiết kế cơ sở đữ liệu khách hàng tốt sẽ giúp tổ chức xác định được những khách hàng mang lại lợi nhuận cho minh Hay noi cach khac, CRM phan tích hỗ trợ các tô chức thực hiện các định hướng

về chiên lược của họ và nâng cao các quy trình kinh doanh

Trang 7

a Đối với CRM chiến lược

CRM chiến lược tập trung vào phát triển hoạt động kinh doanh lấy khách hàng làm trung tâm nhằm giành và giữ khách hàng (có khả năng) sinh lời bằng cách tạo ra

va mang lai gia tri tốt hơn đối thủ cạnh tranh một cách hiệu quả về mặt chỉ phí hay nói cách khác là chiến lược hóa theo sau dé xác định những khách hàng có lợi nhuận nhăm biến họ thành khách hàng trung thành Thêm vào đó, CRM chiến lược liên quan đến các quyết định được đưa ra nhăm phát triển chiến lược kinh doanh của khách hàng, quy trình và văn hóa kinh doanh cũng như hỗ trợ các mô hình công nghệ, trong

khi CRM phân tích đề cập đến việc phân tích thông tin khách hàng và thị trường được

sử dụng đề đạt được mục tiêu chiến lược của công ty, tiếp thị

Phân tích dữ liệu liên quan đến khách hàng có thể giúp trả lời các câu hỏi quan trọng về chiến lược CRM như: chúng ta nên phục vụ khách hàng nào? tỷ lệ chi tiêu của khách hàng cho danh mục của công ty là bao nhiêu? khách hàng nghĩ gì và cảm nhận øì về trải nghiệm kinh doanh của họ với chúng ta? Phân nào trong đề xuất trị của chúng ta vượt trội hoặc kém hơn so với đối thủ cạnh tranh? Đối thủ cạnh tranh chính

là ai và điểm mạnh và điểm yếu của họ là gì? Khách hàng sử dụng dịch vụ của chúng

ta như thế nào và chúng ta có thể giúp họ thu được nhiều giá trị hơn như thể nào?

b Đối với CRM tác nghiệp

Việc tự động hóa hoạt động bán hàng, tiếp thị và dịch vụ khách hàng được thê hiện ở CRM tác nghiệp CRM tác nghiệp tượng trưng cho các quy trình kinh doanh được thực hiện đề đáp ứng các mục tiêu của mô hình quan hệ khách hàng

Phân tích dữ liệu liên quan đến khách hàng có thể giúp trả lời các câu hỏi quan trọng về CRM tác nghiệp như: chúng ta nên sử đụng kênh nào đề giao tiếp với khách hàng? Ưu đãi gì? Doanh nghiệp nên thực hiện như thế vào và khi nào nên thực hiện chúng? Hiệu suất bán hàng của đoanh nghiệp khác nhau như thế nào giữa các vùng lãnh thô và phạm vi sản phẩm, doanh nghiệp có thể khắc phục mọi vấn đề như thế nào? Doanh nghiệp quản lý đường dẫn cơ hội của mình tốt đến mức nào? Mức độ hải lòng của khách hàng với dịch vụ cung cấp và có thê làm gì đề cải thiện địch vụ đó? Ngoài ra, việc kết hợp CRM phân tích và CRM tác nghiệp cùng nhau có thể giúp nâng cao cơ hội cung cấp địch vụ cho khách hàng, từ đó làm tăng lợi tức đầu tư

(ROI).

Trang 8

CRM chiến lược với nhiệm vụ thu hút, giữ chân khách hàng có lợi nhuận, CRM phân tích là tra cứu các quyết định kinh doanh thông qua phân tích dữ liệu khách hàng và mục đích của CRM tác nghiệp là nâng cao hiệu quả hoạt động hằng ngày: hoạt động của khách hàng Thêm vào đó, CRM phân tích còn được sử dụng để

dự đoán hành vi khách hàng bằng cách sử dụng các hệ thống như lưu trữ dữ liệu, khai thác dữ liệu và xử lý phân tích trực tuyến (OLAP) và CRM tác nghiệp được sử dụng

để tăng hiệu quả của quy trình CRM thông qua tự động hóa lực lượng bán hàng, tự động hóa tiếp thị và hệ thống dịch vụ khách hàng

3 Quy trình khai phá dữ liệu trong CRM

Trong ngữ cảnh CRM, khai phá dữ liệu được định nghĩa như sau: khai phá đữ liệu là ứng dụng phân tích mô tả và dự đoán cho các tập dữ liệu lớn đề hỗ trợ các chức năng tiếp thị, bán hàng và địch vụ

Mặc dù việc khai phá dữ liệu có thể được thực hiện trên cơ sở dữ liệu vận hành, nhưng phổ biến hơn là nó được áp dụng cho các bộ dữ liệu ổn định hơn được lưu trữ trong các trung tâm dữ liệu hoặc kho dữ liệu Tốc độ xử ly cao hon, chi phí lưu trữ giảm và các gói phân tích tốt hơn đã làm cho việc khai thác dữ liệu trở nên hấp dẫn và tiết kiệm hơn, đồng thời khối lượng dữ liệu lớn hơn đã khiến việc khai thác đữ liệu trở nên hữu ích hơn, nếu không muốn nói là cần thiết

Phân tích khai phá dữ liệu hoạt động theo một số cách: bằng mô tả và trực quan hóa, phân loại, ước tính, dự đoán, nhóm môi quan hệ va phan cum

a Kỹ thuật khai phá dữ liệu có hướng

Khai phá dữ liệu có hướng (còn gọi là khai phá dữ liệu có giám sát, dự đoán hoặc nhắm mục tiêu) có mục tiêu dự đoán một số sự kiện hoặc giá trỊ trong tương lai Nhà phân tích sử dụng dữ liệu đầu vào để dự đoán một đầu ra cụ thê Phân tích dữ liệu

có hướng nhân mạnh vào việc phân loại, dự đoán và ước tính

- Cây quyết định

Cây quyết định là cây có dạng cấu trúc gốc và nhánh đảo ngược Trong đó, mỗi nút trong (internal node) biéu dién mét thuéc tinh, nhanh (branch) biéu dién giá trị có thé cd ca mdi thuéc tinh, mdi 1a (leaf node) biéu dién các lớp quyết định và đỉnh trên cùng của cây gọi la géc (root) Cay quyét dinh co thé duoc ding để phân lớp bằng

Trang 9

cách xuất phát từ gốc của cây và di chuyến theo các nhánh cho đến khi gặp nút lá Trên cơ sở phân lớp này chúng ta có thê chuyến đôi về các luật quyết định

Cây quyết định hoạt động thông qua một quá trình gọi là phân vùng đệ quy Mỗi bước phân vùng tập trung vào việc tạo ra các nhóm có tính đồng nhất cao nhất hoặc độ tính khiết (purest) cao nhất, tức là các nhóm chứa các mẫu đữ liệu thuộc cùng một lớp hoặc có cùng giá trị đầu ra

Quy trình được thực hiện đệ quy trên mỗi phần chia bổ sung cho đến khi không tìm thấy phần chia hữu ích nào nữa Khi quá trình phân vùng đệ quy hoàn tất, cây quyết định sẽ được hình thành

Cây quyết định có thê hoạt động với cả đữ liệu phân loại và dữ liệu liên tục

- Hoi quy logistic

Hồi quy logistic đo lường mức độ ảnh hưởng của một hoặc nhiều biến loại (dit liệu danh nghĩa hoặc thứ tự) Đầu ra của mô hình hồi quy tuyến tính báo cáo các hệ số hồi quy thể hiện tác động của các biến độc lập dự đoán đối với biến phụ thuộc

Ví dụ: giả sử bạn muốn đoán xem khách truy cập trang web sẽ nhấp vào nút thanh toán trong giỏ hàng của họ hay không Phân tích hồi quy logistic xem xét hành

vi của khách truy cập trước đây, chắng hạn như thời gian dành cho trang web và số lượng các mặt hàng trong giỏ hàng Quá trình phân tích này xác định rằng, trước đây, nếu khách hàng truy cập dành hơn năm phút trên trang web và thêm hơn ba mặt hàng vào giỏ hàng, họ sẽ nhấp vào nút thanh toán Nhờ vào thông tin này, hàm hồi quy logistic có thể đự đoán hành vi của một khách mới truy cập trang web

Một mô hình đảo tạo có thể được phát triển trên tập dữ liệu chứa tất cả các dữ liệu này Các hệ số được tính toán băng thuật toán phản ánh mức độ ảnh hưởng tương đối của từng biến độc lập đến biến mục tiêu Dữ liệu cho các biến độc lập bỗ sung co thể được thêm vào mô hình để cải thiện khả năng dự đoán hành vi mục tiêu Đôi khi việc loại bỏ các biến khỏi phương trình cũng cải thiện hiệu suất dự đoán của mô hình Hồi quy logistic hiếm khi dự đoán được rằng khách hàng chắc chắn sẽ mua (hoặc rời

bỏ, ghé thăm cửa hàng hoặc vỡ nợ) Các mô hình hồi quy chỉ ra xác suất khách hàng tham gia vào hành vi mục tiêu; đo đó, kết quả đầu ra từ hồi quy có thế được sử dụng

để ấn định điểm số hoặc xu hướng hành động cho khách hàng Xu hướng mua hàng cao sẽ khuyến khích người thực hành CRM nhắm mục tiêu đến khách hàng đó bằng một ưu đãi

Trang 10

- Hồi quy bội

Là một kỹ thuật sử dụng hai hoặc nhiều biến dự đoán đề dự đoán một biến phụ thuộc, nhưng trong trường hợp hỏi quy bội, biến phụ thuộc là biến liên tục (khoảng hoặc tý lệ) Ví dụ: hồi quy bội có thể được sử đụng đề dự đoán doanh thu bán hàng, lợi nhuận của khách hàng và tỷ lệ mua hàng lặp lại

Sự phủ hợp của mô hình có thê được cải thiện bằng cách loại bỏ dần dần biến ít ảnh hưởng nhất khỏi phương trình cho đến khi tất cả các biến còn lại là các yêu tố dự báo có ý nghĩa thống kê

Hồi quy bội tìm thấy mối liên hệ thống kê giữa các biến độc lập và biến phụ thuộc Nó không cho biết liệu mô hình giả thuyết có đúng hay không Trong khi hỗồi quy về cơ bản là các mô hình tính điểm, phân tích phân biệt (DA) phân cụm các quan sát thành hai hoặc nhiều lớp DA có thê được sử dụng để tìm ra những biến nào đóng góp nhiều nhất đề giải thích sự khác biệt giữa các nhóm

- Mạng lưới thần kinh (ANN)

Mạng lưới thần kinh là một loại trí tuệ nhân tạo cố găng bắt chước cách thức hoạt động của bộ não con người Thay vì sử dụng mô hình kỹ thuật số, trong đó tất cả các phép tính đều thao tác các số 0 và số l, mạng nơ-ron hoạt động bằng cách tạo ra các kết nối giữa các phần tử xử lý, tương đương với nơ-ron của máy tính Tổ chức và trọng lượng của các kết nối xác định đầu ra

Mạng nơ-ron đặc biệt hiệu quả trong việc dự đoán các sự kiện khi mạng có cơ

sở dữ liệu lớn về các ví dụ trước đó đề dựa vào Nói đúng ra, mạng nơ-ron ngụ ý một máy tính phi kỹ thuật số, nhưng mạng nơ-ron có thê được mô phỏng trên máy tính kỹ thuật số

Mạng lưới thần kinh là một tập hợp các thuật toán, được mô phỏng theo bộ não con người, được thiết kế để nhận dang các mẫu Nó giải thích đữ liệu cảm giác thông qua một loại nhận thức của máy, dán nhãn hoặc phân cụm đầu vào thô Các mẫu mà

nó nhận ra là số, chứa trong các vectơ, trong đó tất cả đữ liệu trong thế giới thực, có thé 1a hình ảnh, âm thanh, văn bản hoặc chuỗi thời gian, phải được dich

b Kỹ thuật khai phá dữ liệu vô hướng

Khai phá dữ liệu không được định hướng (hoặc không được giám sát) chỉ đơn giản là khám phá một tập dữ liệu để xem những gì có thé hoc duoc Đó là về việc

Trang 11

khám phá các mẫu mới trong dữ liệu Nhà phân tích không cố gắng đự đoán hoặc ước tính một số kết quả đầu ra Các câu hỏi sau đây yêu cầu khai phá dữ liệu không có hướng dẫn: cơ sở khách hàng của chúng ta được phân đoạn như thế nào? Có bất kỳ

mô hình hành vi mua hàng nào trong cơ sở khách hàng của chúng ta không? Khai phá

dữ liệu vô hướng tập trung vào các kỹ thuật phân cụm

Kỹ thuật phân cụm xác định các nhóm tự nhiên trong tập dữ liệu Bằng cách thêm yếu tổ thời gian, các kỹ thuật phân cụm có thê được sử dụng để xác định các mẫu trone chuỗi hành vi mua hàng Trong các kỹ thuật phân cụm, không có các lớp hoặc danh mục được xác định trước như người rời bó/người không có sự chuyền đôi Các kỹ thuật phân cụm ghi lại các nhóm theo đữ liệu đầu vào, vì vậy điều quan trọng khi lập mô hình phân cụm là phải xem xét cân thận các trường dữ liệu sẽ được phân cụm

- _ Phân cụm theo cấp bậc

Phân cụm theo cấp bậc là “mẹ của tất cả các mô hình phân cụm” Tổ chức các thuật toán tối ưu bằng cách xác định số lượng cụm từ đầu của quá trình trước khi phân cụm Mặt khác, các thuật toán phân cấp kết hợp hoặc chia nhóm hiện có và chỉ định thứ tự trong đó các cụm được chia ra hoặc kết hợp lại Một cây hoặc đề thị dendrogram được sử dụng để hiển thị các cụm phân cấp Phân cụm theo cấp bậc có thê được thực hiện theo 2 cách Chúng có thể từ dưới lên hoặc từ trên xuống Các cụm lớn được chia thành các cụm nhỏ và các cụm nhỏ của các cụm lớn được kết hợp lại với nhau Các phương pháp phân cấp có thế được phân thành các loại sau:

+ Divisive hierarchical clustering: là một phương pháp "ngược" so với phân nhóm hợp nhất bắt đầu với một cụm hoặc mô hình duy nhất với tất cả các điểm

dữ liệu và chia nó theo cách đệ quy Quá trình được lặp lại cho đến khi đáp ứng một tiêu chí dừng (một số lượng K cụm hoặc mô hình xác định trước) Cụm

"không phù hợp nhất" sẽ có xác suất thập nhất răng các mục trong cụm nảy sẽ được chia sau mỗi vòng lặp của quá trình phân chia Quá trình này được lặp lại cho đến khi các cụm trở thành các phần tử đơn hoặc đáp ứng một tiêu chí đừng Như phân nhóm hợp nhất, phân nhóm phân chia cũng có chí phí tính toán cao

và các vấn đề lựa chọn mô hình Hơn nữa, nó khá nhạy cảm với việc khởi tạo,

do sự chia đữ liệu có thê thành hai cụm ở bước đầu tiên

e Các bước hình thành:

Trang 12

©_ Bước |: Bat dau voi tat cả các điểm đữ liệu trong cụm

o_ Bước 2: Sau mỗi vịng lặp, loại bỏ “outliers” khỏi cụm ít kết nối nhất

©_ Bước 3: Dừng lại khi mỗi ví dụ đều ở trong cụm riêng của nĩ, nếu khơng, quay lại bước 2

+ Aøslomeratfive hierarchical clusterimg: là một phương pháp từ dưới lên trong

đĩ mỗi thực thể đại diện cho một cụm riêng của nĩ, sau đĩ được hợp nhất một cách lặp lại cho đến khi cấu trúc cụm mong muốn được đạt được Thuật tốn nay voi N mẫu bắt đầu với N cụm, mỗi cụm chứa một mẫu duy nhất Tiếp theo, hai cụm cĩ độ tương đồng lớn nhất sẽ kết hợp cho đến khi số lượng cụm được giảm xuống cịn một hoặc người dùng chỉ định Các tham số được sử dụng trong thuật tốn này bao gồm khoảng cách tối thiêu, tối đa, trung bình và trung tâm

©_ Bước 3: Dừng lại khi chỉ cịn một cụm duy nhất chứa tất cả các ví

dụ, nếu khơng tiếp tục bước 2

- Phan cum K-means

Là hình thức được sử dụng rộng rãi nhất Nĩi một cách đơn giản, K means là một thuật tốn đề phân loại hoặc nhĩm các đối tượng dựa trên các thuộc tính/đặc điểm thành K số nhĩm K là số nguyên đương Việc phân nhĩm được thực hiện bằng cách giảm thiểu tổng bình phương khoảng cách giữa đữ liệu và tâm cụm tương ứng Vì vậy, mục đích của K means là phân loại dữ liệu

Việc đề cập đến “means” đề cập đến việc sử dụng giá trị trung bình trong tính tốn Trong trường hợp này, nĩ đề cập đến vị trí trung bình của các thành viên của một cụm cụ thê trong khơng gian n chiều, trong đĩ n là số trường được xem xét trong quy trình phân cụm Quy trình này hoạt động bằng cách gán các bản ghi vào các cụm trong một quy trình lặp đi lặp lại cho đến khi các bản shi được phân cụm một cách tối ưu để tạo ra các cụm “k” Giải pháp tối ưu sẽ vừa giảm thiếu phương sai trong một cụm đồng thời tối đa hĩa khoảng cách giữa các cụm Trừ khi cĩ lý do chính đáng đề chỉ

Trang 13

định một số cụm nhất định, người khai thác dữ liệu có thé muốn thử nghiệm một sỐ giá trị “k” khác nhau và xem phân tích đưa ra kết quả gì Sau khi quy trình đã tạo ra các cụm, người dùng sẽ muốn lập hồ sơ và đặt tên cho từng cụm dé lam cho ching hữu ích hơn về mặt quản lý

——

Grouping based on minimum distance

Thuật todn cay K-means

- Phan cum hai budéc

Phân cụm hai bước kết hợp các quy trình phân cụm được xác định trước và phân cấp Ở giai đoạn một, các bản ghi được gán cho một số cụm được xác định trước (cách khác, bạn có thể cho phép thuật toán xác định số cụm) Ở bước hai, mỗi cụm này được coi là một trường hợp duy nhất và các bản ghi trong mỗi cụm phải được phân cụm theo cấp bậc Phân cụm hai bước có thế hoạt động tốt với các tập dữ liệu lớn Đây là quy trình phân cụm duy nhất hoạt động với hỗn hợp dữ liệu phân loại và

liên tục

- _ Phân tích nhân tố

Phân tích nhân số sử dụng các phương pháp toán học đề đơn giản hóa các đo lường tương quan nhằm khám phá các mẫu trong một tập hợp các biến Việc cố gắng khám phá phương pháp đơn giản nhất để diễn giải đữ liệu quan sát được biết đến là tính đơn giản và đây chính là mục tiêu cơ bản của phân tích nhân số

12

Trang 14

Phân tích nhân tố là một thủ tục rút gọn dữ liệu Nó thực hiện điều nảy bằng cách xác định các biến cơ bản không thê quan sát được (tiềm ân) được phản ánh trong các biến quan sát (các biến biếu hiện)

Những yếu tố không quan sát được này không được đo trực tiếp nhưng thực chất là các khái niệm giả thiết được sử dụng đề đại điện cho các biến

Ví dụ: Điểm số trong bài thuyết trình và một bài thi phỏng vấn có thể được xếp vào một yếu tô gọi là “ khả năng giao tiếp”, trong trường hợp này, yếu tố sau có thế được suy luận từ yếu tố trước nhưng không được đo lường trực tiếp

4 Trí tuệ nhân tạo, học máy và học sâu trong CRM

Ngày nay,việc sử dụng công nghệ như AI, VR, AR, Machine Learning, Deep Learning dang dan trở thành điều cần thiết đối với doanh nghiệp đề phát triển và tồn tại, đặc biệt trong lĩnh vực Quản lý chuỗi cung ứng (SCM), Sản xuất và Quản lý quan

hệ khách hàng (CRM) Công nghệ ứng dụng trong CRM giúp doanh nghiệp ngày càng thâu hiểu nhu cầu và mong muốn của khách hàng và cung cấp sản phẩm, dịch vụ phù hợp

- Bots

Đây là một công cụ tương tác thông minh thời gian thực mà các công ty đang sử dụng

đề cung cấp dịch vụ khách hàng tốt hơn Nó sử dụng hệ thống xử lý ngôn ngữ tự nhiên (Natural Language Processing) phức tạp và tự học hỏi Nó xử lý hàng nghìn tỷ dữ liệu trong mili giay va dua ra cac goi y Google Assistant, Alexa tr Amazon, Siri tr Apple, là một số ví dụ về các bot Chatbot là loại bot phổ biến nhất mà nhiều công

ty đang sử dụng hoặc đang trong quá trình triển khai

Trang 15

b ANN - Artificial Neural Network

ANN:s là một mô hình số hóa não người khi xử lý thông tin Nơ-ron nhân tạo là

thành phan co ban cua ANNs được thiết kế đề mô phỏng chức năng của nơron sinh học ANNs ban đầu được đào tạo để nhận biết và phân loại các đối tượng, chang han như xác định các loài động vật hoặc nhận dạng chữ viết tay, chúng thông minh ở chỗ

có thê quét hình ảnh một con vật và có khả năng cao là phân loại chính xác các loài Quá trình ANNs hoạt động để tạo đầu ra:

- Mạng lưới thần kinh sẽ nhận đầu vào

- _ Triển khai một thuật toán để đánh giá các đầu vào có trọng số trong cái được gọi là lớp ân Các trọng số này được xác định trong giai đoạn huẫn luyện, trong đó mạng neural nhận dau vao va dau ra, đồng thời tính toán các trọng số đề đạt được sự kết hợp tối ưu giữa hai trọng số nay

- Mang ludi than kinh tao dau ra

vụ Ngoài ra, họ còn cung cấp dữ liệu của bên thứ 3 và bên ngoài vào ANN gồm đữ liệu từ hệ thống điểm bán lẻ và đữ liệu truyền thông xã hội (lượt tương tác, lượt thích, nhận xét )

Ví dụ:

- Spotify sử dụng ANN để tạo ra các đanh sách phát và đề xuất bài hát cá nhân hóa cho người dùng dựa trên sở thích âm nhạc và lịch sử nghe nhạc của họ Các mô hình ANN phân tích dữ liệu về các bai hat đã nghe, thích và chia sẻ của người dùng đề tạo ra trải nghiệm nghe nhạc tốt nhất

- - AT&T (công ty viễn thông đa quốc gia): sử dụng ANN để dự đoán kha năng rời bỏ của khách hàng hay xu hướng sử dụng dịch vụ dựa trên các biến số như hành vi sử dụng dịch vụ, cấu hình gói cước hay phản hồi từ

khách hàng

14

Ngày đăng: 11/12/2024, 09:51

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN