tìm người thay thế, Một nghiên cứu của Center for American Progress Tổ chức nghiên cứu và vận động chính sách công tại Mỹ chỉ ra rằng các công ty thường phải chi tra khoảng 1/5 số tiền l
Trang 1BÀI BÁO CÁO CUỐI KỲ MON UNG DUNG PHAN TICH DU LIEU KD
TRONG QUAN LY DETAI: DU BAO VEKHA NANG NGHI VIEC CUA NHÂN VIÊN
CONG TY IBM TẠI MỸ BẰNG CÁCH SỬ DỤNG MÔ HÌNH
TRONG MICROSOFT AZURE MACHINE LEARNING
Giảng viên hướng dẫn:
Ngành: Kinh doanh quốc tế Khoa: Quản trị kinh doanh Nhóm: KI721
Sinh viên thực hiện:
Tram Anh
Thu Thao Cẩm Tú
Dinh Thai Tra Ha
„khóa: 21
71706XYZ 71706ABC 71706GHI 71706KML 717061VCŒ
Trang 2NHÂN XÉT CỦA GIẢNG VIÊN
"¬— THÀNH PHỐ HỒ CHÍ MINH, THÁNG 9 NĂM 2022 ¬—
Trang 3mô hình Chương 2,
Trang 4DANH MỤC HÌNH ẢNH à St cà nh Tà HH nà HH HH1 ng rau 1 DANH MỤC BẢNG nh ng TH HH TH TH HH Hang Ha Hà tr hiệu 2 DANH MỤC BIỂU ĐỔ St nh HT HT HH HH nh Ha nh na gà nh rau 2
CHƯƠNG I: GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU -::c222522zcrcce 3
1.1 Lý do chọn đỀlài uc nh nh HH Ho HH HH HH ru 3 1.2 Giới thiệu tổng quan v`công ty IBM ch HH HH 6 1⁄3 Mục tiêu nghiên cỨu ST HH HH HH HH hy 7 1.4 Câu hỏi nghiên cỨU - St SE SE HH TH HH HH HH 7
6 co na 8 1.6 Đối tượng và phạm vi nghiên CỨU - - tình SE nh kh HH Ho Hy 8 1.7 Bố cục bài nghiên cỨu - cành S HT HH hy 8
2.1 Lý thuyết vềquyết định nghỉ việc và các yếu tố ảnh hưởng -.- 9 2.1.1 Lý thuyết vquyết định nghỉ viỆc ác Tnhh Hong 9 2.1.2 Ảnh hưởng của sự nghỉ viỆc con nh nhung 9 2.1.3 Các yếu tố ảnh hưởng đến quyết định nghỉ việc cài 10 2.2 Các nghiên cỨu tƯỚC ST TS HH HH HH HH HH HH Hà Hy 12
3.1 Thu thập và mô tả dữ liỆU SE HH HH He 14 3.2 Xử lý dữ liệu ST HH HH HH Hy 18 3.3 Phân tích khám phá dữ liệu - - HT nu 20 3.4 Mô hình nghiên cứu ch SH TH TH HH HH Hy 27
Trang 5CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU cccccnn nh n2 1111111811 enrerrrre 33
4.1 Thiết lập mô hinh Two-Class Bayes Point Machine, Two-Class Logistics Regression, Two-Class Decision Forest, Two-Class Support Vector Machine 34 4.2 Thiết lập mô hình Random EOres[ óc tt nhe 36 4.3 Kết luận: HH HH HH HH HH He 40
44 Setup Web S€TVIC€ nh HH HH TH TK HH kg HH kết 40
Trang 6DANH MỤC HÌNH ẢNH
Hình 1.1: Tỷ lệ nghỉ việc của nhân viên tại Mỹ và các khu vực trên thế giới 4 Hình 1.2: Tỷ lệ nghỉ việc tại Mỹ theo ngành ác nh Hà Hà Hà Hà nha 5 Hình 3.1: Những thuộc tính ảnh hưởng nhi i nhất đến biến “Attrition” bằng Eilter
Based Feature Sele€CfOH ác nnnccnn TH nh TH ng TH tàn Hà tàng ra 19
Hình 3.2: Những thuộc tính ít hoặc không ảnh hưởng đến biến “Attrition” bang Filter
Based Feature Sele€CfOH ác nnnccnn TH nh TH ng TH tàn Hà tàng ra 19 Hình 3.3: Mô hình Random FOresf án th Tnhh HH Ha HH te 30
Hình 4.1: Mô hình dự báo khả năng nghỉ việc của nhân viên bằng Azure Machine
Hình 4.2: Mô hình Random Forest trên Azure Machine Learning -.‹-«: 36 Hình 4.3: Kết quả mô hình Random Forest thông qua Metrics cccccccằcằ 38 Hình 4.4: Kết quả Random Forest thông qua ma tran Confusion Matrix 39 Hình 4.5: Setup Web Service của mô hình Two-Class Logistics Regression 40 Hình 4.6: Kết quả dự đoán khả năng nghỉ việc của nhân viên bằng mô hình Two-Class LOglstlcs Ñ€BT€SSIOH LH HH HH HH TH TH TH TH HT HT HT HH hy 42
Trang 7DANH MỤC BẰNG Bảng 3.1: Mô tả biếN 5555 11 2E E111 2121122211 1.1 treo ng 18 Bảng 3.2: Chỉ số ảnh hưởng các thuộc tính có ảnh hưởng nhi ầi nhất đến biến a5 4 20 Bang 4.1: Chỉ số so sánh kết quả các mô hình ó- ch ket 35
DANH MỤC BIỂU ĐỔ
Biểu đ`ô3.1: Thống kê số lượng nhân viên nghỉ việc tại IBM 20 Biểu đ`ô3.2: Thống kê số lượng nhân viên nghỉ việc theo áp lực tăng ca 21 Biểu đ'`ô3.3: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong các mối quan hệ ở cÔng Íy ST HH HH HH HH hy 22 Biểu đ'`ô3.4: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng v`môi trường làm việc Ở cÔng (V ác ch HH HH HH HH HH HH Hy 23 Biểu đ'`ô3.5: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong công Miss na 24 Biểu đ 63.6: Thống kê số lượng nhân viên nghỉ việc theo mức thu nhập hằng tháng ở
Biểu đ'`ô3.7: Kiểm tra mức độ tương quan giữa các biến ánh 26
Trang 8CHƯƠNG I: GIỚI THIỆU ĐỀTÀI NGHIÊN CỨU
1.1 Lý do chọn đềtài
Trong nền kinh tế cạnh tranh ngày nay và sự chuyên môn hóa, mua lại công nghệ ngày càng cao, việc nghiên cứu và phân tích dữ liệu đang tạo ra kiến thức mới, được gọi là “ni kinh tế tri thức” Công nghệ thông tin không chỉ là ngu ân dữ liệu mà trên hết, là yếu tố tạo đi`âi kiện cho phân tích dữ liệu, làm cho có thể xử lý các bộ sưu tập dữ liệu lớn và cho phép thông tin được rút ra chuẩn xác
Trong các tổ chức, có một số lĩnh vực mà việc áp dụng AI - trí tuệ nhân tạo sẽ tác động đến quá trình ra quyết định Những năm g3 đây, ngu ân nhân lực ngày càng được chú trọng Chất lượng và kỹ năng của nhân viên tạo thành yếu tố tăng trưởng và mdi thế cạnh tranh thực sự cho các công ty
Tuy nhiên trong những năm gẦn đây, nhi công ty dang gap phải tình trạng nhân viên “nhảy việc”, nhân viên không gắn kết lâu dài với công ty Khi một nhân viên nghỉ việc, công ty không những mất đi một nhân viên có giá trị, mà còn gây ra nhi i tổn thất cụ thể là thời gian, chí phí tuyển dụng, đào tạo nhân viên mới, gia tăng các sai sót do nhân viên mới chưa quen với công việc, thậm chí gây mất ni ềm tin, sự đoàn kết của các thành viên trong nội bộ Theo Mohd & Lim, 2007 các công ty không giảm tỷ
lệ nghỉ việc của nhân viên thì có khả năng sẽ giảm khả năng cạnh tranh trong thời gian dài Một nhân viên sẽ chọn ở lại hoặc rời khỏi một tổ chức phụ thuộc vào nhỉ âi nguyên nhân như cơ hội phát triển nghề nghiệp, môi trường làm việc, hành vi quản lý, đặc điểm công việc, lương thưởng và phúc lợi, cân bằng giữa công việc và cuộc sống Nhân thấy tần quan trọng của đội ngũ nhân viên, các nhà quản lý đã và đang tìm mọi cách để duy trì, phát triển và nâng cao ngu ôn nhân lực Họ phân tích đến các
Trang 9giải pháp giúp nhân viên gắn bó lâu dài hơn với tổ chức
O Tình hình v`nghỉ việc của nhân viên tại Mỹ
Theo Tổng cục Thống kê lao động ở Mỹ, có khoảng 3 triệu người Mỹ nghỉ việc mỗi tháng với tỷ lệ cao hơn so với Châu Âu và Châu Phi
13.9% 13.3% 13.4% 13.4%
11.40 1.4%
@ Americas @ Europe, Middle East and Africa Asia Pacific
Hinh 1.1: Ty 1é nghi viéc ctia nhan vién tai My va các khu vực trên thế giới Tại Mỹ, tỷ lệ nhân viên nghỉ việc có sự khác nhau giữa các ngành nghề cụ thể năm 2015 tỷ lệ nghỉ việc trung bình là 13.7% trong đó ngành khách sạn có tỷ lệ nhân viên nghỉ việc cao nhất 17,8%, ngành chăm sóc sức khỏe là 14,2% trong khi đó, tỷ lệ thấp hơn rất nhi êi trong các ngành công nghiệp khác, như bảo hiểm 8.8%, tiện ích 6,1%, xây dựng và sản xuất Đến năm 2020, tỷ lệ này có xu hướng giảm nhưng vẫn còn cao hơn so với toàn cầi 10.9%
Trang 10Nghi viéc
Ty lé nghi vide tal Hi
Hình 1.2: Tỷ lệ nghỉ việc tại Mỹ theo ngành
Với hiện trạng thiếu hụt ngu ni nhân lực ở các ngành ngh tăng cao, thì nhân viên khi có kinh nghiệm trong lĩnh vực nghề sẽ có những ý định nghỉ việc để tìm những nơi đem cho họ cơ hội mới Phần lớn (81%) nhân viên đã tự nguyện rời đi để có
cơ hội việc làm tốt hơn Một nửa số nhân viên được khảo sát cho biết họ sẽ nghỉ việc nếu họ tìm thấy một công việc linh hoạt hơn Một nửa số nhân viên Hoa Kỳ đã nghĩ đến việc rời bỏ công ty hiện tại của họ
e Hon 20% nhân viên nhận thấy có cơ hội thăng tiến trong ngh` nghiệp sẽ có khả năng ở lại làm việc cao hơn
e Các nhân viên trẻ mong muốn có sự linh hoạt trong công việc, 84% thế hệ millennials muốn cân bằng giữa công việc và cuộc sống, 36% chọn phương án làm việc tại nhà thay vì tăng lương
® 31% nhân viên nghỉ việc vì văn hoá, môi trường làm việc của công ty không như họ mong nghĩ, trong đó nhân viên da đen có ý định nghỉ việc chiếm 35% cao hơn so với nhân viên da trắng 27%
Theo số liệu thống kê từ Hiệp hội Quản lý Ngu n nhân lực tại Hoa Kỳ (SHRM), tình trạng nghỉ việc của nhân viên đang là một thách thức đối với các công ty ở Hoa Kỳ
Trang 11tìm người thay thế,
Một nghiên cứu của Center for American Progress (Tổ chức nghiên cứu và vận động chính sách công tại Mỹ) chỉ ra rằng các công ty thường phải chi tra khoảng 1/5 số tiền lương của một nhân viên để thay thế họ và chi phí có thể tăng lên đáng kể nếu những chức vụ cao hoặc những nhân viên được trả lương cao cân tìm người thay thế, Việc nắm bất được tại sao và khi nào nhân viên có khả năng nghỉ việc cao có thể giúp nhà quản lý đưa ra các phương án hành động để giữ chân nhân viên lâu hơn cũng như có kế hoạch tuyển dụng phù hợp Nhóm chúng tôi đã tiến hành nghiên cứu thực hiện đềtài “Dự báo khả năng nghỉ việc của nhân viên tại công ty IBM ở Mỹ bằng mô hình Azure Machine Learning” Thông qua bài nghiên cứu này sẽ cung cấp một mô hình mang tính chất tham khảo giúp dự báo khả năng nghỉ việc hay tiếp tục ở lại dựa trên những yếu tố cơ bản từ đó có thể giúp nhà quản lý đưa ra những phương án hành động để giữ chân nhân viên lâu hơn cũng như lập kế hoạch tuyển dụng phù hợp 1.2 Giới thiệu tổng quan v công ty IBM
IBM - Tâp đoàn công nghệ đến từ USA (viết tất của International Business
Machines) là một tập đoàn công nghệ máy tính đa quốc gia có trụ sở tại Armonk, New York, Mỹ Được thành lập năm 1911, công ty IBM là một trong số ít các công ty công nghệ của thế kỷ thứ 19 vẫn còn t ôn tại cho đến ngày nay Các sản phẩm được IBM sản xuất và bán ra chủ yếu là ph cứng và phi mềm máy tính, bên cạnh đó là các dịch vụ
cơ sở hạ tầng, hosting và tư vấn trong nhi ềi lĩnh vực từ máy tính lớn đến công nghệ nano
IBM được biết đến g3n đây như là một công ty sản xuất máy tính hàng đầu thế giới, với hơn 388.000 công nhân trên toàn thế giới IBM là chủ công nhân công nghệ lớn nhất trên toàn thế giới Năm 2011, IBM đã xếp thứ 2 trong top 10 thương hiệu lớn
Trang 12ty, bà Rometty - CEO của IBM đã chia sẻ trong nhiệm kỳ CEO 7 năm của mình “Thời điểm tốt nhất để có được nhân viên là trước khi họ bỏ việc” Rometty nhận định rằng,
mô hình nhân sự truy & thống cân một cuộc đại tu, và đó là một trong số những chuyên môn mà con người cân sự hỗ trợ của AI để cải thiện hiệu quả
Bằng việc hiểu rõ hơn những mẫu dữ liệu và các kỹ năng liên quan, AI của IBM
có thể tập trung vào thế mạnh của mỗi cá nhân Đi êi này sẽ giúp quản lý có thể chỉ dẫn nhân viên tới những cơ hội trong tương lai mà khó có thể xác định khi sử dụng phương pháp truy &n thống “Chúng tôi nhận ra rằng bảng khảo sát bởi quản lý không h chính xác, đánh giá của quản lý mang tính chủ quan, chúng tôi có thể đưa ra nhận định một cách chính xác hơn từ dữ liệu” bà Rometty nói vềquy trình đánh giá kỹ năng
Vì vậy, nhóm chúng tôi mong muốn thực hiện việc đề xuất một mô hình dự đoán khả năng nghỉ việc của nhân viên để có thể giúp ban lãnh đạo quản lý sử dụng ngu ồn nhân sự của công ty một cách chính xác và hiệu quả hơn
1.3 Mục tiêu nghiên cứu
Đlài nghiên cứu của chúng tôi tập trung vào các giải quyết các vấn đ'ềnhư sau:
O Tìm hiểu các yếu tố cơ bản ảnh hưởng đến quyết định nghỉ việc hoặc tiếp tục làm việc của nhân viên tại công ty IBM
[I Đềxuất ra mô hình giúp công ty IBM cũng như các doanh nghiệp có thể áp dụng để dự đoán khả năng nghỉ việc của nhân viên nhằm nâng cao công tác quản lý nhân sự HRM
1.4 Câu hỏi nghiên cứu
Để hỗ trợ việc nghiên cứu, c n đặt ra các câu hỏi nhằm mục đích giải quyết các
Trang 13trọng nhất?
[I1 Mô hình nào phù hợp nhất để dự đoán quyết định nghỉ việc của nhân viên? [1 Giải pháp để nhà lãnh đạo có thể hạn chế được quyết định nghỉ việc của nhân viên trong công ty, nâng cao hiệu quả quản lý ngu ân nhân lực hơn?
1.5 Ý nghĩa của nghiên cứu
Bài nghiên cứu này, tiết kiệm tài nguyên, giảm bớt sự lo lắng của các nhà quản
lý Và chỉ ra cho các nhà quản lý cơ sở để sửa đổi, cải thiện các yêu c}ât làm việc của nhân viên nhằm giữ chân họ lại
1.6 Đối tượng và phạm vi nghiên cứu
[1l Đối tượng nghiên cứu: quyết định nghỉ việc của nhân viên tại công ty IBM ở
Mỹ
[1l Phạm vi nghiên cứu: mô hình được lấy dữ liệu tại Hoa Kỳ được cung cấp bởi IBM Analytics
17 Bố cục bài nghiên cứu
[I Chương l: Giới thiệu đềtài nghiên cứu
Chương 2: Cơ sở lý thuyết
oO
O Chương 3: Phương pháp nghiên cứu
[1 Chương 4: Kết quả nghiên cứu
oO Chương 5: Kết luận và đ xuất giải pháp
Trang 14CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.1 Lý thuyết vềquyết định nghỉ việc và các yếu tố ảnh hưởng
2.1.1 Lý thuyết vềquyết định nghỉ việc
Theo Tommy Thomas, 2009 quyết định nghỉ việc là tình trạng xảy ra khi nhân viên của một tổ chức lựa chọn đưa ra quyết định chấm dứt hợp đồng lao động với tổ chức
Theo Tett & Meyer, 1993 quyết định nghỉ việc là hành động có ý thức, có sự cân nhắc trước khi rời khỏi tổ chức hiện tại
Theo Mobley, 1997 quá trình đưa ra quyết định nghỉ việc là một chuỗi các giai đoạn nhận thức, bắt đ`ầi từ việc đánh giá công việc hiện tại, tiếp theo là cảm giác thỏa mãn hoặc không thoả mãn v công việc hiện tại, nếu không thoả mãn họ sẽ nghĩ đến việc nghỉ việc Kế tiếp họ sẽ đánh giá tìm kiếm việc làm khác và chỉ phí bỏ ra Nếu họ nhận thấy sự thay thế là có sẵn và chỉ phí bỏ ra không cao, họ sẽ thực hiện việc tìm kiếm và đánh giá các lựa chọn Từ đó ý định nghỉ việc sẽ được kích thích và cuối cùng
là đưa ra quyết định nghỉ việc
2.1.2 Ảnh hưởng của sự nghỉ việc
Theo Chan và cộng sự, 2001 đã khẳng định nhân viên nghỉ việc là một vấn dé nghiêm trọng đối với tổ chức, đặc biệt trong lĩnh vực quản trị nhân sự Ông cho rằng tỷ
lệ nghỉ việc cao sẽ gây bất lợi cho tổ chức thông qua việc gia tăng các loại chỉ phí, ảnh hưởng trực tiếp và gián tiếp tới tổ chức
® Ảnh hưởng trực tiếp: Khi một nhân viên nghỉ việc, công ty phải mất 78.000 USD để thay thế nhân viên nghỉ việc (Ramsey Smith, 2004), bao g ân:
-_ Chi phí cho tuyển dụng, chỉ phí đào tạo cho nhân viên (Alexander và cộng sự,
1994),
Trang 152003)
Chi phí phát sinh từ kết quả hoạt động kinh doanh không hiệu quả, suy giảm năng suất tạm thời của tổ chức (Osterman, 1987)
® Ảnh hưởng gián tiếp:
Gây thiếu hụt nhân sự có chuyên môn và kinh nghiệm, làm giảm hiệu suất công việc và gián đoạn hoạt động của dự án
Ảnh hưởng tỉnh thẦn làm việc của nhân viên khác
Thông tin, tình hình kinh doanh cũng như chính sách, khách hàng thân thiết của tổ chức cũng có nguy cơ bị chia sẻ ra bên ngoài đặc biệt nguy hiểm khi nhân viên chuyển sang làm việc cho đối thủ cạnh tranh
2.1.3 Các yếu tố ảnh hưởng đến quyết định nghỉ việc
Hiện nay, công tác nghiên cứu v`ềcác yếu tố ảnh hưởng tới quyết định nghỉ việc của nhân viên đã được nhỉ i nhà nghiên cứu tìm hiểu, nhóm tác giả nhận thấy có 2 yếu
tố chính ảnh hưởng đến quyết định này là: yếu tố cá nhân và yếu tố tổ chức
® Yếu tố cá nhân:
Age: tuổi tác có thể ảnh hưởng đến quyết định nghỉ việc của nhân viên Theo Pitts và cộng sự, 2011 cho thấy ý định nghỉ việc sẽ xuất hiện và tăng trong giai đoạn tuổi đầi tiên tham gia vào lao động sau đó thì giảm lại
Gender: theo kết quả từ các nghiên cứu của Knapp, 1982; Schwartz, 1989; Powell và York, 1992 đã có kết luận rằng có mối quan hệ giữa giới tính và quyết định nghỉ việc, và họ phân tích rằng khả năng nữ giới rời bỏ nơi làm việc nhỉ âi hơn nam giới
Education: trình độ học vấn cá nhân cũng là một nhân tố tác động đến quyết
Trang 16Cordes và Dougherty, 1993; Todd và Deery Schimit, 1996; Blankertz và Robinson, 1997
- Overtime: theo phân tích của Zangaro và Soeken, 2007 v`ềsự hài lòng công việc đã nhận thấy rằng làm thêm giờ gây ra căng thẳng trong công việc, nó mang tính tương quan mạnh mẽ đến sự hài lòng trong công việc
- Marital Status: theo Krau, 1981 tình trạng hôn nhân cũng có thể ảnh hưởng đến sự hao mòn nhân lực Số con, trách nhiệm khi có gia đình sẽ tạo ra các nhu
cM ổn định
- Monthly Income: trong phân tích của Griffith và cộng sự, 2000 thảo luận về tác dụng và trả công sự thoả mãn Họ nhận thấy đi quan trong nhất là nhân viên phải có cảm giác công bằng trong tiên lương Theo McConnell, 2007 cho rằng mức lương là nguyên nhân hàng đầi gây ra ý định nghỉ việc của nhân viên Theo Willis, 2000 tin lương, thưởng là vấn đ quan trọng nhất khi nói đến việc thu hút và giữ chân nhân tài
- Total Working Years: thâm niên làm việc cũng có mối quan hệ với quyết định nghỉ việc của người lao động Người lao động làm việc cho tổ chức với thời gian càng dài, họ sẽ càng gấn bó với tổ chức và tiếp tục làm việc cho tổ chức
lâu dài hơn theo Miller và Wheeler, 1992; Krecker, 1994; Lane, 1998
e Yếu tố tổchức:
- Job Level: theo Delfgaauw Josse, 2007 sự không hài lòng với một lĩnh vực công việc chẳng hạn như nhiệm vụ họ đang làm có thể đẩy người lao động ra
Trang 17trong môi trưởng làm việc có thể ảnh hưởng đến quyết định của một nhân viên
ở lại với tổ chức dù vẫn có cơ hội việc làm khác
Relationship Satisfaction: sự hài lòng trong mối quan hệ là sự đánh giá chủ quan vềmối quan hệ của một người với nhi âi người trong tổ chức Khi sự hài lòng ở mức cao mối quan hệ sẽ kéo dài, và ngược lại
Job Satisfaction: theo kết quả nghiên cứu của Bashir và cộng sự, 2012, sự hài lòng với công việc có tác động ngược chi ềi đến quyết định nghỉ việc Bashir cũng cho biết kết quả này trùng khớp với nghiên cứu của Hulin, 1966 2.2 Các nghiên cứu trước
K Coussement và D Vanden poel, 2008 với bài nghiên cứu “Integrating the voice of customers through call center email into a decision support system for attrition prediction” Trong nghiên cứu này, họ thiết lập rằng việc thêm dữ liệu văn bản, phi cấu trúc thành một nhận dạng rời đi thông thường Các kết quả là nâng cao hiệu suất trong phân tích nhận dạng rời đi Nghiên cứu này hỗ trợ cho những người ra quyết định tiếp thị để cải thiện khả năng nhận biết khách hàng có xác suất rời đi
CP Wei va IT Chiu,2002 với bài nghiên cứu “Turning telecommunications call details to attrition prediction: a data mining approach” Trong nghién cứu này, thực nghiệm đánh giá phương pháp nhận dạng sự rời di từ dữ liệu hợp đồng thuê bao và mô hình cuộc gọi sửa đổi được khai thác từ chỉ tiết cuộc gọi Điềi này được mô ta là phương pháp có khả năng mô tả tiền năng những khách hàng tiêu chuẩn với mức hợp đồng cụ thể cho khoảng thời gian dự đoán
Trang 18prediction” đã nghiên cứu và so sánh một số các phương pháp trong Machine Learning để ngăn chặn quyết định nghỉ việc của nhân viên Trong này họ đã thực hiện một số phương pháp để tạo và so sánh các mô hình để có được mô hình dự đoán tốt nhất
R.Khare, D Kaloya, CK Choudhary và G.Gupta, 2011 đã nghiên cứu v`ề
“Employee attrition risk assessment using logistic regression analysis” Nghiên cứu này sử dụng phương pháp Logistics Regression để ngăn chặn sự rời đi của nhân viên Trong đi êi này các nhà nghiên cứu thu thập dữ liệu nhân khẩu học của nhân viên hiện tại ở công ty Các thông tin này hữu ích để tạo ra những mô hình phân loại nhóm các nhân viên có rủi ro cao Mục tiêu cuối cùng của nghiên cứu là xác định nhóm nhân viên có rủi ro cao để tổ chức chú ý
và ngăn chặn khỏi sự nghỉ việc này
ML Kane- Sellers, 2007 đã nghiên cứu v“Predictive models of employee voluntary turnover in a North American professional salesforce using data-mining analysis” Bài nghiên cứu chủ yếu tập trung vào các đặc điểm cá nhân, đặc tính công việc và phát triển ngu nhân lực (human resources development) anh hưởng đến sự tự nguyện của nhân viên Các kết quả khuyến nghị rằng sự đào tạo và tham gia phát triển là các yếu tố giữ chân nhân viên hon là tín lương và sự thăng tiến trong công việc
Trang 19Chúng tôi đề xuất sử dụng mô hinh Azure Machine Learning để dự báo khả năng nghỉ việc của nhân viên tại công ty IBM theo quy trình như sau:
® Dâi tiên, chúng tôi thu thập dữ liệu v`ềnhân viên bao gầm cả nhân viên ở quá khứ và hiện tại
e Thứ hai, chúng tôi áp dụng các kỹ thuật làm sạch dữ liệu khác nhau tạo ra tập dữ liệu mới đ'ng thời tiến hành phân tích, mô tả dữ liệu để xác định các thuộc tính chính ảnh hưởng lớn đến quyết định nghỉ việc của nhân viên
e@ Thứ ba, chúng tôi áp dụng mô hinh s& hoc Azure Machine Learning voi nhi& thuật toán khác nhau trên tập dữ liệu đã được xử lý cùng với các biến số đã được chọn ra để dự báo khả năng nghỉ việc của nhân viên
e Cuối cùng dựa trên kết quả thu thập được, so sánh các chỉ số hiệu suất của mô hình máy học và chọn ra mô hình có hiệu quả nhất để giải quyết vấn đ đặt ra và phát hành ph m`ền hỗ trợ nhân sự trong công tác HRM
3.1 Thu thập và mô tả dữ liệu
Để thực hiện bài nghiên cứu, chúng tôi đã sử dụng bé dit liéu “IBM Employee Dataset” được cung cấp bởi IBM_ Watson
https://www.kagele.com/rohitsahoo/employee
Analytics tai trang web
Bộ dữ liệu bao g`ồn 1470 mẫu quan sát với 35 đặc tính khác nhau liên quan đến đời sống làm việc và đặc điểm cá nhân của nhân viên tại Hoa Kỳ bao g tm:
Trang 20
Degree/Other Employee
Trang 21
Số lượng công ty đã
làm trước đây workers
22 Over 18 Phan loai Trén 18 tudi
Percent salary Tỷ lệ thay đổi trong
25 Performance Phân loại Mức độ hoàn thành 1 Low
3 High
Trang 22
27 | Standard hours| Số nguyên
chuẩn Stock option - Mức cổ phần nhân
Trang 23không được xác định bởi biến “Attriion”: “No” đại diện cho một nhân viên đã không nghỉ việc và “Yes” đại diện cho một nhân viên đã nghỉ việc tại công ty
3.2 Xử lý dữ liệu
Để cho mô hình máy học được thực hiện một cách dễ dàng, chúng tôi tiến hành chuyển đổi biến phụ thuộc “Attrition” từ định tính (dữ liệu dạng văn bản) thành định lượng (dữ liệu số), cụ thể:
- “Yes” divorce ma hod vé“1”
#No” được mã hoá v`ề“0”
Sau đó tiến hành xác định biến dựa trên hiện việc xem xét mức độ ảnh hưởng của các biến độc lập đối với biến phụ thuộc Mục đích của việc này là xác định các biến sẽ tham gia thực hiện mô hình, loại bỏ những biến ít quan trọng hoặc dư thừa vì chúng có thể ảnh hưởng đến việc đưa ra những dự đoán không chính xác
Chúng tôi sử dụng thuật toán Filter Based Feature Selection trên phầi mềần Azure Machine Learning d@ kiém tra mức độ ảnh hưởng của các biến lên biến
“Attrition” théng qua chỉ số Pearson Correlation
Filter features y Fiter Based Feature Selection » Feature
OverTime JobRole MaritalStatus TotalWorkingYears JcbLevel earslnCurrentRole Monthlylncome Age YearsWithCurrManager StockOptic
.242142 0177211 0.171063 0.15984 0.159205 0.156199 0.137145
Hình 3.3: Những thuộc tính ảnh hưởng nhi i nhất dén bié’n “Attrition” bang Filter
Based Feature Selection.
Trang 240.031373 0.029453 001517 0.013478 0.010577 0.006846 0.002889 0 0 0
Hình 3.4: Những thuộc tính ít hoặc không ảnh hưởng đến biến “Attrition” bằng Filter
Based Feature Selection
Sau quá trình kiểm tra chúng tôi nhận thấy thuộc tính “OverTime” có sự ảnh hưởng lớn
nhất đến sự nghỉ việc của nhân viên, kết quả cụ thể như sau như sau:
Những thuộc tính không ảnh hưởng đến biến “Attriion” là “Overl8'”,
“EmployeeCounf” và “StandardHours” với chỉ sế ảnh hưởng bằng 0 sẽ được chúng tôi xoá bỏ Ngoài ra, theo bài tham khảo chính, các biến “HourlyRate”, “MonthlyRate” và
“EmployeeNumber” cũng được tác giả loại bỏ trong quá trình chạy mô hình 3.3 Phân tích khám phá dữ liệu
Trang 25Tổng số của Attrition theo Attrition
024 nghìn (16 12%) —,
Attrition
@No
‘1.23 nghìn (83.88%)
Biểu đ 63.1: Thống kê số lượng nhân viên nghỉ việc tại IBM
Có 237 nhân viên nghỉ việc trong tổng số 1470 nhân viên, chiếm I6,12% tại công ty Tuy là con số nhỏ nhưng phòng Nhân sự vẫn muốn biết được lý do dẫn đến sự nghỉ việc của nhân viên IBM
Tổng số của Attrition theo OverTime va Attrition
Attrition @No @ Yes
Trang 26tố quan trọng quyết định đến sự nghỉ việc của nhân viên trong một tổ chức
Các chỉ số đánh giá mức độ hài lòng của nhân viên trong công việc, v`ề môi trưởng làm việc, các mối quan hệ cũng là một trong các nhân tố ảnh hưởng đến quyết định nghỉ việc của nhân viên
® Mức độ hài lòng trong các mối quan hệ
Biéu d 63.3: Thong kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong các
mối quan hệ ở công ty
Có thể nói số lượng nhân viên nghỉ việc đối với trường hợp bất đng với các thành viên trong công ty khá là thấp (16,12% trên tổng số nhân viên) Mức độ hài lòng thấp nhất chiếm 20,56% (57/276) lượng nhân viên nghỉ việc Mức độ hài lòng cao chiếm 14,81% (64/432) Có thể thấy mức độ hài lòng vềcác mối quan hệ trong công ty càng thấp sẽ có xu hướng nghỉ việc cao hơn
e Múc độ hài lòng v`ềmôi trưởng làm việc
Trang 27Biểu đ 3.4: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng v`êmôi
trưởng làm việc ở công ty
Môi trưởng làm việc là một vấn đ ềquan trọng trong việc giữ chân các nhân sự của công ty Thông qua biểu đ ồta có thể thấy mức độ hài lòng càng thấp thì tỷ lệ nhân viên nghỉ việc càng cao Môi trường làm việc tốt giúp nhân viên cảm thấy thoải mái, dễ chịu, nâng cao tỉnh thần làm việc của nhân viên tạo đi `êi kiện để nhân viên gắn bó lâu dài với tổ chức
® Mức độ hài lòng trong công việc
Trang 28
2 3
JobSatisfaction
Biểu đ'`ô3.5: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong công
việc ở công ty
Như chúng ta có thể thấy từ dữ liệu trên, có tỷ lệ thôi việc Lần lượt là 22,84%,
16,43%, 16,52% và 11,33% ở các mức độ hài lòng trong công việc 1,2, 3 và 4 Vì vậy,
chúng ta có thể kết luận rằng mức độ hài lòng trong công việc thấp hơn có thể là một yếu tố liên quan đến sự thôi việc của nhân viên Sự hài lòng trong công việc là một trong những yếu tố quan trọng nhất đối với sự nỗ lực của nhân viên Nếu nhân viên không hoàn toàn hài lòng với công việc của mình, cuối cùng, nhân viên đó sẽ ra đi Các
tổ chức nên thưởng xuyên đánh giá mức độ hài lòng của nhân viên Trọng tâm chính của bất kỳ tổ chức nào là làm cho nhân viên của họ hài lòng vì nó gắn liềi với năng suất của nhân viên
Ngoài ra mức thu nhập hằng tháng “Monthly Income” cũng được đánh giá là một yếu tố quan trọng ảnh hưởng đến quyết định nghỉ việc của nhân viên
Trang 29ra, số lương càng cao đồng nghĩa với trách nhiệm càng lớn, nên ph*Ần lớn họ chịu được
áp lực ở mức thu nhập này
3.3.2 Kiểm tra mức độ tương quan
Trang 30
DsstanceF rombor
Education 021
EnvrormentSatstacber
Biểu đ 3.7: Kiểm tra mức độ tương quan giữa các biến
Chúng tôi sử dụng bản đ ôCorrelation matrix để thể hiện sự tương quan giữa các biến: màu đỏ thể hiện mối tương quan nghịch (mối tương cao có giá tri từ -I đến -0.7), màu xanh thể hiện mối tương quan thuận (mối tương quan cao có giá trị từ 0.7 đến 1),
- Bién “PercentSalaryHike” và “PerformanceRating” với chỉ số tương quan 0.77: khi nhân viên nhận được sự tăng lương họ sẽ làm việc tốt hơn
25
Trang 31“YearsWithCurrentManager” và “YearsInCurrentRole” với chỉ số tương quan là 0.71, 0.76 va 0.77
3.4 Mô hình nghiên cứu
Quá trình mô hình hóa bao g ‘Gm việc lựa chọn các mô hình dựa trên các máy học khác nhau các kỹ thuật được sử dụng trong thử nghiệm Trong trường hợp này, các
mô hình dự đoán khác nhau đã được sử dụng như dựa trên cây quyết định, phương pháp Bayes, h ổ quy logistic và SVM Mục tiêu là xác định phân loại tốt nhất cho vấn đềphân tích Các thuật toán phân loại được xem xét là:
3.4.1 Gaussian Naive Bayes
Naive Bayes 1a mét thuat toan dia trén dinh ly Bayes v ély thuyét xac suat để đưa ra các phán đoán cũng như phân loại dữ liệu dựa trên các dữ liệu được quan sát và thống kê
Gaussian Naive Bayes là một biến thể của Naive Bayes tuân theo phân phối chuẩn Gaussian và hỗ trợ dữ liệu liên tục Khi làm việc với dữ liệu liên tục, một giả định thường được đưa ra là các giá trị liên tục được liên kết với mỗi lớp được phân phối theo phân phối chuẩn (hoặc Gaussian) Gaussian Naive Bayes hỗ trợ các tính năng
và mô hình có giá trị liên tục phù hợp với phân phối Gaussian (chuẩn)
Mô hình này chỉ cần ước tính giá trị trung bình và độ lệch chuẩn của các điểm trong mỗi nhãn, đó là tất cả những gì cần thiết để xác định phân phối như vậy Với mỗi chiều dữ liệu ¡ và một class c, x; tuân theo một phân phối chuẩn có kỳ vọng lÒ ¿ và phương sai đ”.;
1 P(x; | y) = = exp | -
yy 2x0 2
y
26
Trang 32Trong mô hinh Bernoulli đa biến, các đặc trưng là các Boolean độc lập (biến nhị phân) mô tả đầi vào Giống như MultinomialNB, bộ phân loại này phù hợp với dữ liệu rời rạc Sự khác biệt là trong khi MultinomialNB hoạt động với tần suất xuất hiện, BernoulliNB được thiết kế cho các tính năng nhị phân / boolean (biến nhị phân) Loại trình phân loại Naive Bayes này có thể hữu ích khi một từ không mong muốn muốn được phát hiện hoặc một loại từ cụ thể muốn được gắn thẻ trong một tài liệu nhất định Ngoài ra, nó phân biệt với phương pháp đa thức bằng cách tạo ra đìầi ra nhị phân là I—0, Đúng-Sai hoặc Có-Không
Khi đó, p (x; | c ) được tính bằng:
P(¡|e) = p(|e)*:(1 — p(|e)**
với p (ï | e) có thể được hiểu là xác suất từ thứ ¡ xuất hiện trong các văn bản của class c 3.43 Logistic Regression classifler (H G@ quy Logistics)
H8 quy logistics là một thuật toán phân loại Đây là phương pháp nổi tiếng trong thống kê được sử dụng để dự đoán xác suất của một kết quả và đặc biệt phổ biến cho các nhiệm vụ phân loại Thuật toán phân loại được tối ưu hóa cho các biến phân đôi hoặc nhị phân (vấn đ với hai lớp giá trị), được dùng để gán các đối tượng cho một tập hợp giá trị rời rạc (như 0, 1, 2, )
Trong một nhiệm vụ phân loại, đầu ra của một thuật toán thuộc một trong các danh mục được chọn trước khác nhau Mô hình phân loại cế gắng dự đoán giá trị đầi
ra khi đưa ra một số biến đầi vào, đặt ví dụ vào danh mục chính xác
Trong tập dữ liệu này, nghiên cứu liên quan đến đời sống làm việc và đặc điểm cá nhân của nhân viên tại Hoa Kỳ và bạn muốn dự đoán mức độ hài lòng v`Šmôi trường