CHƯƠNG III: ỨNG DỤNG MÔ HÌNH LOGISTIC TRONG XHTD CÁ NHÂN TẠI NHNNo&PTNT VIỆT NAM
3.2. Xây dựng mô hình Logistic xếp hạng tín dụng khách hàng cá nhân tại NHNNo&PTNT Việt Nam
3.2.3. Ước lượng mô hình và phân tích kết quả
Ta tiến hành ước lượng 2 mô hình:
Mô hình 1: Ước lượng mô hình Logistic với đầy đủ 24 biến. Sau đó, loại các biến không có ý nghĩa thống kê (Prob > 0.1) ra khỏi mô hình, và ước lượng mô hình Logistic với các biến còn lại.
Mô hình 2: Loại biến tkiem ra khỏi mô hình để khắc phục hiện tượng đa cộng tuyến. Sau đó uớc lượng các biến còn lại, loại bỏ các biến không có ý nghĩa thống kê ra khỏi mô hình.
Kết quả ước lượng 2 mô hình trên như sau:
Bảng 3.4. Kết quả ước lượng mô hình 1 với đầy đủ 24 biến.
Bảng 3.5. Kết quả ước lượng mô hình 1 sau khi đã loại đi các biến không có ý nghĩa thống kê.
Mô hình 1 sau khi loại đi các biến không có ý nghĩa thống kê vẫn chịu sự tác động của hiện tượng đa cộng tuyến, tuy nhiên, tất cả các biến trong mô hình đều có mức ý nghĩa cao (Prob < 0.1).
Theo kết quả hồi quy của mô hình, thứ tự tác động mạnh giảm dần của các biến lên xác suất khách hàng trả nợ cho ngân hàng là: hv, ts1, dvu, tgct, tkiem, gdinh, gtinh, rrcao. Các biến có tác động thuận chiều, làm tăng khả năng trả nợ của khách hàng gồm có: hv, dvu, ts1, tnhap. Các biến có tác động ngược chiều, làm giảm khả năng trả nợ của khách hàng là các biến còn lại: gdinh, tgct, ginh, rrcao, tkiem.
Biến tkiem có tác động ngược chiều có thể do mô hình có hiện tượng đa cộng tuyến chưa được khắc phục
Bảng 3.6. Kết quả ước mô hình 2 sau khi đã loại biến tkiem để khắc phục hiện tượng đa cộng tuyến.
Bảng 3.7. Kết quả ước lượng mô hình 2 sau khi đã loại biến tkiem và các biến không có ý nghĩa thống kê.
Sau khi ước lượng mô hình 2 đã loại biến tkiem, mô hình không còn hiện tượng đa cộng tuyến. Tiếp tục loại các biến không có ý nghĩa thống kê, ta được kết quả ước lượng ở Bảng 3.7.
Trong mô hình có 2 biến tgct, thue có Prob > 0.1, tuy nhiên Prob của 2 biến này không lớn hơn mức ý nghĩa 10% nhiều nên vẫn chấp nhận được trong mô hình để tăng mức dự báo.
Mặc dù biến tkiem đưa ra khỏi mô hình để giải quyết vấn đề đa cộng tuyến, nhưng biến tnhap khi đó lại trở nên không có ý nghĩa thống kê.
Nhận xét tổng quát 2 mô hình:
Kiểm định bằng Log likelihood Ratio cho thấy rằng mô hình hồi quy là phù hợp với Prob = 0.000
Dựa vào giá trị Pseudo R2, ta có các mô hình lần lượt giải thích được: mô hình 1: 51.37%, mô hình 2: 42.93% khả năng trả nợ của khách hàng. Như vậy, mô hình 2 – là mô hình đã giải quyết vấn đề đa cộng tuyến lại là mô hình có R2 thấp hơn
Về kiểm định -2LL cho thấy, cả 2 mô hình đều có chỉ số tương đối thấp, điều này chứng tỏ mức độ phù hợp của mô hình so với tổng thể. Trong đó, mô hình 2 có mức độ phù hợp thấp hơn
Độ chính xác kết quả dự báo của 2 mô hình:
Bảng 3.8. Độ chính xác kết quả dự báo của mô hình 1
Giải thích: Từ bảng trên, ta thấy: Trong 108 khách hàng được dự báo là có khả năng trả nợ Ngân hàng thì có 101 trường hợp dự báo đúng, tỉ lệ dự báo đúng là 93.52%. Trong 22 người được dự báo là không có khả năng trả nợ, có 17 trường hợp đúng, tỉ lệ dự báo đúng là 70.83%. Nhìn chung, tỉ lệ dự báo đúng của Mô hình 1 là 90.77%
Bảng 3.9. Độ chính xác kết quả dự báo của mô hình 2
Giải thích: Trong 107 trường hợp được dự báo là có khả năng trả nợ, có 100 trường hợp dự báo đúng, tỉ lệ dự báo đúng là 93.46%. Trong 23 trường hợp được dự báo là có khả năng trả nợ, có 6 trường hợp dự báo đúng, tỉ lệ dự báo đúng là 70.83%. Như vậy, tỉ lệ dự báo chính xác của mô hình 2 là 90.00%.
Độ chính xác kết quả dự báo của 2 mô hình đều rất cao, xấp xỉ 90%. Tuy nhiên, mô hình 1 có độ chính xác cao hơn, mô hình 2 có độ chính xác thấp hơn.
Lựa chọn mô hình:
Mô hình 2 không có hiện tượng đa cộng tuyến do đã loại bỏ 2 biến tnhap và tkiem. Nhưng mức độ chính xác dự báo của mô hình 2 lại thấp hơn mô
hình 1, các chỉ tiêu thống kê về mức độ phù hợp của mô hình tổng thể, mức độ giải thích của mô hình 1 cũng cao hơn mô hình
Do đặc trưng của mô hình XHTD là khả năng dự báo. Hơn nữa, các biến tnhap và tkiem lại là 2 biến rất quan trọng, ảnh hưởng trực tiếp đến khả năng trả nợ của khách hàng.
=> Vậy nên, ta vẫn lựa chọn mô hình 1 để làm mô hình XHTD. Hiện tượng đa cộng tuyến có thể được khắc phục khi tăng kích thước mẫu.