Một số kiến thức chuẩn bị về xác suất
Phần tử ngẫu nhiên và phân phối xác suất
Trong thống kê, đầu ra của một phép thử ngẫu nhiên có thể là giá trị số hoặc không phải số, như kết quả khi tung đồng xu hoặc xúc sắc Để gán giá trị số cho các kết quả này, khái niệm biến ngẫu nhiên được đưa ra Giả sử A là một -đại số và là không gian các biến cố thực nghiệm, trong đó chứa các kết quả như {sấp, ngửa} khi tung đồng xu Một biến ngẫu nhiên được định nghĩa như một hàm đo được từ không gian xác suất tới một không gian đo được, thường là không gian các giá trị thực với -đại số Borel Định nghĩa rằng X : E là một biến ngẫu nhiên nếu nó là ánh xạ đo được, và trong trường hợp E = R n và F = B n, X được gọi là véc tơ ngẫu nhiên n chiều Khi n = 1, X được gọi là đại lượng ngẫu nhiên.
Trong Thống kê, phân phối xác suất là quy luật gán xác suất cho mỗi khoảng giá trị trong tập số thực, đảm bảo các tiên đề về xác suất được thỏa mãn Đây là một trường hợp đặc biệt của khái niệm độ đo xác suất, là hàm thỏa mãn các tiên đề của Kolmogorov cho các tập đo được trong không gian đo được Phân bố xác suất của một biến ngẫu nhiên X trên R, được gọi là phân phối xác suất P x trên R, với σ-đại số là σ-đại số Borel B của R, được xác định bằng công thức cụ thể.
Hàm phân phối xác suất P F (B) = P(X -1 (B)) với mọi tập con B của R nằm trong σ-đại số B Định nghĩa hàm phân phối xác suất của phân bố xác suất P X trên R cho một biến ngẫu nhiên X là hàm Fx: R → [0; 1], được xác định bởi công thức cụ thể.
Hàm phân phối được xác định duy nhất bởi phân bố xác suất, và ngược lại, nếu biết hàm phân phối F X, ta có thể tính xác suất P X cho các đoạn thẳng đóng và nửa mở của R bằng các công thức tương ứng.
Hàm phân phối F_X của một phân bố xác suất tùy ý trên R thỏa mãn bốn tính chất quan trọng, cho phép tính toán xác suất cho các tập con Borel khác nhau của R Cụ thể, với mọi a, b thuộc R và a ≤ b, ta có thể xác định giới hạn x tiến tới a, từ đó rút ra được xác suất tương ứng.
1 Đơn điệu không giảm: F X (x) F X (y) với mọi x y
2 Liên tục bên phải: lim 0 F X ( x ) F X ( x ) với mọi x,
Ngược lại, mọi hàm số thực trên R thoả mãn 4 tính chất trên là hàm phân phối của một phân bố xác suất trên R
Trong các công việc tính toán liên quan đến biến ngẫu nhiên, chúng ta thường chỉ cần quan tâm đến phân bố xác suất trên R mà không cần nhớ đến không gian xác suất ban đầu Các phân bố trên R được chia thành ba loại chính: rời rạc, liên tục và hỗn hợp Một phân bố P X trên R được gọi là liên tục khi hàm phân phối xác suất F X là hàm liên tục trên R Nếu tồn tại một hàm số tích phân không âm ρ X : R → R +, phân bố được gọi là liên tục tuyệt đối.
Hàm X : R R + thoả mãn như trên gọi là hàm mật độ của P X
Hàm mật độ của một phân bố xác suất Px là liên tục tuyệt đối trên R và duy nhất theo nghĩa xác suất, nghĩa là nếu Px có hai hàm mật độ 1 và 2, thì 1 = 2 hầu hết trên R, tức là tập {x ∈ R, 1(x) ≠ 2(x)} có độ đo Lebesgue bằng 0 Một phân bố xác suất có thể liên tục mà không liên tục tuyệt đối, nhưng khi đề cập đến phân bố liên tục trên R, thường được hiểu là nó liên tục tuyệt đối và được mô tả bởi một hàm mật độ Hàm mật độ thực chất là đạo hàm của hàm phân phối xác suất hầu hết mọi nơi Nhiều vấn đề thực tiễn có thể được mô hình hóa bằng các biến ngẫu nhiên với phân bố xác suất liên tục, chẳng hạn như nhiệt độ nước biển, giá dầu hoả, sản lượng điện và trọng lượng trứng gà.
Một điểm x thuộc R được xác định là điểm hạt của phân bố xác suất P X nếu PX{x} > 0 Điều này dẫn đến kết luận rằng một phân bố được coi là liên tục khi và chỉ khi nó không chứa điểm hạt.
Trong trường hợp phân bố xác suất không liên tục, gọi
Tập hợp các điểm hạt của phân phối xác suất, ký hiệu là AX, bao gồm các điểm gián đoạn của hàm phân phối xác suất và có thể là tập hữu hạn hoặc đếm được Một phân bố xác suất PX được gọi là rời rạc khi nó tập trung hoàn toàn vào các điểm hạt, tức là P X (A X ) = 1 và P X (R\ A X ) = 0 Đối với mỗi phân phối xác suất rời rạc, hàm phân phối có dạng hàm bậc thang, với các bước nhảy tại các điểm hạt tương ứng với giá trị xác suất của từng điểm hạt đó.
Một số đặc trưng của đại lượng ngẫu nhiên
Khi nghiên cứu biến ngẫu nhiên, việc phân tích các tính chất và đặc trưng của nó là rất quan trọng để rút ra thông tin và kết luận Một trong những thông tin quan trọng nhất là giá trị kỳ vọng, hay giá trị trung bình Đối với biến ngẫu nhiên rời rạc, giá trị kỳ vọng, ký hiệu là E(X), được tính bằng trung bình cộng có trọng số của biến ngẫu nhiên đó.
Hai biến ngẫu nhiên có cùng phân bố xác suất trên R sẽ có cùng kỳ vọng Do đó, thay vì chỉ đề cập đến kỳ vọng của từng biến ngẫu nhiên, chúng ta có thể nói về kỳ vọng của phân bố xác suất trên R.
Trong trường hợp không gian xác suất là một tập hợp hữu hạn hoặc đếm được, ký hiệu là = { 1, 2, } với xác suất P( i), và tổng xác suất các sự kiện là i P( i) = 1, công thức tính giá trị kỳ vọng của một biến ngẫu nhiên X được xác định rõ ràng.
Trong trò chơi đề, chỉ có 1 trong 100 số sẽ trúng, còn lại 99 số sẽ bị trượt Nếu người chơi thắng, họ nhận được 70 lần số tiền đặt cọc, còn nếu thua sẽ mất toàn bộ số tiền đó Với số tiền đặt cọc ban đầu là T, kỳ vọng số tiền nhận lại được tính là 0,99 * 0 + 0,01 * 70T = 0,7T, dẫn đến kỳ vọng lỗ là 0,3T.
Trong trường hợp tổng quát, công thức tính giá trị kỳ vọng được viết dưới dạng phân Lesbesgue của X trên không gian xác suất (, R):
E( )Một số tính chất cơ bản của kỳ vọng là:
+ Kỳ vọng của một bằng số c (biến ngẫu nhiên chỉ nhận một giá trị) chính là bằng số đó
+ Tính tuyến tính: Nếu X, Y là hai biến ngẫu nhiên và a, b là hai hằng số thì
+ Đơn điệu: Nếu X 0 thì E(X) 0 Tổng quát hơn,
Giá trị kỳ vọng liên quan đến trung bình cộng của các giá trị trong một biến ngẫu nhiên, bên cạnh đó còn có khái niệm giá trị kỳ vọng hình học, tương ứng với trung bình nhân Ví dụ dưới đây minh chứng cho tầm quan trọng của trung bình nhân trong thực tế.
Trong bốn năm, giá nhà trải qua những biến động đáng kể: năm đầu giảm 15%, năm thứ hai tăng 35%, năm thứ ba giảm 20% và năm thứ tư tăng 20% Tính trung bình cộng, ta có (-15 + 35 - 20 + 20)/4 = 5%, cho thấy giá nhà dường như tăng trung bình 5% mỗi năm Tuy nhiên, con số này không phản ánh chính xác xu hướng tăng trưởng thực tế của giá nhà trong từng năm.
Nếu gọi giá nhà lúc đầu là X, sau năm đầu giá là (1-0,15)X
Sau năm thứ 2 giá nhà là (1+ 0,35)(1-15)X
Tiếp tục sau năm thứ ba giá nhà là (1-0,20)(1+35)(1-0,15)X
Sau 4 năm giá nhà là (1+0,20)(1-0,20)(1+0,35)(1-0,15)X = 1,1016X
Sau 4 năm, giá nhà chỉ tăng 10,16% thay vì 20% như nhiều người nghĩ Để có cái nhìn chính xác về mức độ tăng trưởng hàng năm trong giai đoạn này, cần tính trung bình nhân các con số 1 + 0,20, 1 - 0,20, 1 + 0,35, và 1 - 0,15, sau đó trừ đi 1 Kết quả cho thấy giá nhà có tốc độ tăng trưởng trung bình hàng năm là 2,449%.
Trong một dãy số dương a1, a2,…, an với ai > 0 cho mọi i, ngoài giá trị trung bình cộng ( ai / n), chúng ta còn có trung bình nhân được tính bằng ( ai)^(1/n) Trung bình nhân có thể được định nghĩa thông qua trung bình cộng, hàm logarithm tự nhiên ln và hàm ngược của hàm ln, tức là hàm exp.
Kỳ vọng hình học là một khái niệm quan trọng trong xác suất và thống kê, với tính chất trung bình nhân không vượt quá trung bình cộng Dấu "=" chỉ xảy ra khi tất cả các số trong tập hợp bằng nhau Định nghĩa kỳ vọng hình học được định nghĩa như sau: Nếu X là biến ngẫu nhiên chỉ nhận giá trị dương, thì giá trị kỳ vọng hình học của X, ký hiệu là G(X), được tính theo công thức cụ thể.
Giá trị kỳ vọng hình học luôn không vượt quá giá trị kỳ vọng G(X) ≤ E(X) Đẳng thức này chỉ xảy ra khi hàm phân phối F là hằng số hầu hết trên không gian xác suất, tức là tồn tại một số thực dương c sao cho
Giá trị trung bình E(X) đại diện cho các giá trị của biến ngẫu nhiên X Để hiểu rõ hơn về cách mà các giá trị X tập trung và phân tán quanh E(X), người ta sử dụng phương sai Phương sai là một đại lượng quan trọng để đo lường mức độ tập trung và phân tán của X.
D(X) = E[X-E(X)] 2 còn D X ( ) được gọi là độ lệch tiêu chuẩn của X.
Một số phân phối thường gặp
Trong thực tế, có một số phân phối thường gặp, trong đó phân phối đều trên đoạn [a; b] được định nghĩa cho hai số thực a và b với b > a Phân phối này là một phân bố liên tục với hàm mật độ xác suất cụ thể.
Phân bố xác suất đều trên khoảng [a;b], ký hiệu là U(a;b), cho phép thay thế đoạn thẳng đóng [a;b] bằng các khoảng mở (a;b) hoặc nửa đóng, nửa mở.
Vị trí của một người đi bộ trên đường có thể được mô hình hóa bằng một biến ngẫu nhiên với phân bố đều, khi chúng ta không có thông tin gì ngoài việc người đó đang di chuyển trên quãng đường đó.
Khái niệm phân bố đều có thể được mở rộng trong không gian nhiều chiều, cụ thể là không gian xác suất R^n (với n ≥ 2) Trong trường hợp này, xác suất của một miền con n chiều tỷ lệ thuận với thể tích n chiều của miền con đó Định nghĩa về phân bố xác suất chuẩn (hay phân bố Gauss) trên R với trung bình μ và độ lệch chuẩn σ cho thấy đây là một phân bố liên tục, được mô tả bởi hàm mật độ xác suất đặc trưng.
Ký hiệu phân phối chuẩn trên đây là N(, 2 ), phân bố chuẩn với =
Phân bố chuẩn, với tham số 0 và độ lệch chuẩn 2 = 1, được coi là chuẩn tắc trong thống kê Đây là một trong những phân bố quan trọng nhất vì nhiều phân bố xác suất thực tế có hình dạng tương tự như phân bố chuẩn.
Phân bố chiều cao của đàn ông, chỉ số IQ và giá chứng khoán trong tương lai đều có thể được mô tả bằng các phân bố xác suất Trong đó, giá trị trung bình và phương sai của phân bố chuẩn N(μ,σ²) lần lượt là μ và σ² Ngoài ra, phân bố mũ với tham số λ là một loại phân bố xác suất liên tục trên R, được định nghĩa bởi hàm mật độ xác suất đặc trưng.
Phân bố mũ là một công cụ hữu ích cho các mô hình xác suất liên quan đến "khoảng cách giữa hai lần xuất hiện" Ví dụ điển hình bao gồm khoảng thời gian giữa hai cuộc gọi điện thoại hoặc khoảng cách giữa hai gen đột biến liên tiếp trên một dải.
Các phân phối được đề cập là các phân phối liên tục trên R Dưới đây, chúng ta sẽ giới thiệu một số phân phối đặc trưng trong trường hợp phân phối rời rạc Định nghĩa 11 nêu rõ rằng một biến ngẫu nhiên X được gọi là có phân bố nhị thức với các tham số n và p nếu hàm phân bố xác suất của nó có dạng nhất định.
Giá trị kỳ vọng và phương sai của biến ngẫu nhiên có phân bố nhị thức lần lượt là np và np(1-p) Một biến ngẫu nhiên Y được gọi là phân phối Poisson với tham số λ > 0 nếu nó nhận các giá trị nguyên y = 0, 1, 2,… với xác suất tương ứng.
Khi đó ta ký hiệu Y P ( )
Phân phối Poisson là giới hạn của phân bố nhị thức với tham số p / n
Trong lý thuyết xác suất, nhà toán học Poisson nổi bật với phân bố Poisson và quá trình Poisson, những khái niệm quan trọng mà chúng ta sẽ phân tích chi tiết trong phần tiếp theo của luận văn.
Quá trình ngẫu nhiên
Một số quá trình ngẫu nhiên thường gặp
Chuyển động Brown, hay còn gọi là quá trình Wiener, là một trong những quá trình ngẫu nhiên quan trọng nhất, được đặt tên theo nhà thực vật học Robert Brown Quá trình này mô phỏng chuyển động của các hạt trong môi trường lỏng hoặc khí, đồng thời cũng là mô hình toán học cho các chuyển động tương tự, thường được gọi là mô hình vật lý hạt Chuyển động Brown có nhiều ứng dụng thực tiễn, đặc biệt trong việc mô phỏng sự dao động của thị trường chứng khoán, và được xem là một trong những quá trình ngẫu nhiên liên tục đơn giản nhất.
Quá trình Wiener, được đặt tên theo Norbert Wiener, là một quá trình ngẫu nhiên liên tục và là một trong những quá trình Lesvy nổi bật Nó khác với các quá trình ngẫu nhiên độc lập, thường được áp dụng trong toán học, kinh tế và vật lý Quá trình Wiener W(t) có ba đặc điểm chính.
2 W t liên tục hầu chắc chắn
3 W t có số gia độc lập với phân phối W t - W s ~ N(0, t - s) (với 0 s
t) Ở đây N (, 2 ) biểu thị phân phối chuẩn với giá trị trung bình và phương sai 2 Điều kiện quá trình có số gia độc lập có nghĩa là nếu
Trong khoảng thời gian từ s1 đến t1 và từ s2 đến t2, các biến ngẫu nhiên W t1 - W s1 và W t2 - W s2 là độc lập với nhau Một ví dụ điển hình của quá trình ngẫu nhiên rời rạc là quá trình Poisson, sẽ được thảo luận chi tiết ở phần tiếp theo.
Giới thiệu về hồi quy Poisson
Phân bố Poisson
Phân phối Poisson, được đặt theo tên của nhà toán học Pháp Siméon Denis Poisson (1781 - 1840), là một loại phân phối xác suất Một biến ngẫu nhiên Y có phân phối Poisson với tham số λ > 0 nếu nó nhận các giá trị nguyên y = 0, 1, 2,… với xác suất tương ứng.
Giá trị trung bình và phương sai của phân phối này được chỉ ra bằng:
Trong phân phối Poisson, một tính chất quan trọng là tổng của các biến ngẫu nhiên Poisson độc lập cũng sẽ có phân phối Poisson Cụ thể, nếu Y1 và Y2 là các biến ngẫu nhiên độc lập với Y_i ~ P(λ_i) (i = 1, 2), thì tổng Y1 + Y2 sẽ tuân theo phân phối Poisson với tham số λ_1 + λ_2 Kết quả này có thể được mở rộng cho tổng của nhiều hơn hai biến ngẫu nhiên Poisson.
Giả sử có n nhóm quan sát với phương sai đồng nhất, ký hiệu Y_ij là số lượng biến cố của quan sát thứ j trong nhóm thứ i Tập hợp Y_i đại diện cho toàn bộ các quan sát của nhóm thứ i Dưới giả thiết độc lập, Y_ij tuân theo phân phối Poisson với tham số λ_i, dẫn đến Y_i cũng tuân theo phân phối Poisson với tham số n_iλ_i.
Quá trình hồi quy Poisson
Quá trình Poisson là một quá trình ngẫu nhiên được xác định bởi sự xuất hiện của các biến cố Một quá trình ngẫu nhiên N(t) được coi là một quá trình Poisson (thời gian - thuần nhất, một chiều) khi nó tuân theo các đặc điểm nhất định.
2 Số các biến cố xảy ra trong hai khoảng thời gian không giao nhau là các biến ngẫu nhiên độc lập
3 Xác suất của số biến cố trong một khoảng con [t, t + ] nào đó được cho bởi công thức
Trong một quá trình Poisson, tham số cường độ dương λ là cố định, cho phép mô tả số lần xuất hiện của biến ngẫu nhiên N(t+τ) - N(t) trong khoảng thời gian [t, t+τ] theo phân bố Poisson với tham số λτ Quá trình này gán cho mỗi khoảng thời gian hoặc vùng không gian một số ngẫu nhiên các biến cố, với các đặc điểm chính: a) xác suất xảy ra một biến cố tỷ lệ với chiều dài khoảng thời gian hoặc thể tích vùng không gian; b) xác suất xảy ra hai hoặc nhiều biến cố trong khoảng thời gian rất nhỏ là không đáng kể; c) số lượng biến cố xảy ra trong các khoảng thời gian hoặc vùng không gian rời nhau là độc lập.
Phân phối xác suất của số lượng các biến cố trong một khoảng thời gian cố định tuân theo phân phối Poisson, với giá trị trung bình được xác định là = t, trong đó là cường độ xảy ra các biến cố và t là chiều dài khoảng thời gian Một quá trình ngẫu nhiên đáp ứng ba điều kiện a, b và c được gọi là quá trình Poisson.
Quá trình Poisson là một trong những quá trình Lévy nổi bật và là ví dụ điển hình của các quá trình Markov thời gian liên tục Đây là một quá trình sinh sản thuần tuý, minh họa cho khái niệm sinh - tử trong tự nhiên.
Số cuộc điện thoại tới tổng đài trong một khoảng thời gian xác định có thể được mô tả bằng phân bố Poisson, với các khoảng thời gian không giao nhau có tính độc lập thống kê Đây là một quá trình Poisson một chiều, trong đó có thể giả định tỉ lệ trung bình là hằng số, chẳng hạn như 3 cuộc gọi mỗi phút Giá trị kỳ vọng của số cuộc gọi trong một khoảng thời gian t được tính bằng tỉ lệ nhân với khoảng thời gian Đối với các tình huống phức tạp hơn, người ta thường sử dụng hàm tỉ lệ không hằng số, (t), để tính giá trị kỳ vọng của số cuộc gọi trong khoảng thời gian từ a đến b.
Ví dụ 2 Số hạt photon đập vào máy phát hiện photon trong một khoảng thời gian xác định có thể tuân theo một phân bố Poisson
Trong những ngày đầu của Đại chiến Thế giới lần thứ II, số lượng bom rơi xuống một khu vực cụ thể tại London có thể được mô tả bằng phân bố Poisson Hơn nữa, số bom rơi xuống hai khu vực không giao nhau trong thành phố được coi là độc lập về mặt thống kê Cụ thể, số bom rơi xuống khu vực A được xem như một quá trình Poisson hai chiều trong không gian xác định bởi khu vực này.
Các nhà thiên văn học xem số lượng sao trong một thể tích vũ trụ nhất định như một biến ngẫu nhiên theo phân bố Poisson Họ coi số sao trong hai vùng vũ trụ không giao nhau là độc lập thống kê Số sao quan sát được trong một thể tích V cụ thể được mô tả như một quá trình Poisson ba chiều trong không gian xác định bởi thể tích đó.
Mô hình loga tuyến tính cho quá trình Poisson
Giả sử chúng ta có một tập dữ liệu với n quan sát Y1, Y2,…,Yn là các biến ngẫu nhiên độc lập theo phân phối Poisson, với Yi ~ P(μi) Mục tiêu của chúng ta là xác định rằng μi phụ thuộc vào một véc tơ các biến độc lập, và chúng ta có thể khởi đầu bằng việc áp dụng mô hình tuyến tính đơn giản.
Trong mô hình tuyến tính, để giải quyết vấn đề giá trị trung bình không âm, ta sử dụng logarit của giá trị trung bình với công thức i log ( i ) Mô hình này được biểu diễn bằng log( i ) x i ' j, trong đó j thể hiện sự thay đổi của loga giá trị trung bình tương ứng với mỗi thay đổi của x j Khi lấy luỹ thừa cơ số e cho cả hai vế của mô hình, ta có thể chuyển đổi về dạng mô hình mong muốn.
Để ước lượng các tham số của phân phối Poisson trong mô hình, phương pháp ước lượng hợp lý cực đại được áp dụng Đầu tiên, hàm hợp lý được xây dựng bằng cách tính tích các giá trị của biểu thức từ n quan sát độc lập có phân phối Poisson với tham số μi, tuân theo điều kiện đã nêu.
Lấy loga hai vế ta có
Trong mô hình loga tuyến tính Poisson, biến phụ thuộc được xác định bởi các biến độc lập xi, trong khi β là vector chứa p tham số Để tìm ước lượng hợp lý cực đại, ta cần lấy đạo hàm riêng của hai vế theo từng phần tử của β và thiết lập chúng bằng 0 Các nghiệm thu được từ các phương trình này sẽ thỏa mãn điều kiện cần thiết của mô hình.
Trong phương trình X ' y = Y 'μ̂, X đại diện cho ma trận thiết kế, trong đó mỗi hàng là một quan sát và mỗi cột là biến dự báo, bao gồm cả hằng số Y là biến đáp ứng, còn μ̂ là vectơ giá trị dự báo được tính toán thông qua ước lượng β̂ Giá trị dự báo này được xác định bằng cách lấy exp mũ của dự báo tuyến tính η = X 'β̂.
Một độ đo đánh giá mức độ phù hợp của mô hình với tập giá trị quan sát là độ chệch có dạng
Với cỡ mẫu lớn, đại lượng D có phân phối xấp xỉ phân phối khi bình phương với (n-p) bậc tự do, trong đó n là số lượng quan sát và p là số lượng tham số Vì lý do này, D thường được sử dụng trực tiếp để kiểm tra tính chính xác của mô hình.
Một độ đo khác có thể dùng thay thế là thống kê Khi bình phương của Peason
Khi cỡ mẫu lớn, phân phối thống kê Pearson gần giống với phân phối khi bình phương với (n-p) bậc tự do Hai độ đo này được sử dụng để kiểm định sự phù hợp của mô hình với dữ liệu quan sát.
Mô hình hồi quy Poisson tổng quát
Ước lượng tham số ( ', )
Hàm hợp lý của (13) được cho bởi
Hàm log hợp lý là:
Thay công thức hàm mật độ ở (13) vào (15) ta thu được
Bằng cách lấy đạo hàm riêng theo từng tham số và cho chúng bằng 0, ta thu được
Hệ phương trình hợp lý trên không tuyến tính với các tham số ,, chúng được giải bằng cách dùng phương pháp lặp Newtơn - Raphson
Lấy đạo hàm riêng của (16) ta nhận được ma trận thông tin Fisher )
Để tính toán phương sai của ước lượng hợp lý cực đại, ta sử dụng ma trận Hessian, ký hiệu là H, một ma trận vuông cấp p+2 Ma trận nghịch đảo của I (β, α) cung cấp thông tin về các phương sai này, trong đó I là kỳ vọng của hiệu các đạo hàm cấp hai Toàn bộ ma trận Hessian chứa các đạo hàm riêng cấp hai, cho phép chúng ta xác định các phương sai cần thiết cho ước lượng hợp lý cực đại.
Khi ma trận Hessian được tính tại ước lượng hợp lý cực đại \( \hat{\phi} = (\beta', \hat{\alpha})' \) và có nghịch đảo âm, ta sẽ thu được ma trận phương sai - hiệp phương sai, được ký hiệu là \( S^2 \{\hat{\beta}, \hat{\alpha}\} = [-H(\hat{\phi})]^{-1} \).
Sự phù hợp của thống kê hợp lý
Để xác định sự phù hợp của mô hình CGPS, chúng ta áp dụng tỉ số hợp lý tương tự như trong hồi quy Poisson, với bài toán kiểm định giả thuyết là trọng tâm.
Thống kê tỉ lệ hợp lý có dạng
D được tính bằng công thức D = -2(LL(β̂0, α̂, ŷi) - LL(β̂, α̂, ŷiU)), trong đó LL(β̂0, α̂, ŷi) và LL(β̂, α̂, ŷiU) lần lượt là các hàm loga hợp lý từ mô hình hạn chế và không hạn chế Theo giả thuyết không (21), thống kê D tuân theo phân phối χ² với p bậc tự do.
4.3 Kiểm định tham số hồi quy và các tham số phân tán
Mô hình hồi quy Poisson tổng quát, khi được xây dựng chính xác và phù hợp với tập số liệu, sẽ đảm bảo rằng ước lượng hợp lý cực đại tồn tại và đạt được kết quả tiệm cận chuẩn Cụ thể, ước lượng này được biểu diễn dưới dạng ˆ (ˆ ' ,ˆ )' và tối đa hóa hàm loga hợp lý của mô hình với (' ,)'.
Từ đó giúp ta có các kết luận về các hệ số hồi quy và các tham số phân tán
Kiểm định hệ số phân tán
Hiện tượng mất theo dõi có thể tác động đến mô hình phân tích, và mô hình này cũng có thể dẫn đến mô hình hồi quy Poisson tổng quát Do đó, việc kiểm định là cần thiết để đánh giá ảnh hưởng của hiện tượng này.
Sự quan trọng của tham số α trong mô hình hồi quy Poisson tổng quát được thể hiện qua việc bác bỏ giả thuyết H0 Nếu giả thuyết H0 không được chấp nhận, điều này khẳng định sự xuất hiện của tham số α trong mô hình.
Nếu giả thiết H 0 đúng, D có phân phối 2 với một bậc tự do
Kiểm định các tham số hồi quy Để kiểm định các hệ số mũ J , j = 1, 2, …, p ta có bài toán
H : J = 0; H1: J 0 Thống kê cho giả thuyết không là
là ước lượng hợp lý cực đại của hệ số J , s( ˆ j mle
) là sai số chuẩn của các ước lượng này, được xác định từ ước lượng của ma trận phương sai – hiệp phương sai, S 2 ( ˆ , ) Dưới giả thuyết không, thống kê
Z có phân bố tiệm cận chuẩn.
Kiểm định tham số hồi quy, tham số phân tán
Chương này tập trung vào việc áp dụng mô hình hồi quy Poisson để phân tích tình hình tín dụng tiêu dùng, một loại hình tín dụng phổ biến tại công ty TNHH MTV TÀI CHÍNH VIỆT – SOCIÉTÉ GÉNÉRALE SG VIETFINANCE, chi nhánh Hà Nội.
Tập đoàn Société Générale, một trong những tập đoàn tài chính hàng đầu tại Châu Âu, đã có gần 150 năm hoạt động và phát triển Ngân hàng này được thành lập với mục tiêu cung cấp dịch vụ tài chính vững chắc và đáng tin cậy cho khách hàng.
Vào ngày 4 tháng 5 năm 1864, Napoleon đã ký cấp phép cho tập đoàn hoạt động trong ba lĩnh vực chính: Dịch vụ tài chính, Quản lý đầu tư Toàn cầu và Ngân hàng Để mở rộng ra thị trường quốc tế, tập đoàn thành lập văn phòng thường trực tại Luân Đôn vào năm 1871 Đến năm 1913, tập đoàn đã có hơn 1000 chi nhánh và 122.000 cổ đông, và đến năm 1920, Société Générale trở thành tập đoàn hàng đầu tại Pháp Năm 1940, Société Générale mở chi nhánh tại New York và Buenos Aires Dù được quốc hữu hóa vào năm 1954, tập đoàn đã thuộc sở hữu của Nhà nước Pháp trong hơn 40 năm Kể từ khi thành lập, tập đoàn không ngừng mở rộng hoạt động sang các nước Đông Âu và châu Á, với Việt Nam được chọn là điểm đến cho sự phát triển ngành tín dụng tiêu dùng từ năm 2007.
Tháng 5 năm 2007 Société Générale đề nghị ngân hàng nhà nước Việt Nam cấp phép và vận hành công ty tài chính tín dụng khách hàng phi ngân hàng dưới tên gọi là: “Công ty TNHH MTV Tài chính Việt Société Générale – SG VietFinance”, tháng 9 năm 2007 công ty khai trương hoạt động tại Việt Nam
+ Tên công ty: Công ty TNHH MTV Tài chính Việt Société Générale – SG VietFinance viết tắt là SGVF.
Phân tích hoạt động tín dụng tiêu dùng
Mô tả số liệu
Chương này tập trung vào việc áp dụng mô hình hồi quy Poisson để phân tích tình hình tín dụng tiêu dùng, một loại hình tín dụng phổ biến tại Việt Nam, tại công ty TNHH MTV TÀI CHÍNH VIỆT – SOCIÉTÉ GÉNÉRALE SG VIETFINANCE, chi nhánh Hà Nội.
Tập đoàn Société Générale, một trong những tập đoàn tài chính hàng đầu tại Châu Âu, đã có gần 150 năm lịch sử hoạt động Được thành lập từ một ngân hàng, Société Générale đã phát triển mạnh mẽ và vững chắc trong lĩnh vực tài chính.
Ngày 4 tháng 5 năm 1864, Napoleon đã ký cấp phép cho tập đoàn dẫn đầu trong lĩnh vực dịch vụ tài chính, quản lý đầu tư toàn cầu và ngân hàng Để mở rộng hoạt động quốc tế, tập đoàn đã thành lập văn phòng thường trực tại Luân Đôn vào năm 1871 Đến năm 1913, tập đoàn đã có hơn 1000 chi nhánh và 122.000 cổ đông, trở thành tập đoàn dẫn đầu tại Pháp vào năm 1920 Năm 1940, Société Générale mở chi nhánh tại New York và Buenos Aires Mặc dù được quốc hữu hóa vào năm 1954, tập đoàn vẫn hoạt động dưới quyền sở hữu của Nhà nước Pháp trong hơn 40 năm Từ đó đến nay, Société Générale đã không ngừng mở rộng sang các nước Đông Âu và châu Á, với Việt Nam được chọn làm điểm đến cho sự phát triển ngành tín dụng tiêu dùng từ năm 2007.
Tháng 5 năm 2007 Société Générale đề nghị ngân hàng nhà nước Việt Nam cấp phép và vận hành công ty tài chính tín dụng khách hàng phi ngân hàng dưới tên gọi là: “Công ty TNHH MTV Tài chính Việt Société Générale – SG VietFinance”, tháng 9 năm 2007 công ty khai trương hoạt động tại Việt Nam
+ Tên công ty: Công ty TNHH MTV Tài chính Việt Société Générale – SG VietFinance viết tắt là SGVF
+ Địa chỉ đăng ký của công ty: 2A – 4A phố Tôn Đức Thắng, phòng
1503, Quận 1, Thành phố Hồ Chí Minh
+ Chi nhánh tại Hà Nội chính thức được khai trương vào tháng 4 năm
Từ năm 2009, công ty vẫn hạch toán phụ thuộc vào trụ sở chính mà chưa có sự tách biệt Đồng thời, công ty đã mở rộng hoạt động bằng cách thành lập thêm các chi nhánh tại các thành phố như Cần Thơ, Đà Nẵng, Hải Phòng, Đồng Nai, và Bà Rịa – Vũng Tàu.
Tín dụng tiêu dùng là hình thức cung cấp tín dụng cá nhân thông qua các nghiệp vụ như cho vay mua trả góp, phát hành thẻ tín dụng và cho vay tiền, theo quy định của Ngân hàng Nhà nước Loại tín dụng này nhằm đáp ứng nhu cầu mua sắm phương tiện sinh hoạt và nhà ở của người dân Đồng thời, tín dụng tiêu dùng cũng được thực hiện qua ngành thương mại và dịch vụ thông qua việc bán hàng trả góp, nhằm kích thích tiêu dùng dựa trên thu nhập trong tương lai của người tiêu dùng.
Phát triển tín dụng tiêu dùng đang trở thành xu hướng tất yếu trong nền kinh tế hiện đại, khi nhu cầu nâng cao đời sống của con người ngày càng tăng Dịch vụ tín dụng tiêu dùng, với châm ngôn “dùng trước, trả tiền sau”, giúp người dân dễ dàng tiếp cận các sản phẩm cần thiết bằng cách trả trước một phần và được hỗ trợ phần còn lại qua tín dụng Công ty SGVF chuyên cung cấp các gói vay trả góp cho xe máy và các mặt hàng điện máy, thông qua hợp tác với các đại lý chính hãng và trung tâm điện máy lớn Tại Hà Nội, nhân viên công ty sẽ tìm kiếm khách hàng có nhu cầu, tư vấn và hướng dẫn họ làm hồ sơ vay Trong bối cảnh kinh tế khó khăn do khủng hoảng nợ công tại châu Âu và lạm phát cao tại Việt Nam, tín dụng tiêu dùng được kỳ vọng sẽ kích thích mua sắm và thúc đẩy sự phát triển của các ngành sản xuất, dịch vụ, đồng thời nâng cao đời sống người dân.
Luận văn này nghiên cứu ảnh hưởng của tâm lý khách hàng đối với quyết định mua sắm, đặc biệt là trong dịch vụ vay trả góp của Công ty Bằng cách sử dụng thống kê toán học, nghiên cứu thu thập dữ liệu kinh doanh tại chi nhánh Hà Nội nhằm đưa ra các giải pháp kinh doanh hiệu quả, mang lại lợi ích thiết thực cho cả công ty và xã hội.
Trong một nghiên cứu tại Công ty Tài chính Việt, 2.179 hồ sơ khách hàng tham gia hình thức mua trả góp đã được thu thập từ 19 điểm bán hàng xe máy và điện máy ở Hà Nội Các quận tham gia bao gồm Ba Đình, Đống Đa, Hai Bà Trưng, Cầu Giấy, Thanh Xuân, Hà Đông, Đông Anh, Thanh Trì và Hoàng Mai.
Mỗi hồ sơ khách hàng bao gồm các thông tin quan trọng như tên, giới tính, ngày sinh, địa chỉ hiện tại, ngày ký hợp đồng, điểm bán hàng, loại sản phẩm đã mua, giá sản phẩm tại thời điểm giao dịch, số tiền khách hàng trả trước, số tiền vay, thời hạn vay, cùng với thông tin về nhân viên tư vấn, bao gồm tên và trình độ học vấn, chuyên môn của họ.
Số lượng sản phẩm mà khách hàng mua và tham gia dịch vụ cho vay của công ty là yếu tố quan trọng để đánh giá hiệu quả kinh doanh của công ty cũng như các đại lý bán hàng liên kết Do đó, trong mô hình nghiên cứu, biến quan sát phụ thuộc Y được xác định là tổng số sản phẩm bán ra thông qua dịch vụ cho vay trả góp trong một khoảng thời gian nhất định tại một địa điểm bán hàng.
Trong số liệu gốc, biến sanphamit có hai giá trị mc cho sản phẩm xe máy và it cho sản phẩm công nghệ cao Bảng 1 mô tả sự phân bố số lượng tiêu thụ của hai loại sản phẩm này tại các đại lý của Công ty.
Bảng 1: Thống kê tổng số xe máy (mc) và sản phẩm công nghệ cao (it)
Để đảm bảo số liệu phù hợp với mô hình Poisson cho dữ liệu đếm, chúng tôi đã mã hóa lại và tạo ra biến quan sát "sanphamit", đại diện cho tổng số sản phẩm điện máy và điện lạnh như điều hòa, máy giặt, laptop, ti vi, và máy ảnh kỹ thuật số được bán theo hình thức vay trả góp trong một ngày tại một khu vực Đồng thời, chúng tôi cũng thiết lập biến quan sát "xemay", thể hiện tổng số lượng xe máy được bán bằng hình thức vay trả góp trong cùng một thời gian và khu vực Hai biến "sanphamit" và "xemay" là các biến đếm, phù hợp với mô hình hồi quy Poisson, và được sử dụng làm biến phụ thuộc trong phân tích hồi quy.
Các biến độc lập bao gồm:
Biến macoso là biến mô tả vị trí của các đại lý bán hàng liên kết với Công ty Tài chính Việt, được đặt tại các quận như Đống Đa, Ba Đình, Hai Bà Trưng, Cầu Giấy, Thanh Xuân, Hà Đông, Đông Anh, Thanh Trì và Hoàng Mai Dữ liệu gốc của macoso bao gồm các biến như "ba dinh" cho cơ sở Ba Đình, "cau giay" cho cơ sở Cầu Giấy, "dong da" cho cơ sở Đống Đa, "hai ba trưng" cho cơ sở Hai Bà Trưng, và "thanh xuan ha dong" cho cơ sở Thanh Xuân.
Hà Đông), “dong anh thanh tri hoang mai” (cơ sở Đông Anh – Thanh Trì –
Hoàng Mai) Thống kê số lượng sản phẩm được bán tại các cơ sở được mô tả trong Bảng 2
Bảng 2: Số liệu bán hàng tại các cơ sở
Trong tổng số 2,179 hồ sơ, Đống Đa ghi nhận số lượng khách hàng cao nhất với 511 hồ sơ, chiếm 23.45% tổng quan sát Để phù hợp với mô hình đếm, các số liệu đã được mã hóa thành các biến mới chỉ nhận giá trị 0 và 1 Nhóm chứng được chọn là cơ sở Đống Đa, trong khi các biến mới khác bao gồm cơ sở Ba Đình Các khu vực khác như Thanh Xuân, Hai Bà Trưng và Cầu Giấy cũng có số lượng khách hàng đáng kể, lần lượt là 373, 308 và 319 hồ sơ.
CauGiay (cơ sở Cầu Giấy), HaiBa (cơ sở Hai Bà Trưng), TXHDong (cơ sở
Kết quả phân tích
A/ Mô hình hồi quy Poisson dự báo số lượng tiêu thụ sản phẩm công nghệ cao
Sau khi thực hiện phân tích dữ liệu trong Stata, chúng tôi đã áp dụng mô hình hồi quy Poisson để khảo sát sự phụ thuộc của biến quan sát sphamit vào các yếu tố như gioikh, pos-khan, gioi_th, BaDinh, CauGiay, HaiBa, TXHaDong, DATTHMai, Duoi15Tr, Tu30Tr, D30PT, Tu40PT, Duoi1N, ThHan1N, ThH1323T, TuoiKHDuoi30, TuoiKHTu45, KHBaDinh, CGTLTayHo, HdongTXuan, TtriHmai, HBTrung, LBGLDAnh, Hkiem, Nthanh, CMKinhte, CMQuanly và CMkhac Kết quả chi tiết được trình bày trong Bảng 12.
Bảng 12: Kết quả dự báo số lượng tiêu thụ sản phẩm công nghệ cao
BaDinh -19.04156 1560.36 -0.01 0.990 -3077.29 3039.207 gioi_th 1.346203 3186664 4.22 0.000 7216287 1.970778 pos_khan -.3485535 1897229 -1.84 0.066 -.7204036 0232967 gioikh 0981493 1014904 0.97 0.334 -.1007682 2970669 sphamit Coef Std Err z P>|z| [95% Conf Interval]
Poisson regression Number of obs = 2179
Khi phân tích mô hình hồi quy, việc kiểm định giả thuyết về từng hệ số hồi quy là cần thiết để xác định xem hệ số của biến độc lập có khác 0 hay không Nếu hệ số hồi quy có ý nghĩa khác 0, điều này cho thấy biến độc lập ảnh hưởng đến biến phụ thuộc; ngược lại, nếu không có ý nghĩa, biến độc lập có thể bị loại khỏi mô hình Trong các mô hình hồi quy Poisson, mức xác suất ý nghĩa 5% được sử dụng làm ngưỡng đánh giá Nếu giá trị P nhỏ hơn hoặc bằng 5%, ta bác bỏ giả thuyết rằng hệ số hồi quy bằng 0, kết luận rằng biến độc lập có ảnh hưởng Ngược lại, nếu giá trị P lớn hơn 5%, ta chấp nhận giả thuyết bằng 0 và loại biến độc lập ra khỏi mô hình.
Bảng 12 cho thấy sự phụ thuộc của biến sphamit vào các biến độc lập khác với xác suất ý nghĩa 0.05, cho thấy số lượng sản phẩm công nghệ cao được bán theo hình thức vay trả góp hàng ngày phụ thuộc vào các biến như gioi_th, CauGiay, D30PT, Tu40PT, Duoi1N, CMkinhte, CMquanly, và CMKhac Hệ số hồi quy của biến Pos-khan có xác suất ý nghĩa 0.066, gần mức 0.05, nên được giữ lại trong mô hình hồi quy Poisson Các biến độc lập còn lại không ảnh hưởng đáng kể đến biến phụ thuộc và sẽ bị loại bỏ Sau khi loại bỏ các biến không có ảnh hưởng, chúng tôi tiếp tục xem xét sự phụ thuộc của biến sphamit vào các biến gioi_th, CauGiay, Duoi1N, D30PT, Tu40PT, CMKinhte, CMQuanly, CMkhac và Pos-khan, và kết quả sẽ được trình bày trong bảng tiếp theo.
Bảng 13: Kết quả sự phụ thuộc của số lượng tiêu thụ sản phẩm IT
CauGiay 3979031 1014589 3.92 0.000 1990474 5967589 pos_khan -.4002302 1563968 -2.56 0.010 -.7067624 -.0936981 sphamit Coef Std Err z P>|z| [95% Conf Interval]
Poisson regression Number of obs = 2179
Nhìn vào bảng 13 ta thấy biến pos-khan (với xác suất ý nghĩa P =
Kết quả từ phân tích Tu40PT (P = 0.003) cho thấy các biến độc lập có ảnh hưởng đáng kể đến biến phụ thuộc Các biến gioi_th, CMKinhte, CMQuanly, và CMkhac có hệ số hồi quy với xác suất ý nghĩa vượt quá 5%, do đó đã được loại bỏ khỏi mô hình Mô hình hồi quy Poisson rút gọn, chỉ bao gồm các biến độc lập thực sự ảnh hưởng đến biến phụ thuộc, được trình bày trong Bảng 14.
Bảng 14: Mô hình Poisson rút gọn dự báo số lượng sản phẩm IT
CauGiay 4156177 0992609 4.19 0.000 2210699 6101656 pos_khan -.4027385 1559514 -2.58 0.010 -.7083977 -.0970794 sphamit Coef Std Err z P>|z| [95% Conf Interval]
Poisson regression Number of obs = 2179
Từ bảng 14, ta có thể đưa ra mô hình loga tuyến tính phụ thuộc sau đây: log(Sphamit) = - 0.4027385 pos_khan + 0,4156177 CauGiay + 0.3621661
Lũy thừa cơ số e hai vế của phương trình trên ta thu được
Sphamit = exp{ - 0.4027385 pos_khan + 0,4156177 CauGiay +
0.3621661 Duoi1N + 3.095639 D30PT + 0.8112706 Tu40PT – 3.338353.} Hay:
Sphamit=(0.668^{pos_khan}).(1,5153^{CauGiay}).(1.4364^{Duoi1N})
Khi tham gia vay trả góp cho sản phẩm công nghệ cao, khách hàng rất quan tâm đến tỷ lệ thanh toán trước cho công ty tài chính Các hình thức thanh toán trước dưới 30% và từ 40% trở lên đều có tác động tích cực đến lượng sản phẩm tiêu thụ Đặc biệt, hình thức thanh toán dưới 30% giá trị sản phẩm tạo ra ảnh hưởng mạnh mẽ nhất, làm tăng số lượng tiêu thụ gấp 22,1 lần so với hình thức thanh toán từ 30% đến 40%.
45 phần trăm và gấp gần 10 lần so với hình thức thanh toán từ 40 phần trăm trở lên
Các sản phẩm công nghệ cao như laptop, ti vi và máy lạnh đóng vai trò thiết yếu trong công việc, học tập và đời sống hàng ngày Khi lựa chọn mua trả góp, giá thành sản phẩm là một yếu tố quan trọng ảnh hưởng đến quyết định của khách hàng Để phân tích ảnh hưởng này, chúng ta sẽ sử dụng thống kê T-Test để kiểm tra giá trị trung bình của các sản phẩm mà khách hàng chọn hình thức thanh toán dưới 30% so với hình thức thanh toán từ 30% đến 40%.
Phân tích bằng phần mềm SPSS cho thấy, giá thành trung bình của sản phẩm thanh toán dưới 30% là 14,2 triệu đồng, trong khi giá trung bình của sản phẩm thanh toán từ 30 đến 40% là 14,6 triệu đồng, cho thấy sự khác biệt không đáng kể Với xác suất ý nghĩa 49,1% (lớn hơn 5%), chúng ta chấp nhận giả thiết rằng giá trị trung bình của hai nhóm sản phẩm này là tương đương.
Khi giá sản phẩm không chênh lệch nhiều, khách hàng có xu hướng chọn hình thức trả góp với mức trả trước thấp nhất, tức là vay với số tiền cao nhất có thể.
Sử dụng thống kê T-Test, chúng tôi so sánh giá trị trung bình của giá thành hai nhóm sản phẩm: nhóm khách hàng thanh toán trước trên 40% và nhóm thanh toán từ 30 đến 40% Kết quả cho thấy, giá trung bình của nhóm thanh toán trên 40% là 17,9 triệu đồng, trong khi nhóm còn lại là 14,6 triệu đồng, cho thấy sự chênh lệch đáng kể Với xác suất ý nghĩa 1,6% (nhỏ hơn 5%), chúng tôi kết luận có sự khác biệt về giá trị trung bình giữa hai nhóm sản phẩm Điều này cho thấy nhóm khách hàng có thu nhập ổn định sẵn sàng chi trả cao hơn, phù hợp với khả năng tài chính của họ và giúp giảm bớt khoản tiền phải trả hàng tháng.
Khi khách hàng chọn tỷ lệ trả trước, họ tự điều chỉnh theo khả năng thu nhập hàng tháng và giá trị sản phẩm Đối với hàng hóa có giá trị thấp, khách thường chọn tỷ lệ thanh toán dưới 30%, trong khi với sản phẩm có giá trị cao, họ ưu tiên tỷ lệ trên 40% Hai hình thức này được ưa chuộng hơn so với mức thanh toán từ 30 đến 40% Điều này cung cấp thông tin quan trọng cho các nhà quản lý để định hướng chính sách phù hợp trong chiến lược kinh doanh của công ty.
Thời hạn thanh toán khoản vay ảnh hưởng đáng kể đến số lượng sản phẩm bán ra, đặc biệt trong lĩnh vực công nghệ cao Khách hàng thường ưa chuộng vay trong thời gian dưới 1 năm, dẫn đến số lượng sản phẩm bán trả góp trong khoảng thời gian này cao gấp 1,4 lần so với các hình thức vay dài hơn Mặc dù thời hạn vay ngắn yêu cầu khách hàng phải trả mức tiền hàng tháng cao hơn, nhưng xu hướng này cho thấy sự ưu tiên của người tiêu dùng đối với sự tiện lợi và nhanh chóng trong việc sở hữu sản phẩm công nghệ.
Khi vay trong thời hạn dưới 1 năm, khách hàng trung bình phải trả 1,55 triệu đồng mỗi tháng, trong khi với thời hạn trên 1 năm, số tiền này chỉ dưới 800 nghìn đồng Các mặt hàng công nghệ cao thường có giá trị không lớn như xe máy hay ô tô, nên khách hàng có thu nhập ổn định thường ưa chuộng hình thức thanh toán ngắn hạn Tâm lý người Việt Nam cũng không thích "mang nợ" lâu, dẫn đến việc họ thường trả nợ ngay khi có thể để tiết kiệm lãi suất Do đó, công ty nên xây dựng chính sách thời hạn vay phù hợp với tâm lý và khả năng tài chính của khách hàng, đồng thời cân nhắc đặc điểm nhanh chóng lỗi thời của nhóm mặt hàng công nghệ cao.
Cầu Giấy, với siêu thị Big C, nổi bật là địa chỉ ưa chuộng để bán sản phẩm công nghệ cao hơn so với các quận khác, mặc dù có nhiều trung tâm tiêu thụ nổi tiếng như Trần Anh, Topcare và Pico Big C không chỉ là siêu thị lớn cung cấp hàng hóa từ bình dân đến cao cấp mà còn thu hút hàng nghìn lượt khách mỗi ngày nhờ giá cả hợp lý, thuận tiện giao thông và gần các khu đô thị Điều này dẫn đến việc sản phẩm điện máy và máy tính được bán theo hình thức vay trả góp tại Cầu Giấy cao hơn 1.5 lần so với các khu vực khác Sự lựa chọn địa điểm bán hàng đóng vai trò quan trọng trong quyết định kinh doanh của công ty Tài chính, giúp họ đưa ra những quyết sách đúng đắn, nâng cao hiệu quả và lợi nhuận từ nguồn cho vay.
Một yếu tố quan trọng ảnh hưởng đến lượng sản phẩm công nghệ cao tiêu thụ là biến pos_khan Số lượng sản phẩm được bán ra cho khách hàng cư trú trong cùng quận với đại lý bán hàng thường thấp hơn, cho thấy sự hạn chế trong việc tiếp cận thị trường địa phương.
66,9% sản phẩm được bán ra cho khách hàng ở các quận khác, điều này có thể phản ánh tâm lý "bụt chủ nhà không thiêng" của người Việt Tuy nhiên, khi xem xét kỹ lưỡng, số liệu cho thấy các đại lý cho vay của công ty chỉ tập trung ở một số quận như Đống Đa, Ba Đình, Hai Bà Trưng, Cầu Giấy, Thanh Xuân, Thanh Trì, Hoàng Mai và Đông Anh, trong khi khách hàng lại đến từ hầu hết các quận nội và ngoại thành.
Một số đề xuất tới lãnh đạo Tổng công ty, chi nhánh Hà Nội 48 KẾT LUẬN
1 Đào Hữu Hồ (1998), Xác suất Thống kê, In lần thứ 3, Nhà xuất bản Đại học quốc gia Hà Nội, 224 Tr
2 Đặng Hùng Thắng (1998), Mở đầu về lý thuyết Xác suất và các ứng dụng, In lần thứ 2, Nhà xuất bản Giáo Dục, Hà Nội
3 Nguyễn Duy Tiến (2000), Các mô hình xác suất và ứng dụng; Phần 1: Xích Markov và ứng dụng, Nhà xuất bản Đại học Quốc Gia, Hà Nội
4 Nguyễn Duy Tiến (chủ biên), Đặng Hùng Thắng (2000), Các mô hình xác suất và ứng dụng,Phần 2: Quá trình dừng và ứng dụng, Nhà xuất bản Đại học Quốc Gia, Hà Nội
5 Blundell, R Griffith, and J Van Reenen (1995),” Dynamic Count Data models of Technological innovation”, Economic Journal, 105, pp.333–
6 Cameron, A.C, and D.K Trivedi (1998), Regression analysis of count data, Cambrige University press, NewYork
7 Noriszura Ismail, Abdul Azizjemain (2005), Generalized Poisson regression: An alternative for risk classication, Universiti teknologi