Thử nghiệm phân tích thống kê hoạt động<br />
kinh doanh của Công ty Tài Chính Việt<br />
<br />
Chu Thị Hồng Đăng<br />
<br />
Trường Đại học Khoa học Tự nhiên<br />
Luận văn Thạc sĩ ngành: Lý thuyết xác suất và thống kê; Mã số: 60 46 15<br />
Người hướng dẫn: PGS.TS Hồ Đăng Phúc<br />
Năm bảo vệ: 2012<br />
<br />
Abstract: Trình bày một số kiến thức chuẩn bị về xác suất: phần tử ngẫu nhiên và<br />
phân phối xác suất; một số đặc trưng của đại lượng ngẫu nhiên; một số phân phối<br />
thường gặp. Nghiên cứu quá trình ngẫu nhiên: một số quá trình ngẫu nhiên thường<br />
gặp. Giới thiệu về hồi quy Poisson. Mô hình hồi quy Poisson tổng quát. Phân tích hoạt<br />
động tín dụng tiêu dùng.<br />
<br />
Keywords: Toán học; Phân tích thống kê; Hoạt động kinh doanh; Công ty Tài chính<br />
Việt<br />
<br />
Content<br />
1. Một số kiến thức chuẩn bị về xác suất<br />
1.1. Phần tử ngẫu nhiên và phân phối xác suất<br />
Định nghĩa 1. Giả sử ( , A, P) là không gian xác suất cơ bản và (E, F) là không gian đo<br />
được. Ta gọi X : E là một biến ngẫu nhiên nếu nó là một ánh xạ đo được (tức là X-1 (F)<br />
A)<br />
Đặc biệt, nếu E = Rn và F = Bn là - đại số Borel của Rn thì ta gọi X là véc tơ ngẫu<br />
<br />
nhiên n chiều và viết X thay cho X. Trong trường hợp n = 1, ta viết X thay cho X và gọi X<br />
là đại lượng ngẫu nhiên.<br />
Định nghĩa 2. Phân bố xác suất (hay còn gọi là phân phối xác suất) của một biến ngẫu nhiên<br />
X (trên R) là phân bố xác suất PX trên R, với - đại số là - đại số Borel B của R, cho bởi<br />
công sau:<br />
PF(B) = P(X -1(B)<br />
với mọi tập con B của R nằm trong - đại số B.<br />
Định nghĩa 3. Hàm phân phối xác suất của phân bố xác suất PX trên R của một biến ngẫu<br />
nhiên X là hàm Fx: R [0; 1] cho bởi công thức<br />
<br />
FX : P( X x) P((, x])<br />
Định lý 1. Hàm phân phối FX của một phân bố xác suất tuỳ ý trên R thoả mãn 4 tính chất sau:<br />
1. Đơn điệu không giảm: FX(x) FX(y) với mọi x y.<br />
2. Liên tục bên phải: lim 0 FX ( x ) FX ( x) với mọi x,<br />
<br />
3. lim x FX ( x) 0<br />
<br />
4. lim x FX ( y) 1<br />
<br />
Ngược lại, mọi hàm số thực trên R thoả mãn 4 tính chất trên là hàm phân phối của một<br />
phân bố xác suất trên R.<br />
Định nghĩa 4. Một phân bố PX trên R được gọi là liên tục nếu như hàm phân phối xác suất<br />
FX là hàm liên tục trên R. Nó được gọi là liên tục tuyệt đối nếu như tồn tại một hàm<br />
số X : R R khả tích và không âm, sao cho với mọi a R ta có<br />
a<br />
FX (a) PX ( , a ) X ( x)dx<br />
<br />
<br />
<br />
Hàm X : R R+ thoả mãn như trên gọi là hàm mật độ của PX.<br />
<br />
Định nghĩa 5. Một phân bố xác suất PX được gọi là rời rạc nếu như nó tập trung trên các<br />
điểm hạt của nó: PX (AX) = 1, PX (R\ AX) = 0<br />
1.2. Một số đặc trưng của đại lượng ngẫu nhiên<br />
Đối với trường hợp rời rạc: Giá trị kỳ vọng của một biến ngẫu nhiên X, ký hiệu là E(X),<br />
chính là trung bình cộng có trọng số của biến ngẫu nhiên đó.<br />
Từ đó, có thể suy ra rằng hai biến ngẫu nhiên có cùng phân bố xác suất trên R thì có<br />
cùng kỳ vọng. Bởi vậy, thay vì nói về kỳ vọng của biến ngẫu nhiên, ta có thể nói về kỳ vọng<br />
của phân bố xác suất trên R. Trong trường hợp không gian xác suất là một tập hợp hữu hạn<br />
hoặc đếm được, ={ 1 , 2 ... } với xác suất P (i ), i P( i ) 1 thì công thức tính giá trị kỳ<br />
<br />
vọng của một biến ngẫu nhiên X là<br />
E ( X ) X ( i ) P( i )<br />
i<br />
Trong trường hợp tổng quát, công thức tính giá trị kỳ vọng được viết dưới dạng phân<br />
Lesbesgue của X trên không gian xác suất ( , R):<br />
<br />
E ( X ) XdP<br />
<br />
<br />
Định nghĩa 7. Phương sai của biến ngẫu nhiên X là đại lượng:<br />
D(X) = E[X-E(X)]2<br />
còn D( X ) được gọi là độ lệch tiêu chuẩn của X.<br />
<br />
<br />
1.3. Một số phân phối thường gặp<br />
<br />
<br />
2<br />
Sau đây, ta đưa ra một số phân phối thường gặp trong thực tế.<br />
Định nghĩa 8. Giả sử a, b là hai số thực, với b > a. Khi đó phân phối đều trên đoạn thẳng [a;<br />
b] là phân bố liên tục với hàm mật độ xác suất được cho như sau:<br />
1<br />
khi a x b<br />
( x) b a<br />
<br />
0 khi x a hoac x b<br />
Phân bố xác suất đều trên [a;b] hay được ký hiệu là U(a;b). Trong định nghĩa trên ta có thể<br />
thay đoạn thẳng đóng [a;b] bằng các khoảng mở (a;b) hoặc nửa đóng, nửa mở cũng được.<br />
Ví dụ, vị trí của một người đi trên đường có thể mô hình hoá bằng một biến ngẫu nhiên<br />
với phân bố đều, nếu chúng ta không có thông tin gì ngoài thông tin người đi bộ trên quãng<br />
đường đó.<br />
Khái niệm phân bố đều có thể mở rộng lên trường hợp nhiều chiều: Không gian xác<br />
suất là một miền của Rn (n 2), và xác suất một miền con (n chiều) tỷ lệ thuận với thể tích (n<br />
chiều) của miền con đó.<br />
Định nghĩa 9. Phân bố xác suất chuẩn (hay phân bố Gauss) trên R với trung bình và độ<br />
lệch chuẩn là phân bố liên tục với hàm mật độ sau:<br />
1 ( x )2<br />
. ( x) e xp( )<br />
2 2 2<br />
<br />
Ký hiệu phân phối chuẩn trên đây là N( , 2 ), phân bố chuẩn với = 0, 2= 1 được<br />
gọi là chuẩn tắc. Phân bố chuẩn là một trong những phân bố quan trọng nhất vì nhiều phân bố<br />
xác suất gặp trong thực tế có dáng điệu khá giống phân bố chuẩn.<br />
Định nghĩa 10. Phân bố mũ với tham số là phân bố xác suất liên tục tuyệt đối trên R cho<br />
bởi hàm mật độ sau:<br />
e x khi x 0<br />
( x) <br />
0 khi x 0<br />
Định nghĩa 11. Một biến ngẫu nhiên X được gọi là có phân bố nhị thức với tham số n, p nếu<br />
hàm phân bố xác suất của nó có dạng<br />
P( X k ) Cnk p k (1 p)nk ; k 0,1, 2..., n ;0 p 1<br />
Giá trị kỳ vọng và phương sai của biến ngẫu nhiên có phân bố nhị thức lần lượt là np và<br />
np (1-p)<br />
Định nghĩa 12. Một biến ngẫu nhiên Y được gọi là phân phối Poisson với tham số >0 nếu<br />
nó nhận các giá trị nguyên y = 0, 1, 2,… với xác suất<br />
e y<br />
P Y y (1)<br />
y!<br />
<br />
<br />
3<br />
Khi đó ta ký hiệu Y P( )<br />
Phân phối Poisson là giới hạn của phân bố nhị thức với tham số p = / n và n, khi n<br />
tiến tới vô cùng.<br />
2. Quá trình ngẫu nhiên<br />
2.1. Một số quá trình ngẫu nhiên thường gặp<br />
Chuyển động Brown<br />
Quá trình Wiener Wt có ba đặc điểm:<br />
1. W0 = 0<br />
2. Wt liên tục hầu chắc chắn.<br />
3. Wt có số gia độc lập với phân phối Wt - Ws ~ N(0, t - s) (với 0 s t).<br />
Ở đây N ( , 2 ) biểu thị phân phối chuẩn với giá trị trung bình và phương sai 2 .<br />
<br />
Điều kiện quá trình có số gia độc lập có nghĩa là nếu 0 s1 t1 s2 t 2 thì Wt1 - Ws1 và Wt2-<br />
Ws2 là những biến ngẫu nhiên độc lập.<br />
Một đại diện của quá trình ngẫu nhiên rời rạc chính là quá trình Poisson, sẽ được đề cập<br />
chi tiết ở mục sau.<br />
3. Giới thiệu về hồi quy Poisson<br />
3.1. Phân bố Poisson<br />
Phân phối Poisson là phân phối được đặt theo tên nhà toán học người Pháp Siméon<br />
Denis Poisson (1781 - 1840). Như trên ta đã nói, một biến ngẫu nhiên Y được gọi là có phân<br />
phối Poisson với tham số > 0 nếu nó nhận các giá trị nguyên y = 0, 1, 2,… với xác suất<br />
<br />
e y<br />
P Y y (2)<br />
y!<br />
Giá trị trung bình và phương sai của phân phối này được chỉ ra bằng:<br />
E(Y) = Var (Y) = <br />
Một tính chất quan trọng của phân phối Poisson là tổng của các biến ngẫu nhiên<br />
Poisson độc lập cũng có phân phối Poisson. Cụ thể, nếu Y1, Y2 là các biến ngẫu nhiên độc lập,<br />
Yi ~ P(i ), i 1; 2 thì Y1 Y2 ~ P(1 2 ) . Kết quả này có thể mở rộng cho tổng nhiều hơn hai<br />
<br />
biến ngẫu nhiên Poisson.<br />
Giả sử ta có ni nhóm quan sát có cùng phương sai, ký hiệu Yij là số lượng biến cố của<br />
quan sát thứ j trong lớp nhóm thứ i. Trên các nhóm đó, Yi là toàn bộ các quan sát của nhóm<br />
thứ i. Với giả thiết thông thường về tính độc lập và Yij ~ P( i) với j = 1,2, ni thì Yi ~ P(ni i ) .<br />
<br />
3.2. Quá trình hồi quy Poisson<br />
<br />
<br />
<br />
4<br />
Một quá trình Poisson, là một quá trình ngẫu nhiên được định nghĩa theo sự xuất hiện<br />
của các biến cố. Một quá trình ngẫu nhiên N(t) là một quá trình Poisson (thời gian - thuần<br />
nhất, một chiều) nếu:<br />
1. N (0) = 0<br />
2. Số các biến cố xảy ra trong hai khoảng thời gian không giao nhau là các biến ngẫu<br />
nhiên độc lập.<br />
3. Xác suất của số biến cố trong một khoảng con [t, t + ] nào đó được cho bởi công<br />
thức<br />
<br />
e ( ) k<br />
P( N (t ) N (t )) k k 0,1,...<br />
k!<br />
trong đó số dương là một tham số cố định, được gọi là tham số cường độ, có nghĩa là, biến<br />
ngẫu nhiên N(t+ ) - N(t) mô tả số lần xuất hiện trong khoảng thời gian [t, t+ ] tuân theo<br />
một phân bố Poisson với tham số .<br />
3.3. Mô hình loga tuyến tính cho quá trình Poisson<br />
Giả sử ta có một mẫu bao gồm n quan sát Y1, Y2,…,Yn là các biến ngẫu nhiên độc lập có<br />
phân phối Poisson, Yi ~ P( i ), ta mong muốn i phụ thuộc vào một véc tơ các biến độc lập,<br />
ta có thể bắt đầu bằng mô hình tuyến tính đơn giản.<br />
i xi' j (3)<br />
<br />
Tuy nhiên vế phải của (3) là một số thực bất kỳ trong khi vế trái là giá trị trung bình<br />
không âm. Phương án thay thế giải quyết vấn đề này là ta nghĩ đến logarit của giá trị trung<br />
bình. Ta lấy i log (i ) và xét mô hình tuyến tính.<br />
<br />
log( i ) xi' j (4)<br />
<br />
Trong mô hình này j biểu diễn sự thay đổi của loga giá trị trung bình ứng với mỗi<br />
<br />
thay đổi của xj. Lấy luỹ thừa cơ số e hai vế của (4) ta thu được mô hình<br />
i e xp xi' j (5)<br />
<br />
Để ước lượng các tham số của phân phối Poisson trong mô hình trên, người ta dùng<br />
phương pháp ước lượng hợp lý cực đại. Trước tiên ta xây dựng hàm hợp lý là tích các giá trị<br />
của biểu thức (2) lấy trên n quan sát độc lập có phân phối Poisson với tham số i thoả mãn<br />
(3), tức là<br />
n e i iyi<br />
L( ) (6)<br />
i 1 yi !<br />
Lấy loga hai vế ta có<br />
<br />
<br />
5<br />
n<br />
LogL ( ) yi log( i ) i (7)<br />
i 1<br />
<br />
<br />
Ở đó i phục thuộc vào các biến độc lập xi và là vecto gồm p tham số được cho ở<br />
<br />
(3). Lấy đạo hàm riêng hai vế theo từng phần tử của và cho chúng bằng 0. Nghiệm của các<br />
phương trình đó cho ta ước lượng hợp lý cực đại của mô hình loga tuyến tính Poisson. Có thể<br />
chỉ ra rằng các nghiệm đó thoả mãn phương trình.<br />
X ' y Y ' ˆ (8)<br />
Ở đây X là ma trận thiết kế với mỗi hàng là mỗi quan sát, mỗi cột là biến dự báo (có thể<br />
bao gồm hằng số). Y biến đáp ứng, ˆ là một vectơ của giá trị dự báo, được tính toán thông<br />
<br />
qua ước lượng ˆ bằng cách lấy exp mũ của dự báo tuyến tính X ' ˆ .<br />
Một độ đo đánh giá mức độ phù hợp của mô hình với tập giá trị quan sát là độ chệch có<br />
dạng<br />
n<br />
y <br />
D 2 yi log( i ) ( yi ˆ i (9)<br />
i 1 ˆ i <br />
Với cỡ mẫu lớn, D là đại lượng có phân phối xấp xỉ phân phối khi bình phương với (n-<br />
p) bậc tự do, ở đây n là số lượng quan sát, p số lượng tham số. Do vậy D thường được sử<br />
dụng trực tiếp để kiểm tra tính đúng đắn của mô hình.<br />
Một độ đo khác có thể dùng thay thế là thống kê Khi bình phương của Peason<br />
( yi ˆ i ) 2<br />
X <br />
2<br />
<br />
ˆ i<br />
p<br />
<br />
<br />
<br />
Khi cỡ mẫu lớn, phân phối của thống kê Peason cũng xấp xỉ phân phối khi bình phương<br />
với (n-p) bậc tự do. Hai độ đo trên được dùng để kiểm định sự phù hợp của mô hình với dữ<br />
liệu quan sát được.<br />
4. Mô hình hồi quy Poisson tổng quát<br />
Giả sử biến phụ thuộc Y là một biến đếm tuân theo luật Poisson tổng quát chịu tác động<br />
của p biến mô tả (xi1, xi2,…xip). Mô hình hồi quy Poisson tổng quát được xây dựng bởi<br />
Famoye nói rằng phân phối của Yi lấy điều kiện theo (xi1, xi2,…xip) và được định nghĩa bằng<br />
i (1 yi ) y 1 (1 yi ) 1<br />
P(Yi y | xi ) f ( yi ) ( i ) .exp( i<br />
i<br />
) (10)<br />
1 i 1 i 1 yi yi !<br />
yi = 0,1,…<br />
với x1 = (1, xi1,… xip) là véctơ (p + 1) . 1 chiều, i 0 là giá trị trung bình phụ thuộc của Yi<br />
<br />
với điều kiện xi. Ta cũng có phân tích phổ biến cho i là<br />
<br />
<br />
<br />
6<br />
E (Yi | xi ) i e xp( xit ) (11)<br />
<br />
Phương sai của Y được cho bởi<br />
V a r (Yi | xi ) y2/ x i (1 i )2 (12)<br />
<br />
Ở đây ( 0 , 1 ,... p ) là một véc tơ p + 1 chiều của các tham số hồi quy, tham số <br />
là một độ đo của hàm mật độ. Khi = 0 mô hình hồi quy Poisson tổng quát ở (10) trở thành<br />
mô hình hồi quy Poisson bình thường. Với > 0 mô hình hồi quy Poisson tổng quát có thể<br />
sử dụng cho mô hình có số liệu đếm có độ phân tán vượt trội, tương tự < 0, mô hình hồi<br />
quy Poisson tổng quát sử dụng cho mô hình có số liệu đếm có độ phân tán thiếu hụt. Với một<br />
vài quan sát trong tập số liệu, giá trị Yi có thể bị mất theo dõi, từ đó mô hình hồi quy Poisson<br />
tổng quát mất theo dõi được Faymoye và Wang đề xuất năm 2004.<br />
Nếu quan sát không bị mất theo dõi thì Yi = yi.<br />
Nếu quan sát mất theo dõi thì Yi yi, và phân phối được áp dụng cho số liệu mẫu là<br />
phân phối nhị phân di được xác định như sau: di = 1 nếu Yi yi và di = 0 nếu ngược lại.<br />
Mô hình hồi quy Poisson tổng quát bị mất theo dõi được cho bởi:<br />
di<br />
yi 1 <br />
p( yi , di | xi ) f ( yi ) 1 f ( j ) <br />
1 di<br />
(13)<br />
j 0 <br />
Mô hình hồi quy Poisson tổng quát (13) bao gồm (p+2) tham số được sắp xếp trong<br />
véctơ ( ' , ) , và nó có thể được ước lượng bằng phương pháp hợp lý cực đại như trình<br />
bày tiếp sau đây.<br />
<br />
<br />
4.1. Ước lượng tham số ( ' , )<br />
Hàm hợp lý của (13) được cho bởi<br />
n yi 1<br />
<br />
L( , , yi ) f ( yi ) 1di [1- f ( j )] di (14)<br />
i 1<br />
j 0 <br />
Hàm log hợp lý là:<br />
n n yi 1<br />
LL( , . yi ) (1 di ) log f ( yi ) di log[(1 f ( j )] (15)<br />
i 1 j 0 j 0<br />
<br />
Thay công thức hàm mật độ ở (13) vào (15) ta thu được<br />
n i (1 yi ) <br />
LL( , , yi ) i 1 (1 d i ) log ( y1 1) log(1 yi ) i log( yi !)<br />
1 i 1 i <br />
n<br />
<br />
j 0 d i log(1 j i0 f ( j )<br />
y 1<br />
(16)<br />
<br />
Bằng cách lấy đạo hàm riêng theo từng tham số và cho chúng bằng 0, ta thu được<br />
<br />
<br />
<br />
<br />
7<br />
yi 1 f ( j ) <br />
LL( , , yi ) n<br />
y i n <br />
<br />
j 0<br />
(<br />
<br />
) <br />
<br />
(1 d i )( i ) xi d i 0 (17)<br />
(1 i ) j 0<br />
2 yi 1<br />
i 1 i 1 (1 f ( j )) <br />
<br />
<br />
<br />
<br />
<br />
LL( , , yi ) n yi i y ( y 1) i ( yi i ) <br />
(1 d i )( ) i i ) <br />
i 1 (1 i ) (1 yi ) (1 i ) 2 <br />
yi 1 f ( j ) <br />
( ) <br />
i1 d i (1 yi 1 f( j )) 0<br />
n j 0<br />
(18)<br />
j 0 <br />
<br />
Trong đó:<br />
f ( j ) ( j i )<br />
f ( j) xi , (19)<br />
(1 i ) 2<br />
f ( j ) ( j i ) j ( j 1) i ( j i )<br />
f ( j) , (20)<br />
(1 i ) 1 j (1 i ) 2<br />
Hệ phương trình hợp lý trên không tuyến tính với các tham số , , chúng được giải<br />
bằng cách dùng phương pháp lặp Newtơn - Raphson.<br />
Lấy đạo hàm riêng của (16) ta nhận được ma trận thông tin Fisher I ( , ) bằng cách<br />
lấy kỳ vọng của hiệu các đạo hàm cấp hai. Ma trận nghịch đảo của I ( , ) cho ta các phương<br />
sai của ước lượng hợp lý cực đại. Phương sai của ước lượng hợp lý cực đại có thể thu được từ<br />
ma trận Hessian, H là ma trận vuông cấp p+2. Toàn bộ ma trận Hessian, được ký hiệu là các<br />
đạo hàm riêng cấp hai, được cho bởi:<br />
2 LL( , , yi ) 2 LL( , , yi ) <br />
H 12 <br />
( ) ( )<br />
H 11 ' '<br />
H ( ) .<br />
H 21 H 22 2 LL( , , yi ) 2 LL( , , yi ) <br />
( ) ( ) <br />
2 <br />
Ở đây,<br />
2 LL( , , yi ) n<br />
1 i 2yi '<br />
H11 (1 d i ) ( ) x x <br />
' (1 i ) 3<br />
i i i<br />
i 1 <br />
yi 1 f ( j )<br />
2<br />
yi 1 f ( j ) f ( j ) <br />
<br />
yi 1 yi 1<br />
(1 f ( j )) ( ) ( ) ( ) <br />
n <br />
j 0 j 0<br />
j 0<br />
j 0<br />
' <br />
i1 d i <br />
'<br />
,<br />
(1 j i0 f ( j )) 2<br />
y 1<br />
<br />
<br />
<br />
<br />
<br />
2 LL( , , yi ) n<br />
( y i ) <br />
H12 2 (1 d i ) ( i i ) xi <br />
i 1 (1 i ) 3 <br />
<br />
<br />
8<br />
yi 1 f ( j )<br />
2<br />
y 1 f ( j ) f ( j ) <br />
(1 j 0 f ( j )) j 0 ( ) j i0 ( <br />
yi 1 yi 1<br />
) ( ) <br />
n j 0<br />
<br />
i1 d i (1 j i0 f ( j )) 2<br />
y 1 ,<br />
<br />
<br />
<br />
<br />
2 LL( , , yi ) n<br />
i2 yi yi2 ( y1 1) 212 ( yi i ) <br />
H 22 <br />
2<br />
<br />
i 1 <br />
(1 d i ) ( <br />
(1 i ) 2 (1 yi ) 2<br />
<br />
(1 i3 ) <br />
) <br />
<br />
yi 1 f ( j )<br />
2<br />
y 1 f ( j ) 2 <br />
(1 j 0 f ( j )) j 0 ( ) j i0 (<br />
yi 1<br />
<br />
n <br />
) <br />
<br />
i1 i<br />
2<br />
d ,<br />
(1 j i0 f ( j )) 2<br />
y 1<br />
<br />
<br />
<br />
<br />
H21= H'12<br />
<br />
<br />
2 f ( j) 1 i 2j ( j i ) 2 '<br />
f ( j ) ( )i ) xi xi ,<br />
' (1 i ) 3<br />
(1 i ) 2 <br />
2 f ( j) 2 i ( j i ) j i i j j ( j 1) i ( j i <br />
f ( j ) (<br />
2 <br />
) xi <br />
(1 i ) (1 i ) (1 i 1 j<br />
3<br />
(1 i ) 2 <br />
<br />
2 f ( j) <br />
i j<br />
2<br />
j 2 ( j 1) 2i2 ( j i i j j ( j 1) i ( j i ) <br />
2<br />
<br />
<br />
<br />
f ( j ) ) <br />
2 <br />
2 (1 i ) 2 (1 j ) 2 (1 i ) 3 (1 1 j (1 ) <br />
i i<br />
<br />
Trong trường hợp ma trận Hessian được tính toán tại ước lượng hợp lý cực đại<br />
ˆ ( ' ,ˆ )' , và có nghịch đảo âm thì ta sẽ nhận được ma trận phương sai - hiệp phương sai<br />
<br />
1<br />
được ký hiệu bởi S 2 ˆ , ˆ H (ˆ) . <br />
4.2. Sự phù hợp của thống kê hợp lý<br />
Để kiểm tra sự phù hợp của mô hình CGPS, cũng giống trường hợp hồi quy Poisson, ta<br />
dùng tỉ số hợp lý để kiểm tra mô hình, bài toán kiểm định giả thuyết của chúng ta là<br />
H0 : 1 2 .... p 0 (21)<br />
Thống kê tỉ lệ hợp lý có dạng<br />
D 2( LL(ˆ0 , ˆ , yi ) R LL( ˆ , ˆ , yi )U ) (22)<br />
<br />
Ở đây LL( ˆ0 , ˆ , yi ) R, LL( ˆ , ˆ , yi )U lần lượt là các hàm loga hợp lý được tính toán từ<br />
mô hình được hạn chế và không hạn chế các tham số đưa vào. Với giả thuyết không (21),<br />
thống kê D trên có phân phố 2 với p bậc tự do.<br />
<br />
<br />
4.3. Kiểm định tham số hồi quy và các tham số phân tán<br />
Có thể khẳng định rằng nếu trong mỗi bài toán phân tích, mô hình hồi quy Poisson tổng<br />
quát được xây dựng chính xác và phù hợp với tập số liệu thì ước lượng hợp lý cực<br />
<br />
<br />
9<br />
ˆ (ˆ ' ,ˆ )' cực đại hàm loga hợp lý của mô hình luon tồn tại với ( ' , )' và thu được<br />
đại <br />
kết quả tiệm cận chuẩn sau:<br />
n ( <br />
ˆ ) N (0; E ((1/ n) I (ˆ ,ˆ )) 1<br />
),<br />
Từ đó giúp ta có các kết luận về các hệ số hồi quy và các tham số phân tán .<br />
Kiểm định hệ số phân tán <br />
Hiện tượng mất theo dõi có thể ảnh hưởng đến mô hình không, mô hình cũng có thể dẫn tới<br />
mô hình hồi quy Poisson tổng quát, ta có bài toán kiểm định.<br />
H 0 : 0 ; H : 0 (23)<br />
<br />
Đây là bài toán điểm định sự quan trọng của tham số . Sự xuất hiện của trong mô<br />
hình hồi quy Poisson tổng quát được khẳng định nếu giả thuyết H0 bị bác bỏ, thống kê sử<br />
dụng cho H0 là:<br />
D 2( LL(ˆ , yi ) R LL(ˆ , yi )U ). (24)<br />
<br />
Nếu giả thiết H0 đúng, D có phân phối 2 với một bậc tự do.<br />
Kiểm định các tham số hồi quy<br />
Để kiểm định các hệ số mũ J , j = 1, 2, …, p ta có bài toán<br />
<br />
H : J = 0; H1: J 0<br />
<br />
Thống kê cho giả thuyết không là<br />
<br />
ˆ j mle<br />
Z<br />
s ( ˆ J mle)<br />
<br />
Ở đây, ˆ j mle là ước lượng hợp lý cực đại của hệ số J , s( ˆ<br />
j mle<br />
) là sai số chuẩn của các<br />
<br />
ước lượng này, được xác định từ ước lượng của ma trận phương sai – hiệp phương sai, S2<br />
<br />
( ˆ , ). Dưới giả thuyết không, thống kê Z có phân bố tiệm cận chuẩn.<br />
<br />
<br />
5. Phân tích hoạt động tín dụng tiêu dùng<br />
5.1. Mô tả số liệu<br />
Số lượng sản phẩm khách hàng mua và có tham gia dịch vụ cho vay của công ty là nhân<br />
tố chính để đánh giá được hiệu quả kinh doanh của công ty, và cũng góp phần đánh giá hiệu<br />
quả kinh doanh của các đại lý bán hàng liên kết. Do vậy, trong mô hình, biến quan sát phụ<br />
thuộc Y được chọn là tổng số sản phẩm được bán bằng dịch vụ cho vay trả góp trong một đơn<br />
vị thời gian tại một địa điểm bán hàng.<br />
<br />
<br />
<br />
10<br />
Các biến độc lập bao gồm:<br />
+ Biến macoso là biến mô tả các địa điểm của đại lý bán hàng liên kết với Công ty Tài<br />
chính Việt được đặt tại quận: Đống Đa, Ba Đình, Hai Bà Trưng, Cầu Giấy, Thanh Xuân, Hà<br />
Đông, Đông Anh, Thanh Trì, Hoàng Mai. Trong số liệu gốc macoso bao gồm các biến “ba<br />
dinh” (cơ sở Ba Đình), “cau giay” (cơ sở Cầu Giấy), “dong da” (cơ sở Đống Đa), “hai ba<br />
trưng” (cơ sở Hai Bà Trưng), “thanh xuan ha dong” (cơ sở Thanh Xuân – Hà Đông), “dong<br />
anh thanh tri hoang mai” (cơ sở Đông Anh – Thanh Trì – Hoàng Mai). Thống kê số lượng<br />
sản phẩm được bán tại các cơ sở được mô tả trong Bảng 2.<br />
<br />
<br />
Để các số liệu này phù hợp với mô hình đếm, ta đã mã hoá lại thành các biến mới chỉ nhận<br />
các giá trị 0, 1. Khi quan sát số liệu ta thấy Đống Đa có số lượng khách hàng đông nhất trong<br />
thời gian quan sát (511 hồ sơ trên tổng số 2179 quan sát) nên chọn dongda (Cơ sở Đống Đa)<br />
làm nhóm chứng. Các biến mới được thành lập bao gồm: BaDinh (cơ sở Ba Đình), CauGiay<br />
(cơ sở Cầu Giấy), HaiBa (cơ sở Hai Bà Trưng), TXHDong (cơ sở Thanh Xuân, Hà Đông có vị<br />
trí tương đối gần nhau, ta ghép thành một biến quan sát) và biến DATTrHMai là biến quan sát<br />
các cơ sở tại Đông Anh, Thanh Trì, Hoàng Mai. Vì các cơ sở này có số lượng không nhiều so<br />
với các nơi khác nên ta ghép chung vào một nhóm quan sát. Các biến mới được thành lập kể<br />
trên là các biến nhị phân nhận giá trị 1 nếu sản phẩm được bán tại các cơ sở tương ứng đó và<br />
nhận giá trị 0 trong trường hợp còn lại.<br />
+ Biến gioikh thể hiện giới tính của khách hàng mua sản phẩm. Cụ thể, biến nhận giá trị<br />
0 nếu khách hàng là nữ, nhận giá trị 1 khi khách hàng có giới tính nam. Phân bố giới tính của<br />
khách hàng được trình bày trong Bảng 3.<br />
+ Biến tuoikh là thể hiện nhóm tuổi khách hàng tại thời điểm tham gia dịch vụ của<br />
Công ty. Tuổi khách hàng được phân thành 3 nhóm: Nhóm khách hàng "trẻ" từ 21 đến 29 tuổi<br />
có 886 quan sát, nhóm khách hàng từ 30 tuổi đến 44 tuổi có 921 quan sát, nhóm còn lại là<br />
những khách hàng từ 45 tuổi trở lên (nhưng dưới 60 tuổi) có 372 quan sát. Vì nhóm khách<br />
hàng từ 30 tuổi đến 44 tuổi có số lượng quan sát lớn nhất nên được chọn làm nhóm chứng,<br />
đồng thời ta thành lập 2 biến mới, biến TuoiKHDuoi30 nhận giá trị 1 nếu rơi vào nhóm khách<br />
hàng "trẻ" và nhận giá trị 0 trong các trường hợp còn lại. Tương tự, biến TuoiKHTu45 là biến<br />
nhận giá trị 1 với những khách hàng có độ tuổi từ 45 đến 60, nhận giá trị 0 trong các trường<br />
hợp còn lại. Phân bố độ tuổi của khách hàng được mô tả trong Bảng 4.<br />
+ Biến Madckh là biến mô tả địa chỉ cư trú của khách hàng tại các khu vực khác nhau.<br />
Trong số liệu gốc madckh bao gồm “ba dinh” (khách hàng ở Ba Đình), “cau giay” (khách<br />
hàng ở Cầu Giấy), “dong da” (khách hàng ở Đống Đa), “gia lam” (khách hàng ở Gia Lâm),<br />
<br />
<br />
11<br />
“ha dong” (khách hàng ở Hà Đông), “hai ba trung” (khách hàng ở Hai Bà Trưng), “hoan<br />
kiem” (khách hàng ở Hoàn Kiếm), “hoang mai” (khách hàng ở Hoàng Mai), “long bien”<br />
(khách hàng ở Long Biên), “thanh tri” (khách hàng Thanh Trì), “dong anh” (khách hàng<br />
Đông Anh), “tay ho” (khách hàng Tây Hồ), “ngoai thanh” (khách hàng ở ngoại thành), “thanh<br />
xuan” (khách hàng ở Thanh Xuân), “tu liem” (khách hàng ở Từ Liêm). Phân bố địa chỉ khách<br />
hàng được cho ở Bảng 5.<br />
Vẫn chọn dongda làm nhóm chứng, chúng ta cũng thành lập các biến đếm mới: biến<br />
KHbadinh là biến đếm nhận giá trị 1 nếu khách hàng có địa chỉ ở Ba Đình, nhận giá trị 0<br />
trong các trường hợp còn lại. Tương tự các biến CGTLTTayHo (khách hàng ở Cầu Giấy, Từ<br />
Liêm, Tây Hồ), HdongTXuan (khách hàng ở Hà Đông, Thanh Xuân), TtriHMai (Thanh Trì,<br />
Hoàng Mai), HBTrung (Hai Bà Trưng), LBGLDAnh (Long Biên, Gia Lâm, Đông Anh),<br />
HKiem (Hoàn Kiếm) và NTthanh (khách hàng ở những huyện ngoại thành khác).<br />
+ Biến pos-kha thể hiện mối quan hệ giữa địa chỉ khách hàng với địa điểm khách đó<br />
mua hàng. Biến nhận giá trị 1 nếu địa chỉ khách hàng có cùng khu vực với địa điểm của đại lý<br />
bán hàng, biến nhận giá trị 0 trong trường hợp còn lại. Bảng 6 mô tả quan hệ giữa địa chỉ<br />
khách hàng và địa điểm đại lý bán hàng cho ta thấy chỉ có 566 trường hợp khách hàng có địa<br />
chỉ cùng khu vực với đại lý và có tới 1613 trường hợp khách hàng không cùng khu vực với<br />
đại lý bán hàng.<br />
+ Biến magiatri cho ta biết giá của sản phẩm ở thời điểm hiện tại, đã được gán các giá<br />
trị tương xứng với giá sản phẩm khách hàng mua.Biến này chia các sản phẩm thành 3 nhóm:<br />
nhóm sản phẩm có giá trị dưới 15 triệu, nhóm các sản phẩm có giá trì từ 15 triệu đến dưới 30<br />
triệu và nhóm sản phẩm có giá trị trên 30 triệu đồng. Phân bố các sản phẩm theo giá được mô<br />
tả trong Bảng 7.<br />
Lấy nhóm sản phẩm có giá trị từ 15 đến dưới 30 triệu đồng làm nhóm chứng, ta thành<br />
lập hai biến mới là: Duoi15Tr biến nhận giá trị 1 nếu sản phẩm khách hàng mua có giá dưới<br />
15 triệu, và nhận giá trị 0 nếu ngược lại. Biến Tu30Tr nhận giá trị 1 nếu sản phẩm có giá từ 30<br />
triệu đồng trở lên và nhận giá trị 0 trong trường hợp còn lại.<br />
+ Biến mattoan là biến cho biết khả năng thanh toán, trả trước của khách hàng là bao<br />
nhiêu phần trăm so với sản phẩm mình mua. Với biến này, khả năng thanh toán của khách<br />
hàng được chia thành 3 nhóm: nhóm “duoi 30 ptram” (dưới 30 phần trăm, có 369 số liệu),<br />
nhóm “tu 30 den duoi 40 ptram” (từ 30 phần trăm đến dưới 40 phần trăm, có 1589 số liệu) và<br />
nhóm “tu 40 ptram trở lên” (từ 40 phần trăm trở lên , có 221 số liệu). Phân bố số lượng sản<br />
phẩm theo tỷ lệ thanh toán được thể hiện trong Bảng 8<br />
<br />
<br />
<br />
12<br />
Cũng như trên, ta chọn nhóm thanh toán từ 30 phần trăm đến dưới 40 phần trăm<br />
làm nhóm chứng, thành lập hai biến mới sau là biến D30PT (khách hàng vay dưới 30 phần<br />
trăm) biến nhận giá trị 1 nếu khách hàng mua sản phẩm vay dưới 30 phần trăm, nhận giá trị 0<br />
trong tình huống còn lại và tương tự ta cũng có biến Tu40PT (khách hàng vay từ 40 phần trăm<br />
trở lên).<br />
+ Biến nhomthhan cho biết thời gian khách hàng vay tiền của công ty để mua sản<br />
phẩm. Biến này nhận 4 giá trị: “duoi 1 nam” (thời hạn vay dưới 1 năm), “1 nam” (thời hạn 1<br />
năm), “13-23 thang” (thời hạn vay từ 13 đến 23 tháng) và “2 nam” (thời hạn vay 2 năm). Phân<br />
bố số lượng sản phẩm theo thời hạn thanh toán của khách hàng được cho trong Bảng 9.<br />
Chọn nhóm thời hạn vay 2 năm làm nhóm chứng, ta thành lập được 3 biến mới: biến<br />
Duoi1N, biến nhận giá trị 1 nếu khách hàng vay trong thời hạn dưới 1 năm và nhận giá trị 0<br />
trong các tình huống còn lại, tương tự biến ThHan1N (khách hàng vay trong thời hạn 1 năm),<br />
biến ThH1323T (thời hạn vay từ 13 tháng đến 23 tháng). Các biến này nhận giá trị 1 ứng với<br />
mỗi sản phẩm được khách vay trong thời gian tương ứng với biến và nhận giá trị 0 trong<br />
trường hợp còn lại.<br />
+ Biến gioi_th mô tả giới tính của nhân viên công ty trực tiếp giới thiệu, tư vấn và<br />
hướng dẫn khách hàng tham gia dịch vụ mua trả góp của công ty, chú ý ta không nên nhầm<br />
lẫn đó là giới tính người bán hàng ở các đại lý mà công ty liên kết. Biến này nhận giá trị 0 nếu<br />
người thực hiện có giới tính nữ và nhận giá trị 1 nếu người thực hiện này có giới tính nam.<br />
Bảng 10 mô tả phân bố giới tính của nhân viên thực hiện các giao dịch với khách hàng.<br />
+ Biến machmon mô tả cho ta thấy chuyên môn của những người thực hiện ở trên. Biến<br />
machmon nhận 4 giá trị “ky thuat, it” (nhóm nhân viên có chuyên môn về kỹ thuật, công nghệ<br />
thông tin), “kinh te taichinh ngan hang” (nhóm nhân viên tốt nghiệp các chuyên ngành liên<br />
quan đến kinh tế, tài chính, ngân hàng), “quan ly, luat, xahoi” (nhóm nhân viên tốt nghiệp các<br />
chuyên ngành quản lý, luật, xã hội) và “nganh khac” (nhóm các ngành khác như dược, tốt<br />
nghiệp THPT, vv…). Bảng 11 mô tả phân bố của số lượng khách hàng theo chuyên môn của<br />
nhân viên thực hiện.<br />
Từ biến machmon trên, để đòi hỏi các biến độc lập nhận giá trị 0,1, ta thành lập thêm 3<br />
biến mới sau đây (nhóm ngành kỹ thuật, công nghệ thông tin có số lượng lớn nhất được ta<br />
chọn làm nhóm chứng). Đó là biến CMKinhte biến nhận giá trị 1 nếu người thực hiện có<br />
chuyên môn nằm trong nhóm những người có chuyên môn kinh tế, tài chính, ngân hàng, và<br />
nhận giá trị 0 trong các trường hợp còn lại, cùng với hai biến CMQuanly (người thực hiện có<br />
chuyên môn nằm trong nhóm quản lý, luật, xã hội), biến CMKhac (người thực hiện năm trong<br />
nhóm chuyên môn khác) được thành lập tương tự.<br />
<br />
<br />
13<br />
5.2. Kết quả phân tích<br />
A/ Mô hình hồi quy Poisson dự báo số lượng tiêu thụ sản phẩm công nghệ cao<br />
Sau khi chạy bộ số liệu trong Stata, sử dụng mô hình hồi quy Poisson cho quá trình đếm<br />
để xem xét sự phụ thuộc của biến quan sát sphamit vào các biến gioikh, pos-khan, gioi_th,<br />
BaDinh, CauGiay, HaiBa, TXHaDong,<br />
DATTHMai,Duoi15Tr,Tu30Tr,D30PT,Tu40PT,Duoi1N,ThHan1N,ThH1323T,TuoiKHDuoi30,<br />
TuoiKHTu45, KHBaDinh, CGTLTayHo, HdongTXuan, TtriHmai, HBTrung, LBGLDAnh,<br />
Hkiem, Nthanh, CMKinhte, CMQuanly, CMkhac ta thu được kết quả trong Bảng 12.<br />
Mô hình hồi quy Poisson rút gọn, chỉ chứa các biến độc lập thực sự ảnh hưởng đến biến<br />
phụ thuộc được trình bày trong Bảng 14.<br />
Bảng 14: Mô hình Poisson rút gọn dự báo số lượng sản phẩm IT<br />
Poisson regression Number of obs = 2179<br />
LR chi2(5) = 995.44<br />
Prob > chi2 = 0.0000<br />
Log likelihood = -661.5161 Pseudo R2 = 0.4294<br />
<br />
<br />
sphamit Coef. Std. Err. z P>|z| [95% Conf. Interval]<br />
<br />
pos_khan -.4027385 .1559514 -2.58 0.010 -.7083977 -.0970794<br />
CauGiay .4156177 .0992609 4.19 0.000 .2210699 .6101656<br />
Duoi1N .3621661 .1064238 3.40 0.001 .1535794 .5707529<br />
D30PT 3.095639 .152551 20.29 0.000 2.796645 3.394634<br />
Tu40PT .8112706 .267273 3.04 0.002 .2874251 1.335116<br />
_cons -3.338353 .1398704 -23.87 0.000 -3.612494 -3.064212<br />
<br />
<br />
Từ bảng 14, ta có thể đưa ra mô hình loga tuyến tính phụ thuộc sau đây:<br />
log(Sphamit) = - 0.4027385 pos_khan + 0,4156177 CauGiay + 0.3621661 Duoi1N +<br />
3.095639 D30PT + 0.8112706 Tu40PT – 3.338353.<br />
Lũy thừa cơ số e hai vế của phương trình trên ta thu được<br />
Sphamit = exp{ - 0.4027385 pos_khan + 0,4156177 CauGiay + 0.3621661 Duoi1N +<br />
3.095639 D30PT + 0.8112706 Tu40PT – 3.338353.}<br />
Hay:<br />
Sphamit=(0.668^{pos_khan}).(1,5153^{CauGiay}).(1.4364^{Duoi1N}) .(22.10136<br />
^{D30PT}).(2.2508 ^{Tu40PT}).0,0355<br />
<br />
<br />
B/ Mô hình hồi quy Poisson dự báo số lượng tiêu thụ xe máy<br />
Ta tiếp tục sử dụng mô hình hồi quy Poisson nhờ phần mềm Stata để xem xét sự phụ thuộc<br />
của biến xemay vào các biến: gioikh, pos-khan,<br />
gioi_th,BaDinh,CauGiay,HaiBa,TXHaDong,DATTHMai,Duoi15Tr,Tu30Tr,Tu40PT,Duoi1N,<br />
<br />
<br />
<br />
<br />
14<br />
ThHan1N,ThH1323T,TuoiKHDuoi30,TuoiKHTu45,KHBaDinh, CGTLTayHo, HdongTXuan,<br />
TtriHmai, HBTrung, LBGLDAnh, Hkiem, Nthanh, CMKinhte, CMQuanly, CMkhac<br />
Bảng 16: Sự phụ thuộc của biến xemay vào các biến khác<br />
<br />
<br />
Poisson regression Number of obs = 2179<br />
LR chi2(12) = 267.06<br />
Prob > chi2 = 0.0000<br />
Log likelihood = -2035.914 Pseudo R2 = 0.0615<br />
<br />
<br />
xemay Coef. Std. Err. z P>|z| [95% Conf. Interval]<br />
<br />
pos_khan .1442418 .0565967 2.55 0.011 .0333143 .2551692<br />
gioi_th -.1916381 .0596857 -3.21 0.001 -.3086199 -.0746564<br />
BaDinh .6638394 .0797971 8.32 0.000 .5074399 .8202389<br />
CauGiay -.3671758 .1097185 -3.35 0.001 -.5822202 -.1521314<br />
HaiBa .6414941 .0885326 7.25 0.000 .4679734 .8150148<br />
TXHaDong .7284974 .0865411 8.42 0.000 .55888 .8981147<br />
DATTrHMai .5958677 .0932499 6.39 0.000 .4131013 .7786342<br />
Duoi15Tr -.1480117 .050219 -2.95 0.003 -.2464391 -.0495843<br />
Duoi1N -.3203397 .0936402 -3.42 0.001 -.5038712 -.1368082<br />
HDongTXuan -.1770705 .0877812 -2.02 0.044 -.3491185 -.0050225<br />
CMKinhte -.1932794 .0668398 -2.89 0.004 -.3242831 -.0622757<br />
CMKhac -.2571134 .0684224 -3.76 0.000 -.3912189 -.1230079<br />
_cons -.3738565 .0729181 -5.13 0.000 -.5167733 -.2309397<br />
<br />
<br />
<br />
Kết quả ở Bảng 16 cho thấy, với xác suất ý nghĩa nhỏ hơn 5% trung bình số lượng xe<br />
máy được bán cho vay trả góp tại một địa điểm trong một ngày thực sự phụ thuộc vào các<br />
biến pos_khan, gioi_th, BaDinh, CauGiay, HaiBa, TXHaDong, Duoi15Tr, Duoi1N,<br />
HDongTXuan, CMKinhte, CMKhac.<br />
Ta thu được mô hình hồi quy loga tuyến tính Poisson biểu diễn sự phụ thuộc của biến<br />
xemay như sau:<br />
Log(xemay)= 0.1442418 pos_khan - 0.1916381 gioi_th + 0.6638394 BaDinh – 0.3671758<br />
CauGiay + 0.6414941 HaiBa + 0.7284974 TXHDong + 0. 5958677 DATTrHMai -<br />
0.1480117 Duoi15Tr – 0.3203397 Duoi1N – 0.1770705 HDongTXuan – 0.1932794<br />
CMKinhte – 0.2571134 CMKhac – 0.3738565.<br />
Lấy lũy thừa cơ số e hai vế ta thu được:<br />
xemay = exp{0.1442418 pos_khan - 0.1916381 gioi_th + 0.6638394 BaDinh – 0.3671758<br />
CauGiay + 0.6414941 HaiBa + 0.7284974 TXHDong + 0. 5958677 DATTrHMai -<br />
0.1480117 Duoi15Tr – 0.3203397 Duoi1N – 0.1770705 HDongTXuan – 0.1932794<br />
CMKinhte – 0.2571134 CMKhac –0.3738565}<br />
Hay:<br />
Xemay =(1,15516^{pos_khan}).(0,8256^{gioi_th}) .(1,94224 ^{BaDinh}).(<br />
0,69269^{CauGiay})(1,89931^{HaiBa})(2,07196^{TXHDong})(1,814^<br />
{DATTrHMai})(0,86242^{Duoi15T}).(0,72590^{Duoi1N}).(0,83772^<br />
<br />
<br />
<br />
15<br />
{HdongTXuan}).(0,82425^{CMKinhte}).( 0,77328 ^{ CMKhac}). 0,68808<br />
<br />
References<br />
Tiếng Việt<br />
<br />
1. Đào Hữu Hồ (1998), Xác suất Thống kê, In lần thứ 3, Nhà xuất bản Đại học quốc gia Hà<br />
Nội, 224 Tr.<br />
2. Đặng Hùng Thắng (1998), Mở đầu về lý thuyết Xác suất và các ứng dụng, In lần thứ 2, Nhà<br />
xuất bản Giáo Dục, Hà Nội<br />
3. Nguyễn Duy Tiến (2000), Các mô hình xác suất và ứng dụng; Phần 1: Xích Markov và ứng<br />
dụng, Nhà xuất bản Đại học Quốc Gia, Hà Nội.<br />
4. Nguyễn Duy Tiến (chủ biên), Đặng Hùng Thắng (2000), Các mô hình xác suất và ứng<br />
dụng,Phần 2: Quá trình dừng và ứng dụng, Nhà xuất bản Đại học Quốc Gia, Hà Nội.<br />
Tiếng Anh<br />
<br />
<br />
5. Blundell, R. Griffith, and J. Van Reenen (1995),” Dynamic Count Data models of<br />
Technological innovation”, Economic Journal, 105, pp.333– 344.<br />
6. Cameron, A.C, and D.K Trivedi (1998), Regression analysis of count data, Cambrige<br />
University press, NewYork.<br />
7. Noriszura Ismail, Abdul Azizjemain (2005), Generalized Poisson regression: An<br />
alternative for risk classication, Universiti teknologi Malaysia.<br />
<br />
<br />
<br />
<br />
16<br />