Đ I H C HOA SEN
Ạ Ọ KINH T L
NG
Ế ƯỢ
ậ Ố
ĐÁP ÁN Bài t p S 1 ÔN T P TH NG KÊ và H I QUY Đ N
Ơ
Ồ
Ố
Ậ
Ng ườ i so n: GV. Ph m Văn Minh ạ ạ
Câu 1 (20 đi m): ể
Hãy nêu đ nh nghĩa c a kỳ v ng, ph ủ ọ ị ươ ẫ ng sai, đ l ch chu n c a m t bi n ng u ẩ ộ ệ ủ ế ộ
nhiên. Hãy ch ng minh nh ng tính ch t sau đây c a kỳ v ng và ph ng sai, trong đó ứ ữ ủ ấ ọ ươ
X là m t bi n ng u nhiên và a, b là nh ng h ng s . ố ữ ế ằ ẫ ộ
(a) E[a] = a (b) E[bX] = bE[X]
(c) E[a + bX] = a + bE[X] (d) VAR[a] = 0
(e) VAR[bX] = b2VAR[X] (f) VAR[a + bX] = b2VAR[X]
(g) VAR[X] = E[X2] - (E[X])2
(a) E[a] = a
Gi i: ả
(b) E[bX] = bE[X]
(c) E[a + bX] = a + bE[X]
(d) VAR[a] = 0
(e) VAR[bX] = b2VAR[X]
(f) VAR[a + bX] = b2VAR[X]
D a vào tính ch t c a toán t kỳ v ng E[X]: E[a] = a ( câu a) ấ ủ ự ử ọ ở
(g) VAR[X] = E[X2] - (E[X])2
= E[X] ặ m Đ đ n gi n hóa ký hi u, ta đ t ể ơ ệ ả
Câu 2 (20 đi m):ể
thuy t cho r ng đi m trung bình c a m t sinh viên có th đ c gi Có m t gi ộ ả ể ượ ủ ế ể ằ ộ ả i
thích b i thu nh p trung bình hàng năm c a Cha M . Đ ki m ch ng gi ẹ ể ể ủ ứ ậ ở ả thuy t này, ế
m t sinh viên Kinh t Khóa 34 đã ti n hành thu th p d li u t m t m u g m 8 sinh ộ ế ậ ữ ệ ừ ộ ế ẫ ồ
ng Đ i H c Hoa Sen và đ c k t qu nh sau: viên c a Tr ủ ườ ạ ọ ượ ế ả ư
ể ậ STT
1 2 3 4 5 6 7 8 Đi m trung bình (ĐTB) 10.00 7.50 8.75 5.00 7.50 8.75 6.25 6.25 Thu nh p trung bình hàng năm (TN – tr.đ ng)ồ 105 75 45 45 60 90 30 60
Gi i: ả
ế (a) Hãy tính các tr th ng kê t ng h p cho bi n thu nh p trung bình hàng năm và bi n ị ố ế ậ ổ ợ
đi m trung bình. Đi n các k t qu vào b ng sau: ể ề ế ả ả
HÀM EXCEL ợ ị ố ế ế
ố ầ
ế
Tr th ng kê T ng h p ổ S l n Quan sát Trung bình Trung v ị Y u v ị (mode) Giá tr l n nh t ấ ị ớ Giá tr nh nh t ấ ị ỏ (*) ng sai Ph Đ L ch chu n ẩ ươ ộ ệ
Bi n ĐTB 8 7.5 7.5 6.25; 7.5; 8.75 10 5 2.679 1.637 0.218 Bi n TN 8 63.75 60 45; 60 105 30 626.786 25.036 0.393 H s bi n thiên ệ ố ế =COUNT( ) =AVERAGE( ) =MEDIAN( ) =MODE( ) =MAX( ) =MIN( ) =VAR( ) =STDEV( ) = STDEV( )/ AVERAGE( )
2
Đ ng Ph ng sai =(n/(n-1))*COVAR() = 29.464 ồ ươ
H s bi n thiên: đ c đ nh nghĩa là t s σ/μ, trong đó t s là đ l ch chu n và ệ ố ế ượ ị ỷ ố ử ố ộ ệ ẩ
m u s là tr trung bình. Đó là m t đ i l ng c a s phân tán c a phân ph i t ộ ạ ượ ẫ ố ị ủ ự ố ươ ng ủ
đ i so v i tr trung bình c a phân ph i. ố ớ ị ủ ố
Đ ng Ph ng sai: ng sai (hay ồ ươ Trong lý thuy t xác su t và th ng kê, đ ng ph ấ ế ố ồ ươ hi pệ
ph ng sai ) là đ đo s bi n thiên cùng nhau c a hai bi n ng u nhiên (phân bi ươ ự ế ủ ế ẫ ộ ệ t
ng sai - đo m c đ bi n thiên c a m t bi n). v i ph ớ ươ ứ ộ ế ủ ế ộ
N u 2 bi n có xu h ế ế ướ ơ ng thay đ i cùng nhau (nghĩa là, khi m t bi n có giá tr cao h n ế ổ ộ ị
giá tr kỳ v ng thì bi n kia có xu h ế ọ ị ướ ệ ng cũng cao h n giá tr kỳ v ng), thì hi p ơ ọ ị
ph ươ ng sai gi a hai bi n này có giá tr d ế ị ươ ữ ng. M t khác, n u m t bi n n m trên giá ộ ế ế ặ ằ
tr kì v ng còn bi n kia có xu h i giá tr kì v ng, thì hi p ph ng sai ế ọ ị ướ ng n m d ằ ướ ệ ọ ị ươ
c a hai bi n này có giá tr âm. ủ ế ị
trong Excel có đ n 4 hàm đ tính Ph ng sai. Đó là VAR, VARA, VARP, L u ý:ư ế ể ươ
ng sai cho m u, ta s d ng công th c ng t VARPA. Nh ng đ tính ph ư ể ươ ử ụ ứ VAR( ), t ẫ ươ ự
nh v y công th c ng sai c a hai bi n trên ư ậ ứ (n/(n-1))*COVAR s tính đ ng ph ẽ ồ ươ ủ ế
m u.ẫ
Ho c s d ng Data Analysis/ Descriptive Statistics: ặ ử ụ
Ta có b ng sau: ả
ĐI M TRUNG Ể BÌNH
THU NH PẬ
Mean
7.5 Mean
63.75
0.57863
Standard Error
8 Standard Error
8.851452665
Median
7.5 Median
60
7.5 Mode
45
Mode Standard Deviation
Standard Deviation
25.03568881
1.63663 4 2.67857
Sample Variance
1 Sample Variance
626.7857143
-0.7 Kurtosis
-6.3E-17 Skewness
Kurtosis Skewness Range Minimum
5 Range 5 Minimum
-0.596449704 0.46088053 75 30
3
10 Maximum 60 Sum
Maximum Sum Count
8 Count
105 510 8
ậ (b) V đ th phân tán đi m cho t p d li u trên. Dùng tr c hoành cho bi n thu nh p ậ ữ ệ ẽ ồ ị ụ ế ể
ắ trung bình hàng năm và tr c tung cho bi n đi m trung bình. Nh n xét m t cách ng n ụ ế ể ậ ộ
g n v đ th c a d li u. ọ ề ồ ị ủ ữ ệ
Tính toán các h s h i quy b 1 và b 2 trong mô hình h i quy sau: ĐTB = b 1 + b 2*TN ệ ố ồ ồ
b ng Excel. ằ
Đ th phân tán: ồ ị
Nh n xét: D a vào đ th trên, ta th y d ậ ồ ị ự ấ ườ ộ ng nh gi a đi m trung bình c a m t ư ữ ủ ể
sinh viên có m i t ng quan tuy n tính đ ng bi n v i thu nh p trung bình hàng năm ố ươ ế ớ ế ậ ồ
ể
c a Cha M . ẹ ủ
X*Y
X^2
S quan ố sát (n)
1050.00 562.50 393.75 225.00 450.00 787.50 187.50 375.00
11025 5625 2025 2025 3600 8100 900 3600 4031.3 36900
Thu nh p trung ậ bình hàng năm (TN - tr.đ) - (X) 105 75 45 45 60 90 30 60 510 63.75
Đi m trung bình (ĐTB) - (Y) 10 7.5 8.75 5 7.5 8.75 6.25 6.25 60 7.5
1 2 3 4 5 6 7 8 T NGỔ TRUNG BÌNH Tính h s h i quy nh sau:
ệ ố ồ
ư
b2 b1
0.047 4.503
4
Các b n có th “click đúp” tr c ti p vào b ng trên đ xem cách tính toán mà không ự ế ể ể ả ạ
c tính b ng các công th c nh sau:
1 và b
2 đ
YXn . .
YX i i
4031
i
ˆ b
=
=
=
.0
047
.
2
= 1 n
2
c n ph i m Excel. ầ ở ụ ể ơ b C th h n, ượ ứ ư ằ ả n - (cid:229) -
5.7.*75.63*83. )75.63(*8
36900
2
X
Xn .(
)
2 i
= 1
i
=
=
- - (cid:229)
-= Y
X
.05.7
047
75.63*
.4
5032 .
ˆ b 1
ˆ b 2
-
(c) Theo Anh/Ch , gi thuy t cho r ng đi m trung bình c a m t sinh viên có th ị ả ủ ế ể ằ ộ ể
đ c gi i thích b i thu nh p trung bình hàng năm c a Cha M là đúng hay không ượ ả ủ ẹ ậ ở
đúng. Gi ả i thích ng n g n câu tr l ắ ọ ả ờ ủ i c a Anh/Ch . ị
Câu này ch a c n làm. ư ầ
Câu 3 (20 đi m):ể
Thu th p d li u v thu nh p (R), chi tiêu cho ăn u ng (C1) và các chi tiêu khác (C2), ậ ữ ệ ề ậ ố
bình quân 1 tu n c a 10 h gia đình m t vùng, nhà nghiên c u đ c k t qu sau ầ ủ ộ ở ộ ứ ượ ế ả
(đ n v ngàn VNĐ/ tu n): ầ ơ ị
1 2 3 4 5 6 7 8 9 10 H giaộ đình i
800 1000 1200 1400 1600 1800 2000 2200 2400 2600 Ri
320 310 340 310 450 420 480 520 600 520 C1i
380 340 560 640 660 730 740 880 950 980
C2i
a) G i t ng chi tiêu bình quân 1 tu n c a h gia đình là C (C = C1 + C2). Hãy tính ầ ủ ộ
ọ ổ
ng sai c a t ng chi tiêu C cho t p d li u trên. giá tr kỳ v ng và ph ọ ị ươ ậ ữ ệ ủ ổ
1 800 320 380 700
2 1000 310 340 650
3 1200 340 560 900
4 1400 310 640 950
5 1600 450 660 1110
6 1800 420 730 1150
7 2000 480 740 1220
8 2200 520 880 1400
9 2400 600 950 1550
10 2600 520 980 1500
HGĐ i Ri C1i C2i Ci
Dùng hàm AVERAGE, VAR trong EXCEL ta đ c:ượ
C1i 427
Ci 1113
C2i 686 10778.89 47848.89 99201.11
Kỳ v ngọ Ph ươ Đ ng ph
ng sai
20286.7
ng sai ươ
ồ
5
Ta th y E(C) = E(C1) + E(C2); Var(C) = Var(C1) + Var(C2) +2Cov(C1,C2) ấ
(Các b n ch c n tìm ra Kỳ v ng và ph ng sai c a C, ch đ m màu đ b ng trên, ỉ ầ ạ ọ ươ ữ ậ ỏ ở ả ủ
“click đúp” tr c ti p vào b ng trên đ xem cách tính toán c th ) ụ ể ự ế ể ả
b) G i s ti n tích lũy bình quân 1 tu n c a h gia đình là P (P = R – C). Hãy tính giá ầ ủ ộ ọ ố ề
tr kỳ v ng và ph ọ ị ươ ậ ữ ệ ng sai c a s ti n tích lũy bình quân 1 tu n cho t p d li u ủ ố ề ầ
trên.
Ta có b ng s li u sau: ố ệ ả
1 800 700 100
2 1000 650 350
3 1200 900 300
4 1400 950 450
5 1600 1110 490
6 1800 1150 650
7 2000 1220 780
8 2200 1400 800
9 2400 1550 850
10 2600 1500 1100
HGĐ i Ri Ci Pi
T ng t , ta dùng hàm AVERAGE, VAR trong EXCEL: ươ ự
Ri 1700
Pi 587
Ci 1113 366666.7 99201.11 91423.33
Kỳ v ngọ Ph ươ Đ ng ph
ng sai
187222.2
ng sai ươ
ồ
Ta th y E(P) = E(R) + E(C); Var(P) = Var(R) + Var(C) - 2Cov(R,C) ấ
(Các b n ch c n tìm ra Kỳ v ng và ph ng sai c a P, ch đ m màu đ b ng trên, ỉ ầ ạ ọ ươ ữ ậ ỏ ở ả ủ
“click đúp” tr c ti p vào b ng trên đ xem cách tính toán c th ) ụ ể ự ế ể ả
Câu 4 (20 đi m):ể
thuy t cho r ng t ng chi tiêu c a m t h gia đình ph thu c vào thu Có m t gi ộ ả ộ ộ ủ ụ ế ằ ổ ộ
nh p c a h gia đình đó. Đ ki m ch ng gi thuy t này, nhà nghiên c u đã dùng d ậ ủ ộ ể ể ứ ả ứ ế ữ
li u v thu nh p (R), t ng chi tiêu (C) bình quân 1 tu n c a h gia đình trong Câu 3: ầ ủ ộ ệ ề ậ ổ
ụ a) V đ th phân tán đi m cho t p d li u trên. Dùng tr c hoành cho bi n R và tr c ậ ữ ệ ẽ ồ ị ụ ể ế
6
tung cho bi n C. Nh n xét m t cách ng n g n v đ th c a d li u. ề ồ ị ủ ữ ệ ắ ọ ế ậ ộ
Theo đ th ta th y hình nh gi a C và R có m i quan h đ ng bi n, và gi a C & ư ữ ệ ồ ồ ị ữ ế ấ ố
R có quan h tuy n tính khá ch t. ế ệ ặ
b) Hãy tìm kho ng tin c y 95% c a thu nh p (R) bình quân 1 tu n c a h gia đình. ầ ủ ộ ủ ậ ậ ả
7
Câu này ch a c n làm. ư ầ
Câu 5 (20 đi m):ể
ủ Tìm hi u v nhu c u s d ng đi n tho i, ông Bình đã s d ng b d li u c a ạ ộ ữ ệ ử ụ ử ụ ể ệ ề ầ
Singapore giai đo n 1960-1981 v i 2 bi n sau: ế ạ ớ
TEL: S l ng máy đi n tho i trên 1000 ng i. ố ượ ệ ạ ườ
GDP: T ng s n ph m qu c n i theo đ u ng ố ộ ầ ả ẩ ổ i, t ườ ạ i m c giá c c u tính theo ơ ấ ứ
đô la Singapore năm 1968.
Năm 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 TEL 36 37 38 41 42 45 48 54 59 67 78 GDP 1299 1365 1409 1549 1416 1473 1589 1757 1974 2204 2462 Năm (tt) 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 TEL 90 102 114 126 141 163 196 223 262 291 317 GDP 2723 3033 3317 3487 3575 3784 4025 4286 4628 5038 5472
a. V đ th phân tán đi m cho t p d li u trên. Dùng tr c hoành cho bi n GDP và ẽ ồ ị ữ ệ ụ ế ể ậ
ề ố tr c tung cho bi n TEL. B ng tr c quan, Anh/ ch hãy nh n xét ng n g n v m i ụ ự ế ắ ậ ằ ọ ị
quan h gi a 02 ch s trên d a trên đ th này. ệ ữ ồ ị ỉ ố ự
Đ th cho th y: i. Nói cách khác, GDP ồ ị ấ khi GDP tăng thì TEL tăng, và ng c l ượ ạ
và TEL có quan h thu n chi u (đ ng bi n). Đ th cũng cho th y quan h GDP ế ồ ị ệ ệ ề ấ ậ ồ
8
và TEL x p x tuy n tính. ỉ ế ấ
b. Hãy tính các tr th ng kê t ng h p cho bi n GDP và TEL (trung bình, ph ng sai, ị ố ế ổ ợ ươ
ng sai). đ l ch chu n, đ ng ph ẩ ộ ệ ồ ươ
GDP
Ph
TEL 116.8 7829.3 88.5
Trung bình ươ ộ ệ Đ ng ph
2812.0 1750399.9 1323.0 113863.8
Ghi chú AVERAGE() VAR() STDEV() (n/ (n-1))*COVAR()
ng sai m u ẫ Đ l ch chu n ẩ ng sai ồ
ươ
(“click đúp” tr c ti p vào b ng trên đ xem cách tính toán c th ) ụ ể ự ế ể ả
c. S d ng l nh CORREL trong EXCEL, hãy xác đ nh h s t ng quan tuy n tính ệ ố ươ ử ụ ệ ị ế
gi a TEL và GDP. Gi i thích ý nghĩa c a h s t ng quan. ữ ả ủ ệ ố ươ
H s t
ng quan
r = 0.97265
ệ ố ươ
ng quan d
ng cho th y hai bi n TEL và GDP có quan h t
ươ
ệ ố ươ
ế ế
ấ ấ
ấ ầ
ệ ỷ ệ l ng quan tuy n tính ế
ươ
H s t thu n. |r| r t g n 1 (≥ 0.8) cho th y hai bi n này có t ậ ch t.ặ
(“click đúp” tr c ti p vào b ng trên đ xem cách tính toán c th ) ụ ể ự ế ể ả
H TẾ
GIẢI BẰNG EXCEL
9
Đ n m v ng cách làm, các b n xem c th trong Excel kèm theo đáp án này . ụ ể ể ắ ữ Ho c nh n đúp vào bi u t ng sau ể ượ ặ ạ ấ