Đ I H C QU C GIA TP. H CHÍ MINH
Ồ
Ố
NG Đ I H C BÁCH KHOA
Ạ Ọ TR
ƯỜ
Ạ Ọ
Ậ
BÁO CÁO BÀI T P XÁC SU T TH NG KÊ
Ấ
GVHD: Th yầ Nguy nễ
Ố Bá Thi
Sinh viên: Nguy n Ph c L c ộ ễ
ướ MSSV : 40901457 Nhóm 3 L p:ớ
Bài 1
ộ ệ ấ ớ ỏ ố
M t xí nghi p may s n xu t áo khoác v i 4 màu: đ , xanh, vàng và tím than. S khách ả hàng nam và n mua áo khoác v i các màu đ c ghi trong b ng sau: ượ ữ ả ớ
Xanh Vàng Tím than Đỏ
62 34 71 42 Nữ
Nam 125 233 52 54
V i m c ý nghĩa α = 1% hãy so sánh t l ỷ ệ ộ khách hàng nam và n a chu ng m t ữ ư ộ ớ
ứ trong các màu s c nói trên. ắ
BÀI LÀM
thi ể ế ề ỷ ệ. ị
o:
: t H Nh n xét ậ thi Gi ế ả t v t khách hàng nam và n a chu ng m t trong các màu s c là ộ ả ữ ư l ộ ắ
Đây là bài toán ki m đ nh gi T l ỷ ệ nh nhau ư
ằ
. ự
ệ :
• Nh p giá tr vào b ng tính ị
ậ
Th c hi n bài toán b ng Excel ả
Trang 2
• Tính các t ng s : ố ổ
• T ng hàng:
ổ Ch n ô ọ E8 và nh p ậ = SUM(C8:D8)
• T ng c t: ổ
Dùng con tr kéo nút t đi n t ỏ ự ề ừ E8 đ n ế E11
ộ Ch n ọ C12 và nh p ậ = SUM(C8:C11)
• T ng c ng:
Dùng con tr kéo nút t đi n t ỏ ự ề ừ C12 đ n ế D12
Ch n E12 và nh p ổ ộ ậ =SUM(E8:E11) ọ
• Ch n ọ C16 và nh p ậ =$C$12*E8/$E$12
• Tinh cac tân sô lý thuyêt: ́ ́ ̀ ́ ́
• Ch n ọ D16 và nh p ậ =$D$12*E8/$E$12
Dùng con tr kéo nút t đi n t ỏ ự ề ừ C16 đ n ế C19
Dùng con tr kéo nút t đi n t ỏ ự ề ừ D16 đ n ế D19
• Ch n ọ C21 và nh p ậ = CHITEST(C8:D11,C16:D19) • Ta se co đ
• Ap dung ham sô CHITEST : ́ ̣ ̀ ́
Trang 3
êt qua cua c k ́ ượ ̃ ́ ̉ ̉ P(X>X²).
Trang 4
:
• Bi n lu n ệ
ậ
thi t H ỏ ả
o. ữ ư
T l ậ ỉ ệ P(X>X²) = 1,71514e-18 < α = 0,01. => Bác b gi ế khách hàng nam và n a chu ng m t trong các màu s c là ộ ắ ộ
• K t lu n : ế khác nhau.
Trang 5
Bài 2
ng s a v t đ ẹ c b i 16 con bò cái khi nghe các lo i nh c khác nhau (nh c nh , ạ ạ
nh c r c, nh c c đi n, không có nh c) đ c th ng kê trong b ng sau đây: L ượ ạ ố ữ ắ ượ ở ạ ổ ể ạ ượ ố ạ ả
15 18 22 17 Nh c nhạ ẹ
13 20 16 15 Nh c r c ạ ố
15 14 19 23 24 17 28 14 Nh c c đi n ạ ổ ể Không có nh cạ
ứ ượ ị
ng đ n l ậ ệ ạ ng s a trung bình c a m i nhóm nh ả ư ủ ng s a c a các con ế ượ ỗ ữ ủ ưở
V i m c ý nghĩa 5%, nh n đ nh xem l ữ ớ trên nh nhau hay khác nhau. Li u âm nh c có nh h ư bò hay không?
BÀI LÀM
ươ ố.
: t H Đây là bài toán phân tích ph o: L Nh n xét ậ thi Gi ế ả ượ ̀ ̉ ̃ ́
ng sai m t nhân t ộ ng s a trung binh cua môi nhom la nh nhau. ̀ ư ữ Th c hi n bài toán b ng Excel
ự
ệ
ằ
• Nh p d li u vào b ng tính :
• Vào Data /Data analysis, ch n ọ Anova: Single Factor.
Trang 6
ậ ữ ệ ả
Trang 7
• Trong h p tho i Anova: ạ
Single Factor l n l : t n đ nh ộ ầ ượ ấ ị
Ph m vi đ u vào: Input Range, quét ch n vùng ( ọ ầ ạ
dòng đ u). ằ ở ầ
• C4:F8). • Cách nhóm theo hàng hay c t: ộ Group By, ch n ọ Columns (nhóm theo c t).ộ • Ch n ọ Labels in first row (nhãn d li u n m • M c ý nghĩa α: • Ph m vi đ u ra:
• Nh n OK, ta s c
C10. ữ ệ α=0,05). Alpha ( n đ nh ị ấ Output Range, ch n ô ọ ứ ạ ầ
Trang 8
ẽ ó b ng k t qu sau: ế ả ả ấ
•
Bi n lu n ậ ệ
•
thi : F = 1.354679803 < F0.05 = 3.490295. ậ ả
K t lu n ậ
Ch p nh n gi ượ
Trang 9
ư . ng s a c a các con bò ế Hay âm nh c không nh h ạ : L ả t H ế o ng s a trung bình c a các nhóm là nh nhau. ủ ữ ủ ấ ữ ng đ n l ưở ế ượ
Bài 3
ng quan, h ặ s t ỷ ố ươ ừ ặ ế
ủ ứ ớ
T 12 c p quan sát (x,y) sau đây t ệ c p 2 bi n (X,Y) ,tính t ừ ế ng quan và h s xác đ nh c a Y đ i v i X. V i m c ý nghĩa α = 5%, có k t ố ớ ệ ố ồ ng h i ng quan gi a X và Y (tuy n tính hay phi tuy n )? Tìm đ ế ị ữ ườ ế
s t ố ươ lu n gì v m i t ề ố ươ ậ quy c a Y đ i v i X. ố ớ ủ
X 123 118 118
356, 9 4,1 111, 1 3,74 12 3 4,5 356, 9 4,1 111, 1 3 11 8 3,8 12 3 2 356, 9 3,1 111, 1 3,4 3
Y 4,1 5 3,8 9
BÀI LÀM Nh n xét
: đây là bài toán phân tích t ng quan. ậ ươ
Th c hi n bài toán b ng Excel
ự
ệ
ằ
ng quan tuy n t
ế ính.
ươ Nh p giá tr vào b ng tính:
1. Phân tích t ị ậ
Trang 10
ả
• Thi
•
t l p b ng Correlation . ế ậ ả
Vào Data /Data analysis , ch n ọ Correlation.
• • Cách nhóm theo hang hay c t: ộ Group By, ch n ọ Columns (nhóm theo
Ph m vi đ u vào: Input Range, quét vùng (C5:D17). ạ ầ
c t).ộ
ầ
• Ch n ọ Labels in first row (nhãn d li u ữ ệ ở • Output Range, ch n ô
Trang 11
Ph m vi đ u ra: hàng đ u). F6. ầ ạ ọ
•
• Nh n OK, ta s có b ng k t qu sau: ẽ ế ấ ả ả
ng quan ệ ố ươ
ệ ố ị
c ượ h s t Ta tìm đ Và h s xác đ nh o : X và Y không có t ng quan tuy n tính * Gi thi t H ươ r = 0.17875. r2 = 0.03195. . ế ả ế
r n
=
T
2 2
- Ta có: T = 0.574506 v iớ
1
r
-
(c là phân v m c 10 b c t do). ậ ự
c = 2,228. Mà: ị ứ α/2=0.025 c a phân b ủ Vì T < c nên ch a có c s bác b gi t H
o.
Trang 12
ố Student v i n-2= ớ thi ỏ ả ơ ở ư ế
c X và Y có t ng quan tuy n tính . V y: ậ Ch a k t lu n đ ư ế ậ ượ ươ ế
2. Phân tích t
ng quan phi tuy n.
ươ
ế
Trang 13
S p x p l i các giá tr c a X và Y theo b ng sau: ế ạ ắ ị ủ ả
• Thi
t l p b ng ả Anova: Single Factor.
ế ậ • Vào Data /Data analysis , ch n ọ Anova: Single Factor.
• Trong h p tho i Anova: Single Factor ạ
l n l : t n đ nh ộ ầ ượ ấ ị
o Ph m vi đ u vào: o Cách nhóm theo hàng hay c t: ộ Group By, ch n ọ Columns (nhóm theo
Input Range, quét vùng (D29:G32). ạ ầ
c t).ộ
hàng đ u). ằ ở ầ
o Ch n ọ Labels in first row (nhãn d li u n m o M c ý nghĩa α: o Ph m vi đ u ra:
Trang 14
C34. ữ ệ α=0,05). Alpha ( n đ nh ị ấ Output Range, ch n ô ọ ứ ạ ầ
• Nh n OK, ta s c
ẽ ó b ng k t qu sau: ế ả ả ấ
• Rút ra đ b ng Anova: c t ượ ừ ả
Y/X = SSF/SST = 0,04243.
Tính: SSF = 0,22537. SST = 5,3115. η2
=> T s t ng quan : ỷ ố ươ
Suy ra : ηY/X = 0,206. Y/X - r² = 0.174034 ≠ 0. η2
o : X và Y không có t
2
* Gi thi t H ả ế ươ ế . ng quan phi tuy n
h - -
)
(
r
=
F
2 Y X / 1 -
Ta có: F = 0,87673 v i ớ
n k )
h -
(
) ( ) ( k
2
2 Y X /
Trang 15
c = 4,46.
do (k-2,n-k)=( 2,8)). ủ
ậ ự o. thi t H
Trang 16
Mà: (c là phân v m c Vì: V y: ậ X và Y không có t ố Fisher b c t ị ứ α=0,05 c a phân b F < c nên ch p nh n gi ế ả ấ ế . ng quan phi tuy n ậ ươ
ng quan:
r = 0.178749. r² = 0.03195. ị
• K t lu n : ậ ế H s t ệ ố ươ H s xác đ nh: ệ ố T s t
ng quan: ηY/X = 0.206. ỷ ố ươ
do 10). ủ
c X và Y có t (c là phân v m c Ch a k t lu n đ => ng quan tuy n tính. • T = 0,574506 < c = 2,228. ị ứ 0.025 c a phân b ươ ậ ượ ư ế ố Student b c t ậ ự ế
2,8)). do ( • F = 0,043772 < c = 4,46 ị ứ 0,05 c a phân b ủ
(c là phân v m c X và Y không có t => ố Fisher b c t ậ ự ng quan phi tuy n v i m c ý nghĩa 5%. ế ớ ứ ươ
3. Tìm đ
ườ
ng h i quy c a Y đ i v i X. ủ
ố ớ
ồ
Trang 17
Bài 4
ự ế ườ ủ ề ậ
4 khu v c khác nhau sau đây: Hãy phân tích s bi n đ ng c a thu nh p ($/tháng/ng ộ v t thu nh p trung bình c a 4 lo i ngành ngh ủ ề i) trên c s s li u đi u tra ơ ở ố ệ ự ề ở ạ ậ
N i làm vi c ệ ơ
Lo i ngành ạ nghề 1 2 3 4 V2 200 205 250 228 V1 212 222 241 240 V3 230 222 245 230 V4 220 225 235 240
. ế ố ươ
t Ho: “l ế ng sai hai y u t Nh n xét: Đây là d ng bài t p phân tích ph ạ Gi ng thu nh p trung bình là nh nhau theo ngành và n i làm ư ậ ậ ượ ơ
Ta áp d ng ph
BÀI LÀM ậ thi ả vi c”ệ
ng pháp phân tích ph ng sai 2 y u t ụ ươ ươ . ế ố
Th c hi n bài toán b ng Excel
ự
ệ
ằ
Trang 18
1. Nh p d li u vào b ng tính: ậ ữ ệ ả